/ Forside / Teknologi / Operativsystemer / Linux / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Linux
#NavnPoint
o.v.n. 11177
peque 7911
dk 4814
e.c 2359
Uranus 1334
emesen 1334
stone47 1307
linuxrules 1214
Octon 1100
10  BjarneD 875
ext3 corruption 1. søndag hver måned
Fra : Peter Mogensen


Dato : 08-05-09 13:02

Hej,

Nu har jeg 2 gange på den første søndag i måneden oplevet at min Debian
Etch server crashede (kernen sagde stop) tidlig om morgenen.

filsystemet ligger på mdadm, RADI1 med 2 diske.

Bagefter ville den ikke umiddelbart starte uden fsck.
Første gang var det værst, for der var inode 8 med ext3 journal smadret
og det krævede at jeg downgradede til ext2 og lavede en ny journal før
den ville gennem føre fsck.ext3 uden at den senere lave
remount-read-only p.g.a. fejl.

Nu siger I nok: Hardware fejl, køb en ny disk.

Men nej... diskene har det så vidt jeg kan se fint.
Jeg har kraftigt mistænkt synderen for at være checkarray cron-jobbet,
der kører kl. 01:06 søndag morgen, første søndag i måneden.

Jeg har fundet et enkelt hint på nettet om at der skulle være et problem
med det, men jeg kunne ikke finde mere om det.

Jeg har forsøgt at køre checkarray manuelt, men det virker fint.

Nu søger jeg et tip til hvordan jeg undgår at min server stopper søndag
morgen d. 7/6. ... er der nogen, der har oplevet det samme?

/Peter

 
 
Thorbjørn Ravn Ander~ (08-05-2009)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 08-05-09 13:23

Peter Mogensen skrev:

> Nu siger I nok: Hardware fejl, køb en ny disk.

Nejnej, softwarefejl, opgrader din Debian :)

Kan se 5.0.1 er kommet her i april. Er første skridt ikke at overveje
om det er den vej du skal?

--
Thorbjørn Ravn Andersen "...plus... Tubular Bells!"

Peter Mogensen (08-05-2009)
Kommentar
Fra : Peter Mogensen


Dato : 08-05-09 13:35

Thorbjørn Ravn Andersen wrote:
> Peter Mogensen skrev:
>
>> Nu siger I nok: Hardware fejl, køb en ny disk.
>
> Nejnej, softwarefejl, opgrader din Debian :)

Hmm... Hvis det var løsningen, så var jeg nok faldet over den konkrete
bug-report i Debians BTS og en note om at de mærkeligt nok have valgt
ikke at rette en så kritisk fejl i Etch også.

> Kan se 5.0.1 er kommet her i april. Er første skridt ikke at overveje
> om det er den vej du skal?

Hvis det er et godt svar på ovenstående, så jo :) ... men jeg har
sikkert nogle applikationer, der vil drille i sådan en upgrade.

/Peter


Thorbjørn Ravn Ander~ (08-05-2009)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 08-05-09 14:04

Peter Mogensen skrev:
> Thorbjørn Ravn Andersen wrote:
>> Peter Mogensen skrev:
>>
>>> Nu siger I nok: Hardware fejl, køb en ny disk.
>>
>> Nejnej, softwarefejl, opgrader din Debian :)
>
> Hmm... Hvis det var løsningen, så var jeg nok faldet over den konkrete
> bug-report i Debians BTS og en note om at de mærkeligt nok have valgt
> ikke at rette en så kritisk fejl i Etch også.

Jeg følger ikke med - er Etch stadig understøttet?

Men kunne let være en kombination af en atypisk tilgang af diskene (fra
en brugsmæssig vinkel) og så en driver der får hikke.

Første skridt må være at køre din mistænkte HVER nat! Hver TIME måske
endda :)

>
>> Kan se 5.0.1 er kommet her i april. Er første skridt ikke at overveje
>> om det er den vej du skal?
>
> Hvis det er et godt svar på ovenstående, så jo :) ... men jeg har
> sikkert nogle applikationer, der vil drille i sådan en upgrade.

Tøsedreng :D Hvad skulle det dog være?

--
Thorbjørn Ravn Andersen "...plus... Tubular Bells!"

Peter Mogensen (08-05-2009)
Kommentar
Fra : Peter Mogensen


Dato : 08-05-09 14:09

Thorbjørn Ravn Andersen wrote:
> Jeg følger ikke med - er Etch stadig understøttet?

Det regner jeg da med... old-stable bliver da ikke droppet så kort efter
et release.

> Men kunne let være en kombination af en atypisk tilgang af diskene (fra
> en brugsmæssig vinkel) og så en driver der får hikke.
>
> Første skridt må være at køre din mistænkte HVER nat! Hver TIME måske
> endda :)

Hmm... den tager jo lidt mere end en time om opgaven :)
Men ja.

>>
>>> Kan se 5.0.1 er kommet her i april. Er første skridt ikke at
>>> overveje om det er den vej du skal?
>>
>> Hvis det er et godt svar på ovenstående, så jo :) ... men jeg har
>> sikkert nogle applikationer, der vil drille i sådan en upgrade.
>
> Tøsedreng :D Hvad skulle det dog være?

Mine egne perl hacks :)



Thorbjørn Ravn Ander~ (08-05-2009)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 08-05-09 22:06

Peter Mogensen skrev:
> Thorbjørn Ravn Andersen wrote:
>> Jeg følger ikke med - er Etch stadig understøttet?
>
> Det regner jeg da med... old-stable bliver da ikke droppet så kort efter
> et release.
>
>> Men kunne let være en kombination af en atypisk tilgang af diskene
>> (fra en brugsmæssig vinkel) og så en driver der får hikke.
>>
>> Første skridt må være at køre din mistænkte HVER nat! Hver TIME måske
>> endda :)
>
> Hmm... den tager jo lidt mere end en time om opgaven :)
> Men ja.

Bare klø på - der er nok kun dig med problemet :)

>>>
>>>> Kan se 5.0.1 er kommet her i april. Er første skridt ikke at
>>>> overveje om det er den vej du skal?
>>>
>>> Hvis det er et godt svar på ovenstående, så jo :) ... men jeg har
>>> sikkert nogle applikationer, der vil drille i sådan en upgrade.
>>
>> Tøsedreng :D Hvad skulle det dog være?
>
> Mine egne perl hacks :)

Pyt, så har du jo direkte adgang til den ansvarlige udvikler, som 1)
koder pænt og 2) dokumentere alting så det kan ikke tage mange
millisekunder at få opgraderet :)

--
Thorbjørn Ravn Andersen "...plus... Tubular Bells!"

Peter Mogensen (08-05-2009)
Kommentar
Fra : Peter Mogensen


Dato : 08-05-09 22:46

Thorbjørn Ravn Andersen wrote:
> Pyt, så har du jo direkte adgang til den ansvarlige udvikler, som 1)
> koder pænt og 2) dokumentere alting så det kan ikke tage mange
> millisekunder at få opgraderet :)

Hmm... du er nok frejdig hva' :)
Har du f.eks. nogensinde prøvet at porte et Perl-script, der genererer
Lilypond-kode til en nyere version af Lilypond?
Jeg tror vi snakker mindst 7 cifrede millisekunder her.


Thorbjørn Ravn Ander~ (08-05-2009)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 08-05-09 22:57

Peter Mogensen skrev:
> Thorbjørn Ravn Andersen wrote:
>> Pyt, så har du jo direkte adgang til den ansvarlige udvikler, som 1)
>> koder pænt og 2) dokumentere alting så det kan ikke tage mange
>> millisekunder at få opgraderet :)
>
> Hmm... du er nok frejdig hva' :)
> Har du f.eks. nogensinde prøvet at porte et Perl-script, der genererer
> Lilypond-kode til en nyere version af Lilypond?

Nøp. Det lyder nu mere som om at Lilypondudvikleren skal tampes for at
ændre på ting. MON ikke du kan finde ud af at beholde den gamle,
velkendte pakke? Eller lægge den ind selv?

> Jeg tror vi snakker mindst 7 cifrede millisekunder her.

Under en time? Det er vel ikke mere end du allerede har brugt på at
rive hår ud over det der natproblem?

Måske skulle du bare opgradere til Solaris først som sidst :D
--
Thorbjørn Ravn Andersen "...plus... Tubular Bells!"

Andreas Plesner Jaco~ (08-05-2009)
Kommentar
Fra : Andreas Plesner Jaco~


Dato : 08-05-09 13:27

On 2009-05-08, Peter Mogensen <apm-at-mutex-dot-dk@nospam.no> wrote:
>
> Nu har jeg 2 gange på den første søndag i måneden oplevet at min Debian
> Etch server crashede (kernen sagde stop) tidlig om morgenen.

Hvordan "stop"?

--
Andreas

Peter Mogensen (08-05-2009)
Kommentar
Fra : Peter Mogensen


Dato : 08-05-09 13:36

Andreas Plesner Jacobsen wrote:
> On 2009-05-08, Peter Mogensen <apm-at-mutex-dot-dk@nospam.no> wrote:
>> Nu har jeg 2 gange på den første søndag i måneden oplevet at min Debian
>> Etch server crashede (kernen sagde stop) tidlig om morgenen.
>
> Hvordan "stop"?

Tjae... jeg mener ikke at den nåede at skrive KERNEL PANIC (har ikke set
det på konsollen), men der var registerdump og det hele.
Den store knap var eneste vej frem.

Andreas Plesner Jaco~ (08-05-2009)
Kommentar
Fra : Andreas Plesner Jaco~


Dato : 08-05-09 14:12

On 2009-05-08, Peter Mogensen <apm-at-mutex-dot-dk@nospam.no> wrote:

>>> Nu har jeg 2 gange på den første søndag i måneden oplevet at min Debian
>>> Etch server crashede (kernen sagde stop) tidlig om morgenen.
>>
>> Hvordan "stop"?
>
> Tjae... jeg mener ikke at den nåede at skrive KERNEL PANIC (har ikke set
> det på konsollen), men der var registerdump og det hele.
> Den store knap var eneste vej frem.

Få lige fat i det dump, evt med en seriel konsol, hvis du ikke vil
skrive det hele af.

Hvis der *er* et stack trace er der gode chancer for at finde ud af hvad
der er gået galt.

--
Andreas

Søg
Reklame
Statistik
Spørgsmål : 177458
Tips : 31962
Nyheder : 719565
Indlæg : 6408173
Brugere : 218881

Månedens bedste
Årets bedste
Sidste års bedste