/ Forside / Teknologi / Operativsystemer / Linux / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Linux
#NavnPoint
o.v.n. 11177
peque 7911
dk 4814
e.c 2359
Uranus 1334
emesen 1334
stone47 1307
linuxrules 1214
Octon 1100
10  BjarneD 875
Halvdød harddisk (x2)
Fra : Thomas Lindgaard


Dato : 26-04-05 21:27

Hejsa

Jeg har et par harddiske, som ikke længere vil lege med mig - hvad er den
linux'ske besværgelse for at finde ud af, hvad diskene fejler?

# e2fsck -c?

eller er der noget andet og bedre?

Og er der noget som kan tjekke en hel disk frem for blot en partition
(f.eks. /dev/hda frem for /dev/hda1 og /dev/hda2)?

--
Mvh.
/Thomas


 
 
Kasper Dupont (26-04-2005)
Kommentar
Fra : Kasper Dupont


Dato : 26-04-05 23:31

Thomas Lindgaard wrote:
>
> Hejsa
>
> Jeg har et par harddiske, som ikke længere vil lege med mig - hvad er den
> linux'ske besværgelse for at finde ud af, hvad diskene fejler?
>
> # e2fsck -c?
>
> eller er der noget andet og bedre?

fsck checker for logiske fejl. Hvis du har mistanke
om hardware fejl er badblocks nok et bedre valg. Har
du data på disken, så hold dig til read-only mode.

Man kan selvfølgelig også nøjes med noget simplere,
f.eks. kunne man bare taste 'wc -c </dev/hda'. Jeg
har selv et par småprogrammer skrevet til den slags
formål, hvis du skulle være interesseret.

>
> Og er der noget som kan tjekke en hel disk frem for blot en partition
> (f.eks. /dev/hda frem for /dev/hda1 og /dev/hda2)?

De forslag jeg gav virker lige godt på en hel disk
og på en enkelt partition.

--
Kasper Dupont

Thomas Lindgaard (28-04-2005)
Kommentar
Fra : Thomas Lindgaard


Dato : 28-04-05 08:26

On Wed, 27 Apr 2005 00:31:14 +0200, Kasper Dupont wrote:

>> # e2fsck -c?
>>
>> eller er der noget andet og bedre?
>
> fsck checker for logiske fejl. Hvis du har mistanke
> om hardware fejl er badblocks nok et bedre valg. Har
> du data på disken, så hold dig til read-only mode.

Jeg _har_ mistanke om hardware-fejl, men man-siden for badblocks siger, at
den ikke bør kaldes direkte, og man-siden for e2fsck siger, at -c
medfører et kald af badblocks... så derfor :)

Så jeg prøver at sætte disken i igen og fyre nogle kommandoer af mod
den (dem faktisk - der er to diske) - og faktisk så er den ene af diskene
en af dem, som du satte op i et raid-array for mig i starten af januar...

Maskinen er indkøbt i september-oktober sidste år, og nu er begge de
originale diske stået af... surt sjov!

--
Mvh.
/Thomas


Mogens Kjaer (28-04-2005)
Kommentar
Fra : Mogens Kjaer


Dato : 28-04-05 09:03

Thomas Lindgaard wrote:
.....
> Jeg _har_ mistanke om hardware-fejl, men man-siden for badblocks siger, at
> den ikke bør kaldes direkte, og man-siden for e2fsck siger, at -c
> medfører et kald af badblocks... så derfor :)

Du skal læse hvad der står på man siden:

_Hvis_ output fra badblocks skal bruges til input til
e2fsck eller mke2fs, skal man ikke kalde badblocks direkte.

Du er interesseret i at se, om din disk er syg, ikke at få
markeret bad blocks. Kører du "e2fsck -c" markerer den
de dårlige blokke, og det kan måske give ravage, hvis disken
er ved at fejle helt.

Mogens

--
Mogens Kjaer, Carlsberg A/S, Computer Department
Gamle Carlsberg Vej 10, DK-2500 Valby, Denmark
Phone: +45 33 27 53 25, Fax: +45 33 27 47 08
Email: mk@crc.dk Homepage: http://www.crc.dk

Thomas Lindgaard (28-04-2005)
Kommentar
Fra : Thomas Lindgaard


Dato : 28-04-05 10:39

On Thu, 28 Apr 2005 10:03:03 +0200, Mogens Kjaer wrote:

> Du skal læse hvad der står på man siden:
>
> _Hvis_ output fra badblocks skal bruges til input til
> e2fsck eller mke2fs, skal man ikke kalde badblocks direkte.

Ahh - ok. Det var ikke lige den forståelse, jeg fik ved første
gennemlæsning, men det er jo klart som blæk nu :)

--
Mvh.
/Thomas


Kasper Dupont (28-04-2005)
Kommentar
Fra : Kasper Dupont


Dato : 28-04-05 11:56

Thomas Lindgaard wrote:
>
> Jeg _har_ mistanke om hardware-fejl,

Jeg har kigget lidt på din logfil, og jeg kan se tegn på
problemer med hda og sda.

> men man-siden for badblocks siger, at
> den ikke bør kaldes direkte, og man-siden for e2fsck siger, at -c
> medfører et kald af badblocks... så derfor :)

Hvis man ved hvad man gør, så er det helt i orden at kalde
badblocks fra kommandolinien. Det er ret simpelt, hvis der
er data på disken/partitionen, så skal man nøjes med at
køre badblocks i readonly mode. Stol ikke på non-destructive
read-write mode.

>
> Så jeg prøver at sætte disken i igen og fyre nogle kommandoer af mod
> den (dem faktisk - der er to diske) - og faktisk så er den ene af diskene
> en af dem, som du satte op i et raid-array for mig i starten af januar...

Og du kører stadig med et degraderet raid! Du må hellere få
en disk i raidet før den næste står af. Men det ser faktisk
ikke ud til, at raidet er blevet degraderet pga. en diskfejl.
Derimod ser årsagen ud til at være, at maskinen på et tidspunkt
er blevet startet op med kun den ene disk i. Raidet finder så
selv ud af at køre videre på en disk. Da den anden disk så ved
en senere opstart er kommet tilbage blev den sparket ud af
raidet, fordi den indeholdt forældede data.

>
> Maskinen er indkøbt i september-oktober sidste år, og nu er begge de
> originale diske stået af... surt sjov!

Og du har ikke returneret den første endnu?

Diske bliver tilsyneladende ikke lavet i samme kvalitet som
de gjorde før i tiden. Jeg er efterhånden blevet overbevist
om, at raid er et must. (Med mindre der er tale om en
standardkonfiguration og /home ligger på en filserver, der
naturligvis kører raid).

I øvrigt giver det ikke ret meget mening at kalde badblocks
fra mkfs eller fsck, hvis man bruger raid. De vil jo bare
køre et check på et raid, der overser skjuler alle fejlene.

--
Kasper Dupont

Kasper Dupont (28-04-2005)
Kommentar
Fra : Kasper Dupont


Dato : 28-04-05 13:27

Kasper Dupont wrote:
>
> Thomas Lindgaard wrote:
> >
> > Jeg _har_ mistanke om hardware-fejl,
>
> Jeg har kigget lidt på din logfil, og jeg kan se tegn på
> problemer med hda og sda.

Vi kiggede lidt nærmere på logfiler og fandt det her som
vist er den egentlige årsag til, at SATA disken blev smidt
ud af raidet:

Apr 5 20:55:19 Monster kernel: nv_sata: Primary device removed
Apr 5 20:55:19 Monster kernel: nv_sata: Primary device added
Apr 5 20:55:19 Monster kernel: nv_sata: Primary device removed
Apr 5 20:55:49 Monster kernel: ata1: command 0xca timeout, stat 0x80 host_stat 0x1
Apr 5 20:55:49 Monster kernel: ata1: status=0x80 { Busy }
Apr 5 20:55:49 Monster kernel: ata1: called with no error (80)!
Apr 5 20:55:49 Monster kernel: SCSI error : <0 0 0 0> return code = 0x8000002
Apr 5 20:55:49 Monster kernel: Current sda: sense key Medium Error
Apr 5 20:55:49 Monster kernel: Additional sense: Write error - auto reallocation failed
Apr 5 20:55:49 Monster kernel: end_request: I/O error, dev sda, sector 240091276
Apr 5 20:55:49 Monster kernel: md: write_disk_sb failed for device sda6
Apr 5 20:55:49 Monster kernel: md: errors occurred during superblock update, repeating
Apr 5 20:55:49 Monster kernel: ATA: abnormal status 0x80 on port 0x9F7

Jeg er ikke lige helt klar over, hvad den fejlmelding skyldes.
Men lige nu er der i hvert fald ingen tegn på dårlige sektorer
på disken. Vi har smidt den tilbage i raidet med mdadm -a, så
må vi se, hvad der sker.

--
Kasper Dupont

Mads Martin Joergens~ (28-04-2005)
Kommentar
Fra : Mads Martin Joergens~


Dato : 28-04-05 13:37

Thomas Lindgaard wrote:

> Jeg har et par harddiske, som ikke længere vil lege med mig - hvad er den
> linux'ske besværgelse for at finde ud af, hvad diskene fejler?
>
> # e2fsck -c?
>
> eller er der noget andet og bedre?
>
> Og er der noget som kan tjekke en hel disk frem for blot en partition
> (f.eks. /dev/hda frem for /dev/hda1 og /dev/hda2)?

Hvis diskene er S.M.A.R.T kapable, så er smartmontools et godt bud.

--
Mads Martin Joergensen, http://mmj.dk
"Why make things difficult, when it is possible to make them cryptic
and totally illogical, with just a little bit more effort?"
-- A. P. J.

Søg
Reklame
Statistik
Spørgsmål : 177501
Tips : 31968
Nyheder : 719565
Indlæg : 6408527
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste