/ Forside / Teknologi / Operativsystemer / Linux / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Linux
#NavnPoint
o.v.n. 11177
peque 7911
dk 4814
e.c 2359
Uranus 1334
emesen 1334
stone47 1307
linuxrules 1214
Octon 1100
10  BjarneD 875
Semi-crashed maskine, underlig opførsel?
Fra : Morten Breum Mikkels~


Dato : 21-11-01 18:50

Hej Gruppe,
Jeg har en underlige oplevelse, jeg håber I kan hjælpe mig med at finde
forklaringer på:

Jeg har denneher maskine stående på en ADSL-linje hos en kammerat. Han
ringede en dag og fortalte, at den siden i går havde stået og set
underlig ud. Den var gået død midt i en skærmopdatering,
så halvdelen af skærmen så ok ud, mens resten var hel sort.
Fair nok, tænkte jeg, og prøvede at logge ind på den med ssh.

Det kunne jeg, jeg blev promptet for password og fik en prompt som
normalt. Jeg forsøgte mig så med kommandoen 'ps', som imidlertid aldrig
kom med noget output (eller en ny prompt).
Jeg forsøgte (i en ny skal gennem en ny ssh-forbindelse) med
'ps -aux > processes', som gav samme resultat (ingen ny prompt).

I en ny ssh-shell forsøgte jeg så med 'su' og 'shutdown -r now', hvilket
resulterede i den sædvanlige advarselsbesked - vel at mærke i alle tre
skaller.

Men den rebootede tilsyneladende ikke.

Lidt senere på dagen steg jeg på cyklen og kørte hen til maskinen, som
ikke var andet værd end at strømmen måtte afbrydes - reagerede ikke på
keyboard-input, så en virtuel konsol kunne nås, alt hvad der virkede,
var num-lock-indikatoren.

Da maskinen efterfølgende var startet op, kunne jeg se en fil 'processes' med
størrelsen 0, altså intet indhold.

I /var/log/messages fandt jeg følgende:

---klip log---

Nov 17 14:20:00 myhost CROND[26045]: (root) CMD ( /sbin/rmmod -as)
Nov 17 14:30:00 myhost CROND[26064]: (root) CMD ( /sbin/rmmod -as)
Nov 17 14:32:24 myhost kernel: invalid operand: 0000
Nov 17 14:32:24 myhost kernel: CPU: 0
Nov 17 14:32:24 myhost kernel: EIP: 0010:[shmem_getpage_locked+452/728]
Nov 17 14:32:24 myhost kernel: EIP: 0010:[<c012bb9c>]
Nov 17 14:32:24 myhost kernel: EFLAGS: 00010202
Nov 17 14:32:24 myhost kernel: eax: 00000004 ebx: c10abf24 ecx: 0090c000 edx: 000090c0
Nov 17 14:32:24 myhost kernel: esi: c2fd70d8 edi: 0090c000 ebp: 00000000 esp: c3969e48
Nov 17 14:32:24 myhost kernel: ds: 0018 es: 0018 ss: 0018
Nov 17 14:32:24 myhost kernel: Process tasklist_applet (pid: 1188, stackpage=c3969000)
Nov 17 14:32:24 myhost kernel: Stack: c3969ea4 c3ef5220 c3ef5280 00000046 c122dbc4 30fbd4b4 c3ef5334 c3ef52d0
Nov 17 14:32:24 myhost kernel: c012bd71 c3ef5220 00000046 c3ef5220 c7b92960 00000001 c30d9b9c 00000000
Nov 17 14:32:24 myhost kernel: c012be24 c3ef5220 00000046 c3969ea4 c30e1ae0 c7b92960 00000001 00000000
Nov 17 14:32:24 myhost kernel: Call Trace: [shmem_getpage+193/324] [shmem_nopage+48/156] [do_no_page+84/236] [handle_mm_fault+105/220] [do_page_fault+323/1148] [do_page_fault+0/1148] [sock_recvmsg+65/176]
Nov 17 14:32:24 myhost kernel: Call Trace: [<c012bd71>] [<c012be24>] [<c01204e0>] [<c01205e1>] [<c0110e07>] [<c0110cc4>] [<c01ad881>]
Nov 17 14:32:24 myhost kernel: [unix_stream_recvmsg+0/924] [sock_read+147/156] [sys_read+187/196] [math_state_restore+26/44] [error_code+52/64] [startup_32+43/313]
Nov 17 14:32:24 myhost kernel: [<c01e836c>] [<c01ad98f>] [<c012dcd3>] [<c0107eda>] [<c0107064>] [<c010002b>]
Nov 17 14:32:24 myhost kernel:
Nov 17 14:32:24 myhost kernel: Code: 0f 0b 6a 01 8b 06 50 e8 dc e3 ff ff c7 06 00 00 00 00 53 e8
Nov 17 14:40:00 myhost CROND[26075]: (root) CMD ( /sbin/rmmod -as)
-- cron-linjer udeladt --
Nov 18 12:08:12 myhost sshd[29394]: Did not receive identification string from 208.181.150.179.
Nov 18 12:08:12 myhost sshd[29393]: Did not receive identification string from 208.181.150.179.
Nov 18 12:10:00 myhost CROND[29396]: (root) CMD ( /sbin/rmmod -as)
-- cron-linjer udelade --
Nov 18 14:40:22 myhost sshd[29474]: Accepted password for myself from x.x.x.x port 32770 ssh2
Nov 18 14:40:22 myhost sshd(pam_unix)[29474]: session opened for user myself by (uid=0)
Nov 18 14:41:36 myhost sshd[29496]: Accepted password for myself from x.x.x.x port 32771 ssh2
Nov 18 14:41:36 myhost sshd(pam_unix)[29496]: session opened for user myself by (uid=0)
Nov 18 14:41:48 myhost su(pam_unix)[29519]: session opened for user root by myself(uid=502)
Nov 18 14:42:22 myhost sshd(pam_unix)[29474]: session closed for user myself
Nov 18 14:42:31 myhost sshd[29549]: Accepted password for myself from x.x.x.x port 32772 ssh2
Nov 18 14:42:31 myhost sshd(pam_unix)[29549]: session opened for user myself by (uid=0)
Nov 18 14:42:53 myhost sshd[29571]: Accepted password for myself from x.x.x.x port 32773 ssh2
Nov 18 14:42:53 myhost sshd(pam_unix)[29571]: session opened for user myself by (uid=0)
Nov 18 14:43:04 myhost su(pam_unix)[29594]: session opened for user root by myself(uid=502)
Nov 18 14:43:11 myhost gdm(pam_unix)[1059]: session closed for user myfriend
Nov 18 14:43:17 myhost Font Server[990]: terminating
Nov 18 14:43:18 myhost xfs: xfs shutdown succeeded
Nov 18 14:43:23 myhost httpd: httpd shutdown succeeded
Nov 18 14:43:23 myhost numlock: Disabling numlocks on ttys:
Nov 18 14:43:23 myhost numlock: ^[[60G[ ^[[1;32m
Nov 18 14:43:23 myhost numlock:
Nov 18 14:43:23 myhost rc: Stopping numlock: succeeded
Nov 18 14:43:27 myhost postgresql: postmaster shutdown succeeded
Nov 18 14:43:29 myhost rc: Stopping kheader: succeeded
Nov 18 14:43:29 myhost sshd: Shutting down sshd:
Nov 18 14:43:30 myhost sshd[581]: Received signal 15; terminating.
Nov 18 14:43:30 myhost sshd: sshd shutdown succeeded
Nov 18 14:43:30 myhost sshd: ^[[60G[ ^[[1;32m
Nov 18 14:43:30 myhost sshd:
Nov 18 14:43:30 myhost rc: Stopping sshd: succeeded
Nov 18 14:43:30 myhost postfix: Shutting down postfix:
Nov 18 14:43:30 myhost postfix: postfix
Nov 18 14:43:30 myhost rc: Stopping postfix: succeeded
Nov 18 14:43:30 myhost xinetd[603]: Exiting...
Nov 18 14:43:31 myhost xinetd: xinetd shutdown succeeded
Nov 18 14:43:31 myhost crond: crond shutdown succeeded
Nov 18 14:43:31 myhost dd: 1+0 records in
Nov 18 14:43:31 myhost dd: 1+0 records out
Nov 18 14:43:31 myhost random: Saving random seed: succeeded
Nov 18 14:43:32 myhost kernel: Kernel logging (proc) stopped.
Nov 18 14:43:32 myhost kernel: Kernel log daemon terminating.
Nov 18 14:43:33 myhost syslog: klogd shutdown succeeded
Nov 18 14:43:33 myhost exiting on signal 15
Nov 18 17:45:00 myhost syslogd 1.4-0: restart.
Nov 18 17:45:00 myhost syslog: syslogd startup succeeded
Nov 18 17:45:00 myhost kernel: klogd 1.4-0, log source = /proc/kmsg started.
--- standard opstarts-halløj udeladt ---
Nov 18 17:45:34 myhost login(pam_unix)[1055]: session opened for user root by LOGIN(uid=0)
Nov 18 17:45:34 myhost -- root[1055]: ROOT LOGIN ON tty3


---klip log---

For mig ser det ud som om at det er tasklist_applet'en, der gik ned den
17. men at maskinen kørte nogenlunde videre (cron osv.)

Spørgsmålene er så:
- Var det ikke noget underligt noget, at man kunne få en prompt, men ikke
udføre 'ps'?
- Hvad har 208.181.150.179 haft gang i ?
- Hvorfor lukkede shutdown ikke hele maskinen ned?

Håber der er nogen, der har nogle forslag til svar?

På forhånd tak,
/Morten

 
 
Thorbjørn Ravn Ander~ (21-11-2001)
Kommentar
Fra : Thorbjørn Ravn Ander~


Dato : 21-11-01 18:57

Morten Breum Mikkelsen <mbmNewsreader@mikkelsens.net> writes:

> Nov 17 14:32:24 myhost kernel: invalid operand: 0000
> Nov 17 14:32:24 myhost kernel: CPU: 0
> Nov 17 14:32:24 myhost kernel: EIP: 0010:[shmem_getpage_locked+452/728]
> Nov 17 14:32:24 myhost kernel: EIP: 0010:[<c012bb9c>]
> Nov 17 14:32:24 myhost kernel: EFLAGS: 00010202

Kernen gik ned. Er dyret overclocket?

--
Thorbjørn Ravn Andersen "...plus...Tubular Bells!"
http://bigfoot.com/~thunderbear

Morten Breum Mikkels~ (22-11-2001)
Kommentar
Fra : Morten Breum Mikkels~


Dato : 22-11-01 18:54

On Wed, 21 Nov 2001 18:57:04 +0100, Thorbjørn Ravn Andersen wrote:

> Kernen gik ned. Er dyret overclocket?

Overhovedet ikke, det er en splintrendes ny Dell-maskine..

Jeg prøver en memory-test, som det blev foreslået.

/Morten

Kent Friis (21-11-2001)
Kommentar
Fra : Kent Friis


Dato : 21-11-01 19:39

Den Wed, 21 Nov 2001 18:49:43 +0100 skrev Morten Breum Mikkelsen:
>Hej Gruppe,
>Jeg har en underlige oplevelse, jeg håber I kan hjælpe mig med at finde
>forklaringer på:
>
>Nov 17 14:32:24 myhost kernel: invalid operand: 0000
>Nov 17 14:32:24 myhost kernel: CPU: 0
>Nov 17 14:32:24 myhost kernel: EIP: 0010:[shmem_getpage_locked+452/728]
>Nov 17 14:32:24 myhost kernel: EIP: 0010:[<c012bb9c>]
>Nov 17 14:32:24 myhost kernel: EFLAGS: 00010202
>Nov 17 14:32:24 myhost kernel: eax: 00000004 ebx: c10abf24 ecx: 0090c000 edx: 000090c0
-------------------------------------^^^^^^^^

Bemærk det tal der - nul hele vejen hen, bortset fra en enkelt bit (4),
som er sat. Det kunne tyde på en NULL-pointer, som pga. fx. en RAM-fejl
ikke længere er NULL, og systemet derfor forsøger at bearbejde.

Prøv at køre memtest86 (gerne en hel dag), og se om den finder noget.

Hvis fejlen er i RAM, og memtest86 finder den med det samme, har du
nok en defekt RAM-blok. Hvis den først finder den når maskinen er blevet
varm, så er det nok et problem med køling, evt. på CPU'en.

>Spørgsmålene er så:
>- Var det ikke noget underligt noget, at man kunne få en prompt, men ikke
>udføre 'ps'?

Hvis processerne ligger i en kædet liste, er den afsluttet med en
NULL-pointer. Hvis den er smadret, vil det give problemer for programmer
der forsøger at læse process-listen, fx. tasklist, ps,...

>- Hvad har 208.181.150.179 haft gang i ?

Check at du kører nyeste version af SSH. Der var et hul fornylig.

>- Hvorfor lukkede shutdown ikke hele maskinen ned?

Den skal først lukke alle processerne (se processliste).

>Håber der er nogen, der har nogle forslag til svar?

Check kølingen af CPU'en - det er det der oftest er årsag til den
slags problemer.

Mvh
Kent
--
Det skete i de dage i november engang
at de første kataloger satte hyggen igang

Søg
Reklame
Statistik
Spørgsmål : 177513
Tips : 31968
Nyheder : 719565
Indlæg : 6408601
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste