Autore Topic: Problema Server , si blocca e schermo nero Agg.con log!Help!!  (Letto 14493 volte)

Offline Dolphin

  • Newbie
  • *
  • Post: 11
    • Mostra profilo
    • E-mail
Salve,
ho da poco assemblato un server con la Centos 5.5.
La macchina è così configurata:

Case Cosmos Cooler Master
Alimentatore 500W Cooler Master Silent Pro
Mainboard intel DH55TC
Processore I5 660
Memorie Kingston 4G 1333
Controller Raid Promise
2 Dischi in Raid 1 da 500GB

Il problema:
Saltuariamente si blocca non dando più neanche il segnale video,a volte fa lo stesso dopo che appare la schermata grafica di caricamento del S.O quando switcha lo schermo per il cambio risoluzione, lo schermo rimane nero e il server è bloccato.

Si blocca anche mentre lavora circa una volta al giorno, a volte 2, scollegando i client in rete e non rispondendo più a nessun comando, schermo nero con il monitor che dice "nessun segnale video"

Per la precisione , dopo aver eseguito l'installazione della Centos , non è stato effettuato nessun aggiornamento, pensate possa risolvere per qualche problema di compatibilità??

Aiuto!!

grazie.
« Ultima modifica: 20 Dicembre 2010, 17:44:46 da Dolphin »

Offline LonelyWolf

  • Moderator
  • Hero Member
  • *****
  • Post: 1396
    • Mostra profilo
    • Traversate dei laghi
Re: Problema Server Centos 5.5 , URGENTISSIMO!
« Risposta #1 il: 01 Dicembre 2010, 11:34:56 »
Se riesci a controllare i log e a postarli si potrebbe trovare qualche info utile per capire dove sta il problema.

Offline Dolphin

  • Newbie
  • *
  • Post: 11
    • Mostra profilo
    • E-mail
Re: Problema Server Centos 5.5 , URGENTISSIMO!
« Risposta #2 il: 01 Dicembre 2010, 11:38:33 »
Se riesci a controllare i log e a postarli si potrebbe trovare qualche info utile per capire dove sta il problema.
Salve,
purtroppo ora sono lontano dal server,
dovrò andare all'ora di pranzo per capire che caspita succede.
Avete notizia di qualche possibile provlema con processori i5, o con chipset grafici montati su main intel?

Offline dankan77

  • Moderator
  • Hero Member
  • *****
  • Post: 1365
    • Mostra profilo
    • E-mail
Re: Problema Server Centos 5.5 , URGENTISSIMO!
« Risposta #3 il: 01 Dicembre 2010, 12:20:44 »
Il problema che descrivi di solito è causato da 2 possibili fattori.
1) Problemi al controller RAID (hang totale del sistema)
2) Banco di memoria difettoso di solito nei log vedi un errore che evidenzia la problematica

Come già indicato da LonelyWolf manda pure i log che gli diamo un occhiata

Ciao

Offline dankan77

  • Moderator
  • Hero Member
  • *****
  • Post: 1365
    • Mostra profilo
    • E-mail
Re: Problema Server Centos 5.5 , URGENTISSIMO!
« Risposta #4 il: 01 Dicembre 2010, 12:29:22 »
Aggiornamento :
Hai letto questo advisor : http://downloadmirror.intel.com/19422/eng/TC_0040_ReleaseNotes.pdf

New Fixes/Features:
 Fixed issue where system hangs with POST code EB.
 Fixed issue where system has not video when using certain
graphics card.


Ciao

Offline Dolphin

  • Newbie
  • *
  • Post: 11
    • Mostra profilo
    • E-mail
Re: Problema Server Centos 5.5 , URGENTISSIMO!
« Risposta #5 il: 01 Dicembre 2010, 13:05:14 »
Aggiornamento :
Hai letto questo advisor : http://downloadmirror.intel.com/19422/eng/TC_0040_ReleaseNotes.pdf

New Fixes/Features:
 Fixed issue where system hangs with POST code EB.
 Fixed issue where system has not video when using certain
graphics card.


Ciao

cavolo!!Non avevo letto questa cosa. Allora faccio anche un aggiornamento del bios sulla main!!!

Grazie!!!Vi faccio sapere :)

Offline Dolphin

  • Newbie
  • *
  • Post: 11
    • Mostra profilo
    • E-mail
Re: Problema Server Centos 5.5 , URGENTISSIMO!
« Risposta #6 il: 01 Dicembre 2010, 18:02:58 »
Aggiornamento :
Hai letto questo advisor : http://downloadmirror.intel.com/19422/eng/TC_0040_ReleaseNotes.pdf

New Fixes/Features:
 Fixed issue where system hangs with POST code EB.
 Fixed issue where system has not video when using certain
graphics card.


Ciao
Sembra che si sia tutto risolto con l'aggiornamento del bios.
Una solo parola.
Grazie.Grazie.Grazie.

ciao.

Offline Dolphin

  • Newbie
  • *
  • Post: 11
    • Mostra profilo
    • E-mail
Re: Problema Server , si blocca e schermo nero SI RIPRESENTA!!! HELP!
« Risposta #7 il: 20 Dicembre 2010, 09:52:39 »
Salve,
purtroppo come scritto nel titolo il problema si ripresenta....
troverete la descrizione della macchina nel primo post.
In pratica succede saltuariamente che o al primo avvio dopo che la barra di riempimento ha terminato di completarsi, o mentre lavorano al gestionale , lo schermo del server diventa nero e il monitor dice che non ha più segnale!!Ovviamente i client sono sbattutti fuori, ma capita anche che come è successo Venerdì lo accendano e lavorino tuto il giorno senza nessun problema.
Quando il problema si verifica devono spegnere la macchina tenendo premuto il pulsante di accensione/spegnimento e al riavvio tutto ok, ne un messaggio di errore niente di niente...
Ho aggiornato il bios e sembrava che il problam si fosse risolto ,ma non è stato cosi.
Secondo voi la scheda madre può dare questo tipo di problema perchè magari non è tra le compatibili sul sito Intel?'
Ho fatto ache un check delle Ram ma è tutto a posto.
Cambio la sk video?Al momento usa quella onboard, metto una nvidia n8400 che ho qui in ufficio?
Comincio a pensare di dover rifarem il server.....
Help.

Grazie

Offline dankan77

  • Moderator
  • Hero Member
  • *****
  • Post: 1365
    • Mostra profilo
    • E-mail
Re: Problema Server , si blocca e schermo nero SI RIPRESENTA!!! HELP!
« Risposta #8 il: 20 Dicembre 2010, 10:40:05 »
Ciao a mio avviso è un problema HW dovuto alla mother board.
Magari stanno cercando di risolvere via sw (vedi l'advisor) qualche problema di progettazione dell'HW e non sono ancora riusciti malgrado l'upgrade del bios.
Lavoro da anni e ti dico che capita più spesso di quanto non si credi. Apri una chiamata d'assistenza per la mother board e vedi cosa di ticono eventualmente la sostituisci con un altro modello di pari specifiche


Ciao

Offline Dolphin

  • Newbie
  • *
  • Post: 11
    • Mostra profilo
    • E-mail
Re: Problema Server , si blocca e schermo nero SI RIPRESENTA!!! HELP!
« Risposta #9 il: 20 Dicembre 2010, 11:00:42 »
Grazie della risposta,
a tuo avviso cambiando la Main con uno non identica ma stesso chipset vado incontro a problemi?
Ho in casa una MSI H55M-P31 , se la metto al posto della DH55TC intel faccio casino?

Se stanno cercando di risolvere via software quel tipo di problema potrei metterre una sk video , o sbaglio?

grazie

Ciao a mio avviso è un problema HW dovuto alla mother board.
Magari stanno cercando di risolvere via sw (vedi l'advisor) qualche problema di progettazione dell'HW e non sono ancora riusciti malgrado l'upgrade del bios.
Lavoro da anni e ti dico che capita più spesso di quanto non si credi. Apri una chiamata d'assistenza per la mother board e vedi cosa di ticono eventualmente la sostituisci con un altro modello di pari specifiche


Ciao
« Ultima modifica: 20 Dicembre 2010, 11:07:08 da Dolphin »

Offline dankan77

  • Moderator
  • Hero Member
  • *****
  • Post: 1365
    • Mostra profilo
    • E-mail
Re: Problema Server , si blocca e schermo nero SI RIPRESENTA!!! HELP!
« Risposta #10 il: 20 Dicembre 2010, 11:51:00 »
Sostituendo la mb non riscontri problemi a meno di non aver utilizzato raid hw e avendo tutte le dovute accortezze nello smontare rimontare il tutto. Per la scheda video ti direi di non aggiungerla al momento. Non credo che serva a dire la verità.

Ciao

Offline Dolphin

  • Newbie
  • *
  • Post: 11
    • Mostra profilo
    • E-mail
Re: Problema Server , si blocca e schermo nero SI RIPRESENTA!!! HELP!
« Risposta #11 il: 20 Dicembre 2010, 11:55:54 »
Sostituendo la mb non riscontri problemi a meno di non aver utilizzato raid hw e avendo tutte le dovute accortezze nello smontare rimontare il tutto. Per la scheda video ti direi di non aggiungerla al momento. Non credo che serva a dire la verità.

Ciao
Grazie ancora.
Un raid hardware c'è , ed è gestito da un controller Promise, non è gestito dalla main per intenderci.
Procedo? :D

Offline dankan77

  • Moderator
  • Hero Member
  • *****
  • Post: 1365
    • Mostra profilo
    • E-mail
Re: Problema Server , si blocca e schermo nero SI RIPRESENTA!!! HELP!
« Risposta #12 il: 20 Dicembre 2010, 15:16:08 »
Da come la vedo io ti conviene sempre fare un backup di tutto e poi procedere. Non si sà mai.



Ciao

Offline Dolphin

  • Newbie
  • *
  • Post: 11
    • Mostra profilo
    • E-mail
Re: Problema Server , si blocca e schermo nero SI RIPRESENTA!!! HELP!
« Risposta #13 il: 20 Dicembre 2010, 17:44:24 »
Da come la vedo io ti conviene sempre fare un backup di tutto e poi procedere. Non si sà mai.



Ciao
Ciao, finalmente ho il log del crash di oggi:



Dec 20 15:11:38 NewSrvLinux smbd[10931]: [2010/12/20 15:11:38, 0] lib/util_sock.c:write_data(562)

Dec 20 15:11:38 NewSrvLinux smbd[10931]:   write_data: write failure in writing to client 192.168.0.80. Error Connessione abbattuta dal corrispondente

Dec 20 15:11:38 NewSrvLinux smbd[10931]: [2010/12/20 15:11:38, 0] lib/util_sock.c:send_smb(761)

Dec 20 15:11:38 NewSrvLinux smbd[10931]:   Error writing 4 bytes to client. -1. (Connessione abbattuta dal corrispondente)

Dec 20 15:30:46 NewSrvLinux syslogd 1.4.1: restart.

Dec 20 15:30:46 NewSrvLinux kernel: klogd 1.4.1, log source = /proc/kmsg started.

Dec 20 15:30:46 NewSrvLinux kernel: Linux version 2.6.18-194.26.1.el5 (mockbuild@builder10.centos.org) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-48)) #1 SMP Tue Nov 9 12:54:20 EST 2010

Dec 20 15:30:46 NewSrvLinux kernel: Command line: ro root=LABEL=/ rhgb quiet

Dec 20 15:30:46 NewSrvLinux kernel: BIOS-provided physical RAM map:

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 0000000000010000 - 0000000000097c00 (usable)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 0000000000097c00 - 00000000000a0000 (reserved)

Type  :quit<Enter>  to exit Vim




Dec 20 15:30:46 NewSrvLinux syslogd 1.4.1: restart.

Dec 20 15:30:46 NewSrvLinux kernel: klogd 1.4.1, log source = /proc/kmsg started.

Dec 20 15:30:46 NewSrvLinux kernel: Linux version 2.6.18-194.26.1.el5 (mockbuild@builder10.centos.org) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-48)) #1 SMP Tue Nov 9 12:54:20 EST 2010

Dec 20 15:30:46 NewSrvLinux kernel: Command line: ro root=LABEL=/ rhgb quiet

Dec 20 15:30:46 NewSrvLinux kernel: BIOS-provided physical RAM map:

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 0000000000010000 - 0000000000097c00 (usable)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 0000000000097c00 - 00000000000a0000 (reserved)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000000e0000 - 0000000000100000 (reserved)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 0000000000100000 - 00000000cb443000 (usable)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb443000 - 00000000cb486000 (ACPI NVS)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb486000 - 00000000cb4fa000 (reserved)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb4fa000 - 00000000cb50e000 (ACPI NVS)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb50e000 - 00000000cb510000 (usable)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb510000 - 00000000cb616000 (reserved)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb616000 - 00000000cb617000 (usable)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb617000 - 00000000cb61f000 (ACPI data)

Dec 20 15:30:46 NewSrvLinux cpuspeed: Enabling ondemand cpu frequency scaling governor

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb61f000 - 00000000cb620000 (ACPI NVS)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb620000 - 00000000cb622000 (ACPI data)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb622000 - 00000000cb62a000 (ACPI NVS)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb62a000 - 00000000cb64b000 (reserved)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb64b000 - 00000000cb68e000 (ACPI NVS)

Dec 20 15:30:46 NewSrvLinux kernel:  BIOS-e820: 00000000cb68e000 - 00000000cb800000 (usable)




Dec 20 15:30:47 NewSrvLinux kernel: DMI 2.6 present.

Dec 20 15:30:47 NewSrvLinux rpc.statd[2376]: Version 1.0.9 Starting

Dec 20 15:30:47 NewSrvLinux kernel: No NUMA configuration found

Dec 20 15:30:47 NewSrvLinux kernel: Faking a node at 0000000000000000-0000000128000000

Dec 20 15:30:47 NewSrvLinux kernel: Bootmem setup node 0 0000000000000000-0000000128000000

Dec 20 15:30:47 NewSrvLinux kernel: Memory for crash kernel (0x0 to 0x0) notwithin permissible range

Dec 20 15:30:47 NewSrvLinux kernel: disabling kdump

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: PM-Timer IO Port: 0x408

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x01] lapic_id[0x00] enabled)

Dec 20 15:30:47 NewSrvLinux kernel: Processor #0 6:5 APIC version 21

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x02] lapic_id[0x04] enabled)

Dec 20 15:30:47 NewSrvLinux kernel: Processor #4 6:5 APIC version 21

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x03] lapic_id[0x02] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x04] lapic_id[0x03] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x05] lapic_id[0x04] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x06] lapic_id[0x05] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x07] lapic_id[0x06] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x08] lapic_id[0x07] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x09] lapic_id[0x08] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x0a] lapic_id[0x09] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x0b] lapic_id[0x0a] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x0c] lapic_id[0x0b] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x0d] lapic_id[0x0c] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x0e] lapic_id[0x0d] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x0f] lapic_id[0x0e] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: LAPIC (acpi_id[0x10] lapic_id[0x0f] disabled)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: IOAPIC (id[0x00] address[0xfec00000] gsi_base[0])

Dec 20 15:30:47 NewSrvLinux kernel: IOAPIC[0]: apic_id 0, version 32, address 0xfec00000, GSI 0-23

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: INT_SRC_OVR (bus 0 bus_irq 0 global_irq 2 dfl dfl)

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: INT_SRC_OVR (bus 0 bus_irq 9 global_irq 9 high level)

Dec 20 15:30:47 NewSrvLinux kernel: Setting APIC routing to physical flat

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: HPET id: 0x8086a701 base: 0xfed00000

Dec 20 15:30:47 NewSrvLinux kernel: Using ACPI (MADT) for SMP configuration information

Dec 20 15:30:47 NewSrvLinux kernel: Nosave address range: 0000000000097000 - 0000000000098000

Dec 20 15:30:47 NewSrvLinux kernel: Nosave address range: 0000000000098000 - 00000000000a0000

Dec 20 15:30:47 NewSrvLinux kernel: Nosave address range: 00000000000a0000 - 00000000000e0000




Dec 20 15:30:47 NewSrvLinux kernel: Nosave address range: 00000000d0000000 - 00000000e0000000

Dec 20 15:30:47 NewSrvLinux kernel: Nosave address range: 00000000e0000000 - 00000000e4000000

Dec 20 15:30:47 NewSrvLinux kernel: Nosave address range: 00000000e4000000 - 00000000fed1c000

Dec 20 15:30:47 NewSrvLinux kernel: Nosave address range: 00000000fed1c000 - 00000000fed20000

Dec 20 15:30:47 NewSrvLinux kernel: Nosave address range: 00000000fed20000 - 00000000ff000000

Dec 20 15:30:47 NewSrvLinux kernel: Nosave address range: 00000000ff000000 - 0000000100000000

Dec 20 15:30:47 NewSrvLinux kernel: Allocating PCI resources starting at e6000000 (gap: e4000000:1ad1c000)

Dec 20 15:30:47 NewSrvLinux kernel: SMP: Allowing 16 CPUs, 14 hotplug CPUs

Dec 20 15:30:47 NewSrvLinux kernel: Built 1 zonelists.  Total pages: 978789

Dec 20 15:30:47 NewSrvLinux kernel: Kernel command line: ro root=LABEL=/ rhgb quiet

Dec 20 15:30:47 NewSrvLinux kernel: Initializing CPU#0

Dec 20 15:30:47 NewSrvLinux kernel: PID hash table entries: 4096 (order: 12, 32768 bytes)

Dec 20 15:30:47 NewSrvLinux kernel: Console: colour VGA+ 80x25

Dec 20 15:30:47 NewSrvLinux kernel: Dentry cache hash table entries: 524288 (order: 10, 4194304 bytes)

Dec 20 15:30:47 NewSrvLinux kernel: Inode-cache hash table entries: 262144 (order: 9, 2097152 bytes)

Dec 20 15:30:47 NewSrvLinux kernel: Checking aperture...

Dec 20 15:30:47 NewSrvLinux kernel: ACPI: DMAR not present

Dec 20 15:30:47 NewSrvLinux kernel: PCI-DMA: Using software bounce buffering for IO (SWIOTLB)

Dec 20 15:30:47 NewSrvLinux kernel: Placing software IO TLB between 0x16a1000 - 0x56a1000

Dec 20 15:30:47 NewSrvLinux pcscd: pcscdaemon.c:507:main() pcsc-lite 1.4.4 daemon ready.

Dec 20 15:30:47 NewSrvLinux kernel: Memory: 3839496k/4849664k available (2575k kernel code, 147188k reserved, 1304k data, 212k init)

Dec 20 15:30:47 NewSrvLinux kernel: Calibrating delay loop (skipped), value calculated using timer frequency.. 6650.24 BogoMIPS (lpj=3325123)

Dec 20 15:30:47 NewSrvLinux kernel: Security Framework v1.0.0 initialized

Dec 20 15:30:47 NewSrvLinux kernel: SELinux:  Initializing.

Dec 20 15:30:47 NewSrvLinux kernel: selinux_register_security:  Registering secondary module capability

Dec 20 15:30:47 NewSrvLinux kernel: Capability LSM initialized as secondary

Dec 20 15:30:47 NewSrvLinux kernel: Mount-cache hash table entries: 256

Dec 20 15:30:47 NewSrvLinux kernel: CPU: L1 I cache: 32K, L1 D cache: 32K

Dec 20 15:30:47 NewSrvLinux kernel: CPU: L2 cache: 256K

Dec 20 15:30:47 NewSrvLinux pcscd: hotplug_libusb.c:402:HPEstablishUSBNotifications() Driver ifd-egate.bundle does not support IFD_GENERATE_HOTPLUG. Using active polling instead.

Dec 20 15:30:47 NewSrvLinux kernel: CPU: L3 cache: 4096K

ecc....

Offline dankan77

  • Moderator
  • Hero Member
  • *****
  • Post: 1365
    • Mostra profilo
    • E-mail
Re: Problema Server , si blocca e schermo nero Agg.con log!Help!!
« Risposta #14 il: 21 Dicembre 2010, 09:17:49 »
Ok.. questo log non ti dice nulla ovviamente. In particolare si nota un hang del server alle 15:11:38 e poi un riavvio manuale alle 15:30:46
Da quello che vedo si può escludere un problema disco/controller perchè malgrado l'hang il sistema scrive ancora alcuni dati. Ti direi di aprire una chiamata di supporto in intel per capire se magari stanno lavorando ad un ulteriore advisor.

p.s. Potresti provare a disabilitare l'acpi

http://communities.intel.com/message/91837

Ciao
« Ultima modifica: 21 Dicembre 2010, 09:34:25 da dankan77 »