* [sisyphus] Зависания сервера HP DL380G4
@ 2011-08-25 7:56 astroiLL
2011-08-25 9:07 ` thecrux
2011-09-23 7:26 ` Sergey Alembekov
0 siblings, 2 replies; 6+ messages in thread
From: astroiLL @ 2011-08-25 7:56 UTC (permalink / raw)
To: sisyphus
[-- Attachment #1: Type: text/plain, Size: 1347 bytes --]
Подскажите, плиз, направления диагностики машины.
Симптомы такие. Работает, работает, потом бац и все сервисы зависли, на
экране никаких изменений (не могу точно сказать, т.к. не вижу экран),
пинг еще идет, а по ssh уже не зайти, в логах ничего.
Может несколько дней проработать, может несколько часов.
Осложняется тем, что машина сейчас далеко, доступ к ней только по ssh
или через iLo (чтобы перезагрузить).
Вывод log/kernel во вложении.
Почти последний Сизиф.
# uname -a
Linux fs01-psh.psh.ru 3.0.1-std-def-alt1 #1 SMP Sat Aug 6 10:18:36 UTC
2011 x86_64 GNU/Linux
С предыдущим ядром (2.6.39-std-def-alt3) было то же самое.
Само железо не новое, долго работало в вышестоящей организации под
сервером баз данных. Прислали нам, я подвоха не ожидал поставил систему,
все заработало, отвез, поставил, собрался настраивать/запускать, а она
начала зависать.
Другие похожие машины, старше и новее работают и такого не проявляют.
Если что-то дохнет или валится, то в логах хоть видно и понятно
направление лечения. А тут шайтан.
Через время поеду, заберу/заменю, но пока хотелось бы выяснить, что
происходит.
Хочу помощи в направлении удаленной диагностики, т.к. в логах ничего.
Как повысить информативность логов?
ЗЫ."Политические" темы, что "надо сначала тестировать, а потом ставить
стабильную систему, а не Сизиф" просьба не поднимать.
[-- Attachment #2: psh-kernel.log.bz2 --]
[-- Type: application/x-bzip, Size: 15787 bytes --]
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [sisyphus] Зависания сервера HP DL380G4
2011-08-25 7:56 [sisyphus] Зависания сервера HP DL380G4 astroiLL
@ 2011-08-25 9:07 ` thecrux
2011-08-25 9:42 ` astroiLL
2011-09-23 7:26 ` Sergey Alembekov
1 sibling, 1 reply; 6+ messages in thread
From: thecrux @ 2011-08-25 9:07 UTC (permalink / raw)
To: astroiLL; +Cc: sisyphus
On Thu, Aug 25, 2011 at 11:56:47AM +0400, astroiLL wrote:
> Подскажите, плиз, направления диагностики машины.
> Симптомы такие. Работает, работает, потом бац и все сервисы зависли, на
> экране никаких изменений (не могу точно сказать, т.к. не вижу экран),
> пинг еще идет, а по ssh уже не зайти, в логах ничего.
...
> Само железо не новое, долго работало в вышестоящей организации под
> сервером баз данных. Прислали нам, я подвоха не ожидал поставил систему,
> все заработало, отвез, поставил, собрался настраивать/запускать, а она
> начала зависать.
Были схожие симптомы с таким же сервером, но более младшей модели (G3),
когда начал отказывать SCSI-контроллер (smart array 6i кажется).
При зависании системы на передней панели было видно, что якобы разом
отказали все диски (горели красные лампочки). Ребут какое-то время лечил
проблему, но затем в определённый момент диски перестали быть видны и в
BIOS при загрузке.
Отправили в утиль.
--
Vladimir Lettiev aka crux ✉ theCrux@gmail.com
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [sisyphus] Зависания сервера HP DL380G4
2011-08-25 9:07 ` thecrux
@ 2011-08-25 9:42 ` astroiLL
2011-08-25 16:38 ` Denis Nazarov
0 siblings, 1 reply; 6+ messages in thread
From: astroiLL @ 2011-08-25 9:42 UTC (permalink / raw)
To: sisyphus
25.08.2011 13:07, thecrux@gmail.com пишет:
> On Thu, Aug 25, 2011 at 11:56:47AM +0400, astroiLL wrote:
>> Подскажите, плиз, направления диагностики машины.
>> Симптомы такие. Работает, работает, потом бац и все сервисы зависли, на
>> экране никаких изменений (не могу точно сказать, т.к. не вижу экран),
>> пинг еще идет, а по ssh уже не зайти, в логах ничего.
> ...
>> Само железо не новое, долго работало в вышестоящей организации под
>> сервером баз данных. Прислали нам, я подвоха не ожидал поставил систему,
>> все заработало, отвез, поставил, собрался настраивать/запускать, а она
>> начала зависать.
>
> Были схожие симптомы с таким же сервером, но более младшей модели (G3),
> когда начал отказывать SCSI-контроллер (smart array 6i кажется).
> При зависании системы на передней панели было видно, что якобы разом
> отказали все диски (горели красные лампочки). Ребут какое-то время лечил
> проблему, но затем в определённый момент диски перестали быть видны и в
> BIOS при загрузке.
> Отправили в утиль.
Спасибо, надо будет посмотреть.
Но вроде через iLo в диагностике ничего криминального не пишет.
Попробую как-то выловить сбой SCSI-контроллера записывая лог на внешний
диск, может получиться.
ЗЫ. Кстати почему-то iLo не дает remote-console, пишет, что "The
single-cursor remote console feature requires JVM 1.4.2 or later." Хотя
java-1.6.0
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [sisyphus] Зависания сервера HP DL380G4
2011-08-25 9:42 ` astroiLL
@ 2011-08-25 16:38 ` Denis Nazarov
2011-08-25 21:49 ` Grigory Milev
0 siblings, 1 reply; 6+ messages in thread
From: Denis Nazarov @ 2011-08-25 16:38 UTC (permalink / raw)
To: sisyphus
25.08.2011 14:42, astroiLL пишет:
> 25.08.2011 13:07, thecrux@gmail.com пишет:
>> On Thu, Aug 25, 2011 at 11:56:47AM +0400, astroiLL wrote:
>>> Подскажите, плиз, направления диагностики машины.
>>> Симптомы такие. Работает, работает, потом бац и все сервисы зависли, на
>>> экране никаких изменений (не могу точно сказать, т.к. не вижу экран),
>>> пинг еще идет, а по ssh уже не зайти, в логах ничего.
>> ...
>>> Само железо не новое, долго работало в вышестоящей организации под
>>> сервером баз данных. Прислали нам, я подвоха не ожидал поставил
>>> систему,
>>> все заработало, отвез, поставил, собрался настраивать/запускать, а она
>>> начала зависать.
>>
>> Были схожие симптомы с таким же сервером, но более младшей модели (G3),
>> когда начал отказывать SCSI-контроллер (smart array 6i кажется).
>> При зависании системы на передней панели было видно, что якобы разом
>> отказали все диски (горели красные лампочки). Ребут какое-то время лечил
>> проблему, но затем в определённый момент диски перестали быть видны и в
>> BIOS при загрузке.
>> Отправили в утиль.
> Спасибо, надо будет посмотреть.
> Но вроде через iLo в диагностике ничего криминального не пишет.
> Попробую как-то выловить сбой SCSI-контроллера записывая лог на
> внешний диск, может получиться.
>
> ЗЫ. Кстати почему-то iLo не дает remote-console, пишет, что "The
> single-cursor remote console feature requires JVM 1.4.2 or later."
> Хотя java-1.6.0
если машинка старая то я бы просто тупо перебрал все железо, потом на
диагностику, вполне
возможен банальный неконтакт из-за окисления. За последние пару лет
попадались
машины на 478 сокете, которые отказывались стартовать, элементарное
"вынул-вставил проц" помогало :)
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [sisyphus] Зависания сервера HP DL380G4
2011-08-25 7:56 [sisyphus] Зависания сервера HP DL380G4 astroiLL
2011-08-25 9:07 ` thecrux
@ 2011-09-23 7:26 ` Sergey Alembekov
1 sibling, 0 replies; 6+ messages in thread
From: Sergey Alembekov @ 2011-09-23 7:26 UTC (permalink / raw)
To: sisyphus
Были похожие проблемы с DL380G6. После обновления прошивки контроллера и
BIOS вылечилось.
25.08.2011 11:56, astroiLL пишет:
> Подскажите, плиз, направления диагностики машины.
> Симптомы такие. Работает, работает, потом бац и все сервисы зависли, на
> экране никаких изменений (не могу точно сказать, т.к. не вижу экран),
> пинг еще идет, а по ssh уже не зайти, в логах ничего.
> Может несколько дней проработать, может несколько часов.
> Осложняется тем, что машина сейчас далеко, доступ к ней только по ssh
> или через iLo (чтобы перезагрузить).
> Вывод log/kernel во вложении.
> Почти последний Сизиф.
> # uname -a
> Linux fs01-psh.psh.ru 3.0.1-std-def-alt1 #1 SMP Sat Aug 6 10:18:36 UTC
> 2011 x86_64 GNU/Linux
> С предыдущим ядром (2.6.39-std-def-alt3) было то же самое.
>
> Само железо не новое, долго работало в вышестоящей организации под
> сервером баз данных. Прислали нам, я подвоха не ожидал поставил систему,
> все заработало, отвез, поставил, собрался настраивать/запускать, а она
> начала зависать.
> Другие похожие машины, старше и новее работают и такого не проявляют.
> Если что-то дохнет или валится, то в логах хоть видно и понятно
> направление лечения. А тут шайтан.
>
> Через время поеду, заберу/заменю, но пока хотелось бы выяснить, что
> происходит.
> Хочу помощи в направлении удаленной диагностики, т.к. в логах ничего.
> Как повысить информативность логов?
>
> ЗЫ."Политические" темы, что "надо сначала тестировать, а потом ставить
> стабильную систему, а не Сизиф" просьба не поднимать.
>
>
>
> _______________________________________________
> Sisyphus mailing list
> Sisyphus@lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/sisyphus
--
Regards, Sergey Alembekov
ALTLinux Team
xmpp: rt@jabber.ru
^ permalink raw reply [flat|nested] 6+ messages in thread
end of thread, other threads:[~2011-09-23 7:26 UTC | newest]
Thread overview: 6+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2011-08-25 7:56 [sisyphus] Зависания сервера HP DL380G4 astroiLL
2011-08-25 9:07 ` thecrux
2011-08-25 9:42 ` astroiLL
2011-08-25 16:38 ` Denis Nazarov
2011-08-25 21:49 ` Grigory Milev
2011-09-23 7:26 ` Sergey Alembekov
ALT Linux Sisyphus discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \
sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru
public-inbox-index sisyphus
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.sisyphus
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git