On Sun, 16 Nov 2003 18:58:41 +0300 Sergey Vlasov wrote: > On Sat, Nov 15, 2003 at 06:12:12PM +0300, Vitaly Ostanin wrote: > > Hello, All! > > > > Обнаружилось, что последние stp-smp ядра из Sisyphus виснут > > при использовании IDE-дисков на чипсете ServerWorks CSB5. > > > > Точно так же, как описано в > > http://lkml.org/lkml/2003/6/7/68 > > > > Гарантированно замораживается с ядрами > > 2.4.22-std-smp-alt7 > > 2.4.22-std-smp-alt8 > > > > noapic не помогает, при pci=noacpi не загружается модуль > > SCSI-контроллера dac960. > > Ещё варианты: > > acpi=off > acpi=off noapic > acpi=off noapic nolapic (эта опция есть только в alt8) Попробую, спасибо большое. Что означает последняя? > > IDE-диски - это 2 seagate barracuda по 80Gb. DMA на них > > отключен давным-давно: > > /etc/sysconfig/harddisk/(hdc|hdd) > > USE_DMA=0 > > Но тем не менее сначала ядро всё-таки включает UDMA(33). Не > меняется ли ситуация при указании ide=nodma? Пока не пробовал. В субботу выключил монтирование разделов с ide-винтов. Всё-равно заморозился :( При этом при emergency sync устройства 16:01 и 16:02 уже не упоминаются, а вот 30:03 по-прежнему sync не проходит. Отсюда подозрение уже на mylex scsi raid5, который сделан из 3-х scsi дисков Seagate ST336607LW (как было в поставке, это брендовый вариант). Для эксперимента было поставлено ядро из updates к M2.2 kernel24-smp-2.4.20-alt10 ide-винты не монтировались. Заморозился. > Кроме того, когда и по какому поводу отключали DMA? Сразу после установки туда ide-винтов, из-за проблем udma5. То есть сначала был включен udma2, а потом выключен для чистоты эксперимента (пару раз он всё-таки зависал). Примерно 2 месяца назад. Кстати, при зависаниях сервера он именно морозит дисковую подсистему - DNAT при этом работает. > Возможно, > с тех пор ситуация уже изменилась (серьёзные проблемы там > отмечались только в режиме UDMA5, правда, как раз с Seagate > Barracuda IV - но тут вроде бы UDMA2 выбирается). > > Кстати, как раз в alt8 правилась настройка PIO для этого > чипсета... > > Что происходит в /proc/ide/svwks - как сконфигурирован > контроллер на самом деле? В аттаче. > > Есть ещё CD-ROM Asus, hda, он не используется, даже autofs > > выключен. Правда, модуль для него при загрузке грузится. > > > > Вывод dmesg и lspci -vvv в аттаче. > > > > Ядра -aw- попробовать не удаётся, они не работают с reiserfs, > > я об этом уже писал. > > > > На сервере запущены: > > jabber > > squid > > samba > > postfix > > uw-imap > > vsftpd > > sshd > > named > > > > При этом с данными ide-дисков работает только samba, у неё > > там сетевые ресурсы. > > > > Симптомы заморозки: > > сервер пингуется, ни один из сервисов на запросы не отвечает, > > при попытке локального логина с консоли принимается login, но > > приглашение для ввода пароля не выдаётся. > > > > На alt+sysrq+S/U/B сервер реагирует, но при S в выводе > > синхронизированных устройств (по памяти): > > emergency syncing device 16:01... done > > emergency syncing device 16:02... done > > emergency syncing device 30:03... > > на этом вывод обрывается. > > > > Отсюда подозрение именно на работу ядра с ide-дисками. > > Кстати, откуда берётся номер 30:03 ? > > 0x16 = 22 (16:01 = /dev/hdc1, 16:02 = /dev/hdc2) > 0x30 = 48 (30:03 = /dev/rd/c0d0p3) Всё-равно не понял :( Почему 22 - это именно hdc ? > Т.е. получается, что для IDE как раз sync проходит, а вот на > dac960 виснет. Точно. > Хотя вот уж тот драйвер точно никто не трогал - некому :( Единственный оставшийся у меня вариант - аппаратные проблемы с дисками/контроллером. Есть средство диагностики для Mylex AcceleRaid 170 под linux ? -- Regards, Vyt mailto: vyt@vzljot.ru JID: vyt@vzljot.ru