On Sat, Nov 15, 2003 at 06:12:12PM +0300, Vitaly Ostanin wrote: > Hello, All! > > Обнаружилось, что последние stp-smp ядра из Sisyphus виснут при > использовании IDE-дисков на чипсете ServerWorks CSB5. > > Точно так же, как описано в > http://lkml.org/lkml/2003/6/7/68 > > Гарантированно замораживается с ядрами > 2.4.22-std-smp-alt7 > 2.4.22-std-smp-alt8 > > noapic не помогает, при pci=noacpi не загружается модуль > SCSI-контроллера dac960. Ещё варианты: acpi=off acpi=off noapic acpi=off noapic nolapic (эта опция есть только в alt8) > IDE-диски - это 2 seagate barracuda по 80Gb. DMA на них отключен > давным-давно: > /etc/sysconfig/harddisk/(hdc|hdd) > USE_DMA=0 Но тем не менее сначала ядро всё-таки включает UDMA(33). Не меняется ли ситуация при указании ide=nodma? Кроме того, когда и по какому поводу отключали DMA? Возможно, с тех пор ситуация уже изменилась (серьёзные проблемы там отмечались только в режиме UDMA5, правда, как раз с Seagate Barracuda IV - но тут вроде бы UDMA2 выбирается). Кстати, как раз в alt8 правилась настройка PIO для этого чипсета... Что происходит в /proc/ide/svwks - как сконфигурирован контроллер на самом деле? > Есть ещё CD-ROM Asus, hda, он не используется, даже autofs > выключен. Правда, модуль для него при загрузке грузится. > > Вывод dmesg и lspci -vvv в аттаче. > > Ядра -aw- попробовать не удаётся, они не работают с reiserfs, я > об этом уже писал. > > На сервере запущены: > jabber > squid > samba > postfix > uw-imap > vsftpd > sshd > named > > При этом с данными ide-дисков работает только samba, у неё там > сетевые ресурсы. > > Симптомы заморозки: > сервер пингуется, ни один из сервисов на запросы не отвечает, при > попытке локального логина с консоли принимается login, но > приглашение для ввода пароля не выдаётся. > > На alt+sysrq+S/U/B сервер реагирует, но при S в выводе > синхронизированных устройств (по памяти): > emergency syncing device 16:01... done > emergency syncing device 16:02... done > emergency syncing device 30:03... > на этом вывод обрывается. > > Отсюда подозрение именно на работу ядра с ide-дисками. Кстати, > откуда берётся номер 30:03 ? 0x16 = 22 (16:01 = /dev/hdc1, 16:02 = /dev/hdc2) 0x30 = 48 (30:03 = /dev/rd/c0d0p3) Т.е. получается, что для IDE как раз sync проходит, а вот на dac960 виснет. Хотя вот уж тот драйвер точно никто не трогал - некому :( > В логах ничего совершенно, на 12-й консоли тоже. > > Пока что временно отключил монтирование разделов с ide-дисков, > убрал их из ресурсов samba. Пока вроде работает. До этого работал > от 30-секунд (даже загрузиться не успевал, морозился при старте > named) до 8 часов. > > Вопрос и просьба - подскажите, пожалуйста, как жить, куда копать? > Пусть он хотя бы по выходным не виснет :( > > > Система - почти последний Сизиф.