From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Date: Mon, 17 Nov 2003 12:24:59 +0300 From: Sergey Vlasov To: ALT Linux kernel packages development Subject: Re: [d-kernel] Re: ServerWorks CSB5 freezes on last kernels Message-ID: <20031117092459.GD2088@master.mivlgu.local> Mail-Followup-To: ALT Linux kernel packages development References: <20031115181212.46799cd5.vyt@vzljot.ru> <20031116155841.GE8991@sirius.home> <20031117105827.60132b44.vyt@vzljot.ru> Mime-Version: 1.0 Content-Type: multipart/signed; micalg=pgp-sha1; protocol="application/pgp-signature"; boundary="76DTJ5CE0DCVQemd" Content-Disposition: inline In-Reply-To: <20031117105827.60132b44.vyt@vzljot.ru> X-BeenThere: devel-kernel@altlinux.ru X-Mailman-Version: 2.1.3 Precedence: list Reply-To: ALT Linux kernel packages development List-Id: ALT Linux kernel packages development List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Mon, 17 Nov 2003 09:25:01 -0000 Archived-At: List-Archive: List-Post: --76DTJ5CE0DCVQemd Content-Type: text/plain; charset=koi8-r Content-Disposition: inline Content-Transfer-Encoding: 8bit On Mon, Nov 17, 2003 at 10:58:27AM +0300, Vitaly Ostanin wrote: > On Sun, 16 Nov 2003 18:58:41 +0300 > Sergey Vlasov wrote: > > > On Sat, Nov 15, 2003 at 06:12:12PM +0300, Vitaly Ostanin wrote: > > > Hello, All! > > > > > > Обнаружилось, что последние stp-smp ядра из Sisyphus виснут > > > при использовании IDE-дисков на чипсете ServerWorks CSB5. > > > > > > Точно так же, как описано в > > > http://lkml.org/lkml/2003/6/7/68 > > > > > > Гарантированно замораживается с ядрами > > > 2.4.22-std-smp-alt7 > > > 2.4.22-std-smp-alt8 > > > > > > noapic не помогает, при pci=noacpi не загружается модуль > > > SCSI-контроллера dac960. > > > > Ещё варианты: > > > > acpi=off > > acpi=off noapic > > acpi=off noapic nolapic (эта опция есть только в alt8) > > Попробую, спасибо большое. Что означает последняя? Это отключение ещё и local APIC. Хотя для SMP использование noapic и тем более nolapic нежелательно - разве что без них совсем никак. > > > IDE-диски - это 2 seagate barracuda по 80Gb. DMA на них > > > отключен давным-давно: > > > /etc/sysconfig/harddisk/(hdc|hdd) > > > USE_DMA=0 > > > > Но тем не менее сначала ядро всё-таки включает UDMA(33). Не > > меняется ли ситуация при указании ide=nodma? > > Пока не пробовал. В субботу выключил монтирование разделов с > ide-винтов. Всё-равно заморозился :( При этом при emergency sync > устройства 16:01 и 16:02 уже не упоминаются, а вот 30:03 > по-прежнему sync не проходит. Отсюда подозрение уже на mylex scsi > raid5, который сделан из 3-х scsi дисков > Seagate ST336607LW (как было в поставке, это брендовый вариант). > > Для эксперимента было поставлено ядро из updates к M2.2 > kernel24-smp-2.4.20-alt10 > ide-винты не монтировались. Заморозился. Мда... > > Кроме того, когда и по какому поводу отключали DMA? > > Сразу после установки туда ide-винтов, из-за проблем udma5. То > есть сначала был включен udma2, а потом выключен для чистоты > эксперимента (пару раз он всё-таки зависал). Примерно 2 месяца > назад. UDMA на OSB4 неживой вообще, на CSB5 вроде бы глюки только с UDMA5 были. Хотя чёрт его знает... [skip] > > > Симптомы заморозки: > > > сервер пингуется, ни один из сервисов на запросы не отвечает, > > > при попытке локального логина с консоли принимается login, но > > > приглашение для ввода пароля не выдаётся. > > > > > > На alt+sysrq+S/U/B сервер реагирует, но при S в выводе > > > синхронизированных устройств (по памяти): > > > emergency syncing device 16:01... done > > > emergency syncing device 16:02... done > > > emergency syncing device 30:03... > > > на этом вывод обрывается. > > > > > > Отсюда подозрение именно на работу ядра с ide-дисками. > > > Кстати, откуда берётся номер 30:03 ? > > > > 0x16 = 22 (16:01 = /dev/hdc1, 16:02 = /dev/hdc2) > > 0x30 = 48 (30:03 = /dev/rd/c0d0p3) > > Всё-равно не понял :( Почему 22 - это именно hdc ? /usr/share/doc/kernel*/Documentation/devices.txt > > Т.е. получается, что для IDE как раз sync проходит, а вот на > > dac960 виснет. > > Точно. > > > Хотя вот уж тот драйвер точно никто не трогал - некому :( > > Единственный оставшийся у меня вариант - аппаратные проблемы с > дисками/контроллером. Есть средство диагностики для Mylex > AcceleRaid 170 под linux ? Не знаю - не сталкивался. Хотя вот что обнаружил: http://www.lsilogic.com/products/stor_prod/raid/software_kit_520.html http://www.lsilogic.com/techlib/marketing_docs/storage_stand_prod/raid/gam/release_notes_swkit520.txt | * Do not use Linux DAC drivers 2.2.11 or 2.4.11 with this or any | previous releases of GAM. GAM server 5.10-01 or below cannot | find the DAC controllers if these drivers are compiled into | the Linux kernel. Use DAC drivers 2.2.10 or 2.4.10 instead. | DAC drivers 2.2.10 and 2.4.10 can be found at: | | http://www.dandelion.com/Linux/DAC960-2.2.10.tar.gz and | http://www.dandelion.com/Linux/DAC960-2.4.10.tar.gz respectively. А в ядре, как и следовало ожидать, лежит именно 2.4.11... Правда, оказалось, что этот драйвер всё-таки не совсем заброшен: http://developer.osdl.org/dmo/DAC960/DAC960_V2.4/ И что из этого работает - загадка... --76DTJ5CE0DCVQemd Content-Type: application/pgp-signature Content-Disposition: inline -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.2.3 (GNU/Linux) iD8DBQE/uJPrW82GfkQfsqIRAlyhAKCKC5YLHb1ceDudVOUAKrCQPj+L5gCfYSKq GFgvPDhYSXq2TRa2ngHGzm0= =GYtC -----END PGP SIGNATURE----- --76DTJ5CE0DCVQemd--