From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Message-ID: <43CE336B.5090707@sakhalin.ru> Date: Wed, 18 Jan 2006 22:24:11 +1000 From: Dmitry Lebkov User-Agent: Mozilla Thunderbird 1.0.6 (X11/20050815) X-Accept-Language: en-us, en MIME-Version: 1.0 To: hardware@lists.altlinux.org Content-Type: text/plain; charset=KOI8-R; format=flowed Content-Transfer-Encoding: 8bit X-Virus-Scanned: amavisd-new at sakhalin.ru Subject: [Hardware] Q: Intel SRCU42X RAID card (LSI Logic MegaRAID SCSI 320-2X) X-BeenThere: hardware@lists.altlinux.org X-Mailman-Version: 2.1.5 Precedence: list Reply-To: hardware@altlinux.ru List-Id: ALT Linux hardware support List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Wed, 18 Jan 2006 12:24:47 -0000 Archived-At: List-Archive: List-Post: Доброго времени суток, Имеется Intel SRCU42X (в "девичестве" - LSI Logic MegaRAID SCSI 320-2X) и по два HDD на каждый канал. Всё это собрано в RAID-5 массив и одним разделом отдано под базу PostgreSQL (208Gb, XFS filesystem). Массив отстоял сутки под тестами bonnie++ без всяких нареканий. После заливки данных в SQL-таблицу (порядка 5-6Gb) и попытки построить индексы в логи начинает сыпаться вот такое: Jan 18 19:22:10 nf kernel: megaraid: aborting-8937 cmd=2a Jan 18 19:22:10 nf kernel: megaraid abort: 8937:13[255:0], fw owner Jan 18 19:22:10 nf kernel: megaraid: aborting-8931 cmd=2a Jan 18 19:22:10 nf kernel: megaraid abort: 8931:19[255:0], fw owner Jan 18 19:22:10 nf kernel: megaraid: aborting-8932 cmd=2a ... Jan 18 19:22:10 nf kernel: megaraid abort: 8994:20[255:0], fw owner Jan 18 19:22:10 nf kernel: megaraid: reseting the host... Jan 18 19:22:10 nf kernel: megaraid mbox: Wait for 64 commands to complete:180 Jan 18 19:22:15 nf kernel: megaraid mbox: Wait for 64 commands to complete:175 Jan 18 19:22:20 nf kernel: megaraid mbox: Wait for 64 commands to complete:170 ... Jan 18 19:25:11 nf kernel: megaraid mbox: Wait for 64 commands to complete:0 Jan 18 19:25:11 nf kernel: megaraid mbox: critical hardware error! Jan 18 19:25:11 nf kernel: megaraid: reseting the host... Jan 18 19:25:11 nf kernel: megaraid: reseting the host... Jan 18 19:25:11 nf kernel: end_request: I/O error, dev sda, sector 145063 Jan 18 19:25:11 nf kernel: lost page write due to I/O error on sda1 После чего машина либо зависает полностью, либо отваливается RAID. К жизнии его можно вернуть только перезагрузкой. Поиск в гугле к решению проблемы не привел. Смена ядра улучшения не принесла. kernel-image-std-smp-2.4.32-alt1 kernel-image-vs26-smp-2.6.14-alt2.1 в этой ситуации ведут себя одинаково. У кого-нить есть опыт успешной эксплуатации этой "железки"? Или "в морг"? -- WBR, Dmitry Lebkov PS. Firmware в карту залит самый последний, с интеловского сайта. Не помогло.