* [Hardware] дохнет контроллер @ 2006-07-11 9:26 Anton Gorlov 2006-07-11 9:36 ` Alexander Volkov ` (2 more replies) 0 siblings, 3 replies; 9+ messages in thread From: Anton Gorlov @ 2006-07-11 9:26 UTC (permalink / raw) To: hardware В 4 раз накренился 1 из серваков...пока на плову..но. Вопрос - какова вероятность что дохнет контроллер 00:10.0 Unknown mass storage controller: Promise Technology, Inc. 20265 (rev 02) И будет ли под мастером работать a-142 sil 0680 ata/133? Просто чтобыф срчоно поднять другой сервер свободного железа не оказалось по закону подлости hde: dma_timer_expiry: dma status == 0x21 hde: error waiting for DMA hde: dma timeout retry: status=0x50 { DriveReady SeekComplete } hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error } hde: read_intr: error=0x04 { DriveStatusError } hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error } hde: read_intr: error=0x04 { DriveStatusError } hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error } hde: read_intr: error=0x04 { DriveStatusError } hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error } hde: read_intr: error=0x04 { DriveStatusError } PDC202XX: Primary channel reset. PDC202XX: Secondary channel reset. ide2: reset: master: error (0x00?) blk: queue c0304288, I/O limit 4095Mb (mask 0xffffffff) hde: dma_timer_expiry: dma status == 0x21 hde: error waiting for DMA hde: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest } hde: dma_timer_expiry: dma status == 0x21 hde: error waiting for DMA hde: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest } hde: dma_timer_expiry: dma status == 0x21 hde: error waiting for DMA hde: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest } hdg: dma_timer_expiry: dma status == 0x21 hdg: error waiting for DMA hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest } blk: queue c03046dc, I/O limit 4095Mb (mask 0xffffffff) hdg: dma_timer_expiry: dma status == 0x21 hdg: error waiting for DMA hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest } hdg: dma_timer_expiry: dma status == 0x21 hdg: error waiting for DMA hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest } hdg: dma_timer_expiry: dma status == 0x21 hdg: error waiting for DMA hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest } hdg: irq timeout: status=0xd0 { Busy } PDC202XX: Secondary channel reset. PDC202XX: Primary channel reset. ide3: reset: master: error (0x00?) Смарт. smartctl version 5.30 Copyright (C) 2002-4 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF INFORMATION SECTION === Device Model: SAMSUNG SP1604N Serial Number: S013J20XC94650 Firmware Version: TM100-30 Device is: In smartctl database [for details use: -P show] ATA Version is: 7 ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0 Local Time is: Tue Jul 11 12:23:18 2006 MSD SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: (6000) seconds. Offline data collection capabilities: (0x1b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. No Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. No General Purpose Logging support. Short self-test routine recommended polling time: ( 1) minutes. Extended self-test routine recommended polling time: ( 100) minutes. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail Always - 0 3 Spin_Up_Time 0x0007 100 100 025 Pre-fail Always - 2048 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 59 5 Reallocated_Sector_Ct 0x0033 100 100 011 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 100 100 051 Pre-fail Always - 0 8 Seek_Time_Performance 0x0025 100 100 015 Pre-fail Offline - 0 9 Power_On_Half_Minutes 0x0032 099 099 000 Old_age Always - 6696h+25m 10 Spin_Retry_Count 0x0033 100 100 051 Pre-fail Always - 0 11 Calibration_Retry_Count 0x0012 100 100 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 44 194 Temperature_Celsius 0x0022 151 124 000 Old_age Always - 29 195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 81107 196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x000a 100 100 051 Old_age Always - 0 201 Soft_Read_Error_Rate 0x000a 100 100 051 Old_age Always - 0 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] -- np: silence ( Winamp ушел в Партизаны ;-) ^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер 2006-07-11 9:26 [Hardware] дохнет контроллер Anton Gorlov @ 2006-07-11 9:36 ` Alexander Volkov 2006-07-11 9:38 ` Anton Gorlov 2006-07-11 12:51 ` Anton Gorlov 2006-07-11 10:09 ` [Hardware] " Sergey Vlasov 2006-07-12 10:21 ` Michael Shigorin 2 siblings, 2 replies; 9+ messages in thread From: Alexander Volkov @ 2006-07-11 9:36 UTC (permalink / raw) To: hardware On 2006-07-11 13:26:13 +0400, Anton Gorlov wrote: AG> В 4 раз накренился 1 из серваков...пока на плову..но. AG> Вопрос - какова вероятность что дохнет контроллер AG> 00:10.0 Unknown mass storage controller: Promise Technology, Inc. 20265 AG> (rev 02) AG> И будет ли под мастером работать a-142 sil 0680 ata/133? AG> Просто чтобыф срчоно поднять другой сервер свободного железа не AG> оказалось по закону подлости AG> hde: dma_timer_expiry: dma status == 0x21 AG> hde: error waiting for DMA AG> hde: dma timeout retry: status=0x50 { DriveReady SeekComplete } похожее было, когда перестало хватать питания для всех винтов... Мощности БП достаточно или на пределе? - Regards, Alexander ^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер 2006-07-11 9:36 ` Alexander Volkov @ 2006-07-11 9:38 ` Anton Gorlov 2006-07-11 12:51 ` Anton Gorlov 1 sibling, 0 replies; 9+ messages in thread From: Anton Gorlov @ 2006-07-11 9:38 UTC (permalink / raw) To: hardware Alexander Volkov пишет: > похожее было, когда перестало хватать питания для всех винтов... > Мощности БП достаточно или на пределе? Хватает..там на 400 ват БП..к тмоу же -комп год с лишним работал без проблем..а вот в последние 2 месяца началось.. БП\КОНДЁРЫ првоерил в 1 очередь. -- np: silence ( Winamp ушел в Партизаны ;-) ^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер 2006-07-11 9:36 ` Alexander Volkov 2006-07-11 9:38 ` Anton Gorlov @ 2006-07-11 12:51 ` Anton Gorlov 2006-07-11 13:45 ` Sergey Vlasov 1 sibling, 1 reply; 9+ messages in thread From: Anton Gorlov @ 2006-07-11 12:51 UTC (permalink / raw) To: hardware Alexander Volkov пишет: > AG> И будет ли под мастером работать a-142 sil 0680 ata/133? Интересно -а с чего бы контроллер считает себя главнее чем,тот что стоит на мастере..и диски на эотм контроллере получились..как /dev/hda /dev/hdc? (кноппикс)? -- np: silence ( Winamp ушел в Партизаны ;-) ^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер 2006-07-11 12:51 ` Anton Gorlov @ 2006-07-11 13:45 ` Sergey Vlasov 2006-07-12 10:25 ` [Hardware] [faq] " Michael Shigorin 0 siblings, 1 reply; 9+ messages in thread From: Sergey Vlasov @ 2006-07-11 13:45 UTC (permalink / raw) To: hardware [-- Attachment #1: Type: text/plain, Size: 1948 bytes --] On Tue, Jul 11, 2006 at 04:51:44PM +0400, Anton Gorlov wrote: > Alexander Volkov пишет: > > > AG> И будет ли под мастером работать a-142 sil 0680 ata/133? > > Интересно -а с чего бы контроллер считает себя главнее чем,тот что стоит > на мастере..и диски на эотм контроллере получились..как /dev/hda > /dev/hdc? (кноппикс)? На это влияет: 1) Порядок загрузки драйверов, если они в модулях. 2) Порядок PCI-устройств - определяется аппаратно; находятся ли при этом вставленные в PCI платы до или после устройств на материнской плате - в общем случае неизвестно. 3) Опция CONFIG_BLK_DEV_OFFBOARD в конфигурации ядра - у нас она включена. При включении этой опции IDE-контроллеры, считающиеся находящимися на дополнительных платах, могут занимать интерфейсы ide0 и ide1 (которым соответствуют имена устройств hda..hdd); при выключенной опции им назначаются номера, начиная с ide2 (хотя, если всё до ide9 окажется занятым, ide0 и ide1 всё-таки могут быть использованы). Впрочем, на самом деле ядро не может определить, где именно находится чип контроллера - на материнской плате или в отдельном устройстве - этот флаг просто привязан к PCI ID и отражает "обычное" использование контроллеров на момент написания драйверов. В частности, контроллеры, поддерживаемые драйвером siimage, считаются набортными, а те, которые поддерживаются драйвером pdc202xx_new - внешними, но при включении опции CONFIG_BLK_DEV_OFFBOARD они в этом смысле уже не отличаются друг от друга. Имеется довольно ограниченное количество контроллеров, которые считаются внешними даже при включении CONFIG_BLK_DEV_OFFBOARD: - AEC6260R (модуль aec62xx); - HPT343, HPT345 (модуль hpt34x, но в нём это определяется по состоянию контроллера при загрузке драйвера); - ServerWorks CSB6 (модуль serverworks, тоже определяется динамически). [-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --] ^ permalink raw reply [flat|nested] 9+ messages in thread
* [Hardware] [faq] Re: дохнет контроллер 2006-07-11 13:45 ` Sergey Vlasov @ 2006-07-12 10:25 ` Michael Shigorin 0 siblings, 0 replies; 9+ messages in thread From: Michael Shigorin @ 2006-07-12 10:25 UTC (permalink / raw) To: hardware On Tue, Jul 11, 2006 at 05:45:55PM +0400, Sergey Vlasov wrote: > > Интересно -а с чего бы контроллер считает себя главнее > > чем,тот что стоит на мастере..и диски на эотм контроллере > > получились..как /dev/hda /dev/hdc? (кноппикс)? Кажется, были какие-то опции загрузки на эту тему, но сходу не помню, где могли быть -- посмотрел, не вижу; возможно, уже заносилось в faq. > На это влияет: => http://faq.altlinux.ru/index.php?action=single&nf=1&qid=855 -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер 2006-07-11 9:26 [Hardware] дохнет контроллер Anton Gorlov 2006-07-11 9:36 ` Alexander Volkov @ 2006-07-11 10:09 ` Sergey Vlasov 2006-07-11 10:46 ` Anton Gorlov 2006-07-12 10:21 ` Michael Shigorin 2 siblings, 1 reply; 9+ messages in thread From: Sergey Vlasov @ 2006-07-11 10:09 UTC (permalink / raw) To: hardware [-- Attachment #1: Type: text/plain, Size: 732 bytes --] On Tue, Jul 11, 2006 at 01:26:13PM +0400, Anton Gorlov wrote: > В 4 раз накренился 1 из серваков...пока на плову..но. > Вопрос - какова вероятность что дохнет контроллер > 00:10.0 Unknown mass storage controller: Promise Technology, Inc. 20265 > (rev 02) http://www.google.com/search?q=site:lkml.org+PDC202XX:Primary+channel+reset показывает довольно много похожих ситуаций, причины которых зачастую не совсем понятны. Кто-то заметил, что большая часть проблем возникает с дисками, поддерживающими UDMA133 - возможно, если ограничить скорость хотя бы до UDMA100 (hdparm -X69), ситуация улучшится. > И будет ли под мастером работать a-142 sil 0680 ata/133? Должен (драйвер siimage, хотя там он встроен в ядро). [-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --] ^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер 2006-07-11 10:09 ` [Hardware] " Sergey Vlasov @ 2006-07-11 10:46 ` Anton Gorlov 0 siblings, 0 replies; 9+ messages in thread From: Anton Gorlov @ 2006-07-11 10:46 UTC (permalink / raw) To: hardware Sergey Vlasov пишет: > http://www.google.com/search?q=site:lkml.org+PDC202XX:Primary+channel+reset > показывает довольно много похожих ситуаций, причины которых зачастую не > совсем понятны. угу..я первым делом полез в гугл.. :-( > Кто-то заметил, что большая часть проблем возникает с дисками, > поддерживающими UDMA133 - возможно, если ограничить скорость хотя бы до > UDMA100 (hdparm -X69), ситуация улучшится. Хм.. глюканули как раз те винты..которые про удма133 и слухом не знают. Самсунги. 2 новых самсунга на другом канале -как-то просто отсохли.. причём никто про это мне не сказал в логах..рейд продолжал полёт пока в очередой раз ночью не рубанули свет.. бесперебойник не успел загасить машинку. -- np: silence ( Winamp ушел в Партизаны ;-) ^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер 2006-07-11 9:26 [Hardware] дохнет контроллер Anton Gorlov 2006-07-11 9:36 ` Alexander Volkov 2006-07-11 10:09 ` [Hardware] " Sergey Vlasov @ 2006-07-12 10:21 ` Michael Shigorin 2 siblings, 0 replies; 9+ messages in thread From: Michael Shigorin @ 2006-07-12 10:21 UTC (permalink / raw) To: hardware On Tue, Jul 11, 2006 at 01:26:13PM +0400, Anton Gorlov wrote: > И будет ли под мастером работать a-142 sil 0680 ata/133? Да. -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 9+ messages in thread
end of thread, other threads:[~2006-07-12 10:25 UTC | newest] Thread overview: 9+ messages (download: mbox.gz / follow: Atom feed) -- links below jump to the message on this page -- 2006-07-11 9:26 [Hardware] дохнет контроллер Anton Gorlov 2006-07-11 9:36 ` Alexander Volkov 2006-07-11 9:38 ` Anton Gorlov 2006-07-11 12:51 ` Anton Gorlov 2006-07-11 13:45 ` Sergey Vlasov 2006-07-12 10:25 ` [Hardware] [faq] " Michael Shigorin 2006-07-11 10:09 ` [Hardware] " Sergey Vlasov 2006-07-11 10:46 ` Anton Gorlov 2006-07-12 10:21 ` Michael Shigorin
ALT Linux hardware support This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \ hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org public-inbox-index hardware Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.hardware AGPL code for this site: git clone https://public-inbox.org/public-inbox.git