* [Hardware] дохнет контроллер
@ 2006-07-11 9:26 Anton Gorlov
2006-07-11 9:36 ` Alexander Volkov
` (2 more replies)
0 siblings, 3 replies; 9+ messages in thread
From: Anton Gorlov @ 2006-07-11 9:26 UTC (permalink / raw)
To: hardware
В 4 раз накренился 1 из серваков...пока на плову..но.
Вопрос - какова вероятность что дохнет контроллер
00:10.0 Unknown mass storage controller: Promise Technology, Inc. 20265
(rev 02)
И будет ли под мастером работать a-142 sil 0680 ata/133?
Просто чтобыф срчоно поднять другой сервер свободного железа не
оказалось по закону подлости
hde: dma_timer_expiry: dma status == 0x21
hde: error waiting for DMA
hde: dma timeout retry: status=0x50 { DriveReady SeekComplete }
hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error }
hde: read_intr: error=0x04 { DriveStatusError }
hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error }
hde: read_intr: error=0x04 { DriveStatusError }
hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error }
hde: read_intr: error=0x04 { DriveStatusError }
hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error }
hde: read_intr: error=0x04 { DriveStatusError }
PDC202XX: Primary channel reset.
PDC202XX: Secondary channel reset.
ide2: reset: master: error (0x00?)
blk: queue c0304288, I/O limit 4095Mb (mask 0xffffffff)
hde: dma_timer_expiry: dma status == 0x21
hde: error waiting for DMA
hde: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }
hde: dma_timer_expiry: dma status == 0x21
hde: error waiting for DMA
hde: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }
hde: dma_timer_expiry: dma status == 0x21
hde: error waiting for DMA
hde: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }
hdg: dma_timer_expiry: dma status == 0x21
hdg: error waiting for DMA
hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }
blk: queue c03046dc, I/O limit 4095Mb (mask 0xffffffff)
hdg: dma_timer_expiry: dma status == 0x21
hdg: error waiting for DMA
hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }
hdg: dma_timer_expiry: dma status == 0x21
hdg: error waiting for DMA
hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }
hdg: dma_timer_expiry: dma status == 0x21
hdg: error waiting for DMA
hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }
hdg: irq timeout: status=0xd0 { Busy }
PDC202XX: Secondary channel reset.
PDC202XX: Primary channel reset.
ide3: reset: master: error (0x00?)
Смарт.
smartctl version 5.30 Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Device Model: SAMSUNG SP1604N
Serial Number: S013J20XC94650
Firmware Version: TM100-30
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0
Local Time is: Tue Jul 11 12:23:18 2006 MSD
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity was
never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine
completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (6000) seconds.
Offline data collection
capabilities: (0x1b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
No Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 100) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE
UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail
Always - 0
3 Spin_Up_Time 0x0007 100 100 025 Pre-fail
Always - 2048
4 Start_Stop_Count 0x0032 100 100 000 Old_age
Always - 59
5 Reallocated_Sector_Ct 0x0033 100 100 011 Pre-fail
Always - 0
7 Seek_Error_Rate 0x000f 100 100 051 Pre-fail
Always - 0
8 Seek_Time_Performance 0x0025 100 100 015 Pre-fail
Offline - 0
9 Power_On_Half_Minutes 0x0032 099 099 000 Old_age
Always - 6696h+25m
10 Spin_Retry_Count 0x0033 100 100 051 Pre-fail
Always - 0
11 Calibration_Retry_Count 0x0012 100 100 000 Old_age
Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age
Always - 44
194 Temperature_Celsius 0x0022 151 124 000 Old_age Always
- 29
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always
- 81107
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always
- 0
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always
- 0
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age
Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always
- 0
200 Multi_Zone_Error_Rate 0x000a 100 100 051 Old_age Always
- 0
201 Soft_Read_Error_Rate 0x000a 100 100 051 Old_age Always
- 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
--
np: silence ( Winamp ушел в Партизаны ;-)
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер
2006-07-11 9:26 [Hardware] дохнет контроллер Anton Gorlov
@ 2006-07-11 9:36 ` Alexander Volkov
2006-07-11 9:38 ` Anton Gorlov
2006-07-11 12:51 ` Anton Gorlov
2006-07-11 10:09 ` [Hardware] " Sergey Vlasov
2006-07-12 10:21 ` Michael Shigorin
2 siblings, 2 replies; 9+ messages in thread
From: Alexander Volkov @ 2006-07-11 9:36 UTC (permalink / raw)
To: hardware
On 2006-07-11 13:26:13 +0400, Anton Gorlov wrote:
AG> В 4 раз накренился 1 из серваков...пока на плову..но.
AG> Вопрос - какова вероятность что дохнет контроллер
AG> 00:10.0 Unknown mass storage controller: Promise Technology, Inc. 20265
AG> (rev 02)
AG> И будет ли под мастером работать a-142 sil 0680 ata/133?
AG> Просто чтобыф срчоно поднять другой сервер свободного железа не
AG> оказалось по закону подлости
AG> hde: dma_timer_expiry: dma status == 0x21
AG> hde: error waiting for DMA
AG> hde: dma timeout retry: status=0x50 { DriveReady SeekComplete }
похожее было, когда перестало хватать питания для всех винтов...
Мощности БП достаточно или на пределе?
-
Regards, Alexander
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер
2006-07-11 9:36 ` Alexander Volkov
@ 2006-07-11 9:38 ` Anton Gorlov
2006-07-11 12:51 ` Anton Gorlov
1 sibling, 0 replies; 9+ messages in thread
From: Anton Gorlov @ 2006-07-11 9:38 UTC (permalink / raw)
To: hardware
Alexander Volkov пишет:
> похожее было, когда перестало хватать питания для всех винтов...
> Мощности БП достаточно или на пределе?
Хватает..там на 400 ват БП..к тмоу же -комп год с лишним работал без
проблем..а вот в последние 2 месяца началось.. БП\КОНДЁРЫ првоерил в 1
очередь.
--
np: silence ( Winamp ушел в Партизаны ;-)
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер
2006-07-11 9:26 [Hardware] дохнет контроллер Anton Gorlov
2006-07-11 9:36 ` Alexander Volkov
@ 2006-07-11 10:09 ` Sergey Vlasov
2006-07-11 10:46 ` Anton Gorlov
2006-07-12 10:21 ` Michael Shigorin
2 siblings, 1 reply; 9+ messages in thread
From: Sergey Vlasov @ 2006-07-11 10:09 UTC (permalink / raw)
To: hardware
[-- Attachment #1: Type: text/plain, Size: 732 bytes --]
On Tue, Jul 11, 2006 at 01:26:13PM +0400, Anton Gorlov wrote:
> В 4 раз накренился 1 из серваков...пока на плову..но.
> Вопрос - какова вероятность что дохнет контроллер
> 00:10.0 Unknown mass storage controller: Promise Technology, Inc. 20265
> (rev 02)
http://www.google.com/search?q=site:lkml.org+PDC202XX:Primary+channel+reset
показывает довольно много похожих ситуаций, причины которых зачастую не
совсем понятны.
Кто-то заметил, что большая часть проблем возникает с дисками,
поддерживающими UDMA133 - возможно, если ограничить скорость хотя бы до
UDMA100 (hdparm -X69), ситуация улучшится.
> И будет ли под мастером работать a-142 sil 0680 ata/133?
Должен (драйвер siimage, хотя там он встроен в ядро).
[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер
2006-07-11 10:09 ` [Hardware] " Sergey Vlasov
@ 2006-07-11 10:46 ` Anton Gorlov
0 siblings, 0 replies; 9+ messages in thread
From: Anton Gorlov @ 2006-07-11 10:46 UTC (permalink / raw)
To: hardware
Sergey Vlasov пишет:
> http://www.google.com/search?q=site:lkml.org+PDC202XX:Primary+channel+reset
> показывает довольно много похожих ситуаций, причины которых зачастую не
> совсем понятны.
угу..я первым делом полез в гугл.. :-(
> Кто-то заметил, что большая часть проблем возникает с дисками,
> поддерживающими UDMA133 - возможно, если ограничить скорость хотя бы до
> UDMA100 (hdparm -X69), ситуация улучшится.
Хм.. глюканули как раз те винты..которые про удма133 и слухом не знают.
Самсунги. 2 новых самсунга на другом канале -как-то просто отсохли..
причём никто про это мне не сказал в логах..рейд продолжал полёт пока в
очередой раз ночью не рубанули свет.. бесперебойник не успел загасить
машинку.
--
np: silence ( Winamp ушел в Партизаны ;-)
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер
2006-07-11 9:36 ` Alexander Volkov
2006-07-11 9:38 ` Anton Gorlov
@ 2006-07-11 12:51 ` Anton Gorlov
2006-07-11 13:45 ` Sergey Vlasov
1 sibling, 1 reply; 9+ messages in thread
From: Anton Gorlov @ 2006-07-11 12:51 UTC (permalink / raw)
To: hardware
Alexander Volkov пишет:
> AG> И будет ли под мастером работать a-142 sil 0680 ata/133?
Интересно -а с чего бы контроллер считает себя главнее чем,тот что стоит
на мастере..и диски на эотм контроллере получились..как /dev/hda
/dev/hdc? (кноппикс)?
--
np: silence ( Winamp ушел в Партизаны ;-)
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер
2006-07-11 12:51 ` Anton Gorlov
@ 2006-07-11 13:45 ` Sergey Vlasov
2006-07-12 10:25 ` [Hardware] [faq] " Michael Shigorin
0 siblings, 1 reply; 9+ messages in thread
From: Sergey Vlasov @ 2006-07-11 13:45 UTC (permalink / raw)
To: hardware
[-- Attachment #1: Type: text/plain, Size: 1948 bytes --]
On Tue, Jul 11, 2006 at 04:51:44PM +0400, Anton Gorlov wrote:
> Alexander Volkov пишет:
>
> > AG> И будет ли под мастером работать a-142 sil 0680 ata/133?
>
> Интересно -а с чего бы контроллер считает себя главнее чем,тот что стоит
> на мастере..и диски на эотм контроллере получились..как /dev/hda
> /dev/hdc? (кноппикс)?
На это влияет:
1) Порядок загрузки драйверов, если они в модулях.
2) Порядок PCI-устройств - определяется аппаратно; находятся ли при этом
вставленные в PCI платы до или после устройств на материнской плате -
в общем случае неизвестно.
3) Опция CONFIG_BLK_DEV_OFFBOARD в конфигурации ядра - у нас она
включена. При включении этой опции IDE-контроллеры, считающиеся
находящимися на дополнительных платах, могут занимать интерфейсы ide0
и ide1 (которым соответствуют имена устройств hda..hdd); при
выключенной опции им назначаются номера, начиная с ide2 (хотя, если
всё до ide9 окажется занятым, ide0 и ide1 всё-таки могут быть
использованы). Впрочем, на самом деле ядро не может определить, где
именно находится чип контроллера - на материнской плате или в
отдельном устройстве - этот флаг просто привязан к PCI ID и отражает
"обычное" использование контроллеров на момент написания драйверов. В
частности, контроллеры, поддерживаемые драйвером siimage, считаются
набортными, а те, которые поддерживаются драйвером pdc202xx_new -
внешними, но при включении опции CONFIG_BLK_DEV_OFFBOARD они в этом
смысле уже не отличаются друг от друга.
Имеется довольно ограниченное количество контроллеров, которые
считаются внешними даже при включении CONFIG_BLK_DEV_OFFBOARD:
- AEC6260R (модуль aec62xx);
- HPT343, HPT345 (модуль hpt34x, но в нём это определяется по
состоянию контроллера при загрузке драйвера);
- ServerWorks CSB6 (модуль serverworks, тоже определяется
динамически).
[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 9+ messages in thread
* Re: [Hardware] дохнет контроллер
2006-07-11 9:26 [Hardware] дохнет контроллер Anton Gorlov
2006-07-11 9:36 ` Alexander Volkov
2006-07-11 10:09 ` [Hardware] " Sergey Vlasov
@ 2006-07-12 10:21 ` Michael Shigorin
2 siblings, 0 replies; 9+ messages in thread
From: Michael Shigorin @ 2006-07-12 10:21 UTC (permalink / raw)
To: hardware
On Tue, Jul 11, 2006 at 01:26:13PM +0400, Anton Gorlov wrote:
> И будет ли под мастером работать a-142 sil 0680 ata/133?
Да.
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 9+ messages in thread
* [Hardware] [faq] Re: дохнет контроллер
2006-07-11 13:45 ` Sergey Vlasov
@ 2006-07-12 10:25 ` Michael Shigorin
0 siblings, 0 replies; 9+ messages in thread
From: Michael Shigorin @ 2006-07-12 10:25 UTC (permalink / raw)
To: hardware
On Tue, Jul 11, 2006 at 05:45:55PM +0400, Sergey Vlasov wrote:
> > Интересно -а с чего бы контроллер считает себя главнее
> > чем,тот что стоит на мастере..и диски на эотм контроллере
> > получились..как /dev/hda /dev/hdc? (кноппикс)?
Кажется, были какие-то опции загрузки на эту тему,
но сходу не помню, где могли быть -- посмотрел, не вижу;
возможно, уже заносилось в faq.
> На это влияет:
=> http://faq.altlinux.ru/index.php?action=single&nf=1&qid=855
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 9+ messages in thread
end of thread, other threads:[~2006-07-12 10:25 UTC | newest]
Thread overview: 9+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2006-07-11 9:26 [Hardware] дохнет контроллер Anton Gorlov
2006-07-11 9:36 ` Alexander Volkov
2006-07-11 9:38 ` Anton Gorlov
2006-07-11 12:51 ` Anton Gorlov
2006-07-11 13:45 ` Sergey Vlasov
2006-07-12 10:25 ` [Hardware] [faq] " Michael Shigorin
2006-07-11 10:09 ` [Hardware] " Sergey Vlasov
2006-07-11 10:46 ` Anton Gorlov
2006-07-12 10:21 ` Michael Shigorin
ALT Linux hardware support
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \
hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org
public-inbox-index hardware
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.hardware
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git