ALT Linux hardware support
 help / color / mirror / Atom feed
* [Hardware] дохнет контроллер
@ 2006-07-11  9:26 Anton Gorlov
  2006-07-11  9:36 ` Alexander Volkov
                   ` (2 more replies)
  0 siblings, 3 replies; 9+ messages in thread
From: Anton Gorlov @ 2006-07-11  9:26 UTC (permalink / raw)
  To: hardware

В 4 раз накренился 1 из серваков...пока на плову..но.
Вопрос - какова вероятность что дохнет контроллер
00:10.0 Unknown mass storage controller: Promise Technology, Inc. 20265 
(rev 02)

И будет ли под мастером работать a-142 sil 0680 ata/133?
Просто  чтобыф срчоно поднять другой сервер свободного железа не 
оказалось по закону подлости

hde: dma_timer_expiry: dma status == 0x21
hde: error waiting for DMA
hde: dma timeout retry: status=0x50 { DriveReady SeekComplete }

hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error }
hde: read_intr: error=0x04 { DriveStatusError }
hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error }
hde: read_intr: error=0x04 { DriveStatusError }
hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error }
hde: read_intr: error=0x04 { DriveStatusError }
hde: read_intr: status=0x59 { DriveReady SeekComplete DataRequest Error }
hde: read_intr: error=0x04 { DriveStatusError }
PDC202XX: Primary channel reset.
PDC202XX: Secondary channel reset.
ide2: reset: master: error (0x00?)
blk: queue c0304288, I/O limit 4095Mb (mask 0xffffffff)
hde: dma_timer_expiry: dma status == 0x21
hde: error waiting for DMA
hde: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }

hde: dma_timer_expiry: dma status == 0x21
hde: error waiting for DMA
hde: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }

hde: dma_timer_expiry: dma status == 0x21
hde: error waiting for DMA
hde: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }

hdg: dma_timer_expiry: dma status == 0x21
hdg: error waiting for DMA
hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }

blk: queue c03046dc, I/O limit 4095Mb (mask 0xffffffff)
hdg: dma_timer_expiry: dma status == 0x21
hdg: error waiting for DMA
hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }

hdg: dma_timer_expiry: dma status == 0x21
hdg: error waiting for DMA
hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }

hdg: dma_timer_expiry: dma status == 0x21
hdg: error waiting for DMA
hdg: dma timeout retry: status=0x58 { DriveReady SeekComplete DataRequest }

hdg: irq timeout: status=0xd0 { Busy }

PDC202XX: Secondary channel reset.
PDC202XX: Primary channel reset.
ide3: reset: master: error (0x00?)


Смарт.
smartctl version 5.30 Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     SAMSUNG SP1604N
Serial Number:    S013J20XC94650
Firmware Version: TM100-30
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Tue Jul 11 12:23:18 2006 MSD
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity was
					never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine 
completed
					without error or no self-test has ever
					been run.
Total time to complete Offline
data collection: 		 (6000) seconds.
Offline data collection
capabilities: 			 (0x1b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					No Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					No General Purpose Logging support.
Short self-test routine
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 100) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE 
UPDATED  WHEN_FAILED RAW_VALUE
   1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail 
Always       -       0
   3 Spin_Up_Time            0x0007   100   100   025    Pre-fail 
Always       -       2048
   4 Start_Stop_Count        0x0032   100   100   000    Old_age 
Always       -       59
   5 Reallocated_Sector_Ct   0x0033   100   100   011    Pre-fail 
Always       -       0
   7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail 
Always       -       0
   8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail 
Offline      -       0
   9 Power_On_Half_Minutes   0x0032   099   099   000    Old_age 
Always       -       6696h+25m
  10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail 
Always       -       0
  11 Calibration_Retry_Count 0x0012   100   100   000    Old_age 
Always       -       0
  12 Power_Cycle_Count       0x0032   100   100   000    Old_age 
Always       -       44
194 Temperature_Celsius     0x0022   151   124   000    Old_age   Always 
       -       29
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always 
       -       81107
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always 
       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always 
       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age 
Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always 
       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   051    Old_age   Always 
       -       0
201 Soft_Read_Error_Rate    0x000a   100   100   051    Old_age   Always 
       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]







-- 
   np: silence ( Winamp ушел в Партизаны ;-)


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Hardware] дохнет контроллер
  2006-07-11  9:26 [Hardware] дохнет контроллер Anton Gorlov
@ 2006-07-11  9:36 ` Alexander Volkov
  2006-07-11  9:38   ` Anton Gorlov
  2006-07-11 12:51   ` Anton Gorlov
  2006-07-11 10:09 ` [Hardware] " Sergey Vlasov
  2006-07-12 10:21 ` Michael Shigorin
  2 siblings, 2 replies; 9+ messages in thread
From: Alexander Volkov @ 2006-07-11  9:36 UTC (permalink / raw)
  To: hardware

On 2006-07-11 13:26:13 +0400, Anton Gorlov wrote:
AG> В 4 раз накренился 1 из серваков...пока на плову..но.
AG> Вопрос - какова вероятность что дохнет контроллер
AG> 00:10.0 Unknown mass storage controller: Promise Technology, Inc. 20265 
AG> (rev 02)

AG> И будет ли под мастером работать a-142 sil 0680 ata/133?
AG> Просто  чтобыф срчоно поднять другой сервер свободного железа не 
AG> оказалось по закону подлости

AG> hde: dma_timer_expiry: dma status == 0x21
AG> hde: error waiting for DMA
AG> hde: dma timeout retry: status=0x50 { DriveReady SeekComplete }

похожее было, когда перестало хватать питания для всех винтов...
Мощности БП достаточно или на пределе?

-
 Regards, Alexander



^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Hardware] дохнет контроллер
  2006-07-11  9:36 ` Alexander Volkov
@ 2006-07-11  9:38   ` Anton Gorlov
  2006-07-11 12:51   ` Anton Gorlov
  1 sibling, 0 replies; 9+ messages in thread
From: Anton Gorlov @ 2006-07-11  9:38 UTC (permalink / raw)
  To: hardware

Alexander Volkov пишет:

> похожее было, когда перестало хватать питания для всех винтов...
> Мощности БП достаточно или на пределе?

Хватает..там на 400 ват БП..к тмоу же -комп год с лишним работал без 
проблем..а вот в последние 2 месяца началось.. БП\КОНДЁРЫ првоерил в 1 
очередь.

-- 
   np: silence ( Winamp ушел в Партизаны ;-)


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Hardware] дохнет контроллер
  2006-07-11  9:26 [Hardware] дохнет контроллер Anton Gorlov
  2006-07-11  9:36 ` Alexander Volkov
@ 2006-07-11 10:09 ` Sergey Vlasov
  2006-07-11 10:46   ` Anton Gorlov
  2006-07-12 10:21 ` Michael Shigorin
  2 siblings, 1 reply; 9+ messages in thread
From: Sergey Vlasov @ 2006-07-11 10:09 UTC (permalink / raw)
  To: hardware

[-- Attachment #1: Type: text/plain, Size: 732 bytes --]

On Tue, Jul 11, 2006 at 01:26:13PM +0400, Anton Gorlov wrote:
> В 4 раз накренился 1 из серваков...пока на плову..но.
> Вопрос - какова вероятность что дохнет контроллер
> 00:10.0 Unknown mass storage controller: Promise Technology, Inc. 20265 
> (rev 02)

http://www.google.com/search?q=site:lkml.org+PDC202XX:Primary+channel+reset
показывает довольно много похожих ситуаций, причины которых зачастую не
совсем понятны.

Кто-то заметил, что большая часть проблем возникает с дисками,
поддерживающими UDMA133 - возможно, если ограничить скорость хотя бы до
UDMA100 (hdparm -X69), ситуация улучшится.

> И будет ли под мастером работать a-142 sil 0680 ata/133?

Должен (драйвер siimage, хотя там он встроен в ядро).

[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Hardware] дохнет контроллер
  2006-07-11 10:09 ` [Hardware] " Sergey Vlasov
@ 2006-07-11 10:46   ` Anton Gorlov
  0 siblings, 0 replies; 9+ messages in thread
From: Anton Gorlov @ 2006-07-11 10:46 UTC (permalink / raw)
  To: hardware

Sergey Vlasov пишет:

> http://www.google.com/search?q=site:lkml.org+PDC202XX:Primary+channel+reset
> показывает довольно много похожих ситуаций, причины которых зачастую не
> совсем понятны.
угу..я первым делом полез в гугл..  :-(

> Кто-то заметил, что большая часть проблем возникает с дисками,
> поддерживающими UDMA133 - возможно, если ограничить скорость хотя бы до
> UDMA100 (hdparm -X69), ситуация улучшится.

Хм.. глюканули как раз те винты..которые про удма133 и слухом не знают. 
Самсунги. 2 новых самсунга на другом канале -как-то просто отсохли.. 
причём никто про это мне не сказал в логах..рейд продолжал полёт пока в 
очередой раз ночью не рубанули свет.. бесперебойник не успел загасить 
машинку.

-- 
   np: silence ( Winamp ушел в Партизаны ;-)


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Hardware] дохнет контроллер
  2006-07-11  9:36 ` Alexander Volkov
  2006-07-11  9:38   ` Anton Gorlov
@ 2006-07-11 12:51   ` Anton Gorlov
  2006-07-11 13:45     ` Sergey Vlasov
  1 sibling, 1 reply; 9+ messages in thread
From: Anton Gorlov @ 2006-07-11 12:51 UTC (permalink / raw)
  To: hardware

Alexander Volkov пишет:

> AG> И будет ли под мастером работать a-142 sil 0680 ata/133?

Интересно -а с чего бы контроллер считает себя главнее чем,тот что стоит 
на мастере..и диски на эотм контроллере получились..как /dev/hda 
/dev/hdc? (кноппикс)?

-- 
   np: silence ( Winamp ушел в Партизаны ;-)


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Hardware] дохнет контроллер
  2006-07-11 12:51   ` Anton Gorlov
@ 2006-07-11 13:45     ` Sergey Vlasov
  2006-07-12 10:25       ` [Hardware] [faq] " Michael Shigorin
  0 siblings, 1 reply; 9+ messages in thread
From: Sergey Vlasov @ 2006-07-11 13:45 UTC (permalink / raw)
  To: hardware

[-- Attachment #1: Type: text/plain, Size: 1948 bytes --]

On Tue, Jul 11, 2006 at 04:51:44PM +0400, Anton Gorlov wrote:
> Alexander Volkov пишет:
> 
> > AG> И будет ли под мастером работать a-142 sil 0680 ata/133?
> 
> Интересно -а с чего бы контроллер считает себя главнее чем,тот что стоит 
> на мастере..и диски на эотм контроллере получились..как /dev/hda 
> /dev/hdc? (кноппикс)?

На это влияет:

 1) Порядок загрузки драйверов, если они в модулях.

 2) Порядок PCI-устройств - определяется аппаратно; находятся ли при этом
    вставленные в PCI платы до или после устройств на материнской плате -
    в общем случае неизвестно.

 3) Опция CONFIG_BLK_DEV_OFFBOARD в конфигурации ядра - у нас она
    включена.  При включении этой опции IDE-контроллеры, считающиеся
    находящимися на дополнительных платах, могут занимать интерфейсы ide0
    и ide1 (которым соответствуют имена устройств hda..hdd); при
    выключенной опции им назначаются номера, начиная с ide2 (хотя, если
    всё до ide9 окажется занятым, ide0 и ide1 всё-таки могут быть
    использованы).  Впрочем, на самом деле ядро не может определить, где
    именно находится чип контроллера - на материнской плате или в
    отдельном устройстве - этот флаг просто привязан к PCI ID и отражает
    "обычное" использование контроллеров на момент написания драйверов.  В
    частности, контроллеры, поддерживаемые драйвером siimage, считаются
    набортными, а те, которые поддерживаются драйвером pdc202xx_new -
    внешними, но при включении опции CONFIG_BLK_DEV_OFFBOARD они в этом
    смысле уже не отличаются друг от друга.

    Имеется довольно ограниченное количество контроллеров, которые
    считаются внешними даже при включении CONFIG_BLK_DEV_OFFBOARD:

     - AEC6260R (модуль aec62xx);
     - HPT343, HPT345 (модуль hpt34x, но в нём это определяется по
       состоянию контроллера при загрузке драйвера);
     - ServerWorks CSB6 (модуль serverworks, тоже определяется
       динамически).

[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Hardware] дохнет контроллер
  2006-07-11  9:26 [Hardware] дохнет контроллер Anton Gorlov
  2006-07-11  9:36 ` Alexander Volkov
  2006-07-11 10:09 ` [Hardware] " Sergey Vlasov
@ 2006-07-12 10:21 ` Michael Shigorin
  2 siblings, 0 replies; 9+ messages in thread
From: Michael Shigorin @ 2006-07-12 10:21 UTC (permalink / raw)
  To: hardware

On Tue, Jul 11, 2006 at 01:26:13PM +0400, Anton Gorlov wrote:
> И будет ли под мастером работать a-142 sil 0680 ata/133?

Да.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 9+ messages in thread

* [Hardware] [faq] Re:  дохнет контроллер
  2006-07-11 13:45     ` Sergey Vlasov
@ 2006-07-12 10:25       ` Michael Shigorin
  0 siblings, 0 replies; 9+ messages in thread
From: Michael Shigorin @ 2006-07-12 10:25 UTC (permalink / raw)
  To: hardware

On Tue, Jul 11, 2006 at 05:45:55PM +0400, Sergey Vlasov wrote:
> > Интересно -а с чего бы контроллер считает себя главнее
> > чем,тот что стоит на мастере..и диски на эотм контроллере
> > получились..как /dev/hda /dev/hdc? (кноппикс)?

Кажется, были какие-то опции загрузки на эту тему,
но сходу не помню, где могли быть -- посмотрел, не вижу;
возможно, уже заносилось в faq.

> На это влияет:

=> http://faq.altlinux.ru/index.php?action=single&nf=1&qid=855

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 9+ messages in thread

end of thread, other threads:[~2006-07-12 10:25 UTC | newest]

Thread overview: 9+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2006-07-11  9:26 [Hardware] дохнет контроллер Anton Gorlov
2006-07-11  9:36 ` Alexander Volkov
2006-07-11  9:38   ` Anton Gorlov
2006-07-11 12:51   ` Anton Gorlov
2006-07-11 13:45     ` Sergey Vlasov
2006-07-12 10:25       ` [Hardware] [faq] " Michael Shigorin
2006-07-11 10:09 ` [Hardware] " Sergey Vlasov
2006-07-11 10:46   ` Anton Gorlov
2006-07-12 10:21 ` Michael Shigorin

ALT Linux hardware support

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \
		hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org
	public-inbox-index hardware

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.hardware


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git