ALT Linux hardware support
 help / color / mirror / Atom feed
* [Hardware] Странное поведение hdd
@ 2007-03-05 22:41 Alexei V. Mezin
  2007-03-06  9:09 ` Gennadiy Redko
  2007-03-07 17:43 ` Michael Shigorin
  0 siblings, 2 replies; 6+ messages in thread
From: Alexei V. Mezin @ 2007-03-05 22:41 UTC (permalink / raw)
  To: hardware


Имеется диск
Device Model:     ST3320620AS

то есть Seagete SATA 320Gb, новый, куплен в январе. Вроде как работает, 
с smartctl ничего подозрительного не выдает (или я не понимаю содержимое 
отчетов). Но! С самого начала эксплуатации винт периодически издает 
негромкие, но отчетливо слышимые постукивания. Звук раздается по 10-30 
секунд каждые 5-10 минут. Думал, что это какая-нить термокалибровка. Но 
на остальный дисках (тоже Сигейт, но более старые) ничего подобного не 
наблюдается, правда все они загнаны в тихий режим и их не слышно вообще 
никогда. На скорость такое поведение вроде бы не сказывалось, и от 
нагрузки на винт не менялось.

А вот сегодня заметил странность. На этом диске у меня архив с видео. 
Скопировал сегодня туда очередной файл (большой, 600Мб). Копирование 
сопровождалось этим странным щелкающим звуком :(. Для порядку тут же 
прочитал этот файл в /dev/null, звук есть, скорость чтения около 33Мб/с. 
Прочитал в /dev/null несколько тоже больших файлов, но записанных на 
диск ранее. Читаются без стуков и на скорости 55Мб/с. Повторил несколько 
раз, воспроизводится надежно. Очень подозрительно! Винт с дефектом?

Чем можно проверить линейную скорость чтения со всего диске (напрямую, 
минуя ФС) и построить график? Один раз нашел какую-то софтину, которая 
это делала, но никак не могу вспомнить, что это было.



На всякий случай:

[root@threebears films]# smartctl -a -d ata /dev/sda
smartctl version 5.36 [i586-alt-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     ST3320620AS
Serial Number:    9QF0E8EY
Firmware Version: 3.AAE
User Capacity:    320 072 933 376 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Tue Mar  6 01:40:22 2007 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                         was completed without error.
                                         Auto Offline Data Collection: 
Enabled.
Self-test execution status:      ( 243) Self-test routine in progress...
                                         30% of test remaining.
Total time to complete Offline
data collection:                 ( 430) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                         Auto Offline data collection 
on/off support.
                                         Suspend Offline collection upon new
                                         command.
                                         Offline surface scan supported.
                                         Self-test supported.
                                         No Conveyance Self-test supported.
                                         Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                         power-saving mode.
                                         Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                         General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 115) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE 
UPDATED  WHEN_FAILED RAW_VALUE
   1 Raw_Read_Error_Rate     0x000f   115   096   006    Pre-fail 
Always       -       86283458
   3 Spin_Up_Time            0x0003   096   096   000    Pre-fail 
Always       -       0
   4 Start_Stop_Count        0x0032   100   100   020    Old_age 
Always       -       63
   5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail 
Always       -       0
   7 Seek_Error_Rate         0x000f   069   060   030    Pre-fail 
Always       -       7404120
   9 Power_On_Hours          0x0032   100   100   000    Old_age 
Always       -       382
  10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail 
Always       -       0
  12 Power_Cycle_Count       0x0032   100   100   020    Old_age 
Always       -       73
187 Unknown_Attribute       0x0032   100   100   000    Old_age   Always 
       -       0
189 Unknown_Attribute       0x003a   100   100   000    Old_age   Always 
       -       0
190 Temperature_Celsius     0x0022   065   052   045    Old_age   Always 
       -       589496355
194 Temperature_Celsius     0x0022   035   048   000    Old_age   Always 
       -       35 (Lifetime Min/Max 0/22)
195 Hardware_ECC_Recovered  0x001a   077   060   000    Old_age   Always 
       -       136639362
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always 
       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age 
Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always 
       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age 
Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always 
       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining 
LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Interrupted (host reset)      90%        43 
      -
# 2  Short offline       Self-test routine in progress 30%       382 
      -

SMART Selective self-test log data structure revision number 1
  SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
     1        0        0  Not_testing
     2        0        0  Not_testing
     3        0        0  Not_testing
     4        0        0  Not_testing
     5        0        0  Not_testing
Selective self-test flags (0x0):
   After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Hardware] Странное поведение hdd
  2007-03-05 22:41 [Hardware] Странное поведение hdd Alexei V. Mezin
@ 2007-03-06  9:09 ` Gennadiy Redko
  2007-03-06  9:37   ` Alexei V. Mezin
  2007-03-07 17:43 ` Michael Shigorin
  1 sibling, 1 reply; 6+ messages in thread
From: Gennadiy Redko @ 2007-03-06  9:09 UTC (permalink / raw)
  To: hardware

Alexei V. Mezin пишет:
> Имеется диск
> Device Model:     ST3320620AS
> 
> то есть Seagete SATA 320Gb, новый, куплен в январе. Вроде как работает, 
> с smartctl ничего подозрительного не выдает (или я не понимаю содержимое 
> отчетов). Но! С самого начала эксплуатации винт периодически издает 
> негромкие, но отчетливо слышимые постукивания. Звук раздается по 10-30 
> секунд каждые 5-10 минут. Думал, что это какая-нить термокалибровка. Но 
А диск Вы купили как новый?
"Стук" - результат замены дефектных секторов в середине диска
резервными, находящимися на краю дисковой поверхности.
Сделать это можно, скажем, с помощью этой программы:
http://www.seagate.com/www/en-us/support/downloads/seatools



^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Hardware] Странное поведение hdd
  2007-03-06  9:09 ` Gennadiy Redko
@ 2007-03-06  9:37   ` Alexei V. Mezin
  2007-03-07 18:22     ` Michael Shigorin
  0 siblings, 1 reply; 6+ messages in thread
From: Alexei V. Mezin @ 2007-03-06  9:37 UTC (permalink / raw)
  To: hardware

Gennadiy Redko пишет:
> А диск Вы купили как новый?
Да, новый.

> "Стук" - результат замены дефектных секторов в середине диска
> резервными, находящимися на краю дисковой поверхности.
> Сделать это можно, скажем, с помощью этой программы:
> http://www.seagate.com/www/en-us/support/downloads/seatools
Погоняю утилиту. Если и правда такая засада, придется бодаться с
гарантийкой :(

-- 
Alexei V. Mezin

NT-MDT Co.
Phone: 095-913-5736
Fax: 095-913-573
Email: mezin@ntmdt.ru
URL: http://www.ntmdt.com



^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Hardware] Странное поведение hdd
  2007-03-05 22:41 [Hardware] Странное поведение hdd Alexei V. Mezin
  2007-03-06  9:09 ` Gennadiy Redko
@ 2007-03-07 17:43 ` Michael Shigorin
  2007-03-08 13:22   ` Alexei V. Mezin
  1 sibling, 1 reply; 6+ messages in thread
From: Michael Shigorin @ 2007-03-07 17:43 UTC (permalink / raw)
  To: hardware

On Tue, Mar 06, 2007 at 01:41:30AM +0300, Alexei V. Mezin wrote:
> то есть Seagete SATA 320Gb, новый, куплен в январе. Вроде как
> работает, с smartctl ничего подозрительного не выдает (или я не
> понимаю содержимое отчетов). Но! С самого начала эксплуатации
> винт периодически издает негромкие, но отчетливо слышимые
> постукивания. Звук раздается по 10-30 секунд каждые 5-10 минут.

На ST3200822A (IDE 200G) -- то же.  Живёт то ли больше года,
то ли уже больше двух; до лета -- с приличной нагрузкой (ftp).

> А вот сегодня заметил странность. На этом диске у меня архив с
> видео.  Скопировал сегодня туда очередной файл (большой,
> 600Мб). Копирование сопровождалось этим странным щелкающим
> звуком :(. Для порядку тут же прочитал этот файл в /dev/null,
> звук есть, скорость чтения около 33Мб/с.  Прочитал в /dev/null
> несколько тоже больших файлов, но записанных на диск ранее.
> Читаются без стуков и на скорости 55Мб/с. Повторил несколько
> раз, воспроизводится надежно. Очень подозрительно! Винт с
> дефектом?

Возможно, уже ремапит, но в SMART об этом ещё молчит.
Это сейчас так модно и по гарантии могут не принять.

Если 7200.8 -- я бы понёс менять, на них много нареканий
(предположительно из-за тонкой верхней крышки, поймали на
SATA 400G и есть подозрения на одном из 2x200G ST3200827AS,
на которые тот поменяли -- это 7200.7, что ли?).

>    1 Raw_Read_Error_Rate     0x000f   115   096   006    Pre-fail Always       -       86283458
>    5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail Always       -       0
>    7 Seek_Error_Rate         0x000f   069   060   030    Pre-fail Always       -       7404120
> 195 Hardware_ECC_Recovered  0x001a   077   060   000    Old_age   Always       -       136639362
> 198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
> 199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

> SMART Error Log Version: 1
> No Errors Logged

У болтающейся двухсотки сейчас так:

  1 Raw_Read_Error_Rate     0x000f   119   089   006    Pre-fail  Always       -       220318249
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   089   060   030    Pre-fail  Always       -       891289906
195 Hardware_ECC_Recovered  0x001a   062   055   000    Old_age   Always       -       22698605
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   193   000    Old_age   Always       -       67

ATA Error Count: 57 (device log contains only the most recent five errors)
[...]
Error 57 occurred at disk power-on lifetime: 2087 hours (86 days + 23 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 00 42 f1 c8 e0  Error: ICRC, ABRT at LBA = 0x00c8f142 = 13168962

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 08 3b f1 c8 e0 00      21:29:49.187  READ DMA EXT
  b0 d0 01 00 4f c2 00 02      21:26:05.399  SMART READ DATA
  b0 da 00 00 4f c2 00 00      21:26:05.399  SMART RETURN STATUS
  25 00 08 fb 89 a4 e0 00      21:26:05.394  READ DMA EXT
  25 00 10 ab 89 a4 e0 00      21:26:01.620  READ DMA EXT
[...]

> # 1  Extended offline    Interrupted (host reset)      90%        43       -
> # 2  Short offline       Self-test routine in progress 30%       382       -

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      2099         -
# 2  Conveyance offline  Completed without error       00%      2089         -
# 3  Short offline       Completed without error       00%      2089         -

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Hardware] Странное поведение hdd
  2007-03-06  9:37   ` Alexei V. Mezin
@ 2007-03-07 18:22     ` Michael Shigorin
  0 siblings, 0 replies; 6+ messages in thread
From: Michael Shigorin @ 2007-03-07 18:22 UTC (permalink / raw)
  To: hardware

On Tue, Mar 06, 2007 at 12:37:24PM +0300, Alexei V. Mezin wrote:
> Погоняю утилиту. Если и правда такая засада, придется бодаться
> с гарантийкой :(

У нас сейчас "в моде" Hitachi и WD.  Но 80Gb SATA (на всякий
случай) всё равно лучше избегать, при мне был один прецедент 
с WD 80, который хотя бы в смарт выставил предсмертные
известия... а потом sr@ изложил, что на этих обкаточных
линейках (как для SATA) известно множество проблем.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [Hardware] Странное поведение hdd
  2007-03-07 17:43 ` Michael Shigorin
@ 2007-03-08 13:22   ` Alexei V. Mezin
  0 siblings, 0 replies; 6+ messages in thread
From: Alexei V. Mezin @ 2007-03-08 13:22 UTC (permalink / raw)
  To: hardware

Michael Shigorin пишет:

> На ST3200822A (IDE 200G) -- то же.  Живёт то ли больше года,
> то ли уже больше двух; до лета -- с приличной нагрузкой (ftp).
Точно такой тоже есть, постукивает. Но больше ничем не проявляется.
Может это у них родовой признак? Вот 120Гб никаких звуков не издает,
хотя и самый старый из всех.

Погонял тесты утилитой с сайта Сигейта. Ничего подозрительного не
обнаружено, и самое занятное, что во время полного (длинного) теста
обоих винтов, который занял несколько часов, никаких звуков не было.

Думаю, что "работает -- не трожь!". Критических данных там все равно
нету (незабэкапленых), а рабочее окружение и медиа-архивчик можно
восстановить, если вдруг чего.



^ permalink raw reply	[flat|nested] 6+ messages in thread

end of thread, other threads:[~2007-03-08 13:22 UTC | newest]

Thread overview: 6+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2007-03-05 22:41 [Hardware] Странное поведение hdd Alexei V. Mezin
2007-03-06  9:09 ` Gennadiy Redko
2007-03-06  9:37   ` Alexei V. Mezin
2007-03-07 18:22     ` Michael Shigorin
2007-03-07 17:43 ` Michael Shigorin
2007-03-08 13:22   ` Alexei V. Mezin

ALT Linux hardware support

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \
		hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org
	public-inbox-index hardware

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.hardware


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git