ALT Linux hardware support
 help / color / mirror / Atom feed
* [Hardware] Какое состояние винтов по SMART_у
@ 2006-11-03 16:55 Sharavin Sergey
  2006-11-03 20:15 ` Michael Shigorin
  0 siblings, 1 reply; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-03 16:55 UTC (permalink / raw)
  To: Hardware

[-- Attachment #1: Type: text/plain, Size: 246 bytes --]

Здравствуйте.
Подскажите пожалуста какое состояние у винтов ?
Не пора ли менять :)
Тесты в аттаче для каждого винта.
И на какой параметр надо обращать внимание, не на "RAW_VALUE"
И его значение, больше хуже или наоборот ?

С уважением.
Сергей.
 

[-- Attachment #2: 1.txt --]
[-- Type: text/plain, Size: 6171 bytes --]

 
# smartctl -a -d ata /dev/sda
smartctl version 5.36 [i586-alt-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar SE (Serial ATA) family
Device Model:     WDC WD2000JD-00HBB0
Serial Number:    WD-WMAL81563094
Firmware Version: 08.02D08
User Capacity:    200 049 647 616 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   6
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Fri Nov  3 22:48:43 2006 NOVT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84) Offline data collection activity
                                        was suspended by an interrupting command from host.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 (5785) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        No General Purpose Logging support.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  75) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   200   147   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   129   126   021    Pre-fail  Always       -       6050
  4 Start_Stop_Count        0x0032   099   099   040    Old_age   Always       -       1482
  5 Reallocated_Sector_Ct   0x0033   199   199   140    Pre-fail  Always       -       1
  7 Seek_Error_Rate         0x000b   200   200   051    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -       4852
 10 Spin_Retry_Count        0x0013   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0013   100   100   051    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1481
194 Temperature_Celsius     0x0022   111   094   000    Old_age   Always       -       39
196 Reallocated_Event_Count 0x0032   199   199   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0012   200   200   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0012   200   200   000    Old_age   Always       -       1
199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       31
200 Multi_Zone_Error_Rate   0x0009   200   199   051    Pre-fail  Offline      -       0

SMART Error Log Version: 1
ATA Error Count: 1
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 1 occurred at disk power-on lifetime: 3974 hours (165 days + 14 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 da 5a 3f e0  Error: UNC 8 sectors at LBA = 0x003f5ada = 4152026

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 08 da 5a 3f 14 00      00:01:01.550  READ DMA EXT
  25 00 08 da 5a 3b 14 00      00:01:01.550  READ DMA EXT
  25 00 08 da 5a 37 14 00      00:01:01.550  READ DMA EXT
  25 00 08 da 5a 33 14 00      00:01:01.550  READ DMA EXT
  25 00 08 da 5a 2f 14 00      00:01:01.550  READ DMA EXT

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%        43         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

[-- Attachment #3: 2.txt --]
[-- Type: text/plain, Size: 4745 bytes --]

 
# smartctl -a /dev/hda
smartctl version 5.36 [i586-alt-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.7 and 7200.7 Plus family
Device Model:     ST3120026A
Serial Number:    3JT1LGXF
Firmware Version: 3.06
User Capacity:    120 034 123 776 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   6
ATA Standard is:  ATA/ATAPI-6 T13 1410D revision 2
Local Time is:    Fri Nov  3 22:50:25 2006 NOVT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 ( 430) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        No General Purpose Logging support.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        (  85) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   065   058   006    Pre-fail  Always       -       217984869
  3 Spin_Up_Time            0x0003   098   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       32
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       3
  7 Seek_Error_Rate         0x000f   087   060   030    Pre-fail  Always       -       518881625
  9 Power_On_Hours          0x0032   091   091   000    Old_age   Always       -       8684
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   020    Old_age   Always       -       3799
194 Temperature_Celsius     0x0022   037   050   000    Old_age   Always       -       37
195 Hardware_ECC_Recovered  0x001a   065   057   000    Old_age   Always       -       217984869
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      8682         -
# 2  Short offline       Completed without error       00%      8682         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-03 16:55 [Hardware] Какое состояние винтов по SMART_у Sharavin Sergey
@ 2006-11-03 20:15 ` Michael Shigorin
  2006-11-04  6:16   ` Sharavin Sergey
                     ` (2 more replies)
  0 siblings, 3 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-03 20:15 UTC (permalink / raw)
  To: Hardware

On Fri, Nov 03, 2006 at 10:55:55PM +0600, Sharavin Sergey wrote:
> Подскажите пожалуста какое состояние у винтов ?
> Не пора ли менять :)

WD -- лучше подумать/подстраховать.

> # smartctl -a -d ata /dev/sda
> ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
>   1 Raw_Read_Error_Rate     0x000b   200   147   051    Pre-fail  Always       -       0
>   5 Reallocated_Sector_Ct   0x0033   199   199   140    Pre-fail  Always       -       1
>   7 Seek_Error_Rate         0x000b   200   200   051    Pre-fail  Always       -       0
> 196 Reallocated_Event_Count 0x0032   199   199   000    Old_age   Always       -       1
> 198 Offline_Uncorrectable   0x0012   200   200   000    Old_age   Always       -       1
> 199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       31
> 200 Multi_Zone_Error_Rate   0x0009   200   199   051    Pre-fail  Offline      -       0

Вот эти если прыгать начинают (хорошо smartd держать),
то мне уже не нравится.  "Чем ниже, тем хуже" (ср. WORST).

> SMART Error Log Version: 1
> Error 1 occurred at disk power-on lifetime: 3974 hours (165 days + 14 hours)
>   When the command that caused the error occurred, the device was active or idle.
> 
>   After command completion occurred, registers were:
>   ER ST SC SN CL CH DH
>   -- -- -- -- -- -- --
>   40 51 08 da 5a 3f e0  Error: UNC 8 sectors at LBA = 0x003f5ada = 4152026
> 
>   Commands leading to the command that caused the error were:
>   CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
>   -- -- -- -- -- -- -- --  ----------------  --------------------
>   25 00 08 da 5a 3f 14 00      00:01:01.550  READ DMA EXT
>   25 00 08 da 5a 3b 14 00      00:01:01.550  READ DMA EXT
>   25 00 08 da 5a 37 14 00      00:01:01.550  READ DMA EXT
>   25 00 08 da 5a 33 14 00      00:01:01.550  READ DMA EXT
>   25 00 08 da 5a 2f 14 00      00:01:01.550  READ DMA EXT

Ошибка одна, но уже не нулевая.  С учётом того, что нынешние
винты зачем-то клепают так, что они сперва высыпаться начинают
уже конкретно, а только тогда орут в SMART -- я бы не ждал
следующей...

> SMART Self-test log structure revision number 1
> Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
> # 1  Short offline       Completed without error       00%        43         -
> SMART Selective self-test log data structure revision number 1
>  SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
>     1        0        0  Not_testing
>     2        0        0  Not_testing
>     3        0        0  Not_testing
>     4        0        0  Not_testing
>     5        0        0  Not_testing

Это надо -t short или -t long запустить.

> # smartctl -a /dev/hda
>   1 Raw_Read_Error_Rate     0x000f   065   058   006    Pre-fail  Always       -       217984869
>   5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       3
>   7 Seek_Error_Rate         0x000f   087   060   030    Pre-fail  Always       -       518881625
> 195 Hardware_ECC_Recovered  0x001a   065   057   000    Old_age   Always       -       217984869
> 198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
> 199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
> 200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
> SMART Error Log Version: 1
> No Errors Logged
> # 1  Short offline       Completed without error       00%      8682         -
> # 2  Short offline       Completed without error       00%      8682         -

Этот будто живее.

Вообще зеркала, зеркала и ещё раз зеркала, один винт нынче 
-- это ждущий своего часа расходник.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-03 20:15 ` Michael Shigorin
@ 2006-11-04  6:16   ` Sharavin Sergey
  2006-11-04 16:38     ` Michael Shigorin
  2006-11-04 20:17   ` Vitaly Lipatov
  2006-11-21 18:19   ` Grigory Batalov
  2 siblings, 1 reply; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-04  6:16 UTC (permalink / raw)
  To: Hardware

В сообщении от 4 ноября 2006 02:15 Michael Shigorin написал(a):
> On Fri, Nov 03, 2006 at 10:55:55PM +0600, Sharavin Sergey wrote:
> > Подскажите пожалуста какое состояние у винтов ?
> > Не пора ли менять :)
>
> WD -- лучше подумать/подстраховать.
Большое Вам спасибо, Михаил.
Надеюсь месяца два протянет :)
А вообще то что посоветуете, какой фирмы брать ?


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-04  6:16   ` Sharavin Sergey
@ 2006-11-04 16:38     ` Michael Shigorin
  2006-11-04 23:48       ` Sharavin Sergey
  2006-11-13 10:44       ` ABATAPA
  0 siblings, 2 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-04 16:38 UTC (permalink / raw)
  To: Hardware

On Sat, Nov 04, 2006 at 12:16:59PM +0600, Sharavin Sergey wrote:
> > > Подскажите пожалуста какое состояние у винтов ?
> > > Не пора ли менять :)
> > WD -- лучше подумать/подстраховать.
> Большое Вам спасибо, Михаил.  Надеюсь месяца два протянет :)
> А вообще то что посоветуете, какой фирмы брать ?

У меня на сейчас сложилось неплохое мнение о WD и Hitachi
(и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-03 20:15 ` Michael Shigorin
  2006-11-04  6:16   ` Sharavin Sergey
@ 2006-11-04 20:17   ` Vitaly Lipatov
  2006-11-21 18:19   ` Grigory Batalov
  2 siblings, 0 replies; 17+ messages in thread
From: Vitaly Lipatov @ 2006-11-04 20:17 UTC (permalink / raw)
  To: Hardware

On Friday 03 November 2006 23:15, Michael Shigorin wrote:
...
> > 199 UDMA_CRC_Error_Count    0x000a   200   253   000   
> > Old_age   Always       -       31 200 Multi_Zone_Error_Rate 
> >  0x0009   200   199   051    Pre-fail  Offline      -      
> > 0
>
> Вот эти если прыгать начинают (хорошо smartd держать),
> то мне уже не нравится.  "Чем ниже, тем хуже" (ср. WORST).
Винт вот на сервере стоит уже года два: :)
195 Hardware_ECC_Recovered  0x000a   100   100   000    Old_age   
Always       -       528012484


-- 
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! WINE! LaTeX! LyX! http://freesource.info


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-04 16:38     ` Michael Shigorin
@ 2006-11-04 23:48       ` Sharavin Sergey
  2006-11-05 10:57         ` Michael Shigorin
  2006-11-13 10:44       ` ABATAPA
  1 sibling, 1 reply; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-04 23:48 UTC (permalink / raw)
  To: Hardware

В сообщении от 4 ноября 2006 22:38 Michael Shigorin написал(a):
> У меня на сейчас сложилось неплохое мнение о WD и Hitachi
> (и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).
Спасибо, то же думаю брать WD хотя как
раз винт этой фирмы и помирает после 2 лет эксплуатации :)

^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-04 23:48       ` Sharavin Sergey
@ 2006-11-05 10:57         ` Michael Shigorin
  0 siblings, 0 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-05 10:57 UTC (permalink / raw)
  To: Hardware

On Sun, Nov 05, 2006 at 05:48:00AM +0600, Sharavin Sergey wrote:
> > У меня на сейчас сложилось неплохое мнение о WD и Hitachi
> > (и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).
> Спасибо, то же думаю брать WD хотя как раз винт этой фирмы и
> помирает после 2 лет эксплуатации :)

Если жёсткой -- то приемлемо, хотя лучше "не сильно" и "после
трёх", соответственно.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-04 16:38     ` Michael Shigorin
  2006-11-04 23:48       ` Sharavin Sergey
@ 2006-11-13 10:44       ` ABATAPA
  2006-11-13 15:37         ` Michael Shigorin
  1 sibling, 1 reply; 17+ messages in thread
From: ABATAPA @ 2006-11-13 10:44 UTC (permalink / raw)
  To: Hardware

4 ноября 2006 19:38, Michael Shigorin написал:
> У меня на сейчас сложилось неплохое мнение о WD и Hitachi
> (и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).
А вот продавцы говорят, что отказов мало по Samsung.
Да и тихие они...
-- 
ABATAPA


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-13 10:44       ` ABATAPA
@ 2006-11-13 15:37         ` Michael Shigorin
  0 siblings, 0 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-13 15:37 UTC (permalink / raw)
  To: Hardware

On Mon, Nov 13, 2006 at 01:44:23PM +0300, ABATAPA wrote:
> > У меня на сейчас сложилось неплохое мнение о WD и Hitachi
> > (и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).
> А вот продавцы говорят, что отказов мало по Samsung.
> Да и тихие они...

Как-то пляшет, после ~80Gb вроде выровнялось после серии тихого
ужаса в р-не ~30Gb, после было вроде ровно, за прошлый год вроде
опять слышал неприятное.

Везде "вроде", поскольку зуб не дам -- сам как-то не покупаю их
и вокруг народ -- тоже.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-03 20:15 ` Michael Shigorin
  2006-11-04  6:16   ` Sharavin Sergey
  2006-11-04 20:17   ` Vitaly Lipatov
@ 2006-11-21 18:19   ` Grigory Batalov
  2006-11-22 14:03     ` Sharavin Sergey
  2 siblings, 1 reply; 17+ messages in thread
From: Grigory Batalov @ 2006-11-21 18:19 UTC (permalink / raw)
  To: hardware

On Fri, 3 Nov 2006 22:15:48 +0200
Michael Shigorin <mike@osdn.org.ua> wrote:

> > # smartctl -a -d ata /dev/sda
> > ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
> >   1 Raw_Read_Error_Rate     0x000b   200   147   051    Pre-fail  Always       -       0
> >   5 Reallocated_Sector_Ct   0x0033   199   199   140    Pre-fail  Always       -       1
> >   7 Seek_Error_Rate         0x000b   200   200   051    Pre-fail  Always       -       0
> > 196 Reallocated_Event_Count 0x0032   199   199   000    Old_age   Always       -       1
> > 198 Offline_Uncorrectable   0x0012   200   200   000    Old_age   Always       -       1
> > 199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       31
> > 200 Multi_Zone_Error_Rate   0x0009   200   199   051    Pre-fail  Offline      -       0
> 
> Вот эти если прыгать начинают (хорошо smartd держать),
> то мне уже не нравится.  "Чем ниже, тем хуже" (ср. WORST).

  А мне вот такое logwatch начал выдавать:

 --------------------- Smartd Begin ------------------------
 /dev/hda :
    Prefailure: Raw_Read_Error_Rate (1) changed to
      63, 59, 58, 59, 60,
    Usage: Hardware_ECC_Recovered (195) changed to
      63, 59, 58, 59, 60,                         
 ---------------------- Smartd End -------------------------

  Начинать бояться? =)

$ sudo /usr/sbin/smartctl -a /dev/hda

=== START OF INFORMATION SECTION ===
Device Model:     ST380011A
Serial Number:    4JV1W1QK
Firmware Version: 8.01
User Capacity:    80,026,361,856 bytes
...
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   061   056   006    Pre-fail  Always       -       181864164
...
  7 Seek_Error_Rate         0x000f   081   060   030    Pre-fail  Always       -       147576228
...
195 Hardware_ECC_Recovered  0x001a   061   056   000    Old_age   Always       -       181864164

-- 
 Григорий Баталов,
 программист
 ЗАО "Ланит-Терком"



^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-21 18:19   ` Grigory Batalov
@ 2006-11-22 14:03     ` Sharavin Sergey
  2006-11-22 14:35       ` Alexei V. Mezin
  2006-11-22 15:52       ` Grigory Batalov
  0 siblings, 2 replies; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-22 14:03 UTC (permalink / raw)
  To: hardware

В сообщении от 22 ноября 2006 00:19 Grigory Batalov написал(a):

>  --------------------- Smartd Begin ------------------------
>  /dev/hda :
>     Prefailure: Raw_Read_Error_Rate (1) changed to
>       63, 59, 58, 59, 60,
>     Usage: Hardware_ECC_Recovered (195) changed to
>       63, 59, 58, 59, 60,
>  ---------------------- Smartd End -------------------------
>
>   Начинать бояться? =)
>
> $ sudo /usr/sbin/smartctl -a /dev/hda
>
> === START OF INFORMATION SECTION ===
> Device Model:     ST380011A
> Serial Number:    4JV1W1QK
> Firmware Version: 8.01
> User Capacity:    80,026,361,856 bytes
> ...
> SMART Attributes Data Structure revision number: 10
> Vendor Specific SMART Attributes with Thresholds:
> ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED 
> WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate     0x000f   061   056   006   
> Pre-fail  Always       -       181864164 ...
>   7 Seek_Error_Rate         0x000f   081   060   030    Pre-fail  Always   
>    -       147576228 ...
> 195 Hardware_ECC_Recovered  0x001a   061   056   000    Old_age   Always   
>    -       181864164

Давайте попробуем разобратся и так:
Raw Read Error Rate   
 Частота появления ошибок при чтении данных с диска. 
 Данный параметр показывает частоту появления ошибок при операциях чтения с 
поверхности диска по вине аппаратной части накопителя.

Seek Error Rate   
 Частота появления ошибок позиционирования БМГ. 
 В случае сбоя в механической системе позиционирования, повреждения сервометок 
(  servo  ), сильного термического расширения дисков и т.п. возникают ошибки 
позиционирования. Чем их больше, тем хуже состояние механики и/или 
поверхности жесткого диска.

Похоже скоро винт отойдёт в мир виртуальный :)
Это моё мнение, но ошибки серьёзные опять же ИМХО.
Лучше подстраховаться.
.

^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-22 14:03     ` Sharavin Sergey
@ 2006-11-22 14:35       ` Alexei V. Mezin
  2006-11-22 16:45         ` Michael Shigorin
  2006-11-22 15:52       ` Grigory Batalov
  1 sibling, 1 reply; 17+ messages in thread
From: Alexei V. Mezin @ 2006-11-22 14:35 UTC (permalink / raw)
  To: hardware

Sharavin Sergey пишет:
> Давайте попробуем разобратся и так:
> Raw Read Error Rate   
>  Частота появления ошибок при чтении данных с диска. 
> 
> Seek Error Rate   
>  Частота появления ошибок позиционирования БМГ. 

А где-нить есть _внятное_ описание всех параметров, которые выдает 
smartctl? И при каких величинах какого параметра время бежать за новым 
хардом, а при каких за валидолом в аптеку?

Потому как "Частота появления ошибок при чтении данных с диска" что-то 
не очень проясняет, что именно измеряется. Частота на сколько операций 
чтения? Или в единицу времени?

У меня в логи периодические попадает про смену температуры хардов (ну 
это самое понятное) и про изменение Hardware_ECC_Recovered на пару 
единиц то в одну то в другую сторону. Как понять, на сколько это плохо?


-- 
Alexei V. Mezin

NT-MDT Co.
Phone: 095-913-5736
Fax: 095-913-573
Email: mezin@ntmdt.ru
URL: http://www.ntmdt.com


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-22 14:03     ` Sharavin Sergey
  2006-11-22 14:35       ` Alexei V. Mezin
@ 2006-11-22 15:52       ` Grigory Batalov
  2006-11-23 11:52         ` Sharavin Sergey
                           ` (2 more replies)
  1 sibling, 3 replies; 17+ messages in thread
From: Grigory Batalov @ 2006-11-22 15:52 UTC (permalink / raw)
  To: hardware

On Wed, 22 Nov 2006 20:03:04 +0600
Sharavin Sergey <sharavin@sibmail.ru> wrote:

> >  --------------------- Smartd Begin ------------------------
> >  /dev/hda :
> >     Prefailure: Raw_Read_Error_Rate (1) changed to
> >       63, 59, 58, 59, 60,
> >     Usage: Hardware_ECC_Recovered (195) changed to
> >       63, 59, 58, 59, 60,
> >  ---------------------- Smartd End -------------------------
> >
> >   Начинать бояться? =)
...
> Давайте попробуем разобратся и так:
> Raw Read Error Rate   
>  Частота появления ошибок при чтении данных с диска. 
>  Данный параметр показывает частоту появления ошибок при операциях чтения с 
> поверхности диска по вине аппаратной части накопителя.
> 
> Seek Error Rate   
>  Частота появления ошибок позиционирования БМГ. 
>  В случае сбоя в механической системе позиционирования, повреждения сервометок 
> (  servo  ), сильного термического расширения дисков и т.п. возникают ошибки 
> позиционирования. Чем их больше, тем хуже состояние механики и/или 
> поверхности жесткого диска.

  Спасибо за разъяснение! Это Вы в интернете описание нашли?

> Похоже скоро винт отойдёт в мир виртуальный :)
> Это моё мнение, но ошибки серьёзные опять же ИМХО.
> Лучше подстраховаться.

  Да, я уже пожаловался начальнику =).

  Мне было непонятно следующее: Raw_Read_Error_Rate покрывается
  таким же значением Hardware_ECC_Recovered. Можно ли надеяться,
  что ошибки чтения успешно исправлены при помощи ECC ?

-- 
 Григорий Баталов,
 программист
 ЗАО "Ланит-Терком"



^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-22 14:35       ` Alexei V. Mezin
@ 2006-11-22 16:45         ` Michael Shigorin
  0 siblings, 0 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-22 16:45 UTC (permalink / raw)
  To: hardware

On Wed, Nov 22, 2006 at 05:35:20PM +0300, Alexei V. Mezin wrote:
> А где-нить есть _внятное_ описание всех параметров, которые
> выдает smartctl? И при каких величинах какого параметра время
> бежать за новым хардом, а при каких за валидолом в аптеку?

Последний раз перечитывал smartctl(8), по крайней мере в текущих
версиях он весьма внятный.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-22 15:52       ` Grigory Batalov
@ 2006-11-23 11:52         ` Sharavin Sergey
  2006-12-03 11:05         ` antilopa_gnu
  2006-12-10 11:27         ` Vitaly Lipatov
  2 siblings, 0 replies; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-23 11:52 UTC (permalink / raw)
  To: hardware

В сообщении от 22 ноября 2006 21:52 Grigory Batalov написал(a):

>
>   Спасибо за разъяснение! Это Вы в интернете описание нашли?
>
Да, поищите есть очень доступное описание.

^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-22 15:52       ` Grigory Batalov
  2006-11-23 11:52         ` Sharavin Sergey
@ 2006-12-03 11:05         ` antilopa_gnu
  2006-12-10 11:27         ` Vitaly Lipatov
  2 siblings, 0 replies; 17+ messages in thread
From: antilopa_gnu @ 2006-12-03 11:05 UTC (permalink / raw)
  To: hardware

Grigory Batalov пишет:

>   Мне было непонятно следующее: Raw_Read_Error_Rate покрывается
>   таким же значением Hardware_ECC_Recovered. Можно ли надеяться,
>   что ошибки чтения успешно исправлены при помощи ECC ?

По поводу совпадения Raw_Read_Error_Rate и Hardware_ECC_Recovered
и их больших значениях у Seagate'овских (у Вас ведь такой?) дисков.
Весной этого года я наблюдала такого рода ситуацию у товарища, на
только что купленном диске, и кое-что нагуглила тогда. 

Насколько поняла с моим слабым английским,  Seagate'овские диски 
(в отличие от других (?)) показывают в SMART все возникающие ошибки,
даже когда они тут же были успешно исправлены.

Вот то, что тогда нагуглилось:

http://episteme.arstechnica.com/groupee/forums/a/tpc/f/24609792/m/235002375731
http://forums.storagereview.net/index.php?showtopic=17393
http://forums.storagereview.net/index.php?showtopic=20731
http://forums.storagereview.net/index.php?showtopic=20209
http://forums.storagereview.net/index.php?showtopic=16798
http://www.ale.org/archive/ale/ale-2005-06/msg00268.html
http://hardware.mcse.ms/message256243.html
http://hardware.mcse.ms/archive10-2005-11-256243.html

(Здесь все ссылки кучей, сейчас уже не разберу, какая насколько
адекватна.)

P.S.
Тот самый диск, Seagate ST3120022A, у коллеги жив и работает 
до сих пор, сбоев вроде бы не было.


^ permalink raw reply	[flat|nested] 17+ messages in thread

* Re: [Hardware] Какое состояние винтов по SMART_у
  2006-11-22 15:52       ` Grigory Batalov
  2006-11-23 11:52         ` Sharavin Sergey
  2006-12-03 11:05         ` antilopa_gnu
@ 2006-12-10 11:27         ` Vitaly Lipatov
  2 siblings, 0 replies; 17+ messages in thread
From: Vitaly Lipatov @ 2006-12-10 11:27 UTC (permalink / raw)
  To: hardware

On Wednesday 22 November 2006 18:52, Grigory Batalov wrote:
> On Wed, 22 Nov 2006 20:03:04 +0600
>
> Sharavin Sergey <sharavin@sibmail.ru> wrote:
...
> > Seek Error Rate
> >  Частота появления ошибок позиционирования БМГ.
...
>   Спасибо за разъяснение! Это Вы в интернете описание нашли?
Найдете лучше, милости просим добавить информации на
http://www.freesource.info/wiki/AltLinux/Dokumentacija/RabotaSDiskami

-- 
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! WINE! LaTeX! LyX! http://freesource.info


^ permalink raw reply	[flat|nested] 17+ messages in thread

end of thread, other threads:[~2006-12-10 11:27 UTC | newest]

Thread overview: 17+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2006-11-03 16:55 [Hardware] Какое состояние винтов по SMART_у Sharavin Sergey
2006-11-03 20:15 ` Michael Shigorin
2006-11-04  6:16   ` Sharavin Sergey
2006-11-04 16:38     ` Michael Shigorin
2006-11-04 23:48       ` Sharavin Sergey
2006-11-05 10:57         ` Michael Shigorin
2006-11-13 10:44       ` ABATAPA
2006-11-13 15:37         ` Michael Shigorin
2006-11-04 20:17   ` Vitaly Lipatov
2006-11-21 18:19   ` Grigory Batalov
2006-11-22 14:03     ` Sharavin Sergey
2006-11-22 14:35       ` Alexei V. Mezin
2006-11-22 16:45         ` Michael Shigorin
2006-11-22 15:52       ` Grigory Batalov
2006-11-23 11:52         ` Sharavin Sergey
2006-12-03 11:05         ` antilopa_gnu
2006-12-10 11:27         ` Vitaly Lipatov

ALT Linux hardware support

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \
		hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org
	public-inbox-index hardware

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.hardware


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git