* [Hardware] Какое состояние винтов по SMART_у
@ 2006-11-03 16:55 Sharavin Sergey
2006-11-03 20:15 ` Michael Shigorin
0 siblings, 1 reply; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-03 16:55 UTC (permalink / raw)
To: Hardware
[-- Attachment #1: Type: text/plain, Size: 246 bytes --]
Здравствуйте.
Подскажите пожалуста какое состояние у винтов ?
Не пора ли менять :)
Тесты в аттаче для каждого винта.
И на какой параметр надо обращать внимание, не на "RAW_VALUE"
И его значение, больше хуже или наоборот ?
С уважением.
Сергей.
[-- Attachment #2: 1.txt --]
[-- Type: text/plain, Size: 6171 bytes --]
# smartctl -a -d ata /dev/sda
smartctl version 5.36 [i586-alt-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar SE (Serial ATA) family
Device Model: WDC WD2000JD-00HBB0
Serial Number: WD-WMAL81563094
Firmware Version: 08.02D08
User Capacity: 200 049 647 616 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Fri Nov 3 22:48:43 2006 NOVT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x84) Offline data collection activity
was suspended by an interrupting command from host.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (5785) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 75) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 200 147 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0007 129 126 021 Pre-fail Always - 6050
4 Start_Stop_Count 0x0032 099 099 040 Old_age Always - 1482
5 Reallocated_Sector_Ct 0x0033 199 199 140 Pre-fail Always - 1
7 Seek_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0
9 Power_On_Hours 0x0032 094 094 000 Old_age Always - 4852
10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1481
194 Temperature_Celsius 0x0022 111 094 000 Old_age Always - 39
196 Reallocated_Event_Count 0x0032 199 199 000 Old_age Always - 1
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 1
198 Offline_Uncorrectable 0x0012 200 200 000 Old_age Always - 1
199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age Always - 31
200 Multi_Zone_Error_Rate 0x0009 200 199 051 Pre-fail Offline - 0
SMART Error Log Version: 1
ATA Error Count: 1
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 1 occurred at disk power-on lifetime: 3974 hours (165 days + 14 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 08 da 5a 3f e0 Error: UNC 8 sectors at LBA = 0x003f5ada = 4152026
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 08 da 5a 3f 14 00 00:01:01.550 READ DMA EXT
25 00 08 da 5a 3b 14 00 00:01:01.550 READ DMA EXT
25 00 08 da 5a 37 14 00 00:01:01.550 READ DMA EXT
25 00 08 da 5a 33 14 00 00:01:01.550 READ DMA EXT
25 00 08 da 5a 2f 14 00 00:01:01.550 READ DMA EXT
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 43 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
[-- Attachment #3: 2.txt --]
[-- Type: text/plain, Size: 4745 bytes --]
# smartctl -a /dev/hda
smartctl version 5.36 [i586-alt-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.7 and 7200.7 Plus family
Device Model: ST3120026A
Serial Number: 3JT1LGXF
Firmware Version: 3.06
User Capacity: 120 034 123 776 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: ATA/ATAPI-6 T13 1410D revision 2
Local Time is: Fri Nov 3 22:50:25 2006 NOVT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 430) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 85) minutes.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 065 058 006 Pre-fail Always - 217984869
3 Spin_Up_Time 0x0003 098 096 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 32
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 3
7 Seek_Error_Rate 0x000f 087 060 030 Pre-fail Always - 518881625
9 Power_On_Hours 0x0032 091 091 000 Old_age Always - 8684
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 097 097 020 Old_age Always - 3799
194 Temperature_Celsius 0x0022 037 050 000 Old_age Always - 37
195 Hardware_ECC_Recovered 0x001a 065 057 000 Old_age Always - 217984869
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 8682 -
# 2 Short offline Completed without error 00% 8682 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-03 16:55 [Hardware] Какое состояние винтов по SMART_у Sharavin Sergey
@ 2006-11-03 20:15 ` Michael Shigorin
2006-11-04 6:16 ` Sharavin Sergey
` (2 more replies)
0 siblings, 3 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-03 20:15 UTC (permalink / raw)
To: Hardware
On Fri, Nov 03, 2006 at 10:55:55PM +0600, Sharavin Sergey wrote:
> Подскажите пожалуста какое состояние у винтов ?
> Не пора ли менять :)
WD -- лучше подумать/подстраховать.
> # smartctl -a -d ata /dev/sda
> ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
> 1 Raw_Read_Error_Rate 0x000b 200 147 051 Pre-fail Always - 0
> 5 Reallocated_Sector_Ct 0x0033 199 199 140 Pre-fail Always - 1
> 7 Seek_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0
> 196 Reallocated_Event_Count 0x0032 199 199 000 Old_age Always - 1
> 198 Offline_Uncorrectable 0x0012 200 200 000 Old_age Always - 1
> 199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age Always - 31
> 200 Multi_Zone_Error_Rate 0x0009 200 199 051 Pre-fail Offline - 0
Вот эти если прыгать начинают (хорошо smartd держать),
то мне уже не нравится. "Чем ниже, тем хуже" (ср. WORST).
> SMART Error Log Version: 1
> Error 1 occurred at disk power-on lifetime: 3974 hours (165 days + 14 hours)
> When the command that caused the error occurred, the device was active or idle.
>
> After command completion occurred, registers were:
> ER ST SC SN CL CH DH
> -- -- -- -- -- -- --
> 40 51 08 da 5a 3f e0 Error: UNC 8 sectors at LBA = 0x003f5ada = 4152026
>
> Commands leading to the command that caused the error were:
> CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
> -- -- -- -- -- -- -- -- ---------------- --------------------
> 25 00 08 da 5a 3f 14 00 00:01:01.550 READ DMA EXT
> 25 00 08 da 5a 3b 14 00 00:01:01.550 READ DMA EXT
> 25 00 08 da 5a 37 14 00 00:01:01.550 READ DMA EXT
> 25 00 08 da 5a 33 14 00 00:01:01.550 READ DMA EXT
> 25 00 08 da 5a 2f 14 00 00:01:01.550 READ DMA EXT
Ошибка одна, но уже не нулевая. С учётом того, что нынешние
винты зачем-то клепают так, что они сперва высыпаться начинают
уже конкретно, а только тогда орут в SMART -- я бы не ждал
следующей...
> SMART Self-test log structure revision number 1
> Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
> # 1 Short offline Completed without error 00% 43 -
> SMART Selective self-test log data structure revision number 1
> SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
> 1 0 0 Not_testing
> 2 0 0 Not_testing
> 3 0 0 Not_testing
> 4 0 0 Not_testing
> 5 0 0 Not_testing
Это надо -t short или -t long запустить.
> # smartctl -a /dev/hda
> 1 Raw_Read_Error_Rate 0x000f 065 058 006 Pre-fail Always - 217984869
> 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 3
> 7 Seek_Error_Rate 0x000f 087 060 030 Pre-fail Always - 518881625
> 195 Hardware_ECC_Recovered 0x001a 065 057 000 Old_age Always - 217984869
> 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
> 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
> 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0
> SMART Error Log Version: 1
> No Errors Logged
> # 1 Short offline Completed without error 00% 8682 -
> # 2 Short offline Completed without error 00% 8682 -
Этот будто живее.
Вообще зеркала, зеркала и ещё раз зеркала, один винт нынче
-- это ждущий своего часа расходник.
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-03 20:15 ` Michael Shigorin
@ 2006-11-04 6:16 ` Sharavin Sergey
2006-11-04 16:38 ` Michael Shigorin
2006-11-04 20:17 ` Vitaly Lipatov
2006-11-21 18:19 ` Grigory Batalov
2 siblings, 1 reply; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-04 6:16 UTC (permalink / raw)
To: Hardware
В сообщении от 4 ноября 2006 02:15 Michael Shigorin написал(a):
> On Fri, Nov 03, 2006 at 10:55:55PM +0600, Sharavin Sergey wrote:
> > Подскажите пожалуста какое состояние у винтов ?
> > Не пора ли менять :)
>
> WD -- лучше подумать/подстраховать.
Большое Вам спасибо, Михаил.
Надеюсь месяца два протянет :)
А вообще то что посоветуете, какой фирмы брать ?
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-04 6:16 ` Sharavin Sergey
@ 2006-11-04 16:38 ` Michael Shigorin
2006-11-04 23:48 ` Sharavin Sergey
2006-11-13 10:44 ` ABATAPA
0 siblings, 2 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-04 16:38 UTC (permalink / raw)
To: Hardware
On Sat, Nov 04, 2006 at 12:16:59PM +0600, Sharavin Sergey wrote:
> > > Подскажите пожалуста какое состояние у винтов ?
> > > Не пора ли менять :)
> > WD -- лучше подумать/подстраховать.
> Большое Вам спасибо, Михаил. Надеюсь месяца два протянет :)
> А вообще то что посоветуете, какой фирмы брать ?
У меня на сейчас сложилось неплохое мнение о WD и Hitachi
(и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-04 16:38 ` Michael Shigorin
@ 2006-11-04 23:48 ` Sharavin Sergey
2006-11-05 10:57 ` Michael Shigorin
2006-11-13 10:44 ` ABATAPA
1 sibling, 1 reply; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-04 23:48 UTC (permalink / raw)
To: Hardware
В сообщении от 4 ноября 2006 22:38 Michael Shigorin написал(a):
> У меня на сейчас сложилось неплохое мнение о WD и Hitachi
> (и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).
Спасибо, то же думаю брать WD хотя как
раз винт этой фирмы и помирает после 2 лет эксплуатации :)
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-04 23:48 ` Sharavin Sergey
@ 2006-11-05 10:57 ` Michael Shigorin
0 siblings, 0 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-05 10:57 UTC (permalink / raw)
To: Hardware
On Sun, Nov 05, 2006 at 05:48:00AM +0600, Sharavin Sergey wrote:
> > У меня на сейчас сложилось неплохое мнение о WD и Hitachi
> > (и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).
> Спасибо, то же думаю брать WD хотя как раз винт этой фирмы и
> помирает после 2 лет эксплуатации :)
Если жёсткой -- то приемлемо, хотя лучше "не сильно" и "после
трёх", соответственно.
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-04 16:38 ` Michael Shigorin
2006-11-04 23:48 ` Sharavin Sergey
@ 2006-11-13 10:44 ` ABATAPA
2006-11-13 15:37 ` Michael Shigorin
1 sibling, 1 reply; 17+ messages in thread
From: ABATAPA @ 2006-11-13 10:44 UTC (permalink / raw)
To: Hardware
4 ноября 2006 19:38, Michael Shigorin написал:
> У меня на сейчас сложилось неплохое мнение о WD и Hitachi
> (и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).
А вот продавцы говорят, что отказов мало по Samsung.
Да и тихие они...
--
ABATAPA
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-13 10:44 ` ABATAPA
@ 2006-11-13 15:37 ` Michael Shigorin
0 siblings, 0 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-13 15:37 UTC (permalink / raw)
To: Hardware
On Mon, Nov 13, 2006 at 01:44:23PM +0300, ABATAPA wrote:
> > У меня на сейчас сложилось неплохое мнение о WD и Hitachi
> > (и так себе -- о Seagate 7200.9/8 и чём угодно SATA 80Gb).
> А вот продавцы говорят, что отказов мало по Samsung.
> Да и тихие они...
Как-то пляшет, после ~80Gb вроде выровнялось после серии тихого
ужаса в р-не ~30Gb, после было вроде ровно, за прошлый год вроде
опять слышал неприятное.
Везде "вроде", поскольку зуб не дам -- сам как-то не покупаю их
и вокруг народ -- тоже.
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-03 20:15 ` Michael Shigorin
2006-11-04 6:16 ` Sharavin Sergey
@ 2006-11-04 20:17 ` Vitaly Lipatov
2006-11-21 18:19 ` Grigory Batalov
2 siblings, 0 replies; 17+ messages in thread
From: Vitaly Lipatov @ 2006-11-04 20:17 UTC (permalink / raw)
To: Hardware
On Friday 03 November 2006 23:15, Michael Shigorin wrote:
...
> > 199 UDMA_CRC_Error_Count 0x000a 200 253 000
> > Old_age Always - 31 200 Multi_Zone_Error_Rate
> > 0x0009 200 199 051 Pre-fail Offline -
> > 0
>
> Вот эти если прыгать начинают (хорошо smartd держать),
> то мне уже не нравится. "Чем ниже, тем хуже" (ср. WORST).
Винт вот на сервере стоит уже года два: :)
195 Hardware_ECC_Recovered 0x000a 100 100 000 Old_age
Always - 528012484
--
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! WINE! LaTeX! LyX! http://freesource.info
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-03 20:15 ` Michael Shigorin
2006-11-04 6:16 ` Sharavin Sergey
2006-11-04 20:17 ` Vitaly Lipatov
@ 2006-11-21 18:19 ` Grigory Batalov
2006-11-22 14:03 ` Sharavin Sergey
2 siblings, 1 reply; 17+ messages in thread
From: Grigory Batalov @ 2006-11-21 18:19 UTC (permalink / raw)
To: hardware
On Fri, 3 Nov 2006 22:15:48 +0200
Michael Shigorin <mike@osdn.org.ua> wrote:
> > # smartctl -a -d ata /dev/sda
> > ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
> > 1 Raw_Read_Error_Rate 0x000b 200 147 051 Pre-fail Always - 0
> > 5 Reallocated_Sector_Ct 0x0033 199 199 140 Pre-fail Always - 1
> > 7 Seek_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0
> > 196 Reallocated_Event_Count 0x0032 199 199 000 Old_age Always - 1
> > 198 Offline_Uncorrectable 0x0012 200 200 000 Old_age Always - 1
> > 199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age Always - 31
> > 200 Multi_Zone_Error_Rate 0x0009 200 199 051 Pre-fail Offline - 0
>
> Вот эти если прыгать начинают (хорошо smartd держать),
> то мне уже не нравится. "Чем ниже, тем хуже" (ср. WORST).
А мне вот такое logwatch начал выдавать:
--------------------- Smartd Begin ------------------------
/dev/hda :
Prefailure: Raw_Read_Error_Rate (1) changed to
63, 59, 58, 59, 60,
Usage: Hardware_ECC_Recovered (195) changed to
63, 59, 58, 59, 60,
---------------------- Smartd End -------------------------
Начинать бояться? =)
$ sudo /usr/sbin/smartctl -a /dev/hda
=== START OF INFORMATION SECTION ===
Device Model: ST380011A
Serial Number: 4JV1W1QK
Firmware Version: 8.01
User Capacity: 80,026,361,856 bytes
...
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 061 056 006 Pre-fail Always - 181864164
...
7 Seek_Error_Rate 0x000f 081 060 030 Pre-fail Always - 147576228
...
195 Hardware_ECC_Recovered 0x001a 061 056 000 Old_age Always - 181864164
--
Григорий Баталов,
программист
ЗАО "Ланит-Терком"
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-21 18:19 ` Grigory Batalov
@ 2006-11-22 14:03 ` Sharavin Sergey
2006-11-22 14:35 ` Alexei V. Mezin
2006-11-22 15:52 ` Grigory Batalov
0 siblings, 2 replies; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-22 14:03 UTC (permalink / raw)
To: hardware
В сообщении от 22 ноября 2006 00:19 Grigory Batalov написал(a):
> --------------------- Smartd Begin ------------------------
> /dev/hda :
> Prefailure: Raw_Read_Error_Rate (1) changed to
> 63, 59, 58, 59, 60,
> Usage: Hardware_ECC_Recovered (195) changed to
> 63, 59, 58, 59, 60,
> ---------------------- Smartd End -------------------------
>
> Начинать бояться? =)
>
> $ sudo /usr/sbin/smartctl -a /dev/hda
>
> === START OF INFORMATION SECTION ===
> Device Model: ST380011A
> Serial Number: 4JV1W1QK
> Firmware Version: 8.01
> User Capacity: 80,026,361,856 bytes
> ...
> SMART Attributes Data Structure revision number: 10
> Vendor Specific SMART Attributes with Thresholds:
> ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
> WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 061 056 006
> Pre-fail Always - 181864164 ...
> 7 Seek_Error_Rate 0x000f 081 060 030 Pre-fail Always
> - 147576228 ...
> 195 Hardware_ECC_Recovered 0x001a 061 056 000 Old_age Always
> - 181864164
Давайте попробуем разобратся и так:
Raw Read Error Rate
Частота появления ошибок при чтении данных с диска.
Данный параметр показывает частоту появления ошибок при операциях чтения с
поверхности диска по вине аппаратной части накопителя.
Seek Error Rate
Частота появления ошибок позиционирования БМГ.
В случае сбоя в механической системе позиционирования, повреждения сервометок
( servo ), сильного термического расширения дисков и т.п. возникают ошибки
позиционирования. Чем их больше, тем хуже состояние механики и/или
поверхности жесткого диска.
Похоже скоро винт отойдёт в мир виртуальный :)
Это моё мнение, но ошибки серьёзные опять же ИМХО.
Лучше подстраховаться.
.
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-22 14:03 ` Sharavin Sergey
@ 2006-11-22 14:35 ` Alexei V. Mezin
2006-11-22 16:45 ` Michael Shigorin
2006-11-22 15:52 ` Grigory Batalov
1 sibling, 1 reply; 17+ messages in thread
From: Alexei V. Mezin @ 2006-11-22 14:35 UTC (permalink / raw)
To: hardware
Sharavin Sergey пишет:
> Давайте попробуем разобратся и так:
> Raw Read Error Rate
> Частота появления ошибок при чтении данных с диска.
>
> Seek Error Rate
> Частота появления ошибок позиционирования БМГ.
А где-нить есть _внятное_ описание всех параметров, которые выдает
smartctl? И при каких величинах какого параметра время бежать за новым
хардом, а при каких за валидолом в аптеку?
Потому как "Частота появления ошибок при чтении данных с диска" что-то
не очень проясняет, что именно измеряется. Частота на сколько операций
чтения? Или в единицу времени?
У меня в логи периодические попадает про смену температуры хардов (ну
это самое понятное) и про изменение Hardware_ECC_Recovered на пару
единиц то в одну то в другую сторону. Как понять, на сколько это плохо?
--
Alexei V. Mezin
NT-MDT Co.
Phone: 095-913-5736
Fax: 095-913-573
Email: mezin@ntmdt.ru
URL: http://www.ntmdt.com
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-22 14:35 ` Alexei V. Mezin
@ 2006-11-22 16:45 ` Michael Shigorin
0 siblings, 0 replies; 17+ messages in thread
From: Michael Shigorin @ 2006-11-22 16:45 UTC (permalink / raw)
To: hardware
On Wed, Nov 22, 2006 at 05:35:20PM +0300, Alexei V. Mezin wrote:
> А где-нить есть _внятное_ описание всех параметров, которые
> выдает smartctl? И при каких величинах какого параметра время
> бежать за новым хардом, а при каких за валидолом в аптеку?
Последний раз перечитывал smartctl(8), по крайней мере в текущих
версиях он весьма внятный.
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-22 14:03 ` Sharavin Sergey
2006-11-22 14:35 ` Alexei V. Mezin
@ 2006-11-22 15:52 ` Grigory Batalov
2006-11-23 11:52 ` Sharavin Sergey
` (2 more replies)
1 sibling, 3 replies; 17+ messages in thread
From: Grigory Batalov @ 2006-11-22 15:52 UTC (permalink / raw)
To: hardware
On Wed, 22 Nov 2006 20:03:04 +0600
Sharavin Sergey <sharavin@sibmail.ru> wrote:
> > --------------------- Smartd Begin ------------------------
> > /dev/hda :
> > Prefailure: Raw_Read_Error_Rate (1) changed to
> > 63, 59, 58, 59, 60,
> > Usage: Hardware_ECC_Recovered (195) changed to
> > 63, 59, 58, 59, 60,
> > ---------------------- Smartd End -------------------------
> >
> > Начинать бояться? =)
...
> Давайте попробуем разобратся и так:
> Raw Read Error Rate
> Частота появления ошибок при чтении данных с диска.
> Данный параметр показывает частоту появления ошибок при операциях чтения с
> поверхности диска по вине аппаратной части накопителя.
>
> Seek Error Rate
> Частота появления ошибок позиционирования БМГ.
> В случае сбоя в механической системе позиционирования, повреждения сервометок
> ( servo ), сильного термического расширения дисков и т.п. возникают ошибки
> позиционирования. Чем их больше, тем хуже состояние механики и/или
> поверхности жесткого диска.
Спасибо за разъяснение! Это Вы в интернете описание нашли?
> Похоже скоро винт отойдёт в мир виртуальный :)
> Это моё мнение, но ошибки серьёзные опять же ИМХО.
> Лучше подстраховаться.
Да, я уже пожаловался начальнику =).
Мне было непонятно следующее: Raw_Read_Error_Rate покрывается
таким же значением Hardware_ECC_Recovered. Можно ли надеяться,
что ошибки чтения успешно исправлены при помощи ECC ?
--
Григорий Баталов,
программист
ЗАО "Ланит-Терком"
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-22 15:52 ` Grigory Batalov
@ 2006-11-23 11:52 ` Sharavin Sergey
2006-12-03 11:05 ` antilopa_gnu
2006-12-10 11:27 ` Vitaly Lipatov
2 siblings, 0 replies; 17+ messages in thread
From: Sharavin Sergey @ 2006-11-23 11:52 UTC (permalink / raw)
To: hardware
В сообщении от 22 ноября 2006 21:52 Grigory Batalov написал(a):
>
> Спасибо за разъяснение! Это Вы в интернете описание нашли?
>
Да, поищите есть очень доступное описание.
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-22 15:52 ` Grigory Batalov
2006-11-23 11:52 ` Sharavin Sergey
@ 2006-12-03 11:05 ` antilopa_gnu
2006-12-10 11:27 ` Vitaly Lipatov
2 siblings, 0 replies; 17+ messages in thread
From: antilopa_gnu @ 2006-12-03 11:05 UTC (permalink / raw)
To: hardware
Grigory Batalov пишет:
> Мне было непонятно следующее: Raw_Read_Error_Rate покрывается
> таким же значением Hardware_ECC_Recovered. Можно ли надеяться,
> что ошибки чтения успешно исправлены при помощи ECC ?
По поводу совпадения Raw_Read_Error_Rate и Hardware_ECC_Recovered
и их больших значениях у Seagate'овских (у Вас ведь такой?) дисков.
Весной этого года я наблюдала такого рода ситуацию у товарища, на
только что купленном диске, и кое-что нагуглила тогда.
Насколько поняла с моим слабым английским, Seagate'овские диски
(в отличие от других (?)) показывают в SMART все возникающие ошибки,
даже когда они тут же были успешно исправлены.
Вот то, что тогда нагуглилось:
http://episteme.arstechnica.com/groupee/forums/a/tpc/f/24609792/m/235002375731
http://forums.storagereview.net/index.php?showtopic=17393
http://forums.storagereview.net/index.php?showtopic=20731
http://forums.storagereview.net/index.php?showtopic=20209
http://forums.storagereview.net/index.php?showtopic=16798
http://www.ale.org/archive/ale/ale-2005-06/msg00268.html
http://hardware.mcse.ms/message256243.html
http://hardware.mcse.ms/archive10-2005-11-256243.html
(Здесь все ссылки кучей, сейчас уже не разберу, какая насколько
адекватна.)
P.S.
Тот самый диск, Seagate ST3120022A, у коллеги жив и работает
до сих пор, сбоев вроде бы не было.
^ permalink raw reply [flat|nested] 17+ messages in thread
* Re: [Hardware] Какое состояние винтов по SMART_у
2006-11-22 15:52 ` Grigory Batalov
2006-11-23 11:52 ` Sharavin Sergey
2006-12-03 11:05 ` antilopa_gnu
@ 2006-12-10 11:27 ` Vitaly Lipatov
2 siblings, 0 replies; 17+ messages in thread
From: Vitaly Lipatov @ 2006-12-10 11:27 UTC (permalink / raw)
To: hardware
On Wednesday 22 November 2006 18:52, Grigory Batalov wrote:
> On Wed, 22 Nov 2006 20:03:04 +0600
>
> Sharavin Sergey <sharavin@sibmail.ru> wrote:
...
> > Seek Error Rate
> > Частота появления ошибок позиционирования БМГ.
...
> Спасибо за разъяснение! Это Вы в интернете описание нашли?
Найдете лучше, милости просим добавить информации на
http://www.freesource.info/wiki/AltLinux/Dokumentacija/RabotaSDiskami
--
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! WINE! LaTeX! LyX! http://freesource.info
^ permalink raw reply [flat|nested] 17+ messages in thread
end of thread, other threads:[~2006-12-10 11:27 UTC | newest]
Thread overview: 17+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2006-11-03 16:55 [Hardware] Какое состояние винтов по SMART_у Sharavin Sergey
2006-11-03 20:15 ` Michael Shigorin
2006-11-04 6:16 ` Sharavin Sergey
2006-11-04 16:38 ` Michael Shigorin
2006-11-04 23:48 ` Sharavin Sergey
2006-11-05 10:57 ` Michael Shigorin
2006-11-13 10:44 ` ABATAPA
2006-11-13 15:37 ` Michael Shigorin
2006-11-04 20:17 ` Vitaly Lipatov
2006-11-21 18:19 ` Grigory Batalov
2006-11-22 14:03 ` Sharavin Sergey
2006-11-22 14:35 ` Alexei V. Mezin
2006-11-22 16:45 ` Michael Shigorin
2006-11-22 15:52 ` Grigory Batalov
2006-11-23 11:52 ` Sharavin Sergey
2006-12-03 11:05 ` antilopa_gnu
2006-12-10 11:27 ` Vitaly Lipatov
ALT Linux hardware support
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \
hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org
public-inbox-index hardware
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.hardware
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git