ALT Linux hardware support
 help / color / mirror / Atom feed
* [Hardware] Dangerous values of SMART-attributes?
@ 2006-03-09  9:16 Taurelasse
  2006-03-09 10:06 ` Michael Shigorin
  2006-03-13  5:37 ` antilopa_gnu
  0 siblings, 2 replies; 8+ messages in thread
From: Taurelasse @ 2006-03-09  9:16 UTC (permalink / raw)
  To: hardware

Вот такая проблема. 

Вскоре после установки нового HDD (Seagate ST3160023A) smartctl
показал подозрительные значения некоторых SMART-атрибутов.

Меня настораживает быстрое изменение Seek_Error_Rate с 253 до 60,
а также колебания значений Raw_Read_Error_Rate и
Hardware_ECC_Recovered в пределах 74-71 при ненулевых значениях
их Raw values. У других HDD (правда, не Seagate), с которыми мне
доводилось иметь дело, эти атрибуты не менялись даже после долгой
работы, а их Raw values оставались нулями.

Ждать ли мне проблем от диска?

Вот что сообщает smartctl -a /dev/hda

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   072   071   006    Pre-fail  Always       -       31392212
  3 Spin_Up_Time            0x0003   097   097   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       0
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   062   060   030    Pre-fail  Always       -       1626672
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       16
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       7
194 Temperature_Celsius     0x0022   030   040   000    Old_age   Always       -       30
195 Hardware_ECC_Recovered  0x001a   072   071   000    Old_age   Always       -       31392212
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%        16         -
# 2  Short offline       Completed without error       00%        14         -
# 3  Short offline       Completed without error       00%         5         -



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Hardware] Dangerous values of SMART-attributes?
  2006-03-09  9:16 [Hardware] Dangerous values of SMART-attributes? Taurelasse
@ 2006-03-09 10:06 ` Michael Shigorin
  2006-03-09 11:19   ` Taurelasse
  2006-03-13  5:37 ` antilopa_gnu
  1 sibling, 1 reply; 8+ messages in thread
From: Michael Shigorin @ 2006-03-09 10:06 UTC (permalink / raw)
  To: hardware

On Thu, Mar 09, 2006 at 04:16:11PM +0700, Taurelasse wrote:
> Ждать ли мне проблем от диска?

http://pcjs.chat.ru/smartdoc.html?

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Hardware] Dangerous values of SMART-attributes?
  2006-03-09 10:06 ` Michael Shigorin
@ 2006-03-09 11:19   ` Taurelasse
  2006-03-09 11:35     ` ABATAPA
  0 siblings, 1 reply; 8+ messages in thread
From: Taurelasse @ 2006-03-09 11:19 UTC (permalink / raw)
  To: hardware, shigorin

On Thu, 9 Mar 2006 12:06:00 +0200 Michael Shigorin wrote:

> On Thu, Mar 09, 2006 at 04:16:11PM +0700, Taurelasse wrote:
> > Ждать ли мне проблем от диска?
> 
> http://pcjs.chat.ru/smartdoc.html?

Этот текст мне знаком и как раз наводит на тревожные мысли
насчет состояния механики или поверхности диска.
Тем более что диск новый.
И ничего подозрительного кроме странностей со SMART-атрибутами
за ним еще не замечено.

Но вопрос ещё и в том, бывала ли у кого-то на практике похожая
ситуация со SMART-атрибутами, и что было дальше -- отказ HDD
или его долгая бессбойная работа?




^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Hardware] Dangerous values of SMART-attributes?
  2006-03-09 11:19   ` Taurelasse
@ 2006-03-09 11:35     ` ABATAPA
  0 siblings, 0 replies; 8+ messages in thread
From: ABATAPA @ 2006-03-09 11:35 UTC (permalink / raw)
  To: hardware

9 марта 2006 14:19, Taurelasse написал:
> Но вопрос ещё и в том, бывала ли у кого-то на практике похожая
> ситуация со SMART-атрибутами, и что было дальше -- отказ HDD
> или его долгая бессбойная работа?
А как Вам это поможет? Вы думаете, что жесткие диски выходят из строя по четко 
расписанному алгоритму и в указанные переоды времени?! У кого-то было одно, у 
кого-то - будет другое. В любом случае S.M.A.R.T. игнорировать не стОит.
-- 
ABATAPA


^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Hardware] Dangerous values of SMART-attributes?
  2006-03-09  9:16 [Hardware] Dangerous values of SMART-attributes? Taurelasse
  2006-03-09 10:06 ` Michael Shigorin
@ 2006-03-13  5:37 ` antilopa_gnu
  2006-03-13  8:30   ` Olvin
  1 sibling, 1 reply; 8+ messages in thread
From: antilopa_gnu @ 2006-03-13  5:37 UTC (permalink / raw)
  To: hardware

Taurelasse пишет:

> Вскоре после установки нового HDD (Seagate ST3160023A) smartctl
> показал подозрительные значения некоторых SMART-атрибутов.

Можете, если хотите, сравнить с данными другой Seagate Barracuda.
С этим диском проблем и подозрительностей вроде бы не наблюдалось,
а работает он, насколько я помню, уже около года.

Device Model:     ST3120022A

[...кусь...]

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   077   075   006    Pre-fail  Always       -       214889152
  3 Spin_Up_Time            0x0003   096   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       5
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   078   060   030    Pre-fail  Always       -       81801023
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       944
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       303
194 Temperature_Celsius     0x0022   022   043   000    Old_age   Always       -       22
195 Hardware_ECC_Recovered  0x001a   077   075   000    Old_age   Always       -       214889152
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged


> Меня настораживает быстрое изменение Seek_Error_Rate с 253 до 60,
> а также колебания значений Raw_Read_Error_Rate и
> Hardware_ECC_Recovered в пределах 74-71 при ненулевых значениях
> их Raw values.

Обратите внимание, что и в Вашем, и в моём случае Raw_Read_Error_Rate
и Hardware_ECC_Recovered в точности равны друг другу. 
Что бы это значило?.. (Часом, не то ли, что при чтении с диска не 
проблем по сути дела не было, ошибки исправлялись "на лету"?)


> Ждать ли мне проблем от диска?
Трудно сказать определённо. Лучше не гадать, а регулярно делать 
резервные копии ценной информации. 

И кстати, если речь идёт о той самой машине, с которой мы с Вами
возились на прошлой неделе, попробуйте прежде всего поменять шлейф,
которым подключён винчестер (вид того шлейфа мне показался 
подозрительным).

Удачи!



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Hardware] Dangerous values of SMART-attributes?
  2006-03-13  5:37 ` antilopa_gnu
@ 2006-03-13  8:30   ` Olvin
  2006-03-13  9:58     ` [Hardware] [JT] " antilopa_gnu
  0 siblings, 1 reply; 8+ messages in thread
From: Olvin @ 2006-03-13  8:30 UTC (permalink / raw)
  To: hardware

antilopa_gnu@list.ru wrote:
> Можете, если хотите, сравнить с данными другой Seagate Barracuda.
> С этим диском проблем и подозрительностей вроде бы не наблюдалось,
> а работает он, насколько я помню, уже около года.
> Device Model:     ST3120022A
> SMART Attributes Data Structure revision number: 10
> Vendor Specific SMART Attributes with Thresholds:
> ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE
>      UPDATED  WHEN_FAILED RAW_VALUE
>   4 Start_Stop_Count        0x0032   100   100   020    Old_age
>   Always       -       5
>   9 Power_On_Hours          0x0032   099   099   000    Old_age
>   Always       -       944

Судя по этому он явно не год работает. А либо сильно больше, либо сильно 
меньше. Или у него SMART-статистику как-то сбросили?


^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Hardware] [JT] Dangerous values of SMART-attributes?
  2006-03-13  8:30   ` Olvin
@ 2006-03-13  9:58     ` antilopa_gnu
  2006-03-13 10:25       ` Olvin
  0 siblings, 1 reply; 8+ messages in thread
From: antilopa_gnu @ 2006-03-13  9:58 UTC (permalink / raw)
  To: hardware

Olvin пишет:

> antilopa_gnu wrote:
<skip>
> > Device Model:     ST3120022A
> > ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE
> >      UPDATED  WHEN_FAILED RAW_VALUE
> >   4 Start_Stop_Count        0x0032   100   100   020    Old_age
> >   Always       -       5
> >   9 Power_On_Hours          0x0032   099   099   000    Old_age
> >   Always       -       944
> 
> Судя по этому он явно не год работает. А либо сильно больше, либо сильно 
> меньше. 

Имеете в виду, что 944!=(365*24) ?
Так ведь не о круглосуточной работе речь, а о работе по несколько часов
каждый день. А количеству включений-выключений здесь соответствует, 
видимо, Power_Cycle_Count равный 303.

> Или у него SMART-статистику как-то сбросили?
А такое возможно? 



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Hardware] [JT] Dangerous values of SMART-attributes?
  2006-03-13  9:58     ` [Hardware] [JT] " antilopa_gnu
@ 2006-03-13 10:25       ` Olvin
  0 siblings, 0 replies; 8+ messages in thread
From: Olvin @ 2006-03-13 10:25 UTC (permalink / raw)
  To: hardware

antilopa_gnu@list.ru wrote:

>>>Device Model:     ST3120022A
>>>ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE
>>>     UPDATED  WHEN_FAILED RAW_VALUE
>>>  4 Start_Stop_Count        0x0032   100   100   020    Old_age
>>>  Always       -       5
>>>  9 Power_On_Hours          0x0032   099   099   000    Old_age
>>>  Always       -       944
>>Судя по этому он явно не год работает. А либо сильно больше, либо сильно 
>>меньше. 
> Имеете в виду, что 944!=(365*24) ?
> Так ведь не о круглосуточной работе речь, а о работе по несколько часов
> каждый день.

А... Тогда ясно. Работал в будние дни по 6-7-8 часов? :)

> А количеству включений-выключений здесь соответствует, 
> видимо, Power_Cycle_Count равный 303.

А это как? Я считал, что это значение всегда соответствует реальному 
количеству выключений винта.

>>Или у него SMART-статистику как-то сбросили?
> А такое возможно? 

Теоретически - да. С помощью специального софта. На практике не 
наблюдал. Это надо спрашивать у тех, кто ремонтом винчестеров занимается.


^ permalink raw reply	[flat|nested] 8+ messages in thread

end of thread, other threads:[~2006-03-13 10:25 UTC | newest]

Thread overview: 8+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2006-03-09  9:16 [Hardware] Dangerous values of SMART-attributes? Taurelasse
2006-03-09 10:06 ` Michael Shigorin
2006-03-09 11:19   ` Taurelasse
2006-03-09 11:35     ` ABATAPA
2006-03-13  5:37 ` antilopa_gnu
2006-03-13  8:30   ` Olvin
2006-03-13  9:58     ` [Hardware] [JT] " antilopa_gnu
2006-03-13 10:25       ` Olvin

ALT Linux hardware support

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \
		hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org
	public-inbox-index hardware

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.hardware


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git