ALT Linux sysadmins discussion
 help / color / mirror / Atom feed
* [Sysadmins] Ошибки ata2.00: exception...
@ 2008-10-02  8:49 Денис Ягофаров
  2008-10-02  9:14 ` Serge
  2008-10-06 20:58 ` Michael Shigorin
  0 siblings, 2 replies; 9+ messages in thread
From: Денис Ягофаров @ 2008-10-02  8:49 UTC (permalink / raw)
  To: ALT Linux sysadmin discuss

[-- Attachment #1: Type: text/plain, Size: 2509 bytes --]

Доброго времени суток.

При тестировании soft-RAID 5 на 4-х жестких дисках SATA ST3750640AS в 
логи часто сыпется:
Oct  2 11:07:24 localhost kernel: ata2.00: exception Emask 0x0 SAct 0x0 
SErr 0x0 action 0x0
Oct  2 11:07:24 localhost kernel: ata2.00: (irq_stat 0x40000001)
Oct  2 11:07:24 localhost kernel: ata2.00: tag 0 cmd 0xea Emask 0x1 stat 
0x61 err 0x4 (device error)
Oct  2 11:07:24 localhost kernel: ata2: EH complete
Oct  2 11:07:24 localhost kernel: SCSI device sdf: 1465149168 512-byte 
hdwr sectors (750156 MB)
Oct  2 11:07:24 localhost kernel: sdf: Write Protect is off
Oct  2 11:07:24 localhost kernel: SCSI device sdf: drive cache: write back
Oct  2 11:09:36 localhost kernel: ata2.00: exception Emask 0x0 SAct 0x0 
SErr 0x0 action 0x0
Oct  2 11:09:36 localhost kernel: ata2.00: (irq_stat 0x40000001)
Oct  2 11:09:36 localhost kernel: ata2.00: tag 0 cmd 0xea Emask 0x1 stat 
0x61 err 0x4 (device error)
Oct  2 11:09:41 localhost kernel: ata2: EH complete
Oct  2 11:09:41 localhost kernel: SCSI device sdf: 1465149168 512-byte 
hdwr sectors (750156 MB)
Oct  2 11:09:41 localhost kernel: sdf: Write Protect is off
Oct  2 11:09:41 localhost kernel: SCSI device sdf: drive cache: write back

Вопрос: На сколько это критично, и что это значит (помимо проблем с 1 из 
дисков)?

О конфигурации:
Контроллер 00:1f.2 SATA controller: Intel Corporation 631xESB/632xESB 
SATA Storage Controller AHCI (rev 09)
Ядро 2.6.18-std-smp-alt12.M40.3

/dev/md0:
Version : 00.90.03
Creation Time : Tue Sep 30 10:39:13 2008
Raid Level : raid5
Array Size : 2197715712 (2095.91 GiB 2250.46 GB)
Used Dev Size : 732571904 (698.64 GiB 750.15 GB)
Raid Devices : 4
Total Devices : 4
Preferred Minor : 0
Persistence : Superblock is persistent
Update Time : Thu Oct  2 11:28:08 2008
State : active
Active Devices : 4
Working Devices : 4
Failed Devices : 0
Spare Devices : 0
Layout : left-symmetric
Chunk Size : 64K
UUID : ff9d3992:fc427bd1:d4f6d241:21fdc934
Events : 0.3
    Number   Major   Minor   RaidDevice State
       0       8       81        0      active sync   /dev/sdf1
       1       8       97        1      active sync   /dev/sdg1
       2       8      113        2      active sync   /dev/sdh1
       3       8      129        3      active sync   /dev/sdi1


Тестирование сейчас идёт вот такое:
bonnie -s 2047 -v 80 -m store

[-- Attachment #2: denyago.vcf --]
[-- Type: text/x-vcard, Size: 281 bytes --]

begin:vcard
fn:Denis Timurovich Yagofarov
n:Yagofarov;Denis Timurovich
org:ITGIS NASU
adr:room 615;;Chokolovski blvdr., 13;Kiev;;03151;Ukraine
email;internet:denyago@rambler.ru
title:system administrator
tel;work:80442480755
x-mozilla-html:FALSE
version:2.1
end:vcard


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Sysadmins] Ошибки ata2.00: exception...
  2008-10-02  8:49 [Sysadmins] Ошибки ata2.00: exception Денис Ягофаров
@ 2008-10-02  9:14 ` Serge
  2008-10-02 12:00   ` Денис Ягофаров
  2008-10-06 20:58 ` Michael Shigorin
  1 sibling, 1 reply; 9+ messages in thread
From: Serge @ 2008-10-02  9:14 UTC (permalink / raw)
  To: ALT Linux sysadmin discuss

On Thursday 02 October 2008 11:49:02 Денис Ягофаров wrote:
>  ata2.00: tag 0 cmd 0xea Emask 0x1 stat
http://lists.altlinux.org/pipermail/hardware/2008-July/013575.html



^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Sysadmins] Ошибки ata2.00: exception...
  2008-10-02  9:14 ` Serge
@ 2008-10-02 12:00   ` Денис Ягофаров
  2008-10-08 11:07     ` Michael Shigorin
  0 siblings, 1 reply; 9+ messages in thread
From: Денис Ягофаров @ 2008-10-02 12:00 UTC (permalink / raw)
  To: ALT Linux sysadmin discuss

[-- Attachment #1: Type: text/plain, Size: 275 bytes --]

Спасибо!

Оказалось, жесткий диск посыпался.
ID#    ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      
UPDATED  WHEN_FAILED RAW_VALUE
  5     Reallocated_Sector_Ct           0x0033   018       018           
036        Pre-fail      Always       FAILING_NOW 3295

[-- Attachment #2: denyago.vcf --]
[-- Type: text/x-vcard, Size: 269 bytes --]

begin:vcard
fn:Denis Timurovich Yagofarov
n:Yagofarov;Denis Timurovich
org:ITGIS NASU
adr:room 615;;Chokolovski blvdr., 13;Kiev;;03151;Ukraine
email;internet:denyago@rambler.ru
title:system administrator
tel;work:80442480755
x-mozilla-html:FALSE
version:2.1
end:vcard


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Sysadmins] Ошибки ata2.00: exception...
  2008-10-02  8:49 [Sysadmins] Ошибки ata2.00: exception Денис Ягофаров
  2008-10-02  9:14 ` Serge
@ 2008-10-06 20:58 ` Michael Shigorin
  1 sibling, 0 replies; 9+ messages in thread
From: Michael Shigorin @ 2008-10-06 20:58 UTC (permalink / raw)
  To: ALT Linux sysadmin discuss

On Thu, Oct 02, 2008 at 11:49:02AM +0300, Денис Ягофаров wrote:
> При тестировании soft-RAID 5 на 4-х жестких дисках SATA ST3750640AS

А это уже жёсткие диски?

http://www.google.com/search?q=seagate+sata+shigorin+-.txt.gz+site%3Alists.altlinux.org

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Sysadmins] Ошибки ata2.00: exception...
  2008-10-02 12:00   ` Денис Ягофаров
@ 2008-10-08 11:07     ` Michael Shigorin
  2008-10-08 11:31       ` Led
  0 siblings, 1 reply; 9+ messages in thread
From: Michael Shigorin @ 2008-10-08 11:07 UTC (permalink / raw)
  To: ALT Linux sysadmin discuss

On Thu, Oct 02, 2008 at 03:00:15PM +0300, Денис Ягофаров wrote:
> Оказалось, жесткий диск посыпался.

Такие сигейты (SATA 200..750 -- проверено) сейчас нежёсткие...

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Sysadmins] Ошибки ata2.00: exception...
  2008-10-08 11:07     ` Michael Shigorin
@ 2008-10-08 11:31       ` Led
  2008-10-08 11:41         ` Led
  0 siblings, 1 reply; 9+ messages in thread
From: Led @ 2008-10-08 11:31 UTC (permalink / raw)
  To: ALT Linux sysadmin discuss

On Wednesday, 08 October 2008 14:07:39 Michael Shigorin wrote:
> On Thu, Oct 02, 2008 at 03:00:15PM +0300, Денис Ягофаров wrote:
> > Оказалось, жесткий диск посыпался.
>
> Такие сигейты (SATA 200..750 -- проверено) сейчас нежёсткие...

Они греются сильно. С нормальным теплоотводом у меня две 250-ки живут 
нормально (2 и 1,5 года соответственно).

-- 
Led

^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Sysadmins] Ошибки ata2.00: exception...
  2008-10-08 11:31       ` Led
@ 2008-10-08 11:41         ` Led
  2008-10-08 12:03           ` Денис Ягофаров
  0 siblings, 1 reply; 9+ messages in thread
From: Led @ 2008-10-08 11:41 UTC (permalink / raw)
  To: ALT Linux sysadmin discuss

On Wednesday, 08 October 2008 14:31:09 Led wrote:
> On Wednesday, 08 October 2008 14:07:39 Michael Shigorin wrote:
> > On Thu, Oct 02, 2008 at 03:00:15PM +0300, Денис Ягофаров wrote:
> > > Оказалось, жесткий диск посыпался.
> >
> > Такие сигейты (SATA 200..750 -- проверено) сейчас нежёсткие...
>
> Они греются сильно. С нормальным теплоотводом у меня две 250-ки живут
> нормально (2 и 1,5 года соответственно).

Соврал: не 250-ки, а 320-ки

-- 
Led

^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Sysadmins] Ошибки ata2.00: exception...
  2008-10-08 11:41         ` Led
@ 2008-10-08 12:03           ` Денис Ягофаров
  2008-10-08 12:06             ` Michael Shigorin
  0 siblings, 1 reply; 9+ messages in thread
From: Денис Ягофаров @ 2008-10-08 12:03 UTC (permalink / raw)
  To: ALT Linux sysadmin discuss

[-- Attachment #1: Type: text/plain, Size: 305 bytes --]

Led пишет:
>> Они греются сильно. С нормальным теплоотводом у меня две 250-ки живут
>> нормально (2 и 1,5 года соответственно).
>>     
Пока, если верить - холодные:
 hddtemp /dev/sd{e,f,g,h}
/dev/sde: ST3750640AS: 29 C
/dev/sdf: ST3750640AS: 29 C
/dev/sdg: ST3750640AS: 27 C
/dev/sdh: ST3750640AS: 26 C


[-- Attachment #2: denyago.vcf --]
[-- Type: text/x-vcard, Size: 269 bytes --]

begin:vcard
fn:Denis Timurovich Yagofarov
n:Yagofarov;Denis Timurovich
org:ITGIS NASU
adr:room 615;;Chokolovski blvdr., 13;Kiev;;03151;Ukraine
email;internet:denyago@rambler.ru
title:system administrator
tel;work:80442480755
x-mozilla-html:FALSE
version:2.1
end:vcard


^ permalink raw reply	[flat|nested] 9+ messages in thread

* Re: [Sysadmins] Ошибки ata2.00: exception...
  2008-10-08 12:03           ` Денис Ягофаров
@ 2008-10-08 12:06             ` Michael Shigorin
  0 siblings, 0 replies; 9+ messages in thread
From: Michael Shigorin @ 2008-10-08 12:06 UTC (permalink / raw)
  To: ALT Linux sysadmin discuss

On Wed, Oct 08, 2008 at 03:03:17PM +0300, Денис Ягофаров wrote:
> >>Они греются сильно. С нормальным теплоотводом у меня две
> >>250-ки живут нормально (2 и 1,5 года соответственно).
> Пока, если верить - холодные:
> hddtemp /dev/sd{e,f,g,h}

BTW hddtemp /dev/sd[e-h] :-)

> /dev/sde: ST3750640AS: 29 C
> /dev/sdf: ST3750640AS: 29 C
> /dev/sdg: ST3750640AS: 27 C
> /dev/sdh: ST3750640AS: 26 C

Заглянул на единственную рабочую систему, куда за последний год
устанавливались Seagate SATA (из другой системы, где они больше
года проработали) -- один из дисков содержит с дюжину проблем
чтения в SMART log; возникли через две недели включенности
к четвёртому часу после очередного выключения, судя по логу:

Error 12 occurred at disk power-on lifetime: 345 hours (14 days + 9 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 10 ef 49 e0  Error: UNC at LBA = 0x0049ef10 = 4845328

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 00 85 eb 49 e0 00      03:58:49.803  READ DMA EXT
  27 00 00 00 00 00 e0 00      03:58:49.783  READ NATIVE MAX ADDRESS EXT
  ec 00 00 00 00 00 a0 02      03:58:49.648  IDENTIFY DEVICE
  ef 03 44 00 00 00 a0 00      03:58:47.671  SET FEATURES [Set transfer mode]
  27 00 00 00 00 00 e0 00      03:58:47.619  READ NATIVE MAX ADDRESS EXT

Второй диск проблем не показывает (работают в зеркале).
Это ST3250620NS, который Barracuda ES.  7200.9 летели пачками.
Жили, кажется, 7200.7 ещё.

Вообще эта тема неплохо разбиралась на ixbt.com.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 9+ messages in thread

end of thread, other threads:[~2008-10-08 12:06 UTC | newest]

Thread overview: 9+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2008-10-02  8:49 [Sysadmins] Ошибки ata2.00: exception Денис Ягофаров
2008-10-02  9:14 ` Serge
2008-10-02 12:00   ` Денис Ягофаров
2008-10-08 11:07     ` Michael Shigorin
2008-10-08 11:31       ` Led
2008-10-08 11:41         ` Led
2008-10-08 12:03           ` Денис Ягофаров
2008-10-08 12:06             ` Michael Shigorin
2008-10-06 20:58 ` Michael Shigorin

ALT Linux sysadmins discussion

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/sysadmins/0 sysadmins/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 sysadmins sysadmins/ http://lore.altlinux.org/sysadmins \
		sysadmins@lists.altlinux.org sysadmins@lists.altlinux.ru sysadmins@lists.altlinux.com
	public-inbox-index sysadmins

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.sysadmins


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git