* [Hardware] LSI SAS1064E
@ 2016-06-23 12:47 Anton Gorlov
2016-06-23 13:35 ` Konstantin Lepikhov
0 siblings, 1 reply; 4+ messages in thread
From: Anton Gorlov @ 2016-06-23 12:47 UTC (permalink / raw)
To: hardware
Доброго дня всем.
Озадачился тут мониторингом SAS дисков.. и обнаружил что почти на всех
серверах с указанным контроллером (Logic SAS1064ET)
на портах есть ECC ошибки. Причём даже на заведомо новых дисках. В dmesg
ругани на сколько вижу нет,в отличие от smartctl.
Вот например сервер недавно только включил и поставил новый диск.
===
Vendor: IBM-ESXS
Product: ST9146853SS
Revision: B63E
User Capacity: 146,814,976,000 bytes [146 GB]
Logical block size: 512 bytes
Logical Unit id: 0x5000c500548d2f2b
Serial number: 6XM10X530000B2509A5R
Device type: disk
Transport protocol: SAS
Local Time is: Thu Jun 23 16:46:47 2016 MSK
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK
Current Drive Temperature: 39 C
Drive Trip Temperature: 65 C
Elements in grown defect list: 0
Vendor (Seagate) cache information
Blocks sent to initiator = 0
Vendor (Seagate/Hitachi) factory information
number of hours powered up = 2.32
number of minutes until next internal SMART test = 34
Error counter log:
Errors Corrected by Total Correction
Gigabytes Total
ECC rereads/ errors algorithm
processed uncorrected
fast | delayed rewrites corrected invocations [10^9
bytes] errors
read: 6021031 0 0 6021031 0
0.030 0
write: 0 0 0 0 0
150.153 0
verify: 145317 0 0 145317 0
0.057 0
Non-medium error count: 0
No self-tests have been logged
Long (extended) Self Test duration: 1099 seconds [18.3 minutes]
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Hardware] LSI SAS1064E
2016-06-23 12:47 [Hardware] LSI SAS1064E Anton Gorlov
@ 2016-06-23 13:35 ` Konstantin Lepikhov
2016-06-23 13:45 ` Anton Gorlov
0 siblings, 1 reply; 4+ messages in thread
From: Konstantin Lepikhov @ 2016-06-23 13:35 UTC (permalink / raw)
To: hardware
Hi Anton!
On 06/23/16, at 03:47:57 PM you wrote:
> Доброго дня всем.
>
> Озадачился тут мониторингом SAS дисков.. и обнаружил что почти на всех
> серверах с указанным контроллером (Logic SAS1064ET)
>
> на портах есть ECC ошибки. Причём даже на заведомо новых дисках. В dmesg
> ругани на сколько вижу нет,в отличие от smartctl.
>
> Вот например сервер недавно только включил и поставил новый диск.
>
У вас тут форматирование вывода побилось, если кол-во ошибок совпадает с
corrected, это нестрашно. Но если цифры действительно высокие, есть смысл
проверить кабели, что SATA, что SAS - все теперь экономят на спичках, т.е.
кабелях.
--
WBR et al.
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Hardware] LSI SAS1064E
2016-06-23 13:35 ` Konstantin Lepikhov
@ 2016-06-23 13:45 ` Anton Gorlov
2016-06-23 14:49 ` Konstantin Lepikhov
0 siblings, 1 reply; 4+ messages in thread
From: Anton Gorlov @ 2016-06-23 13:45 UTC (permalink / raw)
To: hardware
23.06.2016 16:35, Konstantin Lepikhov пишет:
> У вас тут форматирование вывода побилось, если кол-во ошибок совпадает с
> corrected, это нестрашно. Но если цифры действительно высокие, есть смысл
> проверить кабели, что SATA, что SAS - все теперь экономят на спичках, т.е.
> кабелях.
Да оно совпадает
http://paste.org.ru/?djzjgp
Провода менял, сейчас ещё съезжу прошивку обновлю. Но что странно оно
почти везде есть, но на некоторых серверах не на всех портах.
Вот на конкретно этом на 1 пору есть на 3 нёт. на соседнем на 3 есть на
1 нет.
Чую надо будет в ibm запрос забросить ещё..Всё таки их сервера.
^ permalink raw reply [flat|nested] 4+ messages in thread
* Re: [Hardware] LSI SAS1064E
2016-06-23 13:45 ` Anton Gorlov
@ 2016-06-23 14:49 ` Konstantin Lepikhov
0 siblings, 0 replies; 4+ messages in thread
From: Konstantin Lepikhov @ 2016-06-23 14:49 UTC (permalink / raw)
To: hardware
Hi Anton!
On 06/23/16, at 04:45:34 PM you wrote:
> 23.06.2016 16:35, Konstantin Lepikhov пишет:
> > У вас тут форматирование вывода побилось, если кол-во ошибок совпадает с
> > corrected, это нестрашно. Но если цифры действительно высокие, есть смысл
> > проверить кабели, что SATA, что SAS - все теперь экономят на спичках, т.е.
> > кабелях.
>
> Да оно совпадает
>
> http://paste.org.ru/?djzjgp
>
> Провода менял, сейчас ещё съезжу прошивку обновлю. Но что странно оно
> почти везде есть, но на некоторых серверах не на всех портах.
>
> Вот на конкретно этом на 1 пору есть на 3 нёт. на соседнем на 3 есть на
> 1 нет.
>
>
> Чую надо будет в ibm запрос забросить ещё..Всё таки их сервера.
Если погуглить, то можно найти вот это обсуждение
https://forums.servethehome.com/index.php?threads/sas-drives-with-high-ecc-corrected-errors.6960/
- говорят, это связано с техникой, как диск выводи smart информацию, т.е.
могут быть "сырые" данные вместо правильно подсчитанных, тогда на кол-во
ошибок можно забить.
--
WBR et al.
^ permalink raw reply [flat|nested] 4+ messages in thread
end of thread, other threads:[~2016-06-23 14:49 UTC | newest]
Thread overview: 4+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2016-06-23 12:47 [Hardware] LSI SAS1064E Anton Gorlov
2016-06-23 13:35 ` Konstantin Lepikhov
2016-06-23 13:45 ` Anton Gorlov
2016-06-23 14:49 ` Konstantin Lepikhov
ALT Linux hardware support
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/hardware/0 hardware/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 hardware hardware/ http://lore.altlinux.org/hardware \
hardware@altlinux.ru hardware@lists.altlinux.org hardware@lists.altlinux.ru hardware@lists.altlinux.com hardware@altlinux.org
public-inbox-index hardware
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.hardware
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git