* [Sysadmins] Ядро ovz-el, software RAID5, его синхронизация и высокий LA
@ 2012-06-03 14:06 Alex Moskalenko
2012-06-03 18:56 ` Alex Moskalenko
0 siblings, 1 reply; 3+ messages in thread
From: Alex Moskalenko @ 2012-06-03 14:06 UTC (permalink / raw)
To: sysadmins
Здравствуйте!
Столкнулся с непонятным мне поведением системы на ovz-el при
синхронизации/создании/проверке программного массива RAID5.
Исходные данные: Intel(R) Core(TM)2 CPU 6420@2.13GHz, чипсет G31, SATA
ICH9R в режиме AHCI. 4 SATA жестких диска. На них собран программный
RAID5 массив
md5 : active raid5 sdc2[0] sdd2[4] sde2[2] sdf2[1]
1514703360 blocks super 1.2 level 5, 512k chunk, algorithm 2
[4/4] [UUUU]
bitmap: 6/482 pages [24KB], 512KB chunk, file: /_bitmap_md5
Работает все это на 2.6.32-ovz-el-alt63 (аналогичное поведение было на
ovz-el ядрах и до alt63). При создании/ребилде/проверке этого массива
получаю нехарактерно низкую для такой системы скорость синхронизации и
нехарактерно высокий LA. Также высокий LA получается при интенсивной
работе с массивом RAID5. С массивом RAID10, расположенным на тех же
дисках, таких эффектов не наблюдается.
Для примера - текущий снимок системы в момент проверки массива:
cat /proc/mdstat
Personalities : [raid1] [raid10] [raid6] [raid5] [raid4]
md5 : active raid5 sdc2[0] sdd2[4] sde2[2] sdf2[1]
1514703360 blocks super 1.2 level 5, 512k chunk, algorithm 2
[4/4] [UUUU]
[>....................] check = 4.6% (23342252/504901120)
finish=990.1min speed=8105K/sec
bitmap: 6/482 pages [24KB], 512KB chunk, file: /_bitmap_md5
uptime
17:21:52 up 23 days, 4:53, 1 user, load average: 50.28, 54.18, 49.92
В списке процессов видно ~255 штук [async/XXX] потоков ядра, из них в
состоянии R находится примерно LA 1min.
По dstat картина следующая:
----total-cpu-usage----
--dsk/sdc-----dsk/sdd-----dsk/sde-----dsk/sdf-- -net/total- ---paging--
---system--
usr sys idl wai hiq siq| read writ: read writ: read writ: read writ|
recv send| in out | int csw
4 2 60 33 0 1| 1082k 1198k: 586k 1196k:1070k 1196k: 574k
1198k| 0 0 | 23B 38B|1864 4188
1 69 30 0 0 0| 0 0 : 0 0 : 0 0 : 0 0
| 22k 27k| 0 0 | 25k 590k
2 73 24 0 0 0| 0 0 : 0 0 :8192B 0 : 0 0
: 0 0 : 0 0 | 43k 49k| 0 0 | 28k 583k
2 72 26 0 0 0| 0 9216B: 0 25k: 0 25k: 0
9216B| 44k 49k| 0 0 | 27k 582k
7 72 21 0 0 0| 0 1024B: 0 1024B: 0 1024B: 0
1024B| 19k 22k| 0 0 | 41k 605k
2 72 25 1 0 0|8568k 2048B:7644k 2048B:8116k 2048B:7584k
2048B| 43k 48k| 0 0 | 31k 526k
2 78 18 0 0 2| 56M 0 : 57M 0 : 56M 0 : 57M 0
| 41k 46k| 0 0 | 26k 585k
1 68 31 0 0 0| 0 0 : 0 0 : 0 0 : 0 0
|5318B 7801B| 0 0 | 25k 589k
1 70 28 0 0 0| 0 13k: 0 9216B: 0 9216B: 0
13k| 27k 31k| 0 0 | 30k 585k
5 71 24 0 0 0| 0 1024B: 0 1024B: 0 1024B: 0
1024B| 31k 35k| 0 0 | 36k 603k
2 75 23 0 0 1| 0 0 : 0 0 : 0 0 : 0 0
| 70k 78k| 0 0 | 30k 577k
2 70 28 0 0 0| 0 0 : 0 0 : 0 0 : 0 0
| 25k 28k| 0 0 | 30k 579k
1 69 29 0 0 0| 0 0 : 0 0 : 0 0 : 0 0
| 11k 14k| 0 0 | 25k 584k
2 76 20 0 0 2|7404k 972k:6384k 940k:8524k 940k:9712k
972k| 74k 82k| 0 0 | 25k 529k
5 72 21 0 0 1| 57M 1024B: 58M 1024B: 56M 1024B: 55M
1024B| 21k 24k| 0 0 | 34k 599k
3 75 22 0 0 0| 0 0 : 0 0 : 0 0 : 0 0
| 48k 54k| 0 0 | 33k 582k^C
Мне кажется, что на таком железе скорость синхронизации RAID5 в 10 Мб/с
при LA 50 - это несколько чересчур. При этом, как видно по dstat, ядра
загружены совсем не на 100%. Также из dstat видно очень больное
количество context switches и программных прерываний.
Подскажите пожалуйста, куда можно покопать в этом вопросе. Может быть,
можно что-то передать ядру/какому либо модулю, чтобы они не вели себя
так ээээ.... неадекватно?
--
WBR, Alex Moskalenko
^ permalink raw reply [flat|nested] 3+ messages in thread
* Re: [Sysadmins] Ядро ovz-el, software RAID5, его синхронизация и высокий LA
2012-06-03 14:06 [Sysadmins] Ядро ovz-el, software RAID5, его синхронизация и высокий LA Alex Moskalenko
@ 2012-06-03 18:56 ` Alex Moskalenko
2012-06-04 10:29 ` Alex Moskalenko
0 siblings, 1 reply; 3+ messages in thread
From: Alex Moskalenko @ 2012-06-03 18:56 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
03.06.2012 18:06, Alex Moskalenko пишет:
> Здравствуйте!
>
> Столкнулся с непонятным мне поведением системы на ovz-el при
> синхронизации/создании/проверке программного массива RAID5.
>
> Исходные данные: Intel(R) Core(TM)2 CPU 6420@2.13GHz, чипсет G31, SATA
> ICH9R в режиме AHCI. 4 SATA жестких диска. На них собран программный
> RAID5 массив
> md5 : active raid5 sdc2[0] sdd2[4] sde2[2] sdf2[1]
> 1514703360 blocks super 1.2 level 5, 512k chunk, algorithm 2
> [4/4] [UUUU]
> bitmap: 6/482 pages [24KB], 512KB chunk, file: /_bitmap_md5
>
> Работает все это на 2.6.32-ovz-el-alt63 (аналогичное поведение было на
> ovz-el ядрах и до alt63). При создании/ребилде/проверке этого массива
> получаю нехарактерно низкую для такой системы скорость синхронизации и
> нехарактерно высокий LA. Также высокий LA получается при интенсивной
> работе с массивом RAID5. С массивом RAID10, расположенным на тех же
> дисках, таких эффектов не наблюдается.
>
> Для примера - текущий снимок системы в момент проверки массива:
>
> cat /proc/mdstat
> Personalities : [raid1] [raid10] [raid6] [raid5] [raid4]
> md5 : active raid5 sdc2[0] sdd2[4] sde2[2] sdf2[1]
> 1514703360 blocks super 1.2 level 5, 512k chunk, algorithm 2
> [4/4] [UUUU]
> [>....................] check = 4.6% (23342252/504901120)
> finish=990.1min speed=8105K/sec
> bitmap: 6/482 pages [24KB], 512KB chunk, file: /_bitmap_md5
> uptime
> 17:21:52 up 23 days, 4:53, 1 user, load average: 50.28, 54.18, 49.92
Проблема, похоже, в CONFIG_MULTICORE_RAID456=y. Возможно, нет смысла
включать по умолчанию эту опцию? Судя по ссылкам, оно работает мягко
говоря "странно". В ближайшее время, если ничего не помешает, попробую
пересобрать ядро с CONFIG_MULTICORE_RAID456=n, и если проблема исчезнет
- повешу багу.
^ permalink raw reply [flat|nested] 3+ messages in thread
* Re: [Sysadmins] Ядро ovz-el, software RAID5, его синхронизация и высокий LA
2012-06-03 18:56 ` Alex Moskalenko
@ 2012-06-04 10:29 ` Alex Moskalenko
0 siblings, 0 replies; 3+ messages in thread
From: Alex Moskalenko @ 2012-06-04 10:29 UTC (permalink / raw)
To: ALT Linux sysadmins' discussion
03.06.2012 22:56, Alex Moskalenko пишет:
> 03.06.2012 18:06, Alex Moskalenko пишет:
>> Здравствуйте!
>>
>> Столкнулся с непонятным мне поведением системы на ovz-el при
>> синхронизации/создании/проверке программного массива RAID5.
>> Работает все это на 2.6.32-ovz-el-alt63 (аналогичное поведение было на
>> ovz-el ядрах и до alt63). При создании/ребилде/проверке этого массива
>> получаю нехарактерно низкую для такой системы скорость синхронизации и
>> нехарактерно высокий LA. Также высокий LA получается при интенсивной
>> работе с массивом RAID5. С массивом RAID10, расположенным на тех же
>> дисках, таких эффектов не наблюдается.
> Проблема, похоже, в CONFIG_MULTICORE_RAID456=y. Возможно, нет смысла
> включать по умолчанию эту опцию? Судя по ссылкам, оно работает мягко
> говоря "странно". В ближайшее время, если ничего не помешает, попробую
> пересобрать ядро с CONFIG_MULTICORE_RAID456=n, и если проблема
> исчезнет - повешу багу.
Да, это оно. Пересборка с отключенным CONFIG_MULTICORE_RAID456 приводит
скорость и LA в адекватное состояние. Соответственно,
https://bugzilla.altlinux.org/show_bug.cgi?id=27399.
^ permalink raw reply [flat|nested] 3+ messages in thread
end of thread, other threads:[~2012-06-04 10:29 UTC | newest]
Thread overview: 3+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2012-06-03 14:06 [Sysadmins] Ядро ovz-el, software RAID5, его синхронизация и высокий LA Alex Moskalenko
2012-06-03 18:56 ` Alex Moskalenko
2012-06-04 10:29 ` Alex Moskalenko
ALT Linux sysadmins discussion
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/sysadmins/0 sysadmins/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 sysadmins sysadmins/ http://lore.altlinux.org/sysadmins \
sysadmins@lists.altlinux.org sysadmins@lists.altlinux.ru sysadmins@lists.altlinux.com
public-inbox-index sysadmins
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.sysadmins
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git