ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] CPU iowait слишком велико
@ 2012-07-13 19:15 Vladimir Karpinsky
  2012-07-13 20:47 ` Arcady V. Ivanov
  2012-07-14  6:45 ` Alexei Takaseev
  0 siblings, 2 replies; 8+ messages in thread
From: Vladimir Karpinsky @ 2012-07-13 19:15 UTC (permalink / raw)
  To: ALT Linux Community general discussions

Здравствуйте!

На одном их компьютеров наблюдаю такую картину:

top - 18:54:42 up 153 days,  3:11,  4 users,  load average: 0.28, 0.31, 0.49
Tasks: 273 total,   1 running, 272 sleeping,   0 stopped,   0 zombie
CPU0  :  0.1%us,  3.1%sy,  0.9%ni, 70.5%id, 25.2%wa,  0.0%hi,  0.2%si,  0.0%st
CPU1  :  0.1%us,  3.1%sy,  0.9%ni, 70.5%id, 25.1%wa,  0.0%hi,  0.2%si,  0.0%st
Mem:   4059540K total,  3906728K used,   152812K free,     7756K buffers
Swap:  2095036K total,  2095036K used,        0K free,   279424K cached

Имеется подтормаживание при запуске некторых процессов. В данный момент 
ничего особенного в данный момент не делает, крутятся несколько процессов, 
MySQL в совсем нежёстком режиме, м.б. не закрыт сеанс KDE4, 4 зеркальных 
RAID'а. Из 271 задачи подавляющее большинство "спит". На соседних ящиках с 
древней начинкой и подобными задачами не вижу, чтобы 25% iowait было, да и 
памяти куда-то сожрано немерено. На что имеет смысл обратить внимание, 
чтобы локализовать проблему?

#uname -a
Linux pulman.spb.gsras.ru 3.0.20-std-def-alt0.M60P.1 #1 SMP Wed Feb 8 
11:19:53 UTC 2012 x86_64 GNU/Linux

Бранч p6, но уже месяца 2--2.5 не обновлялся, --- всё разъезды, да ещё и в 
места с плохой или вообще отсутствующей связью.

-- 
	С уважением,
		Владимир.



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] CPU iowait слишком велико
  2012-07-13 19:15 [Comm] CPU iowait слишком велико Vladimir Karpinsky
@ 2012-07-13 20:47 ` Arcady V. Ivanov
  2012-07-14  4:22   ` Vladimir Karpinsky
  2012-07-14  6:45 ` Alexei Takaseev
  1 sibling, 1 reply; 8+ messages in thread
From: Arcady V. Ivanov @ 2012-07-13 20:47 UTC (permalink / raw)
  To: ALT Linux Community general discussions

Посмотрите с помощью iotop.
Думаю, это проблема RAID-а.

У меня такая же фигня была.
Если dmesg рисует deadlock-и на 120 сек, это проблема hiresolution таймера.

Ещё крайне полезно поставить для монтирования разделов опцию relatime,
если её почему-то нет.



----- Original Message -----
> From: "Vladimir Karpinsky" <vkarpinsky@mail.ru>
> To: "ALT Linux Community general discussions" <community@lists.altlinux.org>
> Sent: Friday, July 13, 2012 9:15:53 PM
> Subject: [Comm] CPU iowait слишком велико
> 
> Здравствуйте!
> 
> На одном их компьютеров наблюдаю такую картину:
> 
> top - 18:54:42 up 153 days,  3:11,  4 users,  load average: 0.28,
> 0.31, 0.49
> Tasks: 273 total,   1 running, 272 sleeping,   0 stopped,   0 zombie
> CPU0  :  0.1%us,  3.1%sy,  0.9%ni, 70.5%id, 25.2%wa,  0.0%hi,
>  0.2%si,  0.0%st
> CPU1  :  0.1%us,  3.1%sy,  0.9%ni, 70.5%id, 25.1%wa,  0.0%hi,
>  0.2%si,  0.0%st
> Mem:   4059540K total,  3906728K used,   152812K free,     7756K
> buffers
> Swap:  2095036K total,  2095036K used,        0K free,   279424K
> cached
> 
> Имеется подтормаживание при запуске некторых процессов. В данный
> момент
> ничего особенного в данный момент не делает, крутятся несколько
> процессов,
> MySQL в совсем нежёстком режиме, м.б. не закрыт сеанс KDE4, 4
> зеркальных
> RAID'а. Из 271 задачи подавляющее большинство "спит". На соседних
> ящиках с
> древней начинкой и подобными задачами не вижу, чтобы 25% iowait было,
> да и
> памяти куда-то сожрано немерено. На что имеет смысл обратить
> внимание,
> чтобы локализовать проблему?
> 
> #uname -a
> Linux pulman.spb.gsras.ru 3.0.20-std-def-alt0.M60P.1 #1 SMP Wed Feb 8
> 11:19:53 UTC 2012 x86_64 GNU/Linux
> 
> Бранч p6, но уже месяца 2--2.5 не обновлялся, --- всё разъезды, да
> ещё и в
> места с плохой или вообще отсутствующей связью.
> 
> --
> 	С уважением,
> 		Владимир.
> 
> _______________________________________________
> community mailing list
> community@lists.altlinux.org
> https://lists.altlinux.org/mailman/listinfo/community

-- 
С уважением.
Гл. специалист по ИТ ИКИР ДВО РАН.
Аркадий Иванов.
Sincerely yours.
My site http://www.arccomm.ru


^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] CPU iowait слишком велико
  2012-07-13 20:47 ` Arcady V. Ivanov
@ 2012-07-14  4:22   ` Vladimir Karpinsky
  2012-07-14  4:29     ` Vladimir Karpinsky
  2012-07-14  7:04     ` Michael Shigorin
  0 siblings, 2 replies; 8+ messages in thread
From: Vladimir Karpinsky @ 2012-07-14  4:22 UTC (permalink / raw)
  To: community

14.07.2012 0:47, Arcady V. Ivanov пишет:
> Посмотрите с помощью iotop.
> Думаю, это проблема RAID-а.

Поставил iotop, но пока там ничего а глаза не бросилось, впрочем м.б. я не 
знаю на что смотреть.

Cron иногда (~1 раза в месяц) присылает сообщения вида:

checkarray: I: selecting idle I/O scheduling class for resync of md0.
checkarray: I: selecting idle I/O scheduling class for resync of md1.
checkarray: I: selecting idle I/O scheduling class for resync of md2.
checkarray: I: selecting idle I/O scheduling class for resync of md3.

> У меня такая же фигня была.
> Если dmesg рисует deadlock-и на 120 сек, это проблема hiresolution таймера.

# dmesg | grepp md
[9735123.335851] md: using 128k window, over a total of 20478912k.
[9735401.818806] md: md2: data-check done.
[12129217.385503] md: data-check of RAID array md0
[12129217.385506] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
[12129217.385508] md: using maximum available idle IO bandwidth (but not 
more than 200000 KB/sec) for data-check.
[12129217.385510] md: using 128k window, over a total of 8707008k.
[12129217.620759] md: delaying data-check of md1 until md0 has finished 
(they share one or more physical units)
[12129217.631725] md: delaying data-check of md2 until md1 has finished 
(they share one or more physical units)
[12129217.631803] md: delaying data-check of md1 until md0 has finished 
(they share one or more physical units)
[12129217.642750] md: delaying data-check of md3 until md1 has finished 
(they share one or more physical units)
[12129217.642753] md: delaying data-check of md1 until md0 has finished 
(they share one or more physical units)
[12129217.642757] md: delaying data-check of md2 until md1 has finished 
(they share one or more physical units)
[12129328.050106] md: md0: data-check done.
[12129328.066514] md: delaying data-check of md2 until md1 has finished 
(they share one or more physical units)
[12129328.066519] md: data-check of RAID array md1
[12129328.066521] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
[12129328.066522] md: using maximum available idle IO bandwidth (but not 
more than 200000 KB/sec) for data-check.
[12129328.066525] md: using 128k window, over a total of 2095040k.
[12129328.066955] md: delaying data-check of md3 until md1 has finished 
(they share one or more physical units)
[12129352.859826] md: md1: data-check done.
[12129352.874434] md: data-check of RAID array md3
[12129352.874437] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
[12129352.874439] md: using maximum available idle IO bandwidth (but not 
more than 200000 KB/sec) for data-check.
[12129352.874442] md: using 128k window, over a total of 945476480k.
[12129352.874452] md: delaying data-check of md2 until md3 has finished 
(they share one or more physical units)
[12154551.743772] md: md3: data-check done.
[12154551.775858] md: data-check of RAID array md2
[12154551.775861] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
[12154551.775862] md: using maximum available idle IO bandwidth (but not 
more than 200000 KB/sec) for data-check.
[12154551.775865] md: using 128k window, over a total of 20478912k.
[12154932.231802] md: md2: data-check done.
[13264118.543397] mdadm: sending ioctl 1261 to a partition!
[13264118.543399] mdadm: sending ioctl 1261 to a partition!
[13264118.725254] mdadm: sending ioctl 1261 to a partition!
[13264118.725256] mdadm: sending ioctl 1261 to a partition!
[13264118.807387] mdadm: sending ioctl 1261 to a partition!
[13264118.807389] mdadm: sending ioctl 1261 to a partition!
[13264118.918880] mdadm: sending ioctl 1261 to a partition!
[13264118.918883] mdadm: sending ioctl 1261 to a partition!
[13264119.015867] mdadm: sending ioctl 1261 to a partition!
[13264119.015870] mdadm: sending ioctl 1261 to a partition!
[13264125.165873] mdadm: sending ioctl 1261 to a partition!
[13264125.165875] mdadm: sending ioctl 1261 to a partition!
[13264125.283665] mdadm: sending ioctl 1261 to a partition!
[13264125.283668] mdadm: sending ioctl 1261 to a partition!
[13264125.354219] mdadm: sending ioctl 1261 to a partition!
[13264125.354221] mdadm: sending ioctl 1261 to a partition!
[13264125.459097] mdadm: sending ioctl 1261 to a partition!
[13264125.459099] mdadm: sending ioctl 1261 to a partition!
[13264125.530656] mdadm: sending ioctl 1261 to a partition!
[13264125.530658] mdadm: sending ioctl 1261 to a partition!

-- 
	С уважением,
		Владимир.




^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] CPU iowait слишком велико
  2012-07-14  4:22   ` Vladimir Karpinsky
@ 2012-07-14  4:29     ` Vladimir Karpinsky
  2012-07-14  7:04     ` Michael Shigorin
  1 sibling, 0 replies; 8+ messages in thread
From: Vladimir Karpinsky @ 2012-07-14  4:29 UTC (permalink / raw)
  To: community

P.S. Пока смотрел логи и пр., заодно обновился, в т.ч. ядро. Что 
посоветуете: искать причину сейчас (uptime > 150 дней) или перегрузиться с 
новым ядром и разбираться потом, если/когда обнаружится?

-- 
	С уважением,
		Владимир.




^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] CPU iowait слишком велико
  2012-07-13 19:15 [Comm] CPU iowait слишком велико Vladimir Karpinsky
  2012-07-13 20:47 ` Arcady V. Ivanov
@ 2012-07-14  6:45 ` Alexei Takaseev
  1 sibling, 0 replies; 8+ messages in thread
From: Alexei Takaseev @ 2012-07-14  6:45 UTC (permalink / raw)
  To: ALT Linux Community general discussions



----- Исходное сообщение -----
> От: "Vladimir Karpinsky" <vkarpinsky@mail.ru>
> Кому: "ALT Linux Community general discussions" <community@lists.altlinux.org>
> Отправленные: Суббота, 14 Июль 2012 г 4:15:53
> Тема: [Comm] CPU iowait слишком велико
> 
> Здравствуйте!
> 
> На одном их компьютеров наблюдаю такую картину:
> 
> top - 18:54:42 up 153 days,  3:11,  4 users,  load average: 0.28,
> 0.31, 0.49
> Tasks: 273 total,   1 running, 272 sleeping,   0 stopped,   0 zombie
> CPU0  :  0.1%us,  3.1%sy,  0.9%ni, 70.5%id, 25.2%wa,  0.0%hi,
>  0.2%si,  0.0%st
> CPU1  :  0.1%us,  3.1%sy,  0.9%ni, 70.5%id, 25.1%wa,  0.0%hi,
>  0.2%si,  0.0%st
> Mem:   4059540K total,  3906728K used,   152812K free,     7756K
> buffers
> Swap:  2095036K total,  2095036K used,        0K free,   279424K
> cached
> 
> Имеется подтормаживание при запуске некторых процессов. В данный
> момент
> ничего особенного в данный момент не делает, крутятся несколько
> процессов,
> MySQL в совсем нежёстком режиме, м.б. не закрыт сеанс KDE4, 4
> зеркальных
> RAID'а. Из 271 задачи подавляющее большинство "спит". На соседних
> ящиках с
> древней начинкой и подобными задачами не вижу, чтобы 25% iowait было,
> да и
> памяти куда-то сожрано немерено. На что имеет смысл обратить
> внимание,
> чтобы локализовать проблему?

Вот и посмотрите, кто у вас сожрал всю память и загнал систему в дикий сваппинг.
Основную нагрузку на диск у вас дает перегонка данных из свапа в память и обратно.

Наверное действительно нужно обновить ядро и ребутнуть систему.

^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] CPU iowait слишком велико
  2012-07-14  4:22   ` Vladimir Karpinsky
  2012-07-14  4:29     ` Vladimir Karpinsky
@ 2012-07-14  7:04     ` Michael Shigorin
  2012-07-14  7:52       ` Vladimir Karpinsky
  1 sibling, 1 reply; 8+ messages in thread
From: Michael Shigorin @ 2012-07-14  7:04 UTC (permalink / raw)
  To: community

On Sat, Jul 14, 2012 at 08:22:38AM +0400, Vladimir Karpinsky wrote:
> Cron иногда (~1 раза в месяц) присылает сообщения вида:
> checkarray: I: selecting idle I/O scheduling class for resync of md0.

Это фича. :) (периодическая принудительная фоновая синхронизация)

> > > Mem:   4059540K total,  3906728K used,   152812K free,     7756K buffers
> > > Swap:  2095036K total,  2095036K used,        0K free,   279424K cached
> > > Имеется подтормаживание при запуске некторых процессов.

Налицо нехватка RAM для такого объёма задач (или утечек памяти);
посмотрите и покажите ps vax --sort=rss | tail -20

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] CPU iowait слишком велико
  2012-07-14  7:04     ` Michael Shigorin
@ 2012-07-14  7:52       ` Vladimir Karpinsky
  2012-07-14  8:12         ` Vladimir Karpinsky
  0 siblings, 1 reply; 8+ messages in thread
From: Vladimir Karpinsky @ 2012-07-14  7:52 UTC (permalink / raw)
  To: community

14.07.2012 11:04, Michael Shigorin пишет:
> On Sat, Jul 14, 2012 at 08:22:38AM +0400, Vladimir Karpinsky wrote:
>> Cron иногда (~1 раза в месяц) присылает сообщения вида:
>> checkarray: I: selecting idle I/O scheduling class for resync of md0.
>
> Это фича. :) (периодическая принудительная фоновая синхронизация)

Понял.

>>>> Mem:   4059540K total,  3906728K used,   152812K free,     7756K buffers
>>>> Swap:  2095036K total,  2095036K used,        0K free,   279424K cached
>>>> Имеется подтормаживание при запуске некторых процессов.
>
> Налицо нехватка RAM для такого объёма задач (или утечек памяти);
> посмотрите и покажите ps vax --sort=rss | tail -20

Спасибо, нашёл процесс, который хотел уже слишком много, надо будет его 
помониторить. С памятью ситуация нормализовалась, а, вот, с iowait что-то 
происходит: раньше стояло на 25%, а сейчас непрерывно меняется, причём то 
упадёт до 0, то поднимается до 70%. Например:
top - 07:49:33 up 153 days, 16:06,  3 users,  load average: 2.14, 2.25, 1.85
Tasks: 270 total,   1 running, 269 sleeping,   0 stopped,   0 zombie
CPU0  :  0.3%us,  0.3%sy,  0.0%ni, 47.0%id, 52.0%wa,  0.0%hi,  0.3%si,  0.0%st
CPU1  :  0.0%us,  0.0%sy,  0.0%ni, 48.3%id, 51.3%wa,  0.0%hi,  0.3%si,  0.0%st
Mem:   4059540K total,  1766388K used,  2293152K free,   121528K buffers
Swap:  2095036K total,   189396K used,  1905640K free,  1247076K cached

Как посмотреть, что это происходит?


-- 
	С уважением,
		Владимир.




^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] CPU iowait слишком велико
  2012-07-14  7:52       ` Vladimir Karpinsky
@ 2012-07-14  8:12         ` Vladimir Karpinsky
  0 siblings, 0 replies; 8+ messages in thread
From: Vladimir Karpinsky @ 2012-07-14  8:12 UTC (permalink / raw)
  To: community

Прошу прощения, это пока я развлекался у меня пошла перекачка данных...

14.07.2012 11:52, Vladimir Karpinsky пишет:
> а, вот, с iowait что-то происходит: раньше стояло на 25%, а сейчас
> непрерывно меняется, причём то упадёт до 0, то поднимается до 70%.

-- 
	С уважением,
		Владимир.




^ permalink raw reply	[flat|nested] 8+ messages in thread

end of thread, other threads:[~2012-07-14  8:12 UTC | newest]

Thread overview: 8+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2012-07-13 19:15 [Comm] CPU iowait слишком велико Vladimir Karpinsky
2012-07-13 20:47 ` Arcady V. Ivanov
2012-07-14  4:22   ` Vladimir Karpinsky
2012-07-14  4:29     ` Vladimir Karpinsky
2012-07-14  7:04     ` Michael Shigorin
2012-07-14  7:52       ` Vladimir Karpinsky
2012-07-14  8:12         ` Vladimir Karpinsky
2012-07-14  6:45 ` Alexei Takaseev

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git