From: "Kirill A. Shutemov" <kirill@shutemov.name>
To: ALT Devel discussion list <devel@lists.altlinux.org>
Subject: Re: [devel] [partially solved] Q: exit_group slowness
Date: Wed, 6 Jun 2012 21:40:34 +0300
Message-ID: <20120606184034.GA19121@shutemov.name> (raw)
In-Reply-To: <20120606013127.GA29780@altlinux.org>
On Wed, Jun 06, 2012 at 05:31:27AM +0400, Dmitry V. Levin wrote:
> On Tue, Jun 05, 2012 at 04:10:35PM +0300, Kirill A. Shutemov wrote:
> > On Tue, Jun 05, 2012 at 04:46:03PM +0400, Dmitry V. Levin wrote:
> > > On Tue, Jun 05, 2012 at 03:37:19PM +0300, Kirill A. Shutemov wrote:
> > > > On Tue, Jun 05, 2012 at 01:08:28PM +0400, Dmitry V. Levin wrote:
> > > > > On Tue, Jun 05, 2012 at 09:06:22AM +0300, Kirill A. Shutemov wrote:
> > > > > > Похоже вот на это:
> > > > > >
> > > > > > http://lkml.org/lkml/2012/6/3/34
> > > > > >
> > > > > > Ниже по трэду Пол предлагает возможное решение.
> > > > >
> > > > > Спасибо, откат на 3.2.14-std-def-alt1 радикально улучшил картинку:
> > > > > # env -i strace -r -eprocess /usr/bin/unshare -i /bin/true
> > > > > 0.000000 execve("/usr/bin/unshare", ["/usr/bin/unshare", "-i", "/bin/true"], [/* 0 vars */]) = 0
> > > > > 0.001357 arch_prctl(ARCH_SET_FS, 0x7f49add73700) = 0
> > > > > 0.000457 unshare(CLONE_NEWIPC) = 0
> > > > > 0.000200 execve("/bin/true", ["/bin/true"], [/* 0 vars */]) = 0
> > > > > 0.000350 exit_group(0) = ?
> > > > > 0.156461 +++ exited with 0 +++
> > > > >
> > > > > Хотя до идеала еще далеко:
> > > > > # env -i strace -r /bin/true
> > > > > 0.000000 execve("/bin/true", ["/bin/true"], [/* 0 vars */]) = 0
> > > > > 0.000628 exit_group(0) = ?
> > > > > 0.000329 +++ exited with 0 +++
> > > >
> > > > exit_group() дорогой только для последнего процесса в namespace, так?
> > >
> > > Да, конечно.
> > >
> > > > Думаю, это цена которую можно заплатить.
> > >
> > > 0.15 секунды это очень долго, то же самое ядро на более простых серверах
> > > завершает последний процесс в namespace на 1-2 порядка быстрее. Так что
> > > вопрос, что не так и как с этим бороться, пока остается.
> >
> > RCU_FAST_NO_HZ не предназначена для больших машин. О чём в явном виде
> > написано в описании опции. Так что CONFIG_RCU_FAST_NO_HZ=y было ошибкой
> > для дистрибутивного ядра.
> >
> > Когда моя большая машинка (40 ядер + ht) освободится я попробую
> > поэксперементировать с этим немного. Есть подозрение, что отмонирование
> > файловой системы (внутриядерной, в случае CLONE_NEWIPC) плохо
> > масштабируется на большое количество процессоров даже без RCU_FAST_NO_HZ.
>
> Для справки: на той же машинке (где "rpm --eval %__nprocs" показывает 32) с
> 3.3.8-std-def-alt1 (с отключенным CONFIG_RCU_FAST_NO_HZ) время завершения
> "unshare -i /bin/true" уменьшилось примерно в полтора раза по сравнению с
> 3.2.14-std-def-alt1 (с 0.15 до 0.10 секунды).
Похоже виноват rcu_barrier() в deactivate_locked_super(). В моём случае
(ядро v3.4) exit_group() выполняется за 0.07538 из них 0.05188 в
rcu_barrier(). Цифры могут несколько разнится от запуска к запуску, но в
целом как-то так. Это должно было наблюдаться с ядра v2.6.38.
См. коммит "d863b50 vfs: call rcu_barrier after ->kill_sb()".
Простого решения я не вижу. Наверно, можно сделать инитиализацию
namespace'а ленивой. В этом use-case'е долно помочь. Если когда-нибудь
будет время может посмотрю. Или напиши ребятам из Parallels, может они что
предложат.
--
Kirill A. Shutemov
next prev parent reply other threads:[~2012-06-06 18:40 UTC|newest]
Thread overview: 20+ messages / expand[flat|nested] mbox.gz Atom feed top
2012-06-04 21:11 [devel] " Dmitry V. Levin
2012-06-04 22:30 ` Kirill A. Shutemov
2012-06-05 0:20 ` Dmitry V. Levin
2012-06-05 6:06 ` Kirill A. Shutemov
2012-06-05 9:08 ` [devel] [partially solved] " Dmitry V. Levin
2012-06-05 12:37 ` Kirill A. Shutemov
2012-06-05 12:46 ` Dmitry V. Levin
2012-06-05 13:10 ` Kirill A. Shutemov
2012-06-06 1:31 ` Dmitry V. Levin
2012-06-06 18:40 ` Kirill A. Shutemov [this message]
2012-06-08 12:46 ` Kirill A. Shutemov
2012-06-08 15:31 ` Kirill A. Shutemov
2012-06-08 15:56 ` Dmitry V. Levin
2012-06-12 7:00 ` Kirill A. Shutemov
2012-06-13 0:32 ` Dmitry V. Levin
2012-08-10 19:41 ` Michael Shigorin
2012-06-04 22:35 ` [devel] " Led
2012-06-04 22:39 ` Kirill A. Shutemov
2012-06-04 22:47 ` Led
2012-06-06 8:43 ` Michael Shigorin
Reply instructions:
You may reply publicly to this message via plain-text email
using any one of the following methods:
* Save the following mbox file, import it into your mail client,
and reply-to-all from there: mbox
Avoid top-posting and favor interleaved quoting:
https://en.wikipedia.org/wiki/Posting_style#Interleaved_style
* Reply using the --to, --cc, and --in-reply-to
switches of git-send-email(1):
git send-email \
--in-reply-to=20120606184034.GA19121@shutemov.name \
--to=kirill@shutemov.name \
--cc=devel@lists.altlinux.org \
/path/to/YOUR_REPLY
https://kernel.org/pub/software/scm/git/docs/git-send-email.html
* If your mail client supports setting the In-Reply-To header
via mailto: links, try the mailto: link
ALT Linux Team development discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
public-inbox-index devel
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.devel
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git