ALT Linux Sisyphus discussions
 help / color / mirror / Atom feed
* [sisyphus] ovz-smp#2.6.16-alt7 и numfile
@ 2006-10-18 13:42 Nikolay A. Fetisov
  2006-10-19  6:25 ` Konstantin A. Lepikhov
  0 siblings, 1 reply; 11+ messages in thread
From: Nikolay A. Fetisov @ 2006-10-18 13:42 UTC (permalink / raw)
  To: sisyphus

Здравствуйте!

Есть четыре машины с указанным ядром и на всех наблюдается одно и то
же занятное явление: с течением времени растёт значение счётчика
открытых файлов numfile для Hardware Node. Проблема в том, что
значение данного счётчика не уменьшается. Есть впечатление, что
закрытие файлов это на счётчике не отражается.

Т.е., например, на машине i586 с uptime порядка 50 часов для HN
при 296 процессах numfile - 11737048.

На машине с ядром x86_64 ситуация та же.

В контейнерах счётчики ведут себя вполне нормально.

Особенно неприятно то, что с ростом numfile также растёт и
значение kmemsize, при этом для указанной машины его размер сейчас уже
примерно равен барьерному значению в 2^31 - и единственным решением
является перезагрузка. 

С ядрами -alt3 и -alt4 данной проблемы не наблюдается.

Соответственно, вопросы: 
- проявляется ли это ещё у кого-нибудь?
- как бы это поправить. 

Да, на всякий случай - # 10154

-- 
С уважением,	
Николай Фетисов


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [sisyphus] ovz-smp#2.6.16-alt7 и numfile
  2006-10-18 13:42 [sisyphus] ovz-smp#2.6.16-alt7 и numfile Nikolay A. Fetisov
@ 2006-10-19  6:25 ` Konstantin A. Lepikhov
  2006-10-19  6:57   ` Nikolay A. Fetisov
  2006-10-19  7:33   ` Dmitry Lebkov
  0 siblings, 2 replies; 11+ messages in thread
From: Konstantin A. Lepikhov @ 2006-10-19  6:25 UTC (permalink / raw)
  To: sisyphus


<цитата от="Nikolay A. Fetisov">
> Здравствуйте!
>
> Есть четыре машины с указанным ядром и на всех наблюдается одно и то
> же занятное явление: с течением времени растёт значение счётчика
> открытых файлов numfile для Hardware Node. Проблема в том, что
> значение данного счётчика не уменьшается. Есть впечатление, что
> закрытие файлов это на счётчике не отражается.
У меня это не воспроизводится. Один раз машину пришлось перегружать из-за
того, что утекал Xorg server.

-- 
WBR et al.



^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [sisyphus] ovz-smp#2.6.16-alt7 и numfile
  2006-10-19  6:25 ` Konstantin A. Lepikhov
@ 2006-10-19  6:57   ` Nikolay A. Fetisov
  2006-11-07  9:29     ` Michael Shigorin
  2006-11-07  9:42     ` Konstantin A. Lepikhov
  2006-10-19  7:33   ` Dmitry Lebkov
  1 sibling, 2 replies; 11+ messages in thread
From: Nikolay A. Fetisov @ 2006-10-19  6:57 UTC (permalink / raw)
  To: sisyphus

On Thu, 19 Oct 2006 10:25:21 +0400 (MSD)
Konstantin A. Lepikhov wrote:

> У меня это не воспроизводится. Один раз машину пришлось перегружать из-за
> того, что утекал Xorg server.

Очень интересно... У меня с этим ядром (было) 6 машин, с совсем разным
железом, от Celeron-433 до Opteron-265. С Sisyphus от разных дат,
начиная от конца августа до текущего. С разными версиями vzctl. С
разной историей жизни системы, от ведущей существование от Master
2.4 до установленной с сентябрьского LifeCD. Как с XOrg так и вообще без
него.
Общие вещи только две - ядро 2.6.16-ovz-smp-alt7 и плавное нарастание
numfile. Переход на -alt3 без изменения чего-либо проблему снимает.

Правда, есть ещё один момент: на 64-битных системах это заметить сложно.
Поскольку барьеры там 2^63-1, то расти до него kmemsize может очень
долго. А вот 32-битные машины к своему барьеру в 2^31-1
приближаются достаточно быстро.

И ещё, здесь _физически_ память не течёт. Просто обновление счётчиков
идёт только в сторону увеличения. Но превысить барьерное значение ядро
всё равно не даёт...


Да, а насчёт # 10157 - на HN ядро использует только один процессор
из доступных - это тоже только мне (с тремя машинами) не везёт?


... поехал последнюю машину на -alt3 переводить....
uptime неделя, numproc=56, numfile=586956, kmemsize=103176293 при
физически установленных 256 Mb...

-- 
С уважением,	
Николай Фетисов


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [sisyphus] ovz-smp#2.6.16-alt7 и numfile
  2006-10-19  6:25 ` Konstantin A. Lepikhov
  2006-10-19  6:57   ` Nikolay A. Fetisov
@ 2006-10-19  7:33   ` Dmitry Lebkov
  2006-10-20 19:44     ` Konstantin A. Lepikhov
  1 sibling, 1 reply; 11+ messages in thread
From: Dmitry Lebkov @ 2006-10-19  7:33 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussion list

Konstantin A. Lepikhov wrote:
> <цитата от="Nikolay A. Fetisov">
>> Здравствуйте!
>>
>> Есть четыре машины с указанным ядром и на всех наблюдается одно и то
>> же занятное явление: с течением времени растёт значение счётчика
>> открытых файлов numfile для Hardware Node. Проблема в том, что
>> значение данного счётчика не уменьшается. Есть впечатление, что
>> закрытие файлов это на счётчике не отражается.
> У меня это не воспроизводится.

Таки воспроизводится на трех разных машинах - 2хXeon-3.2 (x86_64),
2xXeon-2.4 (i586), 1xP4-3.2 (c включенным HT).

Счетчик в HN только увеличивается, а в VSэ'ах значения "плавают".

-- 
WBR, Dmitry Lebkov



^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [sisyphus] ovz-smp#2.6.16-alt7 и numfile
  2006-10-19  7:33   ` Dmitry Lebkov
@ 2006-10-20 19:44     ` Konstantin A. Lepikhov
  0 siblings, 0 replies; 11+ messages in thread
From: Konstantin A. Lepikhov @ 2006-10-20 19:44 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussion list

[-- Attachment #1: Type: text/plain, Size: 885 bytes --]

Hi Dmitry!

Thursday 19, at 06:33:38 PM you wrote:

> Konstantin A. Lepikhov wrote:
> > <цитата от="Nikolay A. Fetisov">
> >> Здравствуйте!
> >>
> >> Есть четыре машины с указанным ядром и на всех наблюдается одно и то
> >> же занятное явление: с течением времени растёт значение счётчика
> >> открытых файлов numfile для Hardware Node. Проблема в том, что
> >> значение данного счётчика не уменьшается. Есть впечатление, что
> >> закрытие файлов это на счётчике не отражается.
> > У меня это не воспроизводится.
> 
> Таки воспроизводится на трех разных машинах - 2хXeon-3.2 (x86_64),
> 2xXeon-2.4 (i586), 1xP4-3.2 (c включенным HT).
> 
> Счетчик в HN только увеличивается, а в VSэ'ах значения "плавают".
если не сложно, попробуйте пересобрать ядра без exec-shield и altsec и
сравнить. Если результат не изменится, придется откатывать ovz патч.

-- 
WBR et al.

[-- Attachment #2: Digital signature --]
[-- Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [sisyphus] ovz-smp#2.6.16-alt7 и numfile
  2006-10-19  6:57   ` Nikolay A. Fetisov
@ 2006-11-07  9:29     ` Michael Shigorin
  2006-11-07  9:47       ` Konstantin A. Lepikhov
  2006-11-07  9:42     ` Konstantin A. Lepikhov
  1 sibling, 1 reply; 11+ messages in thread
From: Michael Shigorin @ 2006-11-07  9:29 UTC (permalink / raw)
  To: sisyphus

On Thu, Oct 19, 2006 at 10:57:45AM +0400, Nikolay A. Fetisov wrote:
> Общие вещи только две - ядро 2.6.16-ovz-smp-alt7 и плавное нарастание
> numfile. Переход на -alt3 без изменения чего-либо проблему снимает.
> Правда, есть ещё один момент: на 64-битных системах это
> заметить сложно.  Поскольку барьеры там 2^63-1, то расти до
> него kmemsize может очень долго. А вот 32-битные машины к
> своему барьеру в 2^31-1 приближаются достаточно быстро.

Подтверждаю на alt10:
# fgrep numfile /proc/user_beancounters
            numfile                    746688               746769  9223372036854775807  9223372036854775807                    0
            numfile                      5035                 7218                32768                32768                    0
            numfile                        94                  990                 2048                 2048                    0
            numfile                      1219                13389                16384                32768                    0
            numfile                       197                 1095                16384                16384                    0
# fgrep kmemsize /proc/user_beancounters       
         0: kmemsize                210749995            212080235  9223372036854775807  9223372036854775807                    0
       102: kmemsize                  8389279             12073187             33554432             67108864                    0
       108: kmemsize                   407972              3080016              5242880              5592405                    0
       109: kmemsize                  1434486             16477277            268435456            335544320                    0
       201: kmemsize                   363932              2823505             33554432             67108864                    0

numfile вроде уже починили:

<lakostis> http://git.openvz.org/?p=linux-2.6.16-openvz;a=commitdiff;h=46d1e25bce7440b23652caf7f463670a5360890a;hp=d55df66c6e0f7917d13737cadee7b064e69a9a23 -f e 

Исправится squashfs, получится собрать.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [sisyphus] ovz-smp#2.6.16-alt7 и numfile
  2006-10-19  6:57   ` Nikolay A. Fetisov
  2006-11-07  9:29     ` Michael Shigorin
@ 2006-11-07  9:42     ` Konstantin A. Lepikhov
  2006-11-07 10:54       ` [sisyphus] [JT] s@b0 Michael Shigorin
  2006-11-07 13:37       ` [sisyphus] ovz-smp#2.6.16-alt7 и numfile Nikolay A. Fetisov
  1 sibling, 2 replies; 11+ messages in thread
From: Konstantin A. Lepikhov @ 2006-11-07  9:42 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussion list

[-- Attachment #1: Type: text/plain, Size: 1732 bytes --]

Hi Nikolay!

Thursday 19, at 10:57:45 AM you wrote:

> On Thu, 19 Oct 2006 10:25:21 +0400 (MSD)
> Konstantin A. Lepikhov wrote:
> 
> > У меня это не воспроизводится. Один раз машину пришлось перегружать из-за
> > того, что утекал Xorg server.
> 
> Очень интересно... У меня с этим ядром (было) 6 машин, с совсем разным
> железом, от Celeron-433 до Opteron-265. С Sisyphus от разных дат,
> начиная от конца августа до текущего. С разными версиями vzctl. С
> разной историей жизни системы, от ведущей существование от Master
> 2.4 до установленной с сентябрьского LifeCD. Как с XOrg так и вообще без
> него.
> Общие вещи только две - ядро 2.6.16-ovz-smp-alt7 и плавное нарастание
> numfile. Переход на -alt3 без изменения чего-либо проблему снимает.
> 
> Правда, есть ещё один момент: на 64-битных системах это заметить сложно.
> Поскольку барьеры там 2^63-1, то расти до него kmemsize может очень
> долго. А вот 32-битные машины к своему барьеру в 2^31-1
> приближаются достаточно быстро.
> 
> И ещё, здесь _физически_ память не течёт. Просто обновление счётчиков
> идёт только в сторону увеличения. Но превысить барьерное значение ядро
> всё равно не даёт...
А что насчет -alt10? + я исправил
http://bugzilla.openvz.org/show_bug.cgi?id=322 в новой сборке -alt12, но
из-за саботажа со squashfs, она никак до сизифа не дойдет :(

> 
> 
> Да, а насчёт # 10157 - на HN ядро использует только один процессор
> из доступных - это тоже только мне (с тремя машинами) не везёт?
> 
> 
> ... поехал последнюю машину на -alt3 переводить....
> uptime неделя, numproc=56, numfile=586956, kmemsize=103176293 при
> физически установленных 256 Mb...
у меня все равно не поспроизводится :)

-- 
WBR et al.

[-- Attachment #2: Digital signature --]
[-- Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [sisyphus] ovz-smp#2.6.16-alt7 и numfile
  2006-11-07  9:29     ` Michael Shigorin
@ 2006-11-07  9:47       ` Konstantin A. Lepikhov
  2006-11-07 10:58         ` Michael Shigorin
  0 siblings, 1 reply; 11+ messages in thread
From: Konstantin A. Lepikhov @ 2006-11-07  9:47 UTC (permalink / raw)
  To: sisyphus

[-- Attachment #1: Type: text/plain, Size: 1494 bytes --]

Hi Michael!

Tuesday 07, at 11:29:45 AM you wrote:

> On Thu, Oct 19, 2006 at 10:57:45AM +0400, Nikolay A. Fetisov wrote:
> > Общие вещи только две - ядро 2.6.16-ovz-smp-alt7 и плавное нарастание
> > numfile. Переход на -alt3 без изменения чего-либо проблему снимает.
> > Правда, есть ещё один момент: на 64-битных системах это
> > заметить сложно.  Поскольку барьеры там 2^63-1, то расти до
> > него kmemsize может очень долго. А вот 32-битные машины к
> > своему барьеру в 2^31-1 приближаются достаточно быстро.
> 
> Подтверждаю на alt10:
> # fgrep numfile /proc/user_beancounters
>             numfile                    746688               746769  9223372036854775807  9223372036854775807                    0
>             numfile                      5035                 7218                32768                32768                    0
>             numfile                        94                  990                 2048                 2048                    0
>             numfile                      1219                13389                16384                32768                    0
>             numfile                       197                 1095                16384                16384                    0
Майк, прочти еще раз комментарии vsu@ и xemul@ к этой баге, это нормально, что
счетчики растут. Другое дело, что они показывают при этом полную ерунду.

https://bugzilla.altlinux.org/show_bug.cgi?id=10154#c11

-- 
WBR et al.

[-- Attachment #2: Digital signature --]
[-- Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 11+ messages in thread

* [sisyphus] [JT] s@b0
  2006-11-07  9:42     ` Konstantin A. Lepikhov
@ 2006-11-07 10:54       ` Michael Shigorin
  2006-11-07 13:37       ` [sisyphus] ovz-smp#2.6.16-alt7 и numfile Nikolay A. Fetisov
  1 sibling, 0 replies; 11+ messages in thread
From: Michael Shigorin @ 2006-11-07 10:54 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussion list

On Tue, Nov 07, 2006 at 12:42:39PM +0300, Konstantin A. Lepikhov wrote:
> но из-за саботажа со squashfs, она никак до сизифа не дойдет :(

Чё-т у тебя сплошные саботажники вокруг ;)
Они всё-таки сперва люди и коллеги.
Мы все регулярно ошибаемся.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [sisyphus] ovz-smp#2.6.16-alt7 и numfile
  2006-11-07  9:47       ` Konstantin A. Lepikhov
@ 2006-11-07 10:58         ` Michael Shigorin
  0 siblings, 0 replies; 11+ messages in thread
From: Michael Shigorin @ 2006-11-07 10:58 UTC (permalink / raw)
  To: sisyphus

On Tue, Nov 07, 2006 at 12:47:38PM +0300, Konstantin A. Lepikhov wrote:
> Майк, прочти еще раз комментарии vsu@ и xemul@ к этой баге, это
> нормально, что счетчики растут. Другое дело, что они показывают
> при этом полную ерунду.

Н-да, это огорчает.

> https://bugzilla.altlinux.org/show_bug.cgi?id=10154#c11

Похоже, мне почта от багзилы приходит -- письмо из десятка.
Не в спаме при этом.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 11+ messages in thread

* Re: [sisyphus] ovz-smp#2.6.16-alt7 и numfile
  2006-11-07  9:42     ` Konstantin A. Lepikhov
  2006-11-07 10:54       ` [sisyphus] [JT] s@b0 Michael Shigorin
@ 2006-11-07 13:37       ` Nikolay A. Fetisov
  1 sibling, 0 replies; 11+ messages in thread
From: Nikolay A. Fetisov @ 2006-11-07 13:37 UTC (permalink / raw)
  To: sisyphus

On Tue, 7 Nov 2006 12:42:39 +0300
Konstantin A. Lepikhov wrote:

> Thursday 19, at 10:57:45 AM you wrote:
> ....
> А что насчет -alt10? + я исправил
> http://bugzilla.openvz.org/show_bug.cgi?id=322 в новой сборке -alt12, но
> из-за саботажа со squashfs, она никак до сизифа не дойдет :(
> 

-alt10 на простеньком Celeron живёт третьи сутки, пока полёт нормальный.
На 2xPIII-933 я успешно получил за полдня два раза вышеупомянутый #322,
и откатился обратно на -alt3.


Меня сейчас больше занимает  
> > ... # 10157 - на HN ядро использует только один процессор
> > из доступных ...

Я понимаю, что на серверах, где практически всё живёт именно в VPS,
такое поведение правильно. Но на настольной машине, где в VPS живут
сборочные среды, да разные эпизодически нужные вещи, очень досадно
наблюдать бездействующий процессор. 

Очень хочется рубильник... 


> ....
> у меня все равно не поспроизводится :)

Хочу это ядро :-)

-- 
С уважением,	
Николай Фетисов


^ permalink raw reply	[flat|nested] 11+ messages in thread

end of thread, other threads:[~2006-11-07 13:37 UTC | newest]

Thread overview: 11+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2006-10-18 13:42 [sisyphus] ovz-smp#2.6.16-alt7 и numfile Nikolay A. Fetisov
2006-10-19  6:25 ` Konstantin A. Lepikhov
2006-10-19  6:57   ` Nikolay A. Fetisov
2006-11-07  9:29     ` Michael Shigorin
2006-11-07  9:47       ` Konstantin A. Lepikhov
2006-11-07 10:58         ` Michael Shigorin
2006-11-07  9:42     ` Konstantin A. Lepikhov
2006-11-07 10:54       ` [sisyphus] [JT] s@b0 Michael Shigorin
2006-11-07 13:37       ` [sisyphus] ovz-smp#2.6.16-alt7 и numfile Nikolay A. Fetisov
2006-10-19  7:33   ` Dmitry Lebkov
2006-10-20 19:44     ` Konstantin A. Lepikhov

ALT Linux Sisyphus discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \
		sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru
	public-inbox-index sisyphus

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.sisyphus


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git