ALT Linux Team development discussions
 help / color / mirror / Atom feed
* [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
@ 2011-07-12  8:48 Dmitry V. Levin
  2011-07-12  8:59 ` REAL
  0 siblings, 1 reply; 21+ messages in thread
From: Dmitry V. Levin @ 2011-07-12  8:48 UTC (permalink / raw)
  To: ALT Devel discussion list

[-- Attachment #1: Type: text/plain, Size: 1500 bytes --]

Hi,

Что-то странное происходит во время сборки некоторых питоновских модулей.
Особенно часто это наблюдается с пакетами python-module-numpy
http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0710/olderr/python-module-numpy-2.0.0-alt2.git20110422
http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0707/olderr/python-module-numpy-2.0.0-alt2.git20110422.gz
http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0703/olderr/python-module-numpy-2.0.0-alt2.git20110422.gz
http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0702/olderr/python-module-numpy-2.0.0-alt2.git20110422.gz
и python-module-matplotlib
http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0710/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218
http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0705/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218.gz
http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0702/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218.gz

Каталог olderr в тестовой пересборке содержит логи сборки пакетов, которые
пересобрались не с первого раза.  Как видно, с довольно высокой
вероятностью сборка python-module-numpy и python-module-matplotlib падает
с однотипной диагностикой:
+ /usr/bin/python2.6 setup.py build --debug
/usr/src/tmp/rpm-tmp.47327: line 104: 32340 Segmentation fault      /usr/bin/python2.6 setup.py build --debug

Что-то с этими модулями не в порядке?


-- 
ldv

[-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --]

^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-12  8:48 [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault Dmitry V. Levin
@ 2011-07-12  8:59 ` REAL
  2011-07-12  9:51   ` Dmitry V. Levin
  0 siblings, 1 reply; 21+ messages in thread
From: REAL @ 2011-07-12  8:59 UTC (permalink / raw)
  To: ALT Linux Team development discussions

12.07.2011 15:48, Dmitry V. Levin пишет:
> Что-то странное происходит во время сборки некоторых питоновских модулей.
> Особенно часто это наблюдается с пакетами python-module-numpy
[...]
> и python-module-matplotlib

> Что-то с этими модулями не в порядке?

Нет, модули ни при чём, и эта жа проблема вылазит и у других модулей. 
Что-то изменилось в самом питоне (и только на i586), а что, я пока не 
разбирался (живая машинка на i586 пока недоступна, поэтому не могу 
проверить), да и вряд ли буду: лично мне проще найти объезд.

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-12  8:59 ` REAL
@ 2011-07-12  9:51   ` Dmitry V. Levin
  2011-07-12  9:59     ` REAL
  0 siblings, 1 reply; 21+ messages in thread
From: Dmitry V. Levin @ 2011-07-12  9:51 UTC (permalink / raw)
  To: ALT Linux Team development discussions

[-- Attachment #1: Type: text/plain, Size: 1477 bytes --]

On Tue, Jul 12, 2011 at 03:59:22PM +0700, REAL wrote:
> 12.07.2011 15:48, Dmitry V. Levin пишет:
> >Что-то странное происходит во время 
> >сборки некоторых питоновских модулей.
> >Особенно часто это наблюдается с 
> >пакетами python-module-numpy
> [...]
> >и python-module-matplotlib
> 
> >Что-то с этими модулями не в порядке?
> 
> Нет, модули ни при чём, и эта жа проблема 
> вылазит и у других модулей.

У этих модулей проблема воспроизводится с высокой вероятностью.  Есть еще
несколько модулей, во время сборки которых проблема воспроизводилась, но
эти два демонстрируют что-то особенное.

> Что-то  изменилось в самом питоне

Давно?

> (и только на i586),

Нет, не только на i586.
На x86_64 тоже воспроизводится, только в несколько раз реже.

> а что, я пока не разбирался (живая 
> машинка на i586 пока недоступна, поэтому не 
> могу проверить),

Все-таки попробуйте проверить на python-module-matplotlib:
http://git.altlinux.org/beehive/logs/Sisyphus-x86_64/archive/2011/0711/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218
http://git.altlinux.org/beehive/logs/Sisyphus-x86_64/archive/2011/0702/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218.gz

> да и вряд ли буду: лично мне проще найти объезд.

Пакеты, которые собираются с вероятностью -- это большая проблема для
тестов, проверяющих регрессии в репозитории.  Из-за них репозиторий
приходится собирать итеративно, что обходится довольно дорого.


-- 
ldv

[-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --]

^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-12  9:51   ` Dmitry V. Levin
@ 2011-07-12  9:59     ` REAL
  2011-07-12 10:13       ` Dmitry V. Levin
  0 siblings, 1 reply; 21+ messages in thread
From: REAL @ 2011-07-12  9:59 UTC (permalink / raw)
  To: ALT Linux Team development discussions

12.07.2011 16:51, Dmitry V. Levin пишет:
>> Что-то  изменилось в самом питоне
>
> Давно?

Даже не могу сказать, заметил пару недель назад. Только не понимайте 
буквально ;) - "самим питоном" может оказаться вообще какая-нибудь 
"непричастная" библиотека, я просто не знаю.

>> (и только на i586),
>
> Нет, не только на i586.
> На x86_64 тоже воспроизводится, только в несколько раз реже.

А вот этого не видел, странно, что мне не пришло ничего по этой теме. 
Рассылка только лидерам пакетов ведётся, что ли?

> Пакеты, которые собираются с вероятностью -- это большая проблема для
> тестов, проверяющих регрессии в репозитории.

Вот только кто виновником этих вероятностей является - вопрос.

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-12  9:59     ` REAL
@ 2011-07-12 10:13       ` Dmitry V. Levin
  2011-07-12 10:38         ` REAL
  2011-07-12 12:15         ` REAL
  0 siblings, 2 replies; 21+ messages in thread
From: Dmitry V. Levin @ 2011-07-12 10:13 UTC (permalink / raw)
  To: ALT Linux Team development discussions

[-- Attachment #1: Type: text/plain, Size: 551 bytes --]

On Tue, Jul 12, 2011 at 04:59:24PM +0700, REAL wrote:
> >На x86_64 тоже воспроизводится, только в 
> >несколько раз реже.
> 
> А вот этого не видел, странно, что мне не 
> пришло ничего по этой теме. Рассылка 
> только лидерам пакетов ведётся, что ли?

Если пакет не собрался во время тестовой пересборки, это значит, что
его не удалось собрать как минимум 3 раза в одинаковой среде.

По пакетам, которые собираются с высокой вероятностью, письма не
рассылаются, поскольку за несколько итераций их все-таки удается собрать.


-- 
ldv

[-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --]

^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-12 10:13       ` Dmitry V. Levin
@ 2011-07-12 10:38         ` REAL
  2011-07-12 10:41           ` REAL
  2011-07-12 12:15         ` REAL
  1 sibling, 1 reply; 21+ messages in thread
From: REAL @ 2011-07-12 10:38 UTC (permalink / raw)
  To: ALT Linux Team development discussions

12.07.2011 17:13, Dmitry V. Levin пишет:
> Если пакет не собрался во время тестовой пересборки, это значит, что
> его не удалось собрать как минимум 3 раза в одинаковой среде.
>
> По пакетам, которые собираются с высокой вероятностью, письма не
> рассылаются, поскольку за несколько итераций их все-таки удается собрать.

Здесь я пока вижу, что команда "/usr/bin/python2.6 setup.py build 
--debug" (равно как и просто "python setup.py build") вываливается ещё 
_до_ каких-либо сообщений от собственно пакетов, так что у меня пока 
нет уверенности, связано ли это как-то с конкретно обсуждаемыми 
модулями. Забавно, что заходя в hsh-shell и делая всё по спеку, ошибка 
не воспроизводится.

PS. Может быть, у хэшера изменились запросы к памяти или добавились 
какие-то ограничения? Или что-то такое неприятное добавилось в rpm-build?

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-12 10:38         ` REAL
@ 2011-07-12 10:41           ` REAL
  2011-07-12 22:37             ` Dmitry V. Levin
  0 siblings, 1 reply; 21+ messages in thread
From: REAL @ 2011-07-12 10:41 UTC (permalink / raw)
  To: ALT Linux Team development discussions

12.07.2011 17:38, REAL пишет:
> модулями. Забавно, что заходя в hsh-shell и делая всё по спеку, ошибка
> не воспроизводится.

И попутно вопрос: как воспроизвести ситуацию в hsh-shell?

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-12 10:13       ` Dmitry V. Levin
  2011-07-12 10:38         ` REAL
@ 2011-07-12 12:15         ` REAL
  1 sibling, 0 replies; 21+ messages in thread
From: REAL @ 2011-07-12 12:15 UTC (permalink / raw)
  To: ALT Linux Team development discussions

12.07.2011 17:13, Dmitry V. Levin пишет:
> Если пакет не собрался во время тестовой пересборки, это значит, что
> его не удалось собрать как минимум 3 раза в одинаковой среде.

добрался до i586. две недели не пересобирается в gear:
http://git.altlinux.org/beehive/logs/Sisyphus-i586/latest/error/OOSuite-0.33-alt1.svn20110325.1

воспроизвести не смог. что это было вообще?

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-12 10:41           ` REAL
@ 2011-07-12 22:37             ` Dmitry V. Levin
  2011-07-13  3:20               ` REAL
  0 siblings, 1 reply; 21+ messages in thread
From: Dmitry V. Levin @ 2011-07-12 22:37 UTC (permalink / raw)
  To: ALT Linux Team development discussions

[-- Attachment #1: Type: text/plain, Size: 9952 bytes --]

On Tue, Jul 12, 2011 at 05:41:10PM +0700, REAL wrote:
> 12.07.2011 17:38, REAL пишет:
> >модулями. Забавно, что заходя в hsh-shell и 
> >делая всё по спеку, ошибка
> >не воспроизводится.
> 
> И попутно вопрос: как воспроизвести 
> ситуацию в hsh-shell?

Воспроизводится, но с очень низкой вероятностью.

Оказывается, все без исключения случаи Segmentation fault в python, вне
зависимости от пакета, происходили в одном и том же месте в libgotoblas2.
Это хорошо видно благодаря тому, что debug.exception-trace по умолчанию
включен и все эти segfaults попадают в dmesg:

$ cat dmesg.* | sed -n '/^[^ ]* python.*segfault at / s///p' | sort -u
7f1202c38000 ip 00007f1213d1f81a sp 00007f1212b58de0 error 6 in libgoto2p-r1.13.so[7f1213925000+1327000]
7f2d2c7f0000 ip 00007f2d3d80b81a sp 00007f2d3c644de0 error 6 in libgoto2p-r1.13.so[7f2d3d411000+1327000]
7f3eddde0000 ip 00007f3eee9a781a sp 00007f3eed7e0de0 error 6 in libgoto2p-r1.13.so[7f3eee5ad000+1327000]
7f693f9a1000 ip 00007f695058b81a sp 00007f694c9a1de0 error 6 in libgoto2p-r1.13.so[7f6950191000+1327000]
7f6955c19000 ip 00007f696687781a sp 00007f69656b0de0 error 6 in libgoto2p-r1.13.so[7f696647d000+1327000]
7f7fe7bf1000 ip 00007f7ff8c9f81a sp 00007f7ff7ad8de0 error 6 in libgoto2p-r1.13.so[7f7ff88a5000+1327000]
7f886f84d000 ip 00007f888053281a sp 00007f887d04ede0 error 6 in libgoto2p-r1.13.so[7f8880138000+1327000]
7f91cb483000 ip 00007f91dc3fa81a sp 00007f91db233de0 error 6 in libgoto2p-r1.13.so[7f91dc000000+1327000]
7f9e0826b000 ip 00007f9e18f5181a sp 00007f9e17d8ade0 error 6 in libgoto2p-r1.13.so[7f9e18b57000+1327000]
7fa0e5696000 ip 00007fa0f667281a sp 00007fa0fddfcde0 error 6 in libgoto2p-r1.13.so[7fa0f6278000+1327000]
7fb0a6623000 ip 00007fb0b701b81a sp 00007fb0b5e54de0 error 6 in libgoto2p-r1.13.so[7fb0b6c21000+1327000]
7fb9b3553000 ip 00007fb9c436b81a sp 00007fb9c31a4de0 error 6 in libgoto2p-r1.13.so[7fb9c3f71000+1327000]
7fcf1bfc0000 ip 00007fcf2cff881a sp 00007fcf2be31de0 error 6 in libgoto2p-r1.13.so[7fcf2cbfe000+1327000]
7ff562642000 ip 00007ff57322281a sp 00007ff57205bde0 error 6 in libgoto2p-r1.13.so[7ff572e28000+1327000]
[это на x86-64]
ec1f3000 ip 00000000f5362ad8 sp 00000000f491b240 error 6 in libgoto2p-r1.13.so[f4fbb000+eb0000]
ec1ff000 ip 00000000f5362ad8 sp 00000000f6923240 error 6 in libgoto2p-r1.13.so[f4fbb000+eb0000]
ec254000 ip 00000000f5402ad8 sp 00000000f69dc240 error 6 in libgoto2p-r1.13.so[f505b000+eb0000]
ec2d0000 ip 00000000f53e7ad8 sp 00000000f69a4240 error 6 in libgoto2p-r1.13.so[f5040000+eb0000]
ec497000 ip 00000000f5402ad8 sp 00000000f7234240 error 6 in libgoto2p-r1.13.so[f505b000+eb0000]
ec4a5000 ip 00000000f5362ad8 sp 00000000f7186240 error 6 in libgoto2p-r1.13.so[f4fbb000+eb0000]
ec571000 ip 00000000f5379ad8 sp 00000000f6936240 error 6 in libgoto2p-r1.13.so[f4fd2000+eb0000]
ec846000 ip 00000000f5402ad8 sp 00000000f7239240 error 6 in libgoto2p-r1.13.so[f505b000+eb0000]
ecbf3000 ip 00000000f6487ad8 sp 00000000f3bf2240 error 6 in libgoto2p-r1.13.so[f60e0000+eb0000]
ecbf4000 ip 00000000f65bfad8 sp 00000000f3bf3240 error 6 in libgoto2p-r1.13.so[f6218000+eb0000]
ecbfb000 ip 00000000f65d3ad8 sp 00000000f5b8c240 error 6 in libgoto2p-r1.13.so[f622c000+eb0000]
ecbfe000 ip 00000000f660ead8 sp 00000000f5bc7240 error 6 in libgoto2p-r1.13.so[f6267000+eb0000]
ecc03000 ip 00000000f65b5ad8 sp 00000000f5b6e240 error 6 in libgoto2p-r1.13.so[f620e000+eb0000]
ecc05000 ip 00000000f65c9ad8 sp 00000000f5b80240 error 6 in libgoto2p-r1.13.so[f6222000+eb0000]
ecc0a000 ip 00000000f6642ad8 sp 00000000f3c09240 error 6 in libgoto2p-r1.13.so[f629b000+eb0000]
ecc10000 ip 00000000f654fad8 sp 00000000f3c0f240 error 6 in libgoto2p-r1.13.so[f61a8000+eb0000]
ecc33000 ip 00000000f65c5ad8 sp 00000000f5b7e240 error 6 in libgoto2p-r1.13.so[f621e000+eb0000]
ecc3a000 ip 00000000f6607ad8 sp 00000000f5bc0240 error 6 in libgoto2p-r1.13.so[f6260000+eb0000]
ecc42000 ip 00000000f6569ad8 sp 00000000f5b21240 error 6 in libgoto2p-r1.13.so[f61c2000+eb0000]
ecc46000 ip 00000000f65d1ad8 sp 00000000f3c45240 error 6 in libgoto2p-r1.13.so[f622a000+eb0000]
ecc79000 ip 00000000f6608ad8 sp 00000000f5bc1240 error 6 in libgoto2p-r1.13.so[f6261000+eb0000]
ecc7a000 ip 00000000f657dad8 sp 00000000f5b36240 error 6 in libgoto2p-r1.13.so[f61d6000+eb0000]
eccf6000 ip 00000000f65e7ad8 sp 00000000f5ba0240 error 6 in libgoto2p-r1.13.so[f6240000+eb0000]
ecd6e000 ip 00000000f65c2ad8 sp 00000000f456d240 error 6 in libgoto2p-r1.13.so[f621b000+eb0000]
ecd80000 ip 00000000f6669ad8 sp 00000000f3d7f240 error 6 in libgoto2p-r1.13.so[f62c2000+eb0000]
ecdb6000 ip 00000000f6586ad8 sp 00000000f5b3f240 error 6 in libgoto2p-r1.13.so[f61df000+eb0000]
ecddd000 ip 00000000f6751ad8 sp 00000000f45dc240 error 6 in libgoto2p-r1.13.so[f63aa000+eb0000]
ecdf2000 ip 00000000f675aad8 sp 00000000f3df1240 error 6 in libgoto2p-r1.13.so[f63b3000+eb0000]
ecdf3000 ip 00000000f6716ad8 sp 00000000f5cce240 error 6 in libgoto2p-r1.13.so[f636f000+eb0000]
ecdf9000 ip 00000000f66b2ad8 sp 00000000f35f8240 error 6 in libgoto2p-r1.13.so[f630b000+eb0000]
ecdfa000 ip 00000000f66d0ad8 sp 00000000f3df9240 error 6 in libgoto2p-r1.13.so[f6329000+eb0000]
ecdfd000 ip 00000000f665ead8 sp 00000000f35fc240 error 6 in libgoto2p-r1.13.so[f62b7000+eb0000]
ece01000 ip 00000000f6685ad8 sp 00000000f5c3d240 error 6 in libgoto2p-r1.13.so[f62de000+eb0000]
ece02000 ip 00000000f6702ad8 sp 00000000f5cba240 error 6 in libgoto2p-r1.13.so[f635b000+eb0000]
ece1a000 ip 00000000f66cead8 sp 00000000f5c86240 error 6 in libgoto2p-r1.13.so[f6327000+eb0000]
ece1f000 ip 00000000f6665ad8 sp 00000000f5c1e240 error 6 in libgoto2p-r1.13.so[f62be000+eb0000]
ece20000 ip 00000000f6656ad8 sp 00000000f5c0f240 error 6 in libgoto2p-r1.13.so[f62af000+eb0000]
ece29000 ip 00000000f669dad8 sp 00000000f3e28240 error 6 in libgoto2p-r1.13.so[f62f6000+eb0000]
ece30000 ip 00000000f6734ad8 sp 00000000f5cec240 error 6 in libgoto2p-r1.13.so[f638d000+eb0000]
ece42000 ip 00000000f66b3ad8 sp 00000000f5c6b240 error 6 in libgoto2p-r1.13.so[f630c000+eb0000]
ece42000 ip 00000000f670aad8 sp 00000000f3641240 error 6 in libgoto2p-r1.13.so[f6363000+eb0000]
ece47000 ip 00000000f6511ad8 sp 00000000f5aca240 error 6 in libgoto2p-r1.13.so[f616a000+eb0000]
ece4c000 ip 00000000f666dad8 sp 00000000f3e4b240 error 6 in libgoto2p-r1.13.so[f62c6000+eb0000]
ece51000 ip 00000000f66a3ad8 sp 00000000f5c5c240 error 6 in libgoto2p-r1.13.so[f62fc000+eb0000]
ece5c000 ip 00000000f67aaad8 sp 00000000f5d61240 error 6 in libgoto2p-r1.13.so[f6403000+eb0000]
ece69000 ip 00000000f6736ad8 sp 00000000f3e68240 error 6 in libgoto2p-r1.13.so[f638f000+eb0000]
ece6d000 ip 00000000f672fad8 sp 00000000f5ce7240 error 6 in libgoto2p-r1.13.so[f6388000+eb0000]
ece74000 ip 00000000f6697ad8 sp 00000000f5c4f240 error 6 in libgoto2p-r1.13.so[f62f0000+eb0000]
ece75000 ip 00000000f6458ad8 sp 00000000f5a10240 error 6 in libgoto2p-r1.13.so[f60b1000+eb0000]
ece87000 ip 00000000f6733ad8 sp 00000000f5ceb240 error 6 in libgoto2p-r1.13.so[f638c000+eb0000]
ece90000 ip 00000000f671aad8 sp 00000000f3e8f240 error 6 in libgoto2p-r1.13.so[f6373000+eb0000]
ece99000 ip 00000000f666aad8 sp 00000000f3698240 error 6 in libgoto2p-r1.13.so[f62c3000+eb0000]
ecea1000 ip 00000000f6723ad8 sp 00000000f3ea0240 error 6 in libgoto2p-r1.13.so[f637c000+eb0000]
ecea3000 ip 00000000f65e1ad8 sp 00000000f5b9a240 error 6 in libgoto2p-r1.13.so[f623a000+eb0000]
ecea7000 ip 00000000f6777ad8 sp 00000000f5d2f240 error 6 in libgoto2p-r1.13.so[f63d0000+eb0000]
ecea9000 ip 00000000f6669ad8 sp 00000000f5c22240 error 6 in libgoto2p-r1.13.so[f62c2000+eb0000]
ecee8000 ip 00000000f6709ad8 sp 00000000f5cc1240 error 6 in libgoto2p-r1.13.so[f6362000+eb0000]
ecef3000 ip 00000000f6674ad8 sp 00000000f46f2240 error 6 in libgoto2p-r1.13.so[f62cd000+eb0000]
ecef4000 ip 00000000f667ead8 sp 00000000f3ef3240 error 6 in libgoto2p-r1.13.so[f62d7000+eb0000]
ecf00000 ip 00000000f6758ad8 sp 00000000f3eff240 error 6 in libgoto2p-r1.13.so[f63b1000+eb0000]
ecf00000 ip 00000000f67b6ad8 sp 00000000f3eff240 error 6 in libgoto2p-r1.13.so[f640f000+eb0000]
ecf23000 ip 00000000f6627ad8 sp 00000000f5be0240 error 6 in libgoto2p-r1.13.so[f6280000+eb0000]
ecf25000 ip 00000000f6734ad8 sp 00000000f5cec240 error 6 in libgoto2p-r1.13.so[f638d000+eb0000]
ecf4d000 ip 00000000f678dad8 sp 00000000f5d45240 error 6 in libgoto2p-r1.13.so[f63e6000+eb0000]
ecf7c000 ip 00000000f66d0ad8 sp 00000000f5c88240 error 6 in libgoto2p-r1.13.so[f6329000+eb0000]
ecfb6000 ip 00000000f672cad8 sp 00000000f5ce4240 error 6 in libgoto2p-r1.13.so[f6385000+eb0000]
ecfc5000 ip 00000000f6733ad8 sp 00000000f5cea240 error 6 in libgoto2p-r1.13.so[f638c000+eb0000]
ecfce000 ip 00000000f65d2ad8 sp 00000000f5b89240 error 6 in libgoto2p-r1.13.so[f622b000+eb0000]
ecfd6000 ip 00000000f668bad8 sp 00000000f3fd5240 error 6 in libgoto2p-r1.13.so[f62e4000+eb0000]
ecfd8000 ip 00000000f6708ad8 sp 00000000f5cc0240 error 6 in libgoto2p-r1.13.so[f6361000+eb0000]
ed040000 ip 00000000f66f3ad8 sp 00000000f403f240 error 6 in libgoto2p-r1.13.so[f634c000+eb0000]
ed0c9000 ip 00000000f66c5ad8 sp 00000000f40c8240 error 6 in libgoto2p-r1.13.so[f631e000+eb0000]
ed1be000 ip 00000000f67acad8 sp 00000000f49bd240 error 6 in libgoto2p-r1.13.so[f6405000+eb0000]
ed1f9000 ip 00000000f6647ad8 sp 00000000f49f8240 error 6 in libgoto2p-r1.13.so[f62a0000+eb0000]
ed1fd000 ip 00000000f6661ad8 sp 00000000f41fc240 error 6 in libgoto2p-r1.13.so[f62ba000+eb0000]
ed21c000 ip 00000000f66a6ad8 sp 00000000f421b240 error 6 in libgoto2p-r1.13.so[f62ff000+eb0000]
ed226000 ip 00000000f66cbad8 sp 00000000f3a25240 error 6 in libgoto2p-r1.13.so[f6324000+eb0000]
ed24f000 ip 00000000f6610ad8 sp 00000000f5bc9240 error 6 in libgoto2p-r1.13.so[f6269000+eb0000]
ed409000 ip 00000000f6715ad8 sp 00000000f4408240 error 6 in libgoto2p-r1.13.so[f636e000+eb0000]
[это на i586]
Если бы не рандомизация адресов, то здесь было бы всего 2 строчки, по
одной для каждой архитектуры.


-- 
ldv

[-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --]

^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-12 22:37             ` Dmitry V. Levin
@ 2011-07-13  3:20               ` REAL
  2011-07-13  7:22                 ` Dmitry V. Levin
  0 siblings, 1 reply; 21+ messages in thread
From: REAL @ 2011-07-13  3:20 UTC (permalink / raw)
  To: ALT Linux Team development discussions

13.07.2011 05:37, Dmitry V. Levin пишет:
>> И попутно вопрос: как воспроизвести
>> ситуацию в hsh-shell?
>
> Воспроизводится, но с очень низкой вероятностью.

На x86_64 с matplotlib при сборке в gear воспроизводится в ~90% 
случаев, но в hsh-shell так и не удалось.

> Оказывается, все без исключения случаи Segmentation fault в python, вне
> зависимости от пакета, происходили в одном и том же месте в libgotoblas2.

Я заметил другое: обломы происходят где-то при обращении к 
lapack_lite.so (в NumPy), так что возможно, что проблема здесь, а не в 
GotoBLAS2.

В общем, поковыряюсь...

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-13  3:20               ` REAL
@ 2011-07-13  7:22                 ` Dmitry V. Levin
  2011-07-13  7:24                   ` REAL
  2011-07-13 17:36                   ` Dmitry V. Levin
  0 siblings, 2 replies; 21+ messages in thread
From: Dmitry V. Levin @ 2011-07-13  7:22 UTC (permalink / raw)
  To: ALT Linux Team development discussions

[-- Attachment #1: Type: text/plain, Size: 462 bytes --]

On Wed, Jul 13, 2011 at 10:20:25AM +0700, REAL wrote:
> 13.07.2011 05:37, Dmitry V. Levin пишет:
> >>И попутно вопрос: как воспроизвести
> >>ситуацию в hsh-shell?
> >
> >Воспроизводится, но с очень низкой 
> >вероятностью.
> 
> На x86_64 с matplotlib при сборке в gear 
> воспроизводится в ~90% случаев, но в hsh-shell 
> так и не удалось.

Тогда имеет смысл снять ограничения на коркообразование, получить корку и
посмотреть на нее.


-- 
ldv

[-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --]

^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-13  7:22                 ` Dmitry V. Levin
@ 2011-07-13  7:24                   ` REAL
  2011-07-13  7:54                     ` Dmitry V. Levin
  2011-07-13 17:36                   ` Dmitry V. Levin
  1 sibling, 1 reply; 21+ messages in thread
From: REAL @ 2011-07-13  7:24 UTC (permalink / raw)
  To: ALT Linux Team development discussions

13.07.2011 14:22, Dmitry V. Levin пишет:
>> На x86_64 с matplotlib при сборке в gear
>> воспроизводится в ~90% случаев, но в hsh-shell
>> так и не удалось.
>
> Тогда имеет смысл снять ограничения на коркообразование, получить корку и
> посмотреть на нее.

А как это сделать? Что подразумевается под коркой?

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-13  7:24                   ` REAL
@ 2011-07-13  7:54                     ` Dmitry V. Levin
  0 siblings, 0 replies; 21+ messages in thread
From: Dmitry V. Levin @ 2011-07-13  7:54 UTC (permalink / raw)
  To: ALT Linux Team development discussions

[-- Attachment #1: Type: text/plain, Size: 484 bytes --]

On Wed, Jul 13, 2011 at 02:24:33PM +0700, REAL wrote:
> 13.07.2011 14:22, Dmitry V. Levin пишет:
> >>На x86_64 с matplotlib при сборке в gear
> >>воспроизводится в ~90% случаев, но в hsh-shell
> >>так и не удалось.
> >
> >Тогда имеет смысл снять ограничения на 
> >коркообразование, получить корку и
> >посмотреть на нее.
> 
> А как это сделать?

# sysctl kernel.core_pattern=core
$ ulimit -c unlimited

> Что подразумевается под коркой?

См. core(5).


-- 
ldv

[-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --]

^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-13  7:22                 ` Dmitry V. Levin
  2011-07-13  7:24                   ` REAL
@ 2011-07-13 17:36                   ` Dmitry V. Levin
  2011-07-14  2:58                     ` REAL
  2011-07-17 10:42                     ` REAL
  1 sibling, 2 replies; 21+ messages in thread
From: Dmitry V. Levin @ 2011-07-13 17:36 UTC (permalink / raw)
  To: ALT Linux Team development discussions

[-- Attachment #1: Type: text/plain, Size: 2074 bytes --]

On Wed, Jul 13, 2011 at 11:22:26AM +0400, Dmitry V. Levin wrote:
> On Wed, Jul 13, 2011 at 10:20:25AM +0700, REAL wrote:
> > На x86_64 с matplotlib при сборке в gear 
> > воспроизводится в ~90% случаев, но в hsh-shell 
> > так и не удалось.
> 
> Тогда имеет смысл снять ограничения на коркообразование, получить корку и
> посмотреть на нее.

Core was generated by `/usr/bin/python2.6 setup.py build --debug'.
Program terminated with signal 11, Segmentation fault.
#0  alloc_mmap (address=0x0) at memory.c:361
361		  *(long *)start = (long)start + PAGESIZE;
(gdb) bt
#0  alloc_mmap (address=0x0) at memory.c:361
#1  0xf66e1104 in blas_memory_alloc (procpos=2) at memory.c:915
#2  0xf66e185e in blas_thread_server (arg=0x0) at blas_server.c:242
#3  0xf74eb940 in start_thread (arg=0xf5c99b70) at pthread_create.c:297
#4  0xf75ce8ae in clone () at ../sysdeps/unix/sysv/linux/i386/clone.S:130
(gdb) l
356		
357		start   = (BLASULONG)map_address;
358		current = (SCALING - 1) * BUFFER_SIZE;
359		
360		while(current > 0) {
361		  *(long *)start = (long)start + PAGESIZE;
362		  start += PAGESIZE;
363		  current -= PAGESIZE;
364		}
365		
(gdb) p map_address
$1 = (void *) 0xecdf2000
(gdb) p/x start
$3 = 0xecdf2000
(gdb) p *(long*)map_address
Cannot access memory at address 0xecdf2000

Картина примерно следующая: тред при старте делает
map_address = mmap(NULL, 0x2000000, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0);
mbind(map_address, 0x20000000, MPOL_PREFERRED, NULL, 0, 0);
сразу после этого пытается записать long по адресу map_address, и
получает SIGSEGV с кодом ошибки 6 (user-mode write access).

Наиболее вероятно, что за время, прошедшее между окончанием mmap(2) и
началом записи, другой тред сделал munmap(2) этой части адресного
пространства.

Подозреваю, хотя и не проверял, что спорадические SIGSEGVы начали
происходить после следующего изменения в gotoblas2:
* Sat Apr 09 2011 Eugeny A. Rostovtsev (REAL) <real at altlinux> 1.13-alt5
- Use pthread instead of OpenMP (inspired by mike@)


-- 
ldv

[-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --]

^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-13 17:36                   ` Dmitry V. Levin
@ 2011-07-14  2:58                     ` REAL
  2011-07-14  3:00                       ` REAL
  2011-07-14  9:49                       ` Dmitry V. Levin
  2011-07-17 10:42                     ` REAL
  1 sibling, 2 replies; 21+ messages in thread
From: REAL @ 2011-07-14  2:58 UTC (permalink / raw)
  To: ALT Linux Team development discussions

14.07.2011 00:36, Dmitry V. Levin пишет:
> Подозреваю, хотя и не проверял, что спорадические SIGSEGVы начали
> происходить после следующего изменения в gotoblas2:
> * Sat Apr 09 2011 Eugeny A. Rostovtsev (REAL)<real at altlinux>  1.13-alt5
> - Use pthread instead of OpenMP (inspired by mike@)

Глядя на дату и отзывы от юзеров, это изменение ничего не поломало, а 
вот сборки начали ломаться примерно 2 недели назад, т.е. что-то 
изменилось во внешней среде. В glibc ничего не могло измениться? Ведь 
GotoBLAS2 с pthreads работает отлично и пока ещё никому не доставлял 
проблем, насколько я слышал. Хотя и вариант, что виновник - NumPy, не 
исключён, надо попробовать обновить.

PS. Тему, думаю, можно сворачивать, т.к., вроде, все возможные 
варианты рассмотрели, мне нужно теперь только время, чтобы 
локализовать проблему и убрать её.

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-14  2:58                     ` REAL
@ 2011-07-14  3:00                       ` REAL
  2011-07-14  9:49                       ` Dmitry V. Levin
  1 sibling, 0 replies; 21+ messages in thread
From: REAL @ 2011-07-14  3:00 UTC (permalink / raw)
  To: ALT Linux Team development discussions

14.07.2011 09:58, REAL пишет:
> изменилось во внешней среде. В glibc ничего не могло измениться? Ведь
> GotoBLAS2 с pthreads работает отлично и пока ещё никому не доставлял
> проблем

Можно и сборку самого GotoBLAS2 покрутить, скажем, попробовать 
-fno-strict-aliasing. Короче, есть чем заняться :)

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-14  2:58                     ` REAL
  2011-07-14  3:00                       ` REAL
@ 2011-07-14  9:49                       ` Dmitry V. Levin
  2011-07-14 10:00                         ` REAL
  1 sibling, 1 reply; 21+ messages in thread
From: Dmitry V. Levin @ 2011-07-14  9:49 UTC (permalink / raw)
  To: ALT Linux Team development discussions

[-- Attachment #1: Type: text/plain, Size: 976 bytes --]

On Thu, Jul 14, 2011 at 09:58:22AM +0700, REAL wrote:
> 14.07.2011 00:36, Dmitry V. Levin пишет:
> >Подозреваю, хотя и не проверял, что 
> >спорадические SIGSEGVы начали
> >происходить после следующего изменения 
> >в gotoblas2:
> >* Sat Apr 09 2011 Eugeny A. Rostovtsev (REAL)<real at altlinux>  1.13-alt5
> >- Use pthread instead of OpenMP (inspired by mike@)
> 
> Глядя на дату и отзывы от юзеров, это 
> изменение ничего не поломало, а вот 
> сборки начали ломаться примерно 2 недели 
> назад, т.е. что-то изменилось во внешней 
> среде.

Кстати говоря, есть еще один фактор.

Я обратил внимание на это безобразие только после того, как сборка
в начале июля уехала на другие сервера с более новым ядром
(std-def-2.6.39-alt2).  До этого тестовая пересборка происходила в
xen-контейнерах (xen-dom0-2.6.32), и там этих падений не было.
На ядре ovz-rhel-2.6.18 это падение в libgoto2p-r1.13.so у меня
пока что воспроизвести не получается.


-- 
ldv

[-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --]

^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-14  9:49                       ` Dmitry V. Levin
@ 2011-07-14 10:00                         ` REAL
  2011-07-14 10:01                           ` REAL
  0 siblings, 1 reply; 21+ messages in thread
From: REAL @ 2011-07-14 10:00 UTC (permalink / raw)
  To: ALT Linux Team development discussions

14.07.2011 16:49, Dmitry V. Levin пишет:
> Я обратил внимание на это безобразие только после того, как сборка
> в начале июля уехала на другие сервера с более новым ядром
> (std-def-2.6.39-alt2).  До этого тестовая пересборка происходила в
> xen-контейнерах (xen-dom0-2.6.32), и там этих падений не было.
> На ядре ovz-rhel-2.6.18 это падение в libgoto2p-r1.13.so у меня
> пока что воспроизвести не получается.

У меня замечательно воспроизводится на 2.6.32-ovz-el-alt25 (64-бит 
контейнер), но только при сборке из gear.

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-14 10:00                         ` REAL
@ 2011-07-14 10:01                           ` REAL
  2011-07-14 10:13                             ` Dmitry V. Levin
  0 siblings, 1 reply; 21+ messages in thread
From: REAL @ 2011-07-14 10:01 UTC (permalink / raw)
  To: ALT Linux Team development discussions

14.07.2011 17:00, REAL пишет:
> У меня замечательно воспроизводится на 2.6.32-ovz-el-alt25 (64-бит
> контейнер), но только при сборке из gear.

Кстати, там и хэшер радостно сообщает:

hasher-priv: chrootuid: UTS namespace isolation is not supported by 
the kernel: Operation not permitted

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-14 10:01                           ` REAL
@ 2011-07-14 10:13                             ` Dmitry V. Levin
  0 siblings, 0 replies; 21+ messages in thread
From: Dmitry V. Levin @ 2011-07-14 10:13 UTC (permalink / raw)
  To: ALT Linux Team development discussions

[-- Attachment #1: Type: text/plain, Size: 304 bytes --]

On Thu, Jul 14, 2011 at 05:01:43PM +0700, REAL wrote:
> Кстати, там и хэшер радостно сообщает:
> 
> hasher-priv: chrootuid: UTS namespace isolation is not supported by 
> the kernel: Operation not permitted

Можно выключить, когда надоест (share_uts=1, по аналогии с share_network).


-- 
ldv

[-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --]

^ permalink raw reply	[flat|nested] 21+ messages in thread

* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault
  2011-07-13 17:36                   ` Dmitry V. Levin
  2011-07-14  2:58                     ` REAL
@ 2011-07-17 10:42                     ` REAL
  1 sibling, 0 replies; 21+ messages in thread
From: REAL @ 2011-07-17 10:42 UTC (permalink / raw)
  To: ALT Linux Team development discussions

привет!

14.07.2011 00:36, Dmitry V. Levin пишет:
>> Тогда имеет смысл снять ограничения на коркообразование, получить корку и
>> посмотреть на нее.
>
> Core was generated by `/usr/bin/python2.6 setup.py build --debug'.
> Program terminated with signal 11, Segmentation fault.

как я и подозревал, проблема была в недрах NumPy. обновил у себя, 
собирается гладко. щас буду в сизиф пихать.

-- 

REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ



^ permalink raw reply	[flat|nested] 21+ messages in thread

end of thread, other threads:[~2011-07-17 10:42 UTC | newest]

Thread overview: 21+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2011-07-12  8:48 [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault Dmitry V. Levin
2011-07-12  8:59 ` REAL
2011-07-12  9:51   ` Dmitry V. Levin
2011-07-12  9:59     ` REAL
2011-07-12 10:13       ` Dmitry V. Levin
2011-07-12 10:38         ` REAL
2011-07-12 10:41           ` REAL
2011-07-12 22:37             ` Dmitry V. Levin
2011-07-13  3:20               ` REAL
2011-07-13  7:22                 ` Dmitry V. Levin
2011-07-13  7:24                   ` REAL
2011-07-13  7:54                     ` Dmitry V. Levin
2011-07-13 17:36                   ` Dmitry V. Levin
2011-07-14  2:58                     ` REAL
2011-07-14  3:00                       ` REAL
2011-07-14  9:49                       ` Dmitry V. Levin
2011-07-14 10:00                         ` REAL
2011-07-14 10:01                           ` REAL
2011-07-14 10:13                             ` Dmitry V. Levin
2011-07-17 10:42                     ` REAL
2011-07-12 12:15         ` REAL

ALT Linux Team development discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
		devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
	public-inbox-index devel

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.devel


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git