* [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault @ 2011-07-12 8:48 Dmitry V. Levin 2011-07-12 8:59 ` REAL 0 siblings, 1 reply; 21+ messages in thread From: Dmitry V. Levin @ 2011-07-12 8:48 UTC (permalink / raw) To: ALT Devel discussion list [-- Attachment #1: Type: text/plain, Size: 1500 bytes --] Hi, Что-то странное происходит во время сборки некоторых питоновских модулей. Особенно часто это наблюдается с пакетами python-module-numpy http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0710/olderr/python-module-numpy-2.0.0-alt2.git20110422 http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0707/olderr/python-module-numpy-2.0.0-alt2.git20110422.gz http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0703/olderr/python-module-numpy-2.0.0-alt2.git20110422.gz http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0702/olderr/python-module-numpy-2.0.0-alt2.git20110422.gz и python-module-matplotlib http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0710/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218 http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0705/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218.gz http://git.altlinux.org/beehive/logs/Sisyphus-i586/archive/2011/0702/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218.gz Каталог olderr в тестовой пересборке содержит логи сборки пакетов, которые пересобрались не с первого раза. Как видно, с довольно высокой вероятностью сборка python-module-numpy и python-module-matplotlib падает с однотипной диагностикой: + /usr/bin/python2.6 setup.py build --debug /usr/src/tmp/rpm-tmp.47327: line 104: 32340 Segmentation fault /usr/bin/python2.6 setup.py build --debug Что-то с этими модулями не в порядке? -- ldv [-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --] ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-12 8:48 [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault Dmitry V. Levin @ 2011-07-12 8:59 ` REAL 2011-07-12 9:51 ` Dmitry V. Levin 0 siblings, 1 reply; 21+ messages in thread From: REAL @ 2011-07-12 8:59 UTC (permalink / raw) To: ALT Linux Team development discussions 12.07.2011 15:48, Dmitry V. Levin пишет: > Что-то странное происходит во время сборки некоторых питоновских модулей. > Особенно часто это наблюдается с пакетами python-module-numpy [...] > и python-module-matplotlib > Что-то с этими модулями не в порядке? Нет, модули ни при чём, и эта жа проблема вылазит и у других модулей. Что-то изменилось в самом питоне (и только на i586), а что, я пока не разбирался (живая машинка на i586 пока недоступна, поэтому не могу проверить), да и вряд ли буду: лично мне проще найти объезд. -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-12 8:59 ` REAL @ 2011-07-12 9:51 ` Dmitry V. Levin 2011-07-12 9:59 ` REAL 0 siblings, 1 reply; 21+ messages in thread From: Dmitry V. Levin @ 2011-07-12 9:51 UTC (permalink / raw) To: ALT Linux Team development discussions [-- Attachment #1: Type: text/plain, Size: 1477 bytes --] On Tue, Jul 12, 2011 at 03:59:22PM +0700, REAL wrote: > 12.07.2011 15:48, Dmitry V. Levin пишет: > >Что-то странное происходит во время > >сборки некоторых питоновских модулей. > >Особенно часто это наблюдается с > >пакетами python-module-numpy > [...] > >и python-module-matplotlib > > >Что-то с этими модулями не в порядке? > > Нет, модули ни при чём, и эта жа проблема > вылазит и у других модулей. У этих модулей проблема воспроизводится с высокой вероятностью. Есть еще несколько модулей, во время сборки которых проблема воспроизводилась, но эти два демонстрируют что-то особенное. > Что-то изменилось в самом питоне Давно? > (и только на i586), Нет, не только на i586. На x86_64 тоже воспроизводится, только в несколько раз реже. > а что, я пока не разбирался (живая > машинка на i586 пока недоступна, поэтому не > могу проверить), Все-таки попробуйте проверить на python-module-matplotlib: http://git.altlinux.org/beehive/logs/Sisyphus-x86_64/archive/2011/0711/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218 http://git.altlinux.org/beehive/logs/Sisyphus-x86_64/archive/2011/0702/olderr/python-module-matplotlib-1.1.0-alt1.svn20110218.gz > да и вряд ли буду: лично мне проще найти объезд. Пакеты, которые собираются с вероятностью -- это большая проблема для тестов, проверяющих регрессии в репозитории. Из-за них репозиторий приходится собирать итеративно, что обходится довольно дорого. -- ldv [-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --] ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-12 9:51 ` Dmitry V. Levin @ 2011-07-12 9:59 ` REAL 2011-07-12 10:13 ` Dmitry V. Levin 0 siblings, 1 reply; 21+ messages in thread From: REAL @ 2011-07-12 9:59 UTC (permalink / raw) To: ALT Linux Team development discussions 12.07.2011 16:51, Dmitry V. Levin пишет: >> Что-то изменилось в самом питоне > > Давно? Даже не могу сказать, заметил пару недель назад. Только не понимайте буквально ;) - "самим питоном" может оказаться вообще какая-нибудь "непричастная" библиотека, я просто не знаю. >> (и только на i586), > > Нет, не только на i586. > На x86_64 тоже воспроизводится, только в несколько раз реже. А вот этого не видел, странно, что мне не пришло ничего по этой теме. Рассылка только лидерам пакетов ведётся, что ли? > Пакеты, которые собираются с вероятностью -- это большая проблема для > тестов, проверяющих регрессии в репозитории. Вот только кто виновником этих вероятностей является - вопрос. -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-12 9:59 ` REAL @ 2011-07-12 10:13 ` Dmitry V. Levin 2011-07-12 10:38 ` REAL 2011-07-12 12:15 ` REAL 0 siblings, 2 replies; 21+ messages in thread From: Dmitry V. Levin @ 2011-07-12 10:13 UTC (permalink / raw) To: ALT Linux Team development discussions [-- Attachment #1: Type: text/plain, Size: 551 bytes --] On Tue, Jul 12, 2011 at 04:59:24PM +0700, REAL wrote: > >На x86_64 тоже воспроизводится, только в > >несколько раз реже. > > А вот этого не видел, странно, что мне не > пришло ничего по этой теме. Рассылка > только лидерам пакетов ведётся, что ли? Если пакет не собрался во время тестовой пересборки, это значит, что его не удалось собрать как минимум 3 раза в одинаковой среде. По пакетам, которые собираются с высокой вероятностью, письма не рассылаются, поскольку за несколько итераций их все-таки удается собрать. -- ldv [-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --] ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-12 10:13 ` Dmitry V. Levin @ 2011-07-12 10:38 ` REAL 2011-07-12 10:41 ` REAL 2011-07-12 12:15 ` REAL 1 sibling, 1 reply; 21+ messages in thread From: REAL @ 2011-07-12 10:38 UTC (permalink / raw) To: ALT Linux Team development discussions 12.07.2011 17:13, Dmitry V. Levin пишет: > Если пакет не собрался во время тестовой пересборки, это значит, что > его не удалось собрать как минимум 3 раза в одинаковой среде. > > По пакетам, которые собираются с высокой вероятностью, письма не > рассылаются, поскольку за несколько итераций их все-таки удается собрать. Здесь я пока вижу, что команда "/usr/bin/python2.6 setup.py build --debug" (равно как и просто "python setup.py build") вываливается ещё _до_ каких-либо сообщений от собственно пакетов, так что у меня пока нет уверенности, связано ли это как-то с конкретно обсуждаемыми модулями. Забавно, что заходя в hsh-shell и делая всё по спеку, ошибка не воспроизводится. PS. Может быть, у хэшера изменились запросы к памяти или добавились какие-то ограничения? Или что-то такое неприятное добавилось в rpm-build? -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-12 10:38 ` REAL @ 2011-07-12 10:41 ` REAL 2011-07-12 22:37 ` Dmitry V. Levin 0 siblings, 1 reply; 21+ messages in thread From: REAL @ 2011-07-12 10:41 UTC (permalink / raw) To: ALT Linux Team development discussions 12.07.2011 17:38, REAL пишет: > модулями. Забавно, что заходя в hsh-shell и делая всё по спеку, ошибка > не воспроизводится. И попутно вопрос: как воспроизвести ситуацию в hsh-shell? -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-12 10:41 ` REAL @ 2011-07-12 22:37 ` Dmitry V. Levin 2011-07-13 3:20 ` REAL 0 siblings, 1 reply; 21+ messages in thread From: Dmitry V. Levin @ 2011-07-12 22:37 UTC (permalink / raw) To: ALT Linux Team development discussions [-- Attachment #1: Type: text/plain, Size: 9952 bytes --] On Tue, Jul 12, 2011 at 05:41:10PM +0700, REAL wrote: > 12.07.2011 17:38, REAL пишет: > >модулями. Забавно, что заходя в hsh-shell и > >делая всё по спеку, ошибка > >не воспроизводится. > > И попутно вопрос: как воспроизвести > ситуацию в hsh-shell? Воспроизводится, но с очень низкой вероятностью. Оказывается, все без исключения случаи Segmentation fault в python, вне зависимости от пакета, происходили в одном и том же месте в libgotoblas2. Это хорошо видно благодаря тому, что debug.exception-trace по умолчанию включен и все эти segfaults попадают в dmesg: $ cat dmesg.* | sed -n '/^[^ ]* python.*segfault at / s///p' | sort -u 7f1202c38000 ip 00007f1213d1f81a sp 00007f1212b58de0 error 6 in libgoto2p-r1.13.so[7f1213925000+1327000] 7f2d2c7f0000 ip 00007f2d3d80b81a sp 00007f2d3c644de0 error 6 in libgoto2p-r1.13.so[7f2d3d411000+1327000] 7f3eddde0000 ip 00007f3eee9a781a sp 00007f3eed7e0de0 error 6 in libgoto2p-r1.13.so[7f3eee5ad000+1327000] 7f693f9a1000 ip 00007f695058b81a sp 00007f694c9a1de0 error 6 in libgoto2p-r1.13.so[7f6950191000+1327000] 7f6955c19000 ip 00007f696687781a sp 00007f69656b0de0 error 6 in libgoto2p-r1.13.so[7f696647d000+1327000] 7f7fe7bf1000 ip 00007f7ff8c9f81a sp 00007f7ff7ad8de0 error 6 in libgoto2p-r1.13.so[7f7ff88a5000+1327000] 7f886f84d000 ip 00007f888053281a sp 00007f887d04ede0 error 6 in libgoto2p-r1.13.so[7f8880138000+1327000] 7f91cb483000 ip 00007f91dc3fa81a sp 00007f91db233de0 error 6 in libgoto2p-r1.13.so[7f91dc000000+1327000] 7f9e0826b000 ip 00007f9e18f5181a sp 00007f9e17d8ade0 error 6 in libgoto2p-r1.13.so[7f9e18b57000+1327000] 7fa0e5696000 ip 00007fa0f667281a sp 00007fa0fddfcde0 error 6 in libgoto2p-r1.13.so[7fa0f6278000+1327000] 7fb0a6623000 ip 00007fb0b701b81a sp 00007fb0b5e54de0 error 6 in libgoto2p-r1.13.so[7fb0b6c21000+1327000] 7fb9b3553000 ip 00007fb9c436b81a sp 00007fb9c31a4de0 error 6 in libgoto2p-r1.13.so[7fb9c3f71000+1327000] 7fcf1bfc0000 ip 00007fcf2cff881a sp 00007fcf2be31de0 error 6 in libgoto2p-r1.13.so[7fcf2cbfe000+1327000] 7ff562642000 ip 00007ff57322281a sp 00007ff57205bde0 error 6 in libgoto2p-r1.13.so[7ff572e28000+1327000] [это на x86-64] ec1f3000 ip 00000000f5362ad8 sp 00000000f491b240 error 6 in libgoto2p-r1.13.so[f4fbb000+eb0000] ec1ff000 ip 00000000f5362ad8 sp 00000000f6923240 error 6 in libgoto2p-r1.13.so[f4fbb000+eb0000] ec254000 ip 00000000f5402ad8 sp 00000000f69dc240 error 6 in libgoto2p-r1.13.so[f505b000+eb0000] ec2d0000 ip 00000000f53e7ad8 sp 00000000f69a4240 error 6 in libgoto2p-r1.13.so[f5040000+eb0000] ec497000 ip 00000000f5402ad8 sp 00000000f7234240 error 6 in libgoto2p-r1.13.so[f505b000+eb0000] ec4a5000 ip 00000000f5362ad8 sp 00000000f7186240 error 6 in libgoto2p-r1.13.so[f4fbb000+eb0000] ec571000 ip 00000000f5379ad8 sp 00000000f6936240 error 6 in libgoto2p-r1.13.so[f4fd2000+eb0000] ec846000 ip 00000000f5402ad8 sp 00000000f7239240 error 6 in libgoto2p-r1.13.so[f505b000+eb0000] ecbf3000 ip 00000000f6487ad8 sp 00000000f3bf2240 error 6 in libgoto2p-r1.13.so[f60e0000+eb0000] ecbf4000 ip 00000000f65bfad8 sp 00000000f3bf3240 error 6 in libgoto2p-r1.13.so[f6218000+eb0000] ecbfb000 ip 00000000f65d3ad8 sp 00000000f5b8c240 error 6 in libgoto2p-r1.13.so[f622c000+eb0000] ecbfe000 ip 00000000f660ead8 sp 00000000f5bc7240 error 6 in libgoto2p-r1.13.so[f6267000+eb0000] ecc03000 ip 00000000f65b5ad8 sp 00000000f5b6e240 error 6 in libgoto2p-r1.13.so[f620e000+eb0000] ecc05000 ip 00000000f65c9ad8 sp 00000000f5b80240 error 6 in libgoto2p-r1.13.so[f6222000+eb0000] ecc0a000 ip 00000000f6642ad8 sp 00000000f3c09240 error 6 in libgoto2p-r1.13.so[f629b000+eb0000] ecc10000 ip 00000000f654fad8 sp 00000000f3c0f240 error 6 in libgoto2p-r1.13.so[f61a8000+eb0000] ecc33000 ip 00000000f65c5ad8 sp 00000000f5b7e240 error 6 in libgoto2p-r1.13.so[f621e000+eb0000] ecc3a000 ip 00000000f6607ad8 sp 00000000f5bc0240 error 6 in libgoto2p-r1.13.so[f6260000+eb0000] ecc42000 ip 00000000f6569ad8 sp 00000000f5b21240 error 6 in libgoto2p-r1.13.so[f61c2000+eb0000] ecc46000 ip 00000000f65d1ad8 sp 00000000f3c45240 error 6 in libgoto2p-r1.13.so[f622a000+eb0000] ecc79000 ip 00000000f6608ad8 sp 00000000f5bc1240 error 6 in libgoto2p-r1.13.so[f6261000+eb0000] ecc7a000 ip 00000000f657dad8 sp 00000000f5b36240 error 6 in libgoto2p-r1.13.so[f61d6000+eb0000] eccf6000 ip 00000000f65e7ad8 sp 00000000f5ba0240 error 6 in libgoto2p-r1.13.so[f6240000+eb0000] ecd6e000 ip 00000000f65c2ad8 sp 00000000f456d240 error 6 in libgoto2p-r1.13.so[f621b000+eb0000] ecd80000 ip 00000000f6669ad8 sp 00000000f3d7f240 error 6 in libgoto2p-r1.13.so[f62c2000+eb0000] ecdb6000 ip 00000000f6586ad8 sp 00000000f5b3f240 error 6 in libgoto2p-r1.13.so[f61df000+eb0000] ecddd000 ip 00000000f6751ad8 sp 00000000f45dc240 error 6 in libgoto2p-r1.13.so[f63aa000+eb0000] ecdf2000 ip 00000000f675aad8 sp 00000000f3df1240 error 6 in libgoto2p-r1.13.so[f63b3000+eb0000] ecdf3000 ip 00000000f6716ad8 sp 00000000f5cce240 error 6 in libgoto2p-r1.13.so[f636f000+eb0000] ecdf9000 ip 00000000f66b2ad8 sp 00000000f35f8240 error 6 in libgoto2p-r1.13.so[f630b000+eb0000] ecdfa000 ip 00000000f66d0ad8 sp 00000000f3df9240 error 6 in libgoto2p-r1.13.so[f6329000+eb0000] ecdfd000 ip 00000000f665ead8 sp 00000000f35fc240 error 6 in libgoto2p-r1.13.so[f62b7000+eb0000] ece01000 ip 00000000f6685ad8 sp 00000000f5c3d240 error 6 in libgoto2p-r1.13.so[f62de000+eb0000] ece02000 ip 00000000f6702ad8 sp 00000000f5cba240 error 6 in libgoto2p-r1.13.so[f635b000+eb0000] ece1a000 ip 00000000f66cead8 sp 00000000f5c86240 error 6 in libgoto2p-r1.13.so[f6327000+eb0000] ece1f000 ip 00000000f6665ad8 sp 00000000f5c1e240 error 6 in libgoto2p-r1.13.so[f62be000+eb0000] ece20000 ip 00000000f6656ad8 sp 00000000f5c0f240 error 6 in libgoto2p-r1.13.so[f62af000+eb0000] ece29000 ip 00000000f669dad8 sp 00000000f3e28240 error 6 in libgoto2p-r1.13.so[f62f6000+eb0000] ece30000 ip 00000000f6734ad8 sp 00000000f5cec240 error 6 in libgoto2p-r1.13.so[f638d000+eb0000] ece42000 ip 00000000f66b3ad8 sp 00000000f5c6b240 error 6 in libgoto2p-r1.13.so[f630c000+eb0000] ece42000 ip 00000000f670aad8 sp 00000000f3641240 error 6 in libgoto2p-r1.13.so[f6363000+eb0000] ece47000 ip 00000000f6511ad8 sp 00000000f5aca240 error 6 in libgoto2p-r1.13.so[f616a000+eb0000] ece4c000 ip 00000000f666dad8 sp 00000000f3e4b240 error 6 in libgoto2p-r1.13.so[f62c6000+eb0000] ece51000 ip 00000000f66a3ad8 sp 00000000f5c5c240 error 6 in libgoto2p-r1.13.so[f62fc000+eb0000] ece5c000 ip 00000000f67aaad8 sp 00000000f5d61240 error 6 in libgoto2p-r1.13.so[f6403000+eb0000] ece69000 ip 00000000f6736ad8 sp 00000000f3e68240 error 6 in libgoto2p-r1.13.so[f638f000+eb0000] ece6d000 ip 00000000f672fad8 sp 00000000f5ce7240 error 6 in libgoto2p-r1.13.so[f6388000+eb0000] ece74000 ip 00000000f6697ad8 sp 00000000f5c4f240 error 6 in libgoto2p-r1.13.so[f62f0000+eb0000] ece75000 ip 00000000f6458ad8 sp 00000000f5a10240 error 6 in libgoto2p-r1.13.so[f60b1000+eb0000] ece87000 ip 00000000f6733ad8 sp 00000000f5ceb240 error 6 in libgoto2p-r1.13.so[f638c000+eb0000] ece90000 ip 00000000f671aad8 sp 00000000f3e8f240 error 6 in libgoto2p-r1.13.so[f6373000+eb0000] ece99000 ip 00000000f666aad8 sp 00000000f3698240 error 6 in libgoto2p-r1.13.so[f62c3000+eb0000] ecea1000 ip 00000000f6723ad8 sp 00000000f3ea0240 error 6 in libgoto2p-r1.13.so[f637c000+eb0000] ecea3000 ip 00000000f65e1ad8 sp 00000000f5b9a240 error 6 in libgoto2p-r1.13.so[f623a000+eb0000] ecea7000 ip 00000000f6777ad8 sp 00000000f5d2f240 error 6 in libgoto2p-r1.13.so[f63d0000+eb0000] ecea9000 ip 00000000f6669ad8 sp 00000000f5c22240 error 6 in libgoto2p-r1.13.so[f62c2000+eb0000] ecee8000 ip 00000000f6709ad8 sp 00000000f5cc1240 error 6 in libgoto2p-r1.13.so[f6362000+eb0000] ecef3000 ip 00000000f6674ad8 sp 00000000f46f2240 error 6 in libgoto2p-r1.13.so[f62cd000+eb0000] ecef4000 ip 00000000f667ead8 sp 00000000f3ef3240 error 6 in libgoto2p-r1.13.so[f62d7000+eb0000] ecf00000 ip 00000000f6758ad8 sp 00000000f3eff240 error 6 in libgoto2p-r1.13.so[f63b1000+eb0000] ecf00000 ip 00000000f67b6ad8 sp 00000000f3eff240 error 6 in libgoto2p-r1.13.so[f640f000+eb0000] ecf23000 ip 00000000f6627ad8 sp 00000000f5be0240 error 6 in libgoto2p-r1.13.so[f6280000+eb0000] ecf25000 ip 00000000f6734ad8 sp 00000000f5cec240 error 6 in libgoto2p-r1.13.so[f638d000+eb0000] ecf4d000 ip 00000000f678dad8 sp 00000000f5d45240 error 6 in libgoto2p-r1.13.so[f63e6000+eb0000] ecf7c000 ip 00000000f66d0ad8 sp 00000000f5c88240 error 6 in libgoto2p-r1.13.so[f6329000+eb0000] ecfb6000 ip 00000000f672cad8 sp 00000000f5ce4240 error 6 in libgoto2p-r1.13.so[f6385000+eb0000] ecfc5000 ip 00000000f6733ad8 sp 00000000f5cea240 error 6 in libgoto2p-r1.13.so[f638c000+eb0000] ecfce000 ip 00000000f65d2ad8 sp 00000000f5b89240 error 6 in libgoto2p-r1.13.so[f622b000+eb0000] ecfd6000 ip 00000000f668bad8 sp 00000000f3fd5240 error 6 in libgoto2p-r1.13.so[f62e4000+eb0000] ecfd8000 ip 00000000f6708ad8 sp 00000000f5cc0240 error 6 in libgoto2p-r1.13.so[f6361000+eb0000] ed040000 ip 00000000f66f3ad8 sp 00000000f403f240 error 6 in libgoto2p-r1.13.so[f634c000+eb0000] ed0c9000 ip 00000000f66c5ad8 sp 00000000f40c8240 error 6 in libgoto2p-r1.13.so[f631e000+eb0000] ed1be000 ip 00000000f67acad8 sp 00000000f49bd240 error 6 in libgoto2p-r1.13.so[f6405000+eb0000] ed1f9000 ip 00000000f6647ad8 sp 00000000f49f8240 error 6 in libgoto2p-r1.13.so[f62a0000+eb0000] ed1fd000 ip 00000000f6661ad8 sp 00000000f41fc240 error 6 in libgoto2p-r1.13.so[f62ba000+eb0000] ed21c000 ip 00000000f66a6ad8 sp 00000000f421b240 error 6 in libgoto2p-r1.13.so[f62ff000+eb0000] ed226000 ip 00000000f66cbad8 sp 00000000f3a25240 error 6 in libgoto2p-r1.13.so[f6324000+eb0000] ed24f000 ip 00000000f6610ad8 sp 00000000f5bc9240 error 6 in libgoto2p-r1.13.so[f6269000+eb0000] ed409000 ip 00000000f6715ad8 sp 00000000f4408240 error 6 in libgoto2p-r1.13.so[f636e000+eb0000] [это на i586] Если бы не рандомизация адресов, то здесь было бы всего 2 строчки, по одной для каждой архитектуры. -- ldv [-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --] ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-12 22:37 ` Dmitry V. Levin @ 2011-07-13 3:20 ` REAL 2011-07-13 7:22 ` Dmitry V. Levin 0 siblings, 1 reply; 21+ messages in thread From: REAL @ 2011-07-13 3:20 UTC (permalink / raw) To: ALT Linux Team development discussions 13.07.2011 05:37, Dmitry V. Levin пишет: >> И попутно вопрос: как воспроизвести >> ситуацию в hsh-shell? > > Воспроизводится, но с очень низкой вероятностью. На x86_64 с matplotlib при сборке в gear воспроизводится в ~90% случаев, но в hsh-shell так и не удалось. > Оказывается, все без исключения случаи Segmentation fault в python, вне > зависимости от пакета, происходили в одном и том же месте в libgotoblas2. Я заметил другое: обломы происходят где-то при обращении к lapack_lite.so (в NumPy), так что возможно, что проблема здесь, а не в GotoBLAS2. В общем, поковыряюсь... -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-13 3:20 ` REAL @ 2011-07-13 7:22 ` Dmitry V. Levin 2011-07-13 7:24 ` REAL 2011-07-13 17:36 ` Dmitry V. Levin 0 siblings, 2 replies; 21+ messages in thread From: Dmitry V. Levin @ 2011-07-13 7:22 UTC (permalink / raw) To: ALT Linux Team development discussions [-- Attachment #1: Type: text/plain, Size: 462 bytes --] On Wed, Jul 13, 2011 at 10:20:25AM +0700, REAL wrote: > 13.07.2011 05:37, Dmitry V. Levin пишет: > >>И попутно вопрос: как воспроизвести > >>ситуацию в hsh-shell? > > > >Воспроизводится, но с очень низкой > >вероятностью. > > На x86_64 с matplotlib при сборке в gear > воспроизводится в ~90% случаев, но в hsh-shell > так и не удалось. Тогда имеет смысл снять ограничения на коркообразование, получить корку и посмотреть на нее. -- ldv [-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --] ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-13 7:22 ` Dmitry V. Levin @ 2011-07-13 7:24 ` REAL 2011-07-13 7:54 ` Dmitry V. Levin 2011-07-13 17:36 ` Dmitry V. Levin 1 sibling, 1 reply; 21+ messages in thread From: REAL @ 2011-07-13 7:24 UTC (permalink / raw) To: ALT Linux Team development discussions 13.07.2011 14:22, Dmitry V. Levin пишет: >> На x86_64 с matplotlib при сборке в gear >> воспроизводится в ~90% случаев, но в hsh-shell >> так и не удалось. > > Тогда имеет смысл снять ограничения на коркообразование, получить корку и > посмотреть на нее. А как это сделать? Что подразумевается под коркой? -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-13 7:24 ` REAL @ 2011-07-13 7:54 ` Dmitry V. Levin 0 siblings, 0 replies; 21+ messages in thread From: Dmitry V. Levin @ 2011-07-13 7:54 UTC (permalink / raw) To: ALT Linux Team development discussions [-- Attachment #1: Type: text/plain, Size: 484 bytes --] On Wed, Jul 13, 2011 at 02:24:33PM +0700, REAL wrote: > 13.07.2011 14:22, Dmitry V. Levin пишет: > >>На x86_64 с matplotlib при сборке в gear > >>воспроизводится в ~90% случаев, но в hsh-shell > >>так и не удалось. > > > >Тогда имеет смысл снять ограничения на > >коркообразование, получить корку и > >посмотреть на нее. > > А как это сделать? # sysctl kernel.core_pattern=core $ ulimit -c unlimited > Что подразумевается под коркой? См. core(5). -- ldv [-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --] ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-13 7:22 ` Dmitry V. Levin 2011-07-13 7:24 ` REAL @ 2011-07-13 17:36 ` Dmitry V. Levin 2011-07-14 2:58 ` REAL 2011-07-17 10:42 ` REAL 1 sibling, 2 replies; 21+ messages in thread From: Dmitry V. Levin @ 2011-07-13 17:36 UTC (permalink / raw) To: ALT Linux Team development discussions [-- Attachment #1: Type: text/plain, Size: 2074 bytes --] On Wed, Jul 13, 2011 at 11:22:26AM +0400, Dmitry V. Levin wrote: > On Wed, Jul 13, 2011 at 10:20:25AM +0700, REAL wrote: > > На x86_64 с matplotlib при сборке в gear > > воспроизводится в ~90% случаев, но в hsh-shell > > так и не удалось. > > Тогда имеет смысл снять ограничения на коркообразование, получить корку и > посмотреть на нее. Core was generated by `/usr/bin/python2.6 setup.py build --debug'. Program terminated with signal 11, Segmentation fault. #0 alloc_mmap (address=0x0) at memory.c:361 361 *(long *)start = (long)start + PAGESIZE; (gdb) bt #0 alloc_mmap (address=0x0) at memory.c:361 #1 0xf66e1104 in blas_memory_alloc (procpos=2) at memory.c:915 #2 0xf66e185e in blas_thread_server (arg=0x0) at blas_server.c:242 #3 0xf74eb940 in start_thread (arg=0xf5c99b70) at pthread_create.c:297 #4 0xf75ce8ae in clone () at ../sysdeps/unix/sysv/linux/i386/clone.S:130 (gdb) l 356 357 start = (BLASULONG)map_address; 358 current = (SCALING - 1) * BUFFER_SIZE; 359 360 while(current > 0) { 361 *(long *)start = (long)start + PAGESIZE; 362 start += PAGESIZE; 363 current -= PAGESIZE; 364 } 365 (gdb) p map_address $1 = (void *) 0xecdf2000 (gdb) p/x start $3 = 0xecdf2000 (gdb) p *(long*)map_address Cannot access memory at address 0xecdf2000 Картина примерно следующая: тред при старте делает map_address = mmap(NULL, 0x2000000, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0); mbind(map_address, 0x20000000, MPOL_PREFERRED, NULL, 0, 0); сразу после этого пытается записать long по адресу map_address, и получает SIGSEGV с кодом ошибки 6 (user-mode write access). Наиболее вероятно, что за время, прошедшее между окончанием mmap(2) и началом записи, другой тред сделал munmap(2) этой части адресного пространства. Подозреваю, хотя и не проверял, что спорадические SIGSEGVы начали происходить после следующего изменения в gotoblas2: * Sat Apr 09 2011 Eugeny A. Rostovtsev (REAL) <real at altlinux> 1.13-alt5 - Use pthread instead of OpenMP (inspired by mike@) -- ldv [-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --] ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-13 17:36 ` Dmitry V. Levin @ 2011-07-14 2:58 ` REAL 2011-07-14 3:00 ` REAL 2011-07-14 9:49 ` Dmitry V. Levin 2011-07-17 10:42 ` REAL 1 sibling, 2 replies; 21+ messages in thread From: REAL @ 2011-07-14 2:58 UTC (permalink / raw) To: ALT Linux Team development discussions 14.07.2011 00:36, Dmitry V. Levin пишет: > Подозреваю, хотя и не проверял, что спорадические SIGSEGVы начали > происходить после следующего изменения в gotoblas2: > * Sat Apr 09 2011 Eugeny A. Rostovtsev (REAL)<real at altlinux> 1.13-alt5 > - Use pthread instead of OpenMP (inspired by mike@) Глядя на дату и отзывы от юзеров, это изменение ничего не поломало, а вот сборки начали ломаться примерно 2 недели назад, т.е. что-то изменилось во внешней среде. В glibc ничего не могло измениться? Ведь GotoBLAS2 с pthreads работает отлично и пока ещё никому не доставлял проблем, насколько я слышал. Хотя и вариант, что виновник - NumPy, не исключён, надо попробовать обновить. PS. Тему, думаю, можно сворачивать, т.к., вроде, все возможные варианты рассмотрели, мне нужно теперь только время, чтобы локализовать проблему и убрать её. -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-14 2:58 ` REAL @ 2011-07-14 3:00 ` REAL 2011-07-14 9:49 ` Dmitry V. Levin 1 sibling, 0 replies; 21+ messages in thread From: REAL @ 2011-07-14 3:00 UTC (permalink / raw) To: ALT Linux Team development discussions 14.07.2011 09:58, REAL пишет: > изменилось во внешней среде. В glibc ничего не могло измениться? Ведь > GotoBLAS2 с pthreads работает отлично и пока ещё никому не доставлял > проблем Можно и сборку самого GotoBLAS2 покрутить, скажем, попробовать -fno-strict-aliasing. Короче, есть чем заняться :) -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-14 2:58 ` REAL 2011-07-14 3:00 ` REAL @ 2011-07-14 9:49 ` Dmitry V. Levin 2011-07-14 10:00 ` REAL 1 sibling, 1 reply; 21+ messages in thread From: Dmitry V. Levin @ 2011-07-14 9:49 UTC (permalink / raw) To: ALT Linux Team development discussions [-- Attachment #1: Type: text/plain, Size: 976 bytes --] On Thu, Jul 14, 2011 at 09:58:22AM +0700, REAL wrote: > 14.07.2011 00:36, Dmitry V. Levin пишет: > >Подозреваю, хотя и не проверял, что > >спорадические SIGSEGVы начали > >происходить после следующего изменения > >в gotoblas2: > >* Sat Apr 09 2011 Eugeny A. Rostovtsev (REAL)<real at altlinux> 1.13-alt5 > >- Use pthread instead of OpenMP (inspired by mike@) > > Глядя на дату и отзывы от юзеров, это > изменение ничего не поломало, а вот > сборки начали ломаться примерно 2 недели > назад, т.е. что-то изменилось во внешней > среде. Кстати говоря, есть еще один фактор. Я обратил внимание на это безобразие только после того, как сборка в начале июля уехала на другие сервера с более новым ядром (std-def-2.6.39-alt2). До этого тестовая пересборка происходила в xen-контейнерах (xen-dom0-2.6.32), и там этих падений не было. На ядре ovz-rhel-2.6.18 это падение в libgoto2p-r1.13.so у меня пока что воспроизвести не получается. -- ldv [-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --] ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-14 9:49 ` Dmitry V. Levin @ 2011-07-14 10:00 ` REAL 2011-07-14 10:01 ` REAL 0 siblings, 1 reply; 21+ messages in thread From: REAL @ 2011-07-14 10:00 UTC (permalink / raw) To: ALT Linux Team development discussions 14.07.2011 16:49, Dmitry V. Levin пишет: > Я обратил внимание на это безобразие только после того, как сборка > в начале июля уехала на другие сервера с более новым ядром > (std-def-2.6.39-alt2). До этого тестовая пересборка происходила в > xen-контейнерах (xen-dom0-2.6.32), и там этих падений не было. > На ядре ovz-rhel-2.6.18 это падение в libgoto2p-r1.13.so у меня > пока что воспроизвести не получается. У меня замечательно воспроизводится на 2.6.32-ovz-el-alt25 (64-бит контейнер), но только при сборке из gear. -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-14 10:00 ` REAL @ 2011-07-14 10:01 ` REAL 2011-07-14 10:13 ` Dmitry V. Levin 0 siblings, 1 reply; 21+ messages in thread From: REAL @ 2011-07-14 10:01 UTC (permalink / raw) To: ALT Linux Team development discussions 14.07.2011 17:00, REAL пишет: > У меня замечательно воспроизводится на 2.6.32-ovz-el-alt25 (64-бит > контейнер), но только при сборке из gear. Кстати, там и хэшер радостно сообщает: hasher-priv: chrootuid: UTS namespace isolation is not supported by the kernel: Operation not permitted -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-14 10:01 ` REAL @ 2011-07-14 10:13 ` Dmitry V. Levin 0 siblings, 0 replies; 21+ messages in thread From: Dmitry V. Levin @ 2011-07-14 10:13 UTC (permalink / raw) To: ALT Linux Team development discussions [-- Attachment #1: Type: text/plain, Size: 304 bytes --] On Thu, Jul 14, 2011 at 05:01:43PM +0700, REAL wrote: > Кстати, там и хэшер радостно сообщает: > > hasher-priv: chrootuid: UTS namespace isolation is not supported by > the kernel: Operation not permitted Можно выключить, когда надоест (share_uts=1, по аналогии с share_network). -- ldv [-- Attachment #2: Type: application/pgp-signature, Size: 198 bytes --] ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-13 17:36 ` Dmitry V. Levin 2011-07-14 2:58 ` REAL @ 2011-07-17 10:42 ` REAL 1 sibling, 0 replies; 21+ messages in thread From: REAL @ 2011-07-17 10:42 UTC (permalink / raw) To: ALT Linux Team development discussions привет! 14.07.2011 00:36, Dmitry V. Levin пишет: >> Тогда имеет смысл снять ограничения на коркообразование, получить корку и >> посмотреть на нее. > > Core was generated by `/usr/bin/python2.6 setup.py build --debug'. > Program terminated with signal 11, Segmentation fault. как я и подозревал, проблема была в недрах NumPy. обновил у себя, собирается гладко. щас буду в сизиф пихать. -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
* Re: [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault 2011-07-12 10:13 ` Dmitry V. Levin 2011-07-12 10:38 ` REAL @ 2011-07-12 12:15 ` REAL 1 sibling, 0 replies; 21+ messages in thread From: REAL @ 2011-07-12 12:15 UTC (permalink / raw) To: ALT Linux Team development discussions 12.07.2011 17:13, Dmitry V. Levin пишет: > Если пакет не собрался во время тестовой пересборки, это значит, что > его не удалось собрать как минимум 3 раза в одинаковой среде. добрался до i586. две недели не пересобирается в gear: http://git.altlinux.org/beehive/logs/Sisyphus-i586/latest/error/OOSuite-0.33-alt1.svn20110325.1 воспроизвести не смог. что это было вообще? -- REAL aka Евгений Ростовцев, программист ЦНИТ КемГУ ^ permalink raw reply [flat|nested] 21+ messages in thread
end of thread, other threads:[~2011-07-17 10:42 UTC | newest] Thread overview: 21+ messages (download: mbox.gz / follow: Atom feed) -- links below jump to the message on this page -- 2011-07-12 8:48 [devel] Q: /usr/bin/python2.6 setup.py build --debug: Segmentation fault Dmitry V. Levin 2011-07-12 8:59 ` REAL 2011-07-12 9:51 ` Dmitry V. Levin 2011-07-12 9:59 ` REAL 2011-07-12 10:13 ` Dmitry V. Levin 2011-07-12 10:38 ` REAL 2011-07-12 10:41 ` REAL 2011-07-12 22:37 ` Dmitry V. Levin 2011-07-13 3:20 ` REAL 2011-07-13 7:22 ` Dmitry V. Levin 2011-07-13 7:24 ` REAL 2011-07-13 7:54 ` Dmitry V. Levin 2011-07-13 17:36 ` Dmitry V. Levin 2011-07-14 2:58 ` REAL 2011-07-14 3:00 ` REAL 2011-07-14 9:49 ` Dmitry V. Levin 2011-07-14 10:00 ` REAL 2011-07-14 10:01 ` REAL 2011-07-14 10:13 ` Dmitry V. Levin 2011-07-17 10:42 ` REAL 2011-07-12 12:15 ` REAL
ALT Linux Team development discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \ devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru public-inbox-index devel Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.devel AGPL code for this site: git clone https://public-inbox.org/public-inbox.git