* [sisyphus] I: recoll-1.10.0 @ 2007-11-26 22:47 ` Michael Shigorin 2007-11-27 19:41 ` Yuriy Shirokov 2007-11-30 12:45 ` Чернов Евгений 0 siblings, 2 replies; 12+ messages in thread From: Michael Shigorin @ 2007-11-26 22:47 UTC (permalink / raw) To: sisyphus On Tue, Nov 27, 2007 at 12:22:29AM +0300, QA Team Robot wrote: > recoll - Recoll is a personal full text search package > * Sun Nov 25 2007 Michael Shigorin <mike@altlinux> 1.10.0-alt1 > - 1.10.0: > + configuration GUI for the indexing parameters > + support for CJK texts > + new filters for image and TeX formats > + kicker applet > * Wed Sep 12 2007 Michael Shigorin <mike@altlinux> 1.9.0-alt1 Всячески рекомендую, "это можно давать детям" (c) У меня нормально проиндексировало примерно четыре гигабайта почты и документов, в т.ч. сжатых; mbox'ы очень удобно показывает по письму с подсветкой найденного, по окну с табами на поиск. Использует xapian (как и gmane.org). -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-11-26 22:47 ` [sisyphus] I: recoll-1.10.0 Michael Shigorin @ 2007-11-27 19:41 ` Yuriy Shirokov 2007-11-28 10:00 ` Alexey Shabalin 2007-11-30 12:45 ` Чернов Евгений 1 sibling, 1 reply; 12+ messages in thread From: Yuriy Shirokov @ 2007-11-27 19:41 UTC (permalink / raw) To: shigorin, ALT Linux Sisyphus discussions -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Michael Shigorin пишет: >> recoll - Recoll is a personal full text search package > Всячески рекомендую, "это можно давать детям" (c) > Использует xapian (как и gmane.org). Всячески присоединяюсь, и вам как мантейнеру большое спасибо! Экспериментировал до этого с Beagle и Google Desktop, получил вполне разочаровывающие результаты (подозреваю, что длительным копанием в настройках их можно было бы улучшить, но локальная поисковая машина --- не то приложение, на изучение которого я готов тратить длительное время). А эта штуковина за смешное время создала, по ощущениям, куда более полный индекс, чем оба вышеупомянутых поисковых движка вместе взятые --- по крайней мере, действительно _ищет_ в трёх гигабайтах текстовых документов и полугигабайте почты, причём находит и такие вещи, которые я найти совершенно не ожидал. - -- С уважением, Ю.А.Широков. -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.7 (GNU/Linux) Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org iQCVAwUBR0xy5OdMeS2DDLCcAQK7dAQAlHjSdlBR75q/ygFNSauk5+xTJnk/5xkM QR7AlsV6hzMzJGD3CKNebyDtGr3ZBpgWx5c/EKCg9N4PJEYmPgxznHUnbtcvMu1u 22MckmKqmkOss2qpy6CLhOQkcgj1GeQpr3LfaaG83pWyKpxLxOi/Vqll0ZUxPGqI V064HtlHIow= =rGz5 -----END PGP SIGNATURE----- ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-11-27 19:41 ` Yuriy Shirokov @ 2007-11-28 10:00 ` Alexey Shabalin 2007-11-28 10:19 ` Alex Karpov 2007-11-28 19:14 ` Yuriy Shirokov 0 siblings, 2 replies; 12+ messages in thread From: Alexey Shabalin @ 2007-11-28 10:00 UTC (permalink / raw) To: ALT Linux Sisyphus discussions > Michael Shigorin пишет: > >> recoll - Recoll is a personal full text search package > > Всячески рекомендую, "это можно давать детям" (c) > > Использует xapian (как и gmane.org). > > Всячески присоединяюсь, и вам как мантейнеру большое спасибо! > Экспериментировал до этого с Beagle и Google Desktop, получил вполне > разочаровывающие результаты (подозреваю, что длительным копанием в > настройках их можно было бы улучшить, но локальная поисковая машина --- > не то приложение, на изучение которого я готов тратить длительное > время). А эта штуковина за смешное время создала, по ощущениям, куда > более полный индекс, чем оба вышеупомянутых поисковых движка вместе > взятые --- по крайней мере, действительно _ищет_ в трёх гигабайтах > текстовых документов и полугигабайте почты, причём находит и такие вещи, > которые я найти совершенно не ожидал. > Тогда ещё выскажите субективное мнение о tracker, пожалуйста. -- Alexey Shabalin ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-11-28 10:00 ` Alexey Shabalin @ 2007-11-28 10:19 ` Alex Karpov 2007-11-28 19:14 ` Yuriy Shirokov 1 sibling, 0 replies; 12+ messages in thread From: Alex Karpov @ 2007-11-28 10:19 UTC (permalink / raw) To: shaba, ALT Linux Sisyphus discussions В сообщении от Wednesday 28 November 2007 15:00:14 Alexey Shabalin написал(а): > > Michael Shigorin пишет: > > >> recoll - Recoll is a personal full text search package > > > > > > Всячески рекомендую, "это можно давать детям" (c) > > > Использует xapian (как и gmane.org). > > > > Всячески присоединяюсь, и вам как мантейнеру большое спасибо! > > Экспериментировал до этого с Beagle и Google Desktop, получил вполне > > разочаровывающие результаты (подозреваю, что длительным копанием в > > настройках их можно было бы улучшить, но локальная поисковая машина --- > > не то приложение, на изучение которого я готов тратить длительное > > время). А эта штуковина за смешное время создала, по ощущениям, куда > > более полный индекс, чем оба вышеупомянутых поисковых движка вместе > > взятые --- по крайней мере, действительно _ищет_ в трёх гигабайтах > > текстовых документов и полугигабайте почты, причём находит и такие вещи, > > которые я найти совершенно не ожидал. > > Тогда ещё выскажите субективное мнение о tracker, пожалуйста. Не могу не присоединиться. ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-11-28 10:00 ` Alexey Shabalin 2007-11-28 10:19 ` Alex Karpov @ 2007-11-28 19:14 ` Yuriy Shirokov 1 sibling, 0 replies; 12+ messages in thread From: Yuriy Shirokov @ 2007-11-28 19:14 UTC (permalink / raw) To: shaba, ALT Linux Sisyphus discussions -----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Alexey Shabalin пишет: >>>> recoll - Recoll is a personal full text search package >>> Всячески рекомендую, "это можно давать детям" (c) >>> Использует xapian (как и gmane.org). >> Всячески присоединяюсь, и вам как мантейнеру большое спасибо! >> Экспериментировал до этого с Beagle и Google Desktop, получил вполне >> разочаровывающие результаты > Тогда ещё выскажите субективное мнение о tracker, пожалуйста. С tracker у меня знакомство ещё более шапочное, чем с Beagle и GD. Сходу добиться от него сколько-нибудь приемлемых результатов мне не удалось, а разбираться было, честно говоря, лень. Теги --- это, вообще-то, многообещающая идея (я в своё время даже пытался в своём домашнем каталоге сделать что-то вроде GMail'овских "виртуальных папок" с помощью симлинков, но упёрся в проблему поддержания актуальности этого безобразия), однако к ним бы хотелось ещё хоть сколько-нибудь адекватный собственно поиск. - -- С уважением, Ю.А.Широков. -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.7 (GNU/Linux) Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org iQCVAwUBR02+I+dMeS2DDLCcAQJNFwP+M2vTlA2wFBQfW+3EOFxKKT6F+/KuMxwf so0jPT5NfJx274m8IS91RwQMcV7bwMRIFtop6YIWTmKnna0/k0OAJlD/68aQY+4I 2T4b+S12S/g7o2KgzWimOyYU6O/Gefz1ioxDkDHgsbpweXO+LhtT+KaYKrWqUDTY osATsF9zWzI= =wjhs -----END PGP SIGNATURE----- ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-11-26 22:47 ` [sisyphus] I: recoll-1.10.0 Michael Shigorin 2007-11-27 19:41 ` Yuriy Shirokov @ 2007-11-30 12:45 ` Чернов Евгений 2007-11-30 13:18 ` Michael Shigorin 1 sibling, 1 reply; 12+ messages in thread From: Чернов Евгений @ 2007-11-30 12:45 UTC (permalink / raw) To: shigorin, ALT Linux Sisyphus discussions Michael Shigorin wrote: > On Tue, Nov 27, 2007 at 12:22:29AM +0300, QA Team Robot wrote: >> recoll - Recoll is a personal full text search package >> * Sun Nov 25 2007 Michael Shigorin <mike@altlinux> 1.10.0-alt1 >> - 1.10.0: Пересобрал его под свой компьютер(сизиф примерно месячной+ давности). Нормально заставить работать не удалось(проиндексировалась только часть файлов), хотя вешь интересная. Баги не вешаю потому как весь софт уже не сизифовский может местные баги. Вобщем в моем хоуме лежал файлик обозванный по русски с именем примерно 100 символьным на нём индексация падала(если что - на xfs домашний каталог с koi8-r). Ради интереса оставил индексироваться почтовик от симанки. Писем в одном ящике под 200000, во втором под 100000. Ну и несколько ящиков по мелочи примерно по 1000 писем. Насколько я понял оно выдергивает все письма в файлы а потом индексирует. Падает с чем-то вроде key_ too long или term too long на каком-то письме. При удалении писем этих индексация пошла опять с начала ящика. Дождавшись через неизвестно сколько времени падения на другом письме с такой же ошибкой плюнул на всё это.Он вобще может запоминать в mbox письма которые уже проиндексировал и пропускать их? Или есть какой ключик при ошибках пропускать файлики дальше продолжать индексацию? Да и ещё ругается на pstotext, которого естественно в сизифе нет. Он в ps вобще ищет без этого pstotext? Я для себя его собрал, чтобы не видеть ругани. ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-11-30 12:45 ` Чернов Евгений @ 2007-11-30 13:18 ` Michael Shigorin 2007-11-30 13:27 ` Alexey Petrakov 2007-12-01 10:01 ` Чернов Евгений 0 siblings, 2 replies; 12+ messages in thread From: Michael Shigorin @ 2007-11-30 13:18 UTC (permalink / raw) To: ALT Linux Sisyphus discussions On Fri, Nov 30, 2007 at 04:45:08PM +0400, Чернов Евгений wrote: > >>recoll - Recoll is a personal full text search package > >>- 1.10.0: > Пересобрал его под свой компьютер(сизиф примерно месячной+ > давности). Нормально заставить работать не удалось > (проиндексировалась только часть файлов), хотя вешь интересная. А что _не_ проиндексировалось? Я исключаю из пакета хелпер для *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто метров несколько многовато для скромной искалки). Остальное вроде входит всё. Что не входит -- писать надо (дампилки в plaintext). > Баги не вешаю потому как весь софт уже не сизифовский может > местные баги. Тут критична только версия libxapian -- крэш-тест проводился дома на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1. > Вобщем в моем хоуме лежал файлик обозванный по русски с именем > примерно 100 символьным на нём индексация падала(если что - на > xfs домашний каталог с koi8-r). Мгм. Можете прислать _имя_? xfs с koi8-r найдётся ;) > Ради интереса оставил индексироваться почтовик от симанки. > Писем в одном ящике под 200000, во втором под 100000. Ну и > несколько ящиков по мелочи примерно по 1000 писем. Насколько я > понял оно выдергивает все письма в файлы а потом индексирует. Примерно. > Падает с чем-то вроде key_ too long или term too long на > каком-то письме. Просьба сохранять вывод и по возможности (если это рассылки или другая публичная информация) -- именно те данные, на которых падает. Тут хороший автор, можете и сами к нему сходить, но могу и я. > При удалении писем этих индексация пошла опять с начала ящика. Да. > Дождавшись через неизвестно сколько времени падения на другом > письме с такой же ошибкой плюнул на всё это.Он вобще может > запоминать в mbox письма которые уже проиндексировал и > пропускать их? Боюсь, нет -- mbox суть один файл, там гранулярность "уже видели" -- пофайловая. Но я подсовывал больше трёх гигабайт почты, ни разу индексатор не упал. Вот год или полтора назад падал со страшной силой даже на гигабайте или двух, но тогда и xapian был заметно другой. > Или есть какой ключик при ошибках пропускать файлики дальше > продолжать индексацию? Ммм... нет вроде, но мысль разумная, надо бы попросить. > Да и ещё ругается на pstotext, которого естественно в сизифе > нет. Он в ps вобще ищет без этого pstotext? Я для себя его > собрал, чтобы не видеть ругани. Ну так закиньте в сизиф? Если лень связываться -- бросайте src.rpm или .spec, соберу, но почти всегда лучше самому присматривать за тем, что интересно. Особенно если его ещё не было. Ergo: давайте попробуем сформировать чуть более конкретный багрепорт, в идеале с использованием текущей версии xapian (бишь взять из сизифа xapian, пересобрать, поставить, собрать с ним recoll, поставить, проверить -- если собираете в hasher, достаточно просто засунуть туда сперва xapian, потом recoll, собранное rpm -Uvh). -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-11-30 13:18 ` Michael Shigorin @ 2007-11-30 13:27 ` Alexey Petrakov 2007-12-01 10:01 ` Чернов Евгений 1 sibling, 0 replies; 12+ messages in thread From: Alexey Petrakov @ 2007-11-30 13:27 UTC (permalink / raw) To: shigorin, ALT Linux Sisyphus discussions On Fri, 30 Nov 2007 19:18:10 +0600, Michael Shigorin <mike@osdn.org.ua> wrote: > Я исключаю из пакета хелпер для > *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто > метров несколько многовато для скромной искалки). А может этот хелпер, вместе с зависимостями, просто отдельно завернуть? Для пользующихся lyx'ом, думаю, он будет очень приятен. >> Да и ещё ругается на pstotext, которого естественно в сизифе >> нет. Он в ps вобще ищет без этого pstotext? Я для себя его >> собрал, чтобы не видеть ругани. > Ну так закиньте в сизиф? В хелпере посвящённом постскрипту можно выбрать что использовать: pstotext или ps2ascii (который в сизифе и бранче есть). Я не тестил, т.к. нет поблизости постскрипт файлов с русскими буквами, но мне кажется, стоит попробовать. ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-11-30 13:18 ` Michael Shigorin 2007-11-30 13:27 ` Alexey Petrakov @ 2007-12-01 10:01 ` Чернов Евгений 2007-12-04 10:31 ` Michael Shigorin 1 sibling, 1 reply; 12+ messages in thread From: Чернов Евгений @ 2007-12-01 10:01 UTC (permalink / raw) To: shigorin, ALT Linux Sisyphus discussions [-- Attachment #1: Type: text/plain, Size: 5700 bytes --] Michael Shigorin wrote: > On Fri, Nov 30, 2007 at 04:45:08PM +0400, Чернов Евгений wrote: > А что _не_ проиндексировалось? Я исключаю из пакета хелпер для > *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто > метров несколько многовато для скромной искалки). Остальное > вроде входит всё. Что не входит -- писать надо (дампилки в > plaintext). Не индексируется естественно всё что осталось непросмотренное после "падения" recollindex. > >> Баги не вешаю потому как весь софт уже не сизифовский может >> местные баги. > > Тут критична только версия libxapian -- крэш-тест проводился дома > на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1. > Ну это пересобранное из сизифа для себя. $ rpm -qa|grep xapian libxapian-1.0.4-alt1 xapian-core-1.0.4-alt1 xapian-core-doc-1.0.4-alt1 libxapian-devel-1.0.4-alt1 $ rpm -qa|grep recoll recoll-1.10.0-alt1 >> Вобщем в моем хоуме лежал файлик обозванный по русски с именем >> примерно 100 символьным на нём индексация падала(если что - на >> xfs домашний каталог с koi8-r). > > Мгм. Можете прислать _имя_? xfs с koi8-r найдётся ;) Миш помоему ты ссылку кидал на эту статью http://samba.org.ua/articles/?section=1&articleid=26 - я её просто в firefox сохранил. Сейчас в отдельный каталог её сохранил и на него только натравил recollindex. Вот вывод с максимальным debug. $ recollindex :4:../rcldb/rcldb.cpp:613:Db::open: m_isopen 0 m_iswritable 0 :4:../rcldb/stoplist.cpp:22:StopList::StopList: file_to_string(/home/jin/.recoll/stoplist.txt) failed: file_to_string: open failed: ю :4:../rcldb/rcldb.cpp:639:Db::open: lastdocid: 374786 :4:../index/indexer.cpp:95:DbIndexer::index: Indexing /home/jin/tmp/test into /home/jin/.recoll/xapiandb :4:../internfile/internfile.cpp:109:FileInterner::FileInterner: [/home/jin/tmp/test] mime [(null)] preview 0 :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning MimeHandlerUnknown :4:../internfile/internfile.cpp:170:FileInterner::FileInterner: application/x-fsdirectory [/home/jin/tmp/test] :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath [] :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc is text/plain :4:../rcldb/rcldb.cpp:1154:Db::add: docid 374787 added [/home/jin/tmp/test , ] :4:../internfile/internfile.cpp:109:FileInterner::FileInterner: [/home/jin/tmp/test/Использование службы директорий LDAP для представления метаинформации в глобальных вычислительных системах (Using LDAP directory service for representation of metainformation in global computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] mime [(null)] preview 0 :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning MimeHandlerUnknown :4:../internfile/internfile.cpp:170:FileInterner::FileInterner: application/x-fsdirectory [/home/jin/tmp/test/Использование службы директорий LDAP для представления метаинформации в глобальных вычислительных системах (Using LDAP directory service for representation of metainformation in global computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath [] :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc is text/plain :2:../rcldb/rcldb.cpp:1159:Db::add: replace_document failed: Term too long (> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀ п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐ п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘ п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory service for representation of metainformation in global computing systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files :2:../rcldb/rcldb.cpp:1168:Db::add: add_document failed: Term too long (> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀ п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐ п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘ п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory service for representation of metainformation in global computing systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files :2:../index/indexer.cpp:120:DbIndexer::index: error while indexing /home/jin/tmp/test: :4:../rcldb/rcldb.cpp:693:Db::i_close(0): m_isopen 1 m_iswritable 1 :4:../rcldb/rcldb.cpp:701:Rcl::Db:close: xapian will close. May take some time :4:../rcldb/rcldb.cpp:705:Rcl::Db:close() xapian close done. :4:../rcldb/rcldb.cpp:577:Db::~Db: isopen 0 m_iswritable 0 :4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0 $ Естественно после этого больше ничего не проиндексируется дальше. >> Падает с чем-то вроде key_ too long или term too long на >> каком-то письме. > > Просьба сохранять вывод и по возможности (если это рассылки > или другая публичная информация) -- именно те данные, на которых > падает. Тут хороший автор, можете и сами к нему сходить, но могу > и я. Сегодня времени нет на это, слишком долго индексируется. В понедельник натравлю занаво и вывод пришлю. >> Да и ещё ругается на pstotext, которого естественно в сизифе >> нет. Он в ps вобще ищет без этого pstotext? Я для себя его >> собрал, чтобы не видеть ругани. > > Ну так закиньте в сизиф? Если лень связываться -- бросайте > src.rpm или .spec, соберу, но почти всегда лучше самому > присматривать за тем, что интересно. Особенно если его ещё > не было. Я просто не знаю надо этот pstotext ему или нет(может он что другое использует, а это так забытые куски кода). В консоли ругается а меня это немного напрягает. Вот и собрал 1.9. Там уже никаких обновлений с 2004 года. spec приложил - переделал из чужого как мог. Если что ещё пересобрать надо, то в понедельник могу продолжить с ним играться. [-- Attachment #2: pstotext.spec --] [-- Type: text/plain, Size: 1393 bytes --] # $Revision: 1.1 $, $Date: 2002/03/06 00:08:27 $ Summary: PostScript to text converter Summary(pl): Konwerter PostScriptu do czystego tekstu Name: pstotext Version: 1.9 Release: 1 License: Digital's paranoid but open-source license Group: Applications/Text Source0: ftp://mirror.cs.wisc.edu/pub/mirrors/ghost/contrib/%{name}-%{version}.tar.gz URL: http://www.research.digital.com/SRC/virtualpaper/pstotext.html Requires: ghostscript %description This utility reads in postscript files and outputs an ASCII rendering. While the rendering is not always accurate, it is often sufficient. %prep %setup -q -n %name-%version %build %{__make} CC="%{__cc}" %install rm -rf $RPM_BUILD_ROOT install -d $RPM_BUILD_ROOT{%_bindir,%_mandir/man1} install pstotext $RPM_BUILD_ROOT%_bindir/pstotext install pstotext.1 $RPM_BUILD_ROOT%_mandir/man1/pstotext.1 gzip -9nf pstotext.txt %files %defattr(644,root,root,755) %doc *.gz %attr(755,root,root) %_bindir/pstotext %_mandir/man1/pstotext.1* %clean rm -rf $RPM_BUILD_ROOT %changelog ##* Thu Nov 28 2007 1.9-alt1 ##- rebuild for alt ##* %{date} PLD Team <feedback@pld.org.pl> ##All persons listed below can be reached at <cvs_login>@pld.org.pl ##$Log: pstotext.spec,v $ ##Revision 1.1 2002/03/06 00:08:27 qboosh ##- new: spec based on old RH-contrib package, but uptated to 1.8g ## (unfortunately, there is no version information in Source URL) ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-12-01 10:01 ` Чернов Евгений @ 2007-12-04 10:31 ` Michael Shigorin 2007-12-05 4:28 ` Чернов Евгений 0 siblings, 1 reply; 12+ messages in thread From: Michael Shigorin @ 2007-12-04 10:31 UTC (permalink / raw) To: ALT Linux Sisyphus discussions On Sat, Dec 01, 2007 at 02:01:45PM +0400, Чернов Евгений wrote: > >А что _не_ проиндексировалось? Я исключаю из пакета хелпер для > >*.lyx (он тащил за собой lyx, который тащил tetex-core -- сто > >метров несколько многовато для скромной искалки). Остальное > >вроде входит всё. Что не входит -- писать надо (дампилки в > >plaintext). > Не индексируется естественно всё что осталось непросмотренное > после "падения" recollindex. А, я думал -- по типам. > >>Баги не вешаю потому как весь софт уже не сизифовский может > >>местные баги. > >Тут критична только версия libxapian -- крэш-тест проводился > >дома на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1. > Ну это пересобранное из сизифа для себя. > libxapian-1.0.4-alt1 > recoll-1.10.0-alt1 > > >>Вобщем в моем хоуме лежал файлик обозванный по русски с > >>именем примерно 100 символьным на нём индексация падала(если > >>что - на xfs домашний каталог с koi8-r). > >Мгм. Можете прислать _имя_? xfs с koi8-r найдётся ;) > Миш помоему ты ссылку кидал на эту статью > http://samba.org.ua/articles/?section=1&articleid=26 - я её > просто в firefox сохранил. Сейчас в отдельный каталог её > сохранил и на него только натравил recollindex. Вот вывод с > максимальным debug. > $ recollindex > > :4:../rcldb/rcldb.cpp:613:Db::open: m_isopen 0 m_iswritable 0 > :4:../rcldb/stoplist.cpp:22:StopList::StopList: > file_to_string(/home/jin/.recoll/stoplist.txt) failed: file_to_string: > open failed: ю > :4:../rcldb/rcldb.cpp:639:Db::open: lastdocid: 374786 > :4:../index/indexer.cpp:95:DbIndexer::index: Indexing /home/jin/tmp/test > into /home/jin/.recoll/xapiandb > :4:../internfile/internfile.cpp:109:FileInterner::FileInterner: > [/home/jin/tmp/test] mime [(null)] preview 0 > :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning > MimeHandlerUnknown > :4:../internfile/internfile.cpp:170:FileInterner::FileInterner: > application/x-fsdirectory [/home/jin/tmp/test] > :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath [] > :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc > is text/plain > :4:../rcldb/rcldb.cpp:1154:Db::add: docid 374787 added > [/home/jin/tmp/test , ] > :4:../internfile/internfile.cpp:109:FileInterner::FileInterner: > [/home/jin/tmp/test/Использование службы директорий LDAP для > представления метаинформации в глобальных вычислительных системах (Using > LDAP directory service for representation of metainformation in global > computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] mime > [(null)] preview 0 > :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning > MimeHandlerUnknown > :4:../internfile/internfile.cpp:170:FileInterner::FileInterner: > application/x-fsdirectory [/home/jin/tmp/test/Использование службы > директорий LDAP для представления метаинформации в глобальных > вычислительных системах (Using LDAP directory service for representation > of metainformation in global computing systems) - Samba & LDAP - Статьи > - samba.org.ua_files] > :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath [] > :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc > is text/plain > :2:../rcldb/rcldb.cpp:1159:Db::add: replace_document failed: Term too > long (> 245): XSFNп╦я│п©п╬п╩я▄п?п╬п╡п╟п?п╦п╣ я│п╩я┐п?п╠я▀ > п?п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п?п╩я▐ п©я─п╣п?я│я┌п╟п╡п╩п╣п?п╦я▐ > п╪п╣я┌п╟п╦п?я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п?я▀я┘ > п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п?я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory > service for representation of metainformation in global computing > systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files > :2:../rcldb/rcldb.cpp:1168:Db::add: add_document failed: Term too long > (> 245): XSFNп╦я│п©п╬п╩я▄п?п╬п╡п╟п?п╦п╣ я│п╩я┐п?п╠я▀ > п?п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п?п╩я▐ п©я─п╣п?я│я┌п╟п╡п╩п╣п?п╦я▐ > п╪п╣я┌п╟п╦п?я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п?я▀я┘ > п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п?я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory > service for representation of metainformation in global computing > systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files > :2:../index/indexer.cpp:120:DbIndexer::index: error while indexing > /home/jin/tmp/test: > :4:../rcldb/rcldb.cpp:693:Db::i_close(0): m_isopen 1 m_iswritable 1 > :4:../rcldb/rcldb.cpp:701:Rcl::Db:close: xapian will close. May take > some time > :4:../rcldb/rcldb.cpp:705:Rcl::Db:close() xapian close done. > :4:../rcldb/rcldb.cpp:577:Db::~Db: isopen 0 m_iswritable 0 > :4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0 > $ > Естественно после этого больше ничего не проиндексируется дальше. Оно на этом именно вывалилось или встало в задумчивости? > >>Падает с чем-то вроде key_ too long или term too long на > >>каком-то письме. > >Просьба сохранять вывод и по возможности (если это рассылки > >или другая публичная информация) -- именно те данные, на > >которых падает. Тут хороший автор, можете и сами к нему > >сходить, но могу и я. > Сегодня времени нет на это, слишком долго индексируется. > В понедельник натравлю занаво и вывод пришлю. tnx > >>Да и ещё ругается на pstotext, которого естественно в сизифе > >>нет. Он в ps вобще ищет без этого pstotext? Я для себя его > >>собрал, чтобы не видеть ругани. > >Ну так закиньте в сизиф? Если лень связываться -- бросайте > >src.rpm или .spec, соберу, но почти всегда лучше самому > >присматривать за тем, что интересно. Особенно если его ещё > >не было. > Я просто не знаю надо этот pstotext ему или нет(может он что > другое использует, а это так забытые куски кода). В консоли > ругается а меня это немного напрягает. Вот и собрал 1.9. Там > уже никаких обновлений с 2004 года. spec приложил - переделал > из чужого как мог. Если что ещё пересобрать надо, то в > понедельник могу продолжить с ним играться. Тоже бы неплохо, мне сейчас хватает работы по ALTSP... -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-12-04 10:31 ` Michael Shigorin @ 2007-12-05 4:28 ` Чернов Евгений 2007-12-05 8:43 ` Michael Shigorin 0 siblings, 1 reply; 12+ messages in thread From: Чернов Евгений @ 2007-12-05 4:28 UTC (permalink / raw) To: shigorin, ALT Linux Sisyphus discussions Michael Shigorin wrote: <кусь> >> :4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0 >> $ ^^^^^^ >> Естественно после этого больше ничего не проиндексируется дальше. > > Оно на этом именно вывалилось или встало в задумчивости? Ну я же значок доллара в конце оставил:) В консольку вываливается. >>>> Падает с чем-то вроде key_ too long или term too long на >>>> каком-то письме. >>> Просьба сохранять вывод и по возможности (если это рассылки >>> или другая публичная информация) -- именно те данные, на >>> которых падает. Тут хороший автор, можете и сами к нему >>> сходить, но могу и я. >> Сегодня времени нет на это, слишком долго индексируется. >> В понедельник натравлю занаво и вывод пришлю. Да не получилось ничего. Те файлы я оказывается сразу удалил но seamonkey оставли открытую. А после закрытия seamonkey папки сжались и соотвественно на самом деле письмо удалилось из mbox. Но скорее всего там таже ошибка. Ещё один вопрос тут возник. Он когда текстовые файлы парсит в какой кодировке это делает? Или там автоопределение через что-нибудь типа enca? ^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0 2007-12-05 4:28 ` Чернов Евгений @ 2007-12-05 8:43 ` Michael Shigorin 0 siblings, 0 replies; 12+ messages in thread From: Michael Shigorin @ 2007-12-05 8:43 UTC (permalink / raw) To: ALT Linux Sisyphus discussions On Wed, Dec 05, 2007 at 08:28:32AM +0400, Чернов Евгений wrote: > >Оно на этом именно вывалилось или встало в задумчивости? > Ну я же значок доллара в конце оставил:) В консольку вываливается. Ааа :) Не заметил. [ну ой] > Ещё один вопрос тут возник. Он когда текстовые файлы парсит в > какой кодировке это делает? Или там автоопределение через > что-нибудь типа enca? См. defaultcharset в ~/.recoll/recoll.conf (e.g. KOI8-U// -- кажется, это в нотации recode(1)) или новопоявившийся диалог конфигурации индексера. Кстати, буду сильно признателен за помощь с переводом -- последние несколько версий не успеваю подновлять. -- ---- WBR, Michael Shigorin <mike@altlinux.ru> ------ Linux.Kiev http://www.linux.kiev.ua/ ^ permalink raw reply [flat|nested] 12+ messages in thread
end of thread, other threads:[~2007-12-05 8:43 UTC | newest] Thread overview: 12+ messages (download: mbox.gz / follow: Atom feed) -- links below jump to the message on this page -- 2007-11-26 22:47 ` [sisyphus] I: recoll-1.10.0 Michael Shigorin 2007-11-27 19:41 ` Yuriy Shirokov 2007-11-28 10:00 ` Alexey Shabalin 2007-11-28 10:19 ` Alex Karpov 2007-11-28 19:14 ` Yuriy Shirokov 2007-11-30 12:45 ` Чернов Евгений 2007-11-30 13:18 ` Michael Shigorin 2007-11-30 13:27 ` Alexey Petrakov 2007-12-01 10:01 ` Чернов Евгений 2007-12-04 10:31 ` Michael Shigorin 2007-12-05 4:28 ` Чернов Евгений 2007-12-05 8:43 ` Michael Shigorin
ALT Linux Sisyphus discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \ sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru public-inbox-index sisyphus Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.sisyphus AGPL code for this site: git clone https://public-inbox.org/public-inbox.git