From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Message-ID: <47513109.6000205@votgk.com> Date: Sat, 01 Dec 2007 14:01:45 +0400 From: =?KOI8-R?Q?=FE=C5=D2=CE=CF=D7_=E5=D7=C7=C5=CE=C9=CA?= User-Agent: Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070804 SeaMonkey/1.1.4 Mnenhy/0.7.4.0 MIME-Version: 1.0 To: shigorin@gmail.com, ALT Linux Sisyphus discussions References: <20071126212228.GA9774@hint1.office.altlinux.org> <20071126224725.GN9619@osdn.org.ua> <475005D4.6040607@votgk.com> <20071130131809.GY16028@osdn.org.ua> In-Reply-To: <20071130131809.GY16028@osdn.org.ua> Content-Type: multipart/mixed; boundary="------------010101000802050308040000" X-Virus-Scanned: ClamAV version 0.91.1, clamav-milter version 0.91.1 on relay.votgk.com X-Virus-Scanned: ClamAV version 0.91.1, clamav-milter version 0.91.1 on sp3.samen.elektra.ru X-Virus-Status: Clean Subject: Re: [sisyphus] I: recoll-1.10.0 X-BeenThere: sisyphus@lists.altlinux.org X-Mailman-Version: 2.1.9 Precedence: list Reply-To: ALT Linux Sisyphus discussions List-Id: ALT Linux Sisyphus discussions List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Sat, 01 Dec 2007 10:06:25 -0000 Archived-At: List-Archive: List-Post: This is a multi-part message in MIME format. --------------010101000802050308040000 Content-Type: text/plain; charset=KOI8-R; format=flowed Content-Transfer-Encoding: 8bit Michael Shigorin wrote: > On Fri, Nov 30, 2007 at 04:45:08PM +0400, Чернов Евгений wrote: > А что _не_ проиндексировалось? Я исключаю из пакета хелпер для > *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто > метров несколько многовато для скромной искалки). Остальное > вроде входит всё. Что не входит -- писать надо (дампилки в > plaintext). Не индексируется естественно всё что осталось непросмотренное после "падения" recollindex. > >> Баги не вешаю потому как весь софт уже не сизифовский может >> местные баги. > > Тут критична только версия libxapian -- крэш-тест проводился дома > на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1. > Ну это пересобранное из сизифа для себя. $ rpm -qa|grep xapian libxapian-1.0.4-alt1 xapian-core-1.0.4-alt1 xapian-core-doc-1.0.4-alt1 libxapian-devel-1.0.4-alt1 $ rpm -qa|grep recoll recoll-1.10.0-alt1 >> Вобщем в моем хоуме лежал файлик обозванный по русски с именем >> примерно 100 символьным на нём индексация падала(если что - на >> xfs домашний каталог с koi8-r). > > Мгм. Можете прислать _имя_? xfs с koi8-r найдётся ;) Миш помоему ты ссылку кидал на эту статью http://samba.org.ua/articles/?section=1&articleid=26 - я её просто в firefox сохранил. Сейчас в отдельный каталог её сохранил и на него только натравил recollindex. Вот вывод с максимальным debug. $ recollindex :4:../rcldb/rcldb.cpp:613:Db::open: m_isopen 0 m_iswritable 0 :4:../rcldb/stoplist.cpp:22:StopList::StopList: file_to_string(/home/jin/.recoll/stoplist.txt) failed: file_to_string: open failed: ю :4:../rcldb/rcldb.cpp:639:Db::open: lastdocid: 374786 :4:../index/indexer.cpp:95:DbIndexer::index: Indexing /home/jin/tmp/test into /home/jin/.recoll/xapiandb :4:../internfile/internfile.cpp:109:FileInterner::FileInterner: [/home/jin/tmp/test] mime [(null)] preview 0 :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning MimeHandlerUnknown :4:../internfile/internfile.cpp:170:FileInterner::FileInterner: application/x-fsdirectory [/home/jin/tmp/test] :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath [] :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc is text/plain :4:../rcldb/rcldb.cpp:1154:Db::add: docid 374787 added [/home/jin/tmp/test , ] :4:../internfile/internfile.cpp:109:FileInterner::FileInterner: [/home/jin/tmp/test/Использование службы директорий LDAP для представления метаинформации в глобальных вычислительных системах (Using LDAP directory service for representation of metainformation in global computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] mime [(null)] preview 0 :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning MimeHandlerUnknown :4:../internfile/internfile.cpp:170:FileInterner::FileInterner: application/x-fsdirectory [/home/jin/tmp/test/Использование службы директорий LDAP для представления метаинформации в глобальных вычислительных системах (Using LDAP directory service for representation of metainformation in global computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath [] :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc is text/plain :2:../rcldb/rcldb.cpp:1159:Db::add: replace_document failed: Term too long (> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀ п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐ п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘ п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory service for representation of metainformation in global computing systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files :2:../rcldb/rcldb.cpp:1168:Db::add: add_document failed: Term too long (> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀ п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐ п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘ п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory service for representation of metainformation in global computing systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files :2:../index/indexer.cpp:120:DbIndexer::index: error while indexing /home/jin/tmp/test: :4:../rcldb/rcldb.cpp:693:Db::i_close(0): m_isopen 1 m_iswritable 1 :4:../rcldb/rcldb.cpp:701:Rcl::Db:close: xapian will close. May take some time :4:../rcldb/rcldb.cpp:705:Rcl::Db:close() xapian close done. :4:../rcldb/rcldb.cpp:577:Db::~Db: isopen 0 m_iswritable 0 :4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0 $ Естественно после этого больше ничего не проиндексируется дальше. >> Падает с чем-то вроде key_ too long или term too long на >> каком-то письме. > > Просьба сохранять вывод и по возможности (если это рассылки > или другая публичная информация) -- именно те данные, на которых > падает. Тут хороший автор, можете и сами к нему сходить, но могу > и я. Сегодня времени нет на это, слишком долго индексируется. В понедельник натравлю занаво и вывод пришлю. >> Да и ещё ругается на pstotext, которого естественно в сизифе >> нет. Он в ps вобще ищет без этого pstotext? Я для себя его >> собрал, чтобы не видеть ругани. > > Ну так закиньте в сизиф? Если лень связываться -- бросайте > src.rpm или .spec, соберу, но почти всегда лучше самому > присматривать за тем, что интересно. Особенно если его ещё > не было. Я просто не знаю надо этот pstotext ему или нет(может он что другое использует, а это так забытые куски кода). В консоли ругается а меня это немного напрягает. Вот и собрал 1.9. Там уже никаких обновлений с 2004 года. spec приложил - переделал из чужого как мог. Если что ещё пересобрать надо, то в понедельник могу продолжить с ним играться. --------------010101000802050308040000 Content-Type: text/plain; name="pstotext.spec" Content-Transfer-Encoding: 7bit Content-Disposition: inline; filename="pstotext.spec" # $Revision: 1.1 $, $Date: 2002/03/06 00:08:27 $ Summary: PostScript to text converter Summary(pl): Konwerter PostScriptu do czystego tekstu Name: pstotext Version: 1.9 Release: 1 License: Digital's paranoid but open-source license Group: Applications/Text Source0: ftp://mirror.cs.wisc.edu/pub/mirrors/ghost/contrib/%{name}-%{version}.tar.gz URL: http://www.research.digital.com/SRC/virtualpaper/pstotext.html Requires: ghostscript %description This utility reads in postscript files and outputs an ASCII rendering. While the rendering is not always accurate, it is often sufficient. %prep %setup -q -n %name-%version %build %{__make} CC="%{__cc}" %install rm -rf $RPM_BUILD_ROOT install -d $RPM_BUILD_ROOT{%_bindir,%_mandir/man1} install pstotext $RPM_BUILD_ROOT%_bindir/pstotext install pstotext.1 $RPM_BUILD_ROOT%_mandir/man1/pstotext.1 gzip -9nf pstotext.txt %files %defattr(644,root,root,755) %doc *.gz %attr(755,root,root) %_bindir/pstotext %_mandir/man1/pstotext.1* %clean rm -rf $RPM_BUILD_ROOT %changelog ##* Thu Nov 28 2007 1.9-alt1 ##- rebuild for alt ##* %{date} PLD Team ##All persons listed below can be reached at @pld.org.pl ##$Log: pstotext.spec,v $ ##Revision 1.1 2002/03/06 00:08:27 qboosh ##- new: spec based on old RH-contrib package, but uptated to 1.8g ## (unfortunately, there is no version information in Source URL) --------------010101000802050308040000--