* [sisyphus] I: recoll-1.10.0
@ 2007-11-26 22:47 ` Michael Shigorin
2007-11-27 19:41 ` Yuriy Shirokov
2007-11-30 12:45 ` Чернов Евгений
0 siblings, 2 replies; 12+ messages in thread
From: Michael Shigorin @ 2007-11-26 22:47 UTC (permalink / raw)
To: sisyphus
On Tue, Nov 27, 2007 at 12:22:29AM +0300, QA Team Robot wrote:
> recoll - Recoll is a personal full text search package
> * Sun Nov 25 2007 Michael Shigorin <mike@altlinux> 1.10.0-alt1
> - 1.10.0:
> + configuration GUI for the indexing parameters
> + support for CJK texts
> + new filters for image and TeX formats
> + kicker applet
> * Wed Sep 12 2007 Michael Shigorin <mike@altlinux> 1.9.0-alt1
Всячески рекомендую, "это можно давать детям" (c)
У меня нормально проиндексировало примерно четыре гигабайта почты
и документов, в т.ч. сжатых; mbox'ы очень удобно показывает по
письму с подсветкой найденного, по окну с табами на поиск.
Использует xapian (как и gmane.org).
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-11-26 22:47 ` [sisyphus] I: recoll-1.10.0 Michael Shigorin
@ 2007-11-27 19:41 ` Yuriy Shirokov
2007-11-28 10:00 ` Alexey Shabalin
2007-11-30 12:45 ` Чернов Евгений
1 sibling, 1 reply; 12+ messages in thread
From: Yuriy Shirokov @ 2007-11-27 19:41 UTC (permalink / raw)
To: shigorin, ALT Linux Sisyphus discussions
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Michael Shigorin пишет:
>> recoll - Recoll is a personal full text search package
> Всячески рекомендую, "это можно давать детям" (c)
> Использует xapian (как и gmane.org).
Всячески присоединяюсь, и вам как мантейнеру большое спасибо!
Экспериментировал до этого с Beagle и Google Desktop, получил вполне
разочаровывающие результаты (подозреваю, что длительным копанием в
настройках их можно было бы улучшить, но локальная поисковая машина ---
не то приложение, на изучение которого я готов тратить длительное
время). А эта штуковина за смешное время создала, по ощущениям, куда
более полный индекс, чем оба вышеупомянутых поисковых движка вместе
взятые --- по крайней мере, действительно _ищет_ в трёх гигабайтах
текстовых документов и полугигабайте почты, причём находит и такие вещи,
которые я найти совершенно не ожидал.
- --
С уважением,
Ю.А.Широков.
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.7 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org
iQCVAwUBR0xy5OdMeS2DDLCcAQK7dAQAlHjSdlBR75q/ygFNSauk5+xTJnk/5xkM
QR7AlsV6hzMzJGD3CKNebyDtGr3ZBpgWx5c/EKCg9N4PJEYmPgxznHUnbtcvMu1u
22MckmKqmkOss2qpy6CLhOQkcgj1GeQpr3LfaaG83pWyKpxLxOi/Vqll0ZUxPGqI
V064HtlHIow=
=rGz5
-----END PGP SIGNATURE-----
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-11-27 19:41 ` Yuriy Shirokov
@ 2007-11-28 10:00 ` Alexey Shabalin
2007-11-28 10:19 ` Alex Karpov
2007-11-28 19:14 ` Yuriy Shirokov
0 siblings, 2 replies; 12+ messages in thread
From: Alexey Shabalin @ 2007-11-28 10:00 UTC (permalink / raw)
To: ALT Linux Sisyphus discussions
> Michael Shigorin пишет:
> >> recoll - Recoll is a personal full text search package
> > Всячески рекомендую, "это можно давать детям" (c)
> > Использует xapian (как и gmane.org).
>
> Всячески присоединяюсь, и вам как мантейнеру большое спасибо!
> Экспериментировал до этого с Beagle и Google Desktop, получил вполне
> разочаровывающие результаты (подозреваю, что длительным копанием в
> настройках их можно было бы улучшить, но локальная поисковая машина ---
> не то приложение, на изучение которого я готов тратить длительное
> время). А эта штуковина за смешное время создала, по ощущениям, куда
> более полный индекс, чем оба вышеупомянутых поисковых движка вместе
> взятые --- по крайней мере, действительно _ищет_ в трёх гигабайтах
> текстовых документов и полугигабайте почты, причём находит и такие вещи,
> которые я найти совершенно не ожидал.
>
Тогда ещё выскажите субективное мнение о tracker, пожалуйста.
--
Alexey Shabalin
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-11-28 10:00 ` Alexey Shabalin
@ 2007-11-28 10:19 ` Alex Karpov
2007-11-28 19:14 ` Yuriy Shirokov
1 sibling, 0 replies; 12+ messages in thread
From: Alex Karpov @ 2007-11-28 10:19 UTC (permalink / raw)
To: shaba, ALT Linux Sisyphus discussions
В сообщении от Wednesday 28 November 2007 15:00:14 Alexey Shabalin написал(а):
> > Michael Shigorin пишет:
> > >> recoll - Recoll is a personal full text search package
> > >
> > > Всячески рекомендую, "это можно давать детям" (c)
> > > Использует xapian (как и gmane.org).
> >
> > Всячески присоединяюсь, и вам как мантейнеру большое спасибо!
> > Экспериментировал до этого с Beagle и Google Desktop, получил вполне
> > разочаровывающие результаты (подозреваю, что длительным копанием в
> > настройках их можно было бы улучшить, но локальная поисковая машина ---
> > не то приложение, на изучение которого я готов тратить длительное
> > время). А эта штуковина за смешное время создала, по ощущениям, куда
> > более полный индекс, чем оба вышеупомянутых поисковых движка вместе
> > взятые --- по крайней мере, действительно _ищет_ в трёх гигабайтах
> > текстовых документов и полугигабайте почты, причём находит и такие вещи,
> > которые я найти совершенно не ожидал.
>
> Тогда ещё выскажите субективное мнение о tracker, пожалуйста.
Не могу не присоединиться.
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-11-28 10:00 ` Alexey Shabalin
2007-11-28 10:19 ` Alex Karpov
@ 2007-11-28 19:14 ` Yuriy Shirokov
1 sibling, 0 replies; 12+ messages in thread
From: Yuriy Shirokov @ 2007-11-28 19:14 UTC (permalink / raw)
To: shaba, ALT Linux Sisyphus discussions
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Alexey Shabalin пишет:
>>>> recoll - Recoll is a personal full text search package
>>> Всячески рекомендую, "это можно давать детям" (c)
>>> Использует xapian (как и gmane.org).
>> Всячески присоединяюсь, и вам как мантейнеру большое спасибо!
>> Экспериментировал до этого с Beagle и Google Desktop, получил вполне
>> разочаровывающие результаты
> Тогда ещё выскажите субективное мнение о tracker, пожалуйста.
С tracker у меня знакомство ещё более шапочное, чем с Beagle и GD. Сходу
добиться от него сколько-нибудь приемлемых результатов мне не удалось, а
разбираться было, честно говоря, лень. Теги --- это, вообще-то,
многообещающая идея (я в своё время даже пытался в своём домашнем
каталоге сделать что-то вроде GMail'овских "виртуальных папок" с помощью
симлинков, но упёрся в проблему поддержания актуальности этого
безобразия), однако к ним бы хотелось ещё хоть сколько-нибудь адекватный
собственно поиск.
- --
С уважением,
Ю.А.Широков.
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.7 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org
iQCVAwUBR02+I+dMeS2DDLCcAQJNFwP+M2vTlA2wFBQfW+3EOFxKKT6F+/KuMxwf
so0jPT5NfJx274m8IS91RwQMcV7bwMRIFtop6YIWTmKnna0/k0OAJlD/68aQY+4I
2T4b+S12S/g7o2KgzWimOyYU6O/Gefz1ioxDkDHgsbpweXO+LhtT+KaYKrWqUDTY
osATsF9zWzI=
=wjhs
-----END PGP SIGNATURE-----
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-11-26 22:47 ` [sisyphus] I: recoll-1.10.0 Michael Shigorin
2007-11-27 19:41 ` Yuriy Shirokov
@ 2007-11-30 12:45 ` Чернов Евгений
2007-11-30 13:18 ` Michael Shigorin
1 sibling, 1 reply; 12+ messages in thread
From: Чернов Евгений @ 2007-11-30 12:45 UTC (permalink / raw)
To: shigorin, ALT Linux Sisyphus discussions
Michael Shigorin wrote:
> On Tue, Nov 27, 2007 at 12:22:29AM +0300, QA Team Robot wrote:
>> recoll - Recoll is a personal full text search package
>> * Sun Nov 25 2007 Michael Shigorin <mike@altlinux> 1.10.0-alt1
>> - 1.10.0:
Пересобрал его под свой компьютер(сизиф примерно месячной+ давности).
Нормально заставить работать не удалось(проиндексировалась только часть
файлов), хотя вешь интересная. Баги не вешаю потому как весь софт уже не
сизифовский может местные баги. Вобщем в моем хоуме лежал файлик
обозванный по русски с именем примерно 100 символьным на нём индексация
падала(если что - на xfs домашний каталог с koi8-r). Ради интереса
оставил индексироваться почтовик от симанки. Писем в одном ящике под
200000, во втором под 100000. Ну и несколько ящиков по мелочи примерно
по 1000 писем. Насколько я понял оно выдергивает все письма в файлы а
потом индексирует. Падает с чем-то вроде key_ too long или term too long
на каком-то письме. При удалении писем этих индексация пошла опять с
начала ящика. Дождавшись через неизвестно сколько времени падения на
другом письме с такой же ошибкой плюнул на всё это.Он вобще может
запоминать в mbox письма которые уже проиндексировал и пропускать их?
Или есть какой ключик при ошибках пропускать файлики дальше продолжать
индексацию? Да и ещё ругается на pstotext, которого естественно в сизифе
нет. Он в ps вобще ищет без этого pstotext? Я для себя его собрал, чтобы
не видеть ругани.
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-11-30 12:45 ` Чернов Евгений
@ 2007-11-30 13:18 ` Michael Shigorin
2007-11-30 13:27 ` Alexey Petrakov
2007-12-01 10:01 ` Чернов Евгений
0 siblings, 2 replies; 12+ messages in thread
From: Michael Shigorin @ 2007-11-30 13:18 UTC (permalink / raw)
To: ALT Linux Sisyphus discussions
On Fri, Nov 30, 2007 at 04:45:08PM +0400, Чернов Евгений wrote:
> >>recoll - Recoll is a personal full text search package
> >>- 1.10.0:
> Пересобрал его под свой компьютер(сизиф примерно месячной+
> давности). Нормально заставить работать не удалось
> (проиндексировалась только часть файлов), хотя вешь интересная.
А что _не_ проиндексировалось? Я исключаю из пакета хелпер для
*.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
метров несколько многовато для скромной искалки). Остальное
вроде входит всё. Что не входит -- писать надо (дампилки в
plaintext).
> Баги не вешаю потому как весь софт уже не сизифовский может
> местные баги.
Тут критична только версия libxapian -- крэш-тест проводился дома
на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1.
> Вобщем в моем хоуме лежал файлик обозванный по русски с именем
> примерно 100 символьным на нём индексация падала(если что - на
> xfs домашний каталог с koi8-r).
Мгм. Можете прислать _имя_? xfs с koi8-r найдётся ;)
> Ради интереса оставил индексироваться почтовик от симанки.
> Писем в одном ящике под 200000, во втором под 100000. Ну и
> несколько ящиков по мелочи примерно по 1000 писем. Насколько я
> понял оно выдергивает все письма в файлы а потом индексирует.
Примерно.
> Падает с чем-то вроде key_ too long или term too long на
> каком-то письме.
Просьба сохранять вывод и по возможности (если это рассылки
или другая публичная информация) -- именно те данные, на которых
падает. Тут хороший автор, можете и сами к нему сходить, но могу
и я.
> При удалении писем этих индексация пошла опять с начала ящика.
Да.
> Дождавшись через неизвестно сколько времени падения на другом
> письме с такой же ошибкой плюнул на всё это.Он вобще может
> запоминать в mbox письма которые уже проиндексировал и
> пропускать их?
Боюсь, нет -- mbox суть один файл, там гранулярность "уже видели"
-- пофайловая.
Но я подсовывал больше трёх гигабайт почты, ни разу индексатор
не упал. Вот год или полтора назад падал со страшной силой даже
на гигабайте или двух, но тогда и xapian был заметно другой.
> Или есть какой ключик при ошибках пропускать файлики дальше
> продолжать индексацию?
Ммм... нет вроде, но мысль разумная, надо бы попросить.
> Да и ещё ругается на pstotext, которого естественно в сизифе
> нет. Он в ps вобще ищет без этого pstotext? Я для себя его
> собрал, чтобы не видеть ругани.
Ну так закиньте в сизиф? Если лень связываться -- бросайте
src.rpm или .spec, соберу, но почти всегда лучше самому
присматривать за тем, что интересно. Особенно если его ещё
не было.
Ergo: давайте попробуем сформировать чуть более конкретный
багрепорт, в идеале с использованием текущей версии xapian
(бишь взять из сизифа xapian, пересобрать, поставить, собрать
с ним recoll, поставить, проверить -- если собираете в hasher,
достаточно просто засунуть туда сперва xapian, потом recoll,
собранное rpm -Uvh).
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-11-30 13:18 ` Michael Shigorin
@ 2007-11-30 13:27 ` Alexey Petrakov
2007-12-01 10:01 ` Чернов Евгений
1 sibling, 0 replies; 12+ messages in thread
From: Alexey Petrakov @ 2007-11-30 13:27 UTC (permalink / raw)
To: shigorin, ALT Linux Sisyphus discussions
On Fri, 30 Nov 2007 19:18:10 +0600, Michael Shigorin <mike@osdn.org.ua>
wrote:
> Я исключаю из пакета хелпер для
> *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
> метров несколько многовато для скромной искалки).
А может этот хелпер, вместе с зависимостями, просто отдельно завернуть?
Для пользующихся lyx'ом, думаю, он будет очень приятен.
>> Да и ещё ругается на pstotext, которого естественно в сизифе
>> нет. Он в ps вобще ищет без этого pstotext? Я для себя его
>> собрал, чтобы не видеть ругани.
> Ну так закиньте в сизиф?
В хелпере посвящённом постскрипту можно выбрать что использовать: pstotext
или ps2ascii (который в сизифе и бранче есть). Я не тестил, т.к. нет
поблизости постскрипт файлов с русскими буквами, но мне кажется, стоит
попробовать.
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-11-30 13:18 ` Michael Shigorin
2007-11-30 13:27 ` Alexey Petrakov
@ 2007-12-01 10:01 ` Чернов Евгений
2007-12-04 10:31 ` Michael Shigorin
1 sibling, 1 reply; 12+ messages in thread
From: Чернов Евгений @ 2007-12-01 10:01 UTC (permalink / raw)
To: shigorin, ALT Linux Sisyphus discussions
[-- Attachment #1: Type: text/plain, Size: 5700 bytes --]
Michael Shigorin wrote:
> On Fri, Nov 30, 2007 at 04:45:08PM +0400, Чернов Евгений wrote:
> А что _не_ проиндексировалось? Я исключаю из пакета хелпер для
> *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
> метров несколько многовато для скромной искалки). Остальное
> вроде входит всё. Что не входит -- писать надо (дампилки в
> plaintext).
Не индексируется естественно всё что осталось непросмотренное после
"падения" recollindex.
>
>> Баги не вешаю потому как весь софт уже не сизифовский может
>> местные баги.
>
> Тут критична только версия libxapian -- крэш-тест проводился дома
> на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1.
>
Ну это пересобранное из сизифа для себя.
$ rpm -qa|grep xapian
libxapian-1.0.4-alt1
xapian-core-1.0.4-alt1
xapian-core-doc-1.0.4-alt1
libxapian-devel-1.0.4-alt1
$ rpm -qa|grep recoll
recoll-1.10.0-alt1
>> Вобщем в моем хоуме лежал файлик обозванный по русски с именем
>> примерно 100 символьным на нём индексация падала(если что - на
>> xfs домашний каталог с koi8-r).
>
> Мгм. Можете прислать _имя_? xfs с koi8-r найдётся ;)
Миш помоему ты ссылку кидал на эту статью
http://samba.org.ua/articles/?section=1&articleid=26 - я её просто в
firefox сохранил. Сейчас в отдельный каталог её сохранил и на него
только натравил recollindex. Вот вывод с максимальным debug.
$ recollindex
:4:../rcldb/rcldb.cpp:613:Db::open: m_isopen 0 m_iswritable 0
:4:../rcldb/stoplist.cpp:22:StopList::StopList:
file_to_string(/home/jin/.recoll/stoplist.txt) failed: file_to_string:
open failed: ю
:4:../rcldb/rcldb.cpp:639:Db::open: lastdocid: 374786
:4:../index/indexer.cpp:95:DbIndexer::index: Indexing /home/jin/tmp/test
into /home/jin/.recoll/xapiandb
:4:../internfile/internfile.cpp:109:FileInterner::FileInterner:
[/home/jin/tmp/test] mime [(null)] preview 0
:4:../internfile/mimehandler.cpp:102:getMimeHandler: returning
MimeHandlerUnknown
:4:../internfile/internfile.cpp:170:FileInterner::FileInterner:
application/x-fsdirectory [/home/jin/tmp/test]
:4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
:4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc
is text/plain
:4:../rcldb/rcldb.cpp:1154:Db::add: docid 374787 added
[/home/jin/tmp/test , ]
:4:../internfile/internfile.cpp:109:FileInterner::FileInterner:
[/home/jin/tmp/test/Использование службы директорий LDAP для
представления метаинформации в глобальных вычислительных системах (Using
LDAP directory service for representation of metainformation in global
computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] mime
[(null)] preview 0
:4:../internfile/mimehandler.cpp:102:getMimeHandler: returning
MimeHandlerUnknown
:4:../internfile/internfile.cpp:170:FileInterner::FileInterner:
application/x-fsdirectory [/home/jin/tmp/test/Использование службы
директорий LDAP для представления метаинформации в глобальных
вычислительных системах (Using LDAP directory service for representation
of metainformation in global computing systems) - Samba & LDAP - Статьи
- samba.org.ua_files]
:4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
:4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc
is text/plain
:2:../rcldb/rcldb.cpp:1159:Db::add: replace_document failed: Term too
long (> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀
п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐
п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘
п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory
service for representation of metainformation in global computing
systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
:2:../rcldb/rcldb.cpp:1168:Db::add: add_document failed: Term too long
(> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀
п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐
п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘
п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory
service for representation of metainformation in global computing
systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
:2:../index/indexer.cpp:120:DbIndexer::index: error while indexing
/home/jin/tmp/test:
:4:../rcldb/rcldb.cpp:693:Db::i_close(0): m_isopen 1 m_iswritable 1
:4:../rcldb/rcldb.cpp:701:Rcl::Db:close: xapian will close. May take
some time
:4:../rcldb/rcldb.cpp:705:Rcl::Db:close() xapian close done.
:4:../rcldb/rcldb.cpp:577:Db::~Db: isopen 0 m_iswritable 0
:4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0
$
Естественно после этого больше ничего не проиндексируется дальше.
>> Падает с чем-то вроде key_ too long или term too long на
>> каком-то письме.
>
> Просьба сохранять вывод и по возможности (если это рассылки
> или другая публичная информация) -- именно те данные, на которых
> падает. Тут хороший автор, можете и сами к нему сходить, но могу
> и я.
Сегодня времени нет на это, слишком долго индексируется. В понедельник
натравлю занаво и вывод пришлю.
>> Да и ещё ругается на pstotext, которого естественно в сизифе
>> нет. Он в ps вобще ищет без этого pstotext? Я для себя его
>> собрал, чтобы не видеть ругани.
>
> Ну так закиньте в сизиф? Если лень связываться -- бросайте
> src.rpm или .spec, соберу, но почти всегда лучше самому
> присматривать за тем, что интересно. Особенно если его ещё
> не было.
Я просто не знаю надо этот pstotext ему или нет(может он что другое
использует, а это так забытые куски кода). В консоли ругается а меня это
немного напрягает. Вот и собрал 1.9. Там уже никаких обновлений с 2004
года. spec приложил - переделал из чужого как мог.
Если что ещё пересобрать надо, то в понедельник могу продолжить с ним
играться.
[-- Attachment #2: pstotext.spec --]
[-- Type: text/plain, Size: 1393 bytes --]
# $Revision: 1.1 $, $Date: 2002/03/06 00:08:27 $
Summary: PostScript to text converter
Summary(pl): Konwerter PostScriptu do czystego tekstu
Name: pstotext
Version: 1.9
Release: 1
License: Digital's paranoid but open-source license
Group: Applications/Text
Source0: ftp://mirror.cs.wisc.edu/pub/mirrors/ghost/contrib/%{name}-%{version}.tar.gz
URL: http://www.research.digital.com/SRC/virtualpaper/pstotext.html
Requires: ghostscript
%description
This utility reads in postscript files and outputs an ASCII rendering.
While the rendering is not always accurate, it is often sufficient.
%prep
%setup -q -n %name-%version
%build
%{__make} CC="%{__cc}"
%install
rm -rf $RPM_BUILD_ROOT
install -d $RPM_BUILD_ROOT{%_bindir,%_mandir/man1}
install pstotext $RPM_BUILD_ROOT%_bindir/pstotext
install pstotext.1 $RPM_BUILD_ROOT%_mandir/man1/pstotext.1
gzip -9nf pstotext.txt
%files
%defattr(644,root,root,755)
%doc *.gz
%attr(755,root,root) %_bindir/pstotext
%_mandir/man1/pstotext.1*
%clean
rm -rf $RPM_BUILD_ROOT
%changelog
##* Thu Nov 28 2007 1.9-alt1
##- rebuild for alt
##* %{date} PLD Team <feedback@pld.org.pl>
##All persons listed below can be reached at <cvs_login>@pld.org.pl
##$Log: pstotext.spec,v $
##Revision 1.1 2002/03/06 00:08:27 qboosh
##- new: spec based on old RH-contrib package, but uptated to 1.8g
## (unfortunately, there is no version information in Source URL)
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-12-01 10:01 ` Чернов Евгений
@ 2007-12-04 10:31 ` Michael Shigorin
2007-12-05 4:28 ` Чернов Евгений
0 siblings, 1 reply; 12+ messages in thread
From: Michael Shigorin @ 2007-12-04 10:31 UTC (permalink / raw)
To: ALT Linux Sisyphus discussions
On Sat, Dec 01, 2007 at 02:01:45PM +0400, Чернов Евгений wrote:
> >А что _не_ проиндексировалось? Я исключаю из пакета хелпер для
> >*.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
> >метров несколько многовато для скромной искалки). Остальное
> >вроде входит всё. Что не входит -- писать надо (дампилки в
> >plaintext).
> Не индексируется естественно всё что осталось непросмотренное
> после "падения" recollindex.
А, я думал -- по типам.
> >>Баги не вешаю потому как весь софт уже не сизифовский может
> >>местные баги.
> >Тут критична только версия libxapian -- крэш-тест проводился
> >дома на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1.
> Ну это пересобранное из сизифа для себя.
> libxapian-1.0.4-alt1
> recoll-1.10.0-alt1
>
> >>Вобщем в моем хоуме лежал файлик обозванный по русски с
> >>именем примерно 100 символьным на нём индексация падала(если
> >>что - на xfs домашний каталог с koi8-r).
> >Мгм. Можете прислать _имя_? xfs с koi8-r найдётся ;)
> Миш помоему ты ссылку кидал на эту статью
> http://samba.org.ua/articles/?section=1&articleid=26 - я её
> просто в firefox сохранил. Сейчас в отдельный каталог её
> сохранил и на него только натравил recollindex. Вот вывод с
> максимальным debug.
> $ recollindex
>
> :4:../rcldb/rcldb.cpp:613:Db::open: m_isopen 0 m_iswritable 0
> :4:../rcldb/stoplist.cpp:22:StopList::StopList:
> file_to_string(/home/jin/.recoll/stoplist.txt) failed: file_to_string:
> open failed: ю
> :4:../rcldb/rcldb.cpp:639:Db::open: lastdocid: 374786
> :4:../index/indexer.cpp:95:DbIndexer::index: Indexing /home/jin/tmp/test
> into /home/jin/.recoll/xapiandb
> :4:../internfile/internfile.cpp:109:FileInterner::FileInterner:
> [/home/jin/tmp/test] mime [(null)] preview 0
> :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning
> MimeHandlerUnknown
> :4:../internfile/internfile.cpp:170:FileInterner::FileInterner:
> application/x-fsdirectory [/home/jin/tmp/test]
> :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
> :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc
> is text/plain
> :4:../rcldb/rcldb.cpp:1154:Db::add: docid 374787 added
> [/home/jin/tmp/test , ]
> :4:../internfile/internfile.cpp:109:FileInterner::FileInterner:
> [/home/jin/tmp/test/Использование службы директорий LDAP для
> представления метаинформации в глобальных вычислительных системах (Using
> LDAP directory service for representation of metainformation in global
> computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] mime
> [(null)] preview 0
> :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning
> MimeHandlerUnknown
> :4:../internfile/internfile.cpp:170:FileInterner::FileInterner:
> application/x-fsdirectory [/home/jin/tmp/test/Использование службы
> директорий LDAP для представления метаинформации в глобальных
> вычислительных системах (Using LDAP directory service for representation
> of metainformation in global computing systems) - Samba & LDAP - Статьи
> - samba.org.ua_files]
> :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
> :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc
> is text/plain
> :2:../rcldb/rcldb.cpp:1159:Db::add: replace_document failed: Term too
> long (> 245): XSFNп╦я│п©п╬п╩я▄п?п╬п╡п╟п?п╦п╣ я│п╩я┐п?п╠я▀
> п?п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п?п╩я▐ п©я─п╣п?я│я┌п╟п╡п╩п╣п?п╦я▐
> п╪п╣я┌п╟п╦п?я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п?я▀я┘
> п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п?я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory
> service for representation of metainformation in global computing
> systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
> :2:../rcldb/rcldb.cpp:1168:Db::add: add_document failed: Term too long
> (> 245): XSFNп╦я│п©п╬п╩я▄п?п╬п╡п╟п?п╦п╣ я│п╩я┐п?п╠я▀
> п?п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п?п╩я▐ п©я─п╣п?я│я┌п╟п╡п╩п╣п?п╦я▐
> п╪п╣я┌п╟п╦п?я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п?я▀я┘
> п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п?я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory
> service for representation of metainformation in global computing
> systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
> :2:../index/indexer.cpp:120:DbIndexer::index: error while indexing
> /home/jin/tmp/test:
> :4:../rcldb/rcldb.cpp:693:Db::i_close(0): m_isopen 1 m_iswritable 1
> :4:../rcldb/rcldb.cpp:701:Rcl::Db:close: xapian will close. May take
> some time
> :4:../rcldb/rcldb.cpp:705:Rcl::Db:close() xapian close done.
> :4:../rcldb/rcldb.cpp:577:Db::~Db: isopen 0 m_iswritable 0
> :4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0
> $
> Естественно после этого больше ничего не проиндексируется дальше.
Оно на этом именно вывалилось или встало в задумчивости?
> >>Падает с чем-то вроде key_ too long или term too long на
> >>каком-то письме.
> >Просьба сохранять вывод и по возможности (если это рассылки
> >или другая публичная информация) -- именно те данные, на
> >которых падает. Тут хороший автор, можете и сами к нему
> >сходить, но могу и я.
> Сегодня времени нет на это, слишком долго индексируется.
> В понедельник натравлю занаво и вывод пришлю.
tnx
> >>Да и ещё ругается на pstotext, которого естественно в сизифе
> >>нет. Он в ps вобще ищет без этого pstotext? Я для себя его
> >>собрал, чтобы не видеть ругани.
> >Ну так закиньте в сизиф? Если лень связываться -- бросайте
> >src.rpm или .spec, соберу, но почти всегда лучше самому
> >присматривать за тем, что интересно. Особенно если его ещё
> >не было.
> Я просто не знаю надо этот pstotext ему или нет(может он что
> другое использует, а это так забытые куски кода). В консоли
> ругается а меня это немного напрягает. Вот и собрал 1.9. Там
> уже никаких обновлений с 2004 года. spec приложил - переделал
> из чужого как мог. Если что ещё пересобрать надо, то в
> понедельник могу продолжить с ним играться.
Тоже бы неплохо, мне сейчас хватает работы по ALTSP...
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-12-04 10:31 ` Michael Shigorin
@ 2007-12-05 4:28 ` Чернов Евгений
2007-12-05 8:43 ` Michael Shigorin
0 siblings, 1 reply; 12+ messages in thread
From: Чернов Евгений @ 2007-12-05 4:28 UTC (permalink / raw)
To: shigorin, ALT Linux Sisyphus discussions
Michael Shigorin wrote:
<кусь>
>> :4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0
>> $
^^^^^^
>> Естественно после этого больше ничего не проиндексируется дальше.
>
> Оно на этом именно вывалилось или встало в задумчивости?
Ну я же значок доллара в конце оставил:) В консольку вываливается.
>>>> Падает с чем-то вроде key_ too long или term too long на
>>>> каком-то письме.
>>> Просьба сохранять вывод и по возможности (если это рассылки
>>> или другая публичная информация) -- именно те данные, на
>>> которых падает. Тут хороший автор, можете и сами к нему
>>> сходить, но могу и я.
>> Сегодня времени нет на это, слишком долго индексируется.
>> В понедельник натравлю занаво и вывод пришлю.
Да не получилось ничего. Те файлы я оказывается сразу удалил но
seamonkey оставли открытую. А после закрытия seamonkey папки сжались и
соотвественно на самом деле письмо удалилось из mbox. Но скорее всего
там таже ошибка.
Ещё один вопрос тут возник. Он когда текстовые файлы парсит в какой
кодировке это делает? Или там автоопределение через что-нибудь типа enca?
^ permalink raw reply [flat|nested] 12+ messages in thread
* Re: [sisyphus] I: recoll-1.10.0
2007-12-05 4:28 ` Чернов Евгений
@ 2007-12-05 8:43 ` Michael Shigorin
0 siblings, 0 replies; 12+ messages in thread
From: Michael Shigorin @ 2007-12-05 8:43 UTC (permalink / raw)
To: ALT Linux Sisyphus discussions
On Wed, Dec 05, 2007 at 08:28:32AM +0400, Чернов Евгений wrote:
> >Оно на этом именно вывалилось или встало в задумчивости?
> Ну я же значок доллара в конце оставил:) В консольку вываливается.
Ааа :) Не заметил.
[ну ой]
> Ещё один вопрос тут возник. Он когда текстовые файлы парсит в
> какой кодировке это делает? Или там автоопределение через
> что-нибудь типа enca?
См. defaultcharset в ~/.recoll/recoll.conf (e.g. KOI8-U// --
кажется, это в нотации recode(1)) или новопоявившийся диалог
конфигурации индексера.
Кстати, буду сильно признателен за помощь с переводом --
последние несколько версий не успеваю подновлять.
--
---- WBR, Michael Shigorin <mike@altlinux.ru>
------ Linux.Kiev http://www.linux.kiev.ua/
^ permalink raw reply [flat|nested] 12+ messages in thread
end of thread, other threads:[~2007-12-05 8:43 UTC | newest]
Thread overview: 12+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2007-11-26 22:47 ` [sisyphus] I: recoll-1.10.0 Michael Shigorin
2007-11-27 19:41 ` Yuriy Shirokov
2007-11-28 10:00 ` Alexey Shabalin
2007-11-28 10:19 ` Alex Karpov
2007-11-28 19:14 ` Yuriy Shirokov
2007-11-30 12:45 ` Чернов Евгений
2007-11-30 13:18 ` Michael Shigorin
2007-11-30 13:27 ` Alexey Petrakov
2007-12-01 10:01 ` Чернов Евгений
2007-12-04 10:31 ` Michael Shigorin
2007-12-05 4:28 ` Чернов Евгений
2007-12-05 8:43 ` Michael Shigorin
ALT Linux Sisyphus discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \
sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru
public-inbox-index sisyphus
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.sisyphus
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git