ALT Linux Sisyphus discussions
 help / color / mirror / Atom feed
* [sisyphus] I: recoll-1.10.0
  @ 2007-11-26 22:47 ` Michael Shigorin
  2007-11-27 19:41   ` Yuriy Shirokov
  2007-11-30 12:45   ` Чернов Евгений
  0 siblings, 2 replies; 12+ messages in thread
From: Michael Shigorin @ 2007-11-26 22:47 UTC (permalink / raw)
  To: sisyphus

On Tue, Nov 27, 2007 at 12:22:29AM +0300, QA Team Robot wrote:
> recoll - Recoll is a personal full text search package
> * Sun Nov 25 2007 Michael Shigorin <mike@altlinux> 1.10.0-alt1
> - 1.10.0:
>   + configuration GUI for the indexing parameters
>   + support for CJK texts
>   + new filters for image and TeX formats
>   + kicker applet
> * Wed Sep 12 2007 Michael Shigorin <mike@altlinux> 1.9.0-alt1

Всячески рекомендую, "это можно давать детям" (c)

У меня нормально проиндексировало примерно четыре гигабайта почты
и документов, в т.ч. сжатых; mbox'ы очень удобно показывает по
письму с подсветкой найденного, по окну с табами на поиск.

Использует xapian (как и gmane.org).

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-11-26 22:47 ` [sisyphus] I: recoll-1.10.0 Michael Shigorin
@ 2007-11-27 19:41   ` Yuriy Shirokov
  2007-11-28 10:00     ` Alexey Shabalin
  2007-11-30 12:45   ` Чернов Евгений
  1 sibling, 1 reply; 12+ messages in thread
From: Yuriy Shirokov @ 2007-11-27 19:41 UTC (permalink / raw)
  To: shigorin, ALT Linux Sisyphus discussions

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Michael Shigorin пишет:
>> recoll - Recoll is a personal full text search package
> Всячески рекомендую, "это можно давать детям" (c)
> Использует xapian (как и gmane.org).

Всячески присоединяюсь, и вам как мантейнеру большое спасибо!
Экспериментировал до этого с Beagle и Google Desktop, получил вполне
разочаровывающие результаты (подозреваю, что длительным копанием в
настройках их можно было бы улучшить, но локальная поисковая машина ---
не то приложение, на изучение которого я готов тратить длительное
время). А эта штуковина за смешное время создала, по ощущениям, куда
более полный индекс, чем оба вышеупомянутых поисковых движка вместе
взятые --- по крайней мере, действительно _ищет_ в трёх гигабайтах
текстовых документов и полугигабайте почты, причём находит и такие вещи,
которые я найти совершенно не ожидал.

- --
С уважением,
Ю.А.Широков.

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.7 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iQCVAwUBR0xy5OdMeS2DDLCcAQK7dAQAlHjSdlBR75q/ygFNSauk5+xTJnk/5xkM
QR7AlsV6hzMzJGD3CKNebyDtGr3ZBpgWx5c/EKCg9N4PJEYmPgxznHUnbtcvMu1u
22MckmKqmkOss2qpy6CLhOQkcgj1GeQpr3LfaaG83pWyKpxLxOi/Vqll0ZUxPGqI
V064HtlHIow=
=rGz5
-----END PGP SIGNATURE-----


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-11-27 19:41   ` Yuriy Shirokov
@ 2007-11-28 10:00     ` Alexey Shabalin
  2007-11-28 10:19       ` Alex Karpov
  2007-11-28 19:14       ` Yuriy Shirokov
  0 siblings, 2 replies; 12+ messages in thread
From: Alexey Shabalin @ 2007-11-28 10:00 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussions

> Michael Shigorin пишет:
> >> recoll - Recoll is a personal full text search package
> > Всячески рекомендую, "это можно давать детям" (c)
> > Использует xapian (как и gmane.org).
>
> Всячески присоединяюсь, и вам как мантейнеру большое спасибо!
> Экспериментировал до этого с Beagle и Google Desktop, получил вполне
> разочаровывающие результаты (подозреваю, что длительным копанием в
> настройках их можно было бы улучшить, но локальная поисковая машина ---
> не то приложение, на изучение которого я готов тратить длительное
> время). А эта штуковина за смешное время создала, по ощущениям, куда
> более полный индекс, чем оба вышеупомянутых поисковых движка вместе
> взятые --- по крайней мере, действительно _ищет_ в трёх гигабайтах
> текстовых документов и полугигабайте почты, причём находит и такие вещи,
> которые я найти совершенно не ожидал.
>
Тогда ещё выскажите субективное мнение о tracker, пожалуйста.

-- 
Alexey Shabalin

^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-11-28 10:00     ` Alexey Shabalin
@ 2007-11-28 10:19       ` Alex Karpov
  2007-11-28 19:14       ` Yuriy Shirokov
  1 sibling, 0 replies; 12+ messages in thread
From: Alex Karpov @ 2007-11-28 10:19 UTC (permalink / raw)
  To: shaba, ALT Linux Sisyphus discussions

В сообщении от Wednesday 28 November 2007 15:00:14 Alexey Shabalin написал(а):
> > Michael Shigorin пишет:
> > >> recoll - Recoll is a personal full text search package
> > >
> > > Всячески рекомендую, "это можно давать детям" (c)
> > > Использует xapian (как и gmane.org).
> >
> > Всячески присоединяюсь, и вам как мантейнеру большое спасибо!
> > Экспериментировал до этого с Beagle и Google Desktop, получил вполне
> > разочаровывающие результаты (подозреваю, что длительным копанием в
> > настройках их можно было бы улучшить, но локальная поисковая машина ---
> > не то приложение, на изучение которого я готов тратить длительное
> > время). А эта штуковина за смешное время создала, по ощущениям, куда
> > более полный индекс, чем оба вышеупомянутых поисковых движка вместе
> > взятые --- по крайней мере, действительно _ищет_ в трёх гигабайтах
> > текстовых документов и полугигабайте почты, причём находит и такие вещи,
> > которые я найти совершенно не ожидал.
>
> Тогда ещё выскажите субективное мнение о tracker, пожалуйста.

Не могу не присоединиться.

^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-11-28 10:00     ` Alexey Shabalin
  2007-11-28 10:19       ` Alex Karpov
@ 2007-11-28 19:14       ` Yuriy Shirokov
  1 sibling, 0 replies; 12+ messages in thread
From: Yuriy Shirokov @ 2007-11-28 19:14 UTC (permalink / raw)
  To: shaba, ALT Linux Sisyphus discussions

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Alexey Shabalin пишет:
>>>> recoll - Recoll is a personal full text search package
>>> Всячески рекомендую, "это можно давать детям" (c)
>>> Использует xapian (как и gmane.org).
>> Всячески присоединяюсь, и вам как мантейнеру большое спасибо!
>> Экспериментировал до этого с Beagle и Google Desktop, получил вполне
>> разочаровывающие результаты
> Тогда ещё выскажите субективное мнение о tracker, пожалуйста.

С tracker у меня знакомство ещё более шапочное, чем с Beagle и GD. Сходу
добиться от него сколько-нибудь приемлемых результатов мне не удалось, а
разбираться было, честно говоря, лень. Теги --- это, вообще-то,
многообещающая идея (я в своё время даже пытался в своём домашнем
каталоге сделать что-то вроде GMail'овских "виртуальных папок" с помощью
симлинков, но упёрся в проблему поддержания актуальности этого
безобразия), однако к ним бы хотелось ещё хоть сколько-нибудь адекватный
собственно поиск.

- --
С уважением,
Ю.А.Широков.

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.7 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iQCVAwUBR02+I+dMeS2DDLCcAQJNFwP+M2vTlA2wFBQfW+3EOFxKKT6F+/KuMxwf
so0jPT5NfJx274m8IS91RwQMcV7bwMRIFtop6YIWTmKnna0/k0OAJlD/68aQY+4I
2T4b+S12S/g7o2KgzWimOyYU6O/Gefz1ioxDkDHgsbpweXO+LhtT+KaYKrWqUDTY
osATsF9zWzI=
=wjhs
-----END PGP SIGNATURE-----


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-11-26 22:47 ` [sisyphus] I: recoll-1.10.0 Michael Shigorin
  2007-11-27 19:41   ` Yuriy Shirokov
@ 2007-11-30 12:45   ` Чернов Евгений
  2007-11-30 13:18     ` Michael Shigorin
  1 sibling, 1 reply; 12+ messages in thread
From: Чернов Евгений @ 2007-11-30 12:45 UTC (permalink / raw)
  To: shigorin, ALT Linux Sisyphus discussions

Michael Shigorin wrote:
> On Tue, Nov 27, 2007 at 12:22:29AM +0300, QA Team Robot wrote:
>> recoll - Recoll is a personal full text search package
>> * Sun Nov 25 2007 Michael Shigorin <mike@altlinux> 1.10.0-alt1
>> - 1.10.0:

Пересобрал его под свой компьютер(сизиф примерно месячной+ давности). 
Нормально заставить работать не удалось(проиндексировалась только часть 
файлов), хотя вешь интересная. Баги не вешаю потому как весь софт уже не 
сизифовский может местные баги. Вобщем в моем хоуме лежал файлик 
обозванный по русски с именем примерно 100 символьным на нём индексация 
падала(если что - на xfs домашний каталог с koi8-r). Ради интереса 
оставил индексироваться почтовик от симанки. Писем в одном ящике под 
200000, во втором под 100000. Ну и несколько ящиков по мелочи примерно 
по 1000 писем. Насколько я понял оно выдергивает все письма в файлы а 
потом индексирует. Падает с чем-то вроде key_ too long или term too long 
на каком-то письме. При удалении писем этих индексация пошла опять с 
начала ящика. Дождавшись через неизвестно сколько времени падения на 
другом письме с такой же ошибкой плюнул на всё это.Он вобще может 
запоминать в mbox письма которые уже проиндексировал и пропускать их? 
Или есть какой ключик при ошибках пропускать файлики дальше продолжать 
индексацию? Да и ещё ругается на pstotext, которого естественно в сизифе 
нет. Он в ps вобще ищет без этого pstotext? Я для себя его собрал, чтобы 
не видеть ругани.


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-11-30 12:45   ` Чернов Евгений
@ 2007-11-30 13:18     ` Michael Shigorin
  2007-11-30 13:27       ` Alexey Petrakov
  2007-12-01 10:01       ` Чернов Евгений
  0 siblings, 2 replies; 12+ messages in thread
From: Michael Shigorin @ 2007-11-30 13:18 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussions

On Fri, Nov 30, 2007 at 04:45:08PM +0400, Чернов Евгений wrote:
> >>recoll - Recoll is a personal full text search package
> >>- 1.10.0:
> Пересобрал его под свой компьютер(сизиф примерно месячной+
> давности).  Нормально заставить работать не удалось
> (проиндексировалась только часть файлов), хотя вешь интересная.

А что _не_ проиндексировалось?  Я исключаю из пакета хелпер для
*.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
метров несколько многовато для скромной искалки).  Остальное
вроде входит всё.  Что не входит -- писать надо (дампилки в
plaintext).

> Баги не вешаю потому как весь софт уже не сизифовский может
> местные баги.

Тут критична только версия libxapian -- крэш-тест проводился дома
на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1.

> Вобщем в моем хоуме лежал файлик обозванный по русски с именем
> примерно 100 символьным на нём индексация падала(если что - на
> xfs домашний каталог с koi8-r).

Мгм.  Можете прислать _имя_?  xfs с koi8-r найдётся ;)

> Ради интереса оставил индексироваться почтовик от симанки.
> Писем в одном ящике под 200000, во втором под 100000. Ну и
> несколько ящиков по мелочи примерно по 1000 писем. Насколько я
> понял оно выдергивает все письма в файлы а потом индексирует.

Примерно.

> Падает с чем-то вроде key_ too long или term too long на
> каком-то письме.

Просьба сохранять вывод и по возможности (если это рассылки
или другая публичная информация) -- именно те данные, на которых
падает.  Тут хороший автор, можете и сами к нему сходить, но могу
и я.

> При удалении писем этих индексация пошла опять с начала ящика.

Да.

> Дождавшись через неизвестно сколько времени падения на другом
> письме с такой же ошибкой плюнул на всё это.Он вобще может
> запоминать в mbox письма которые уже проиндексировал и
> пропускать их?

Боюсь, нет -- mbox суть один файл, там гранулярность "уже видели"
-- пофайловая.

Но я подсовывал больше трёх гигабайт почты, ни разу индексатор 
не упал.  Вот год или полтора назад падал со страшной силой даже 
на гигабайте или двух, но тогда и xapian был заметно другой.

> Или есть какой ключик при ошибках пропускать файлики дальше
> продолжать индексацию?

Ммм... нет вроде, но мысль разумная, надо бы попросить.

> Да и ещё ругается на pstotext, которого естественно в сизифе
> нет. Он в ps вобще ищет без этого pstotext? Я для себя его
> собрал, чтобы не видеть ругани.

Ну так закиньте в сизиф?  Если лень связываться -- бросайте
src.rpm или .spec, соберу, но почти всегда лучше самому
присматривать за тем, что интересно.  Особенно если его ещё
не было.

Ergo: давайте попробуем сформировать чуть более конкретный
багрепорт, в идеале с использованием текущей версии xapian
(бишь взять из сизифа xapian, пересобрать, поставить, собрать
с ним recoll, поставить, проверить -- если собираете в hasher,
достаточно просто засунуть туда сперва xapian, потом recoll,
собранное rpm -Uvh).

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-11-30 13:18     ` Michael Shigorin
@ 2007-11-30 13:27       ` Alexey Petrakov
  2007-12-01 10:01       ` Чернов Евгений
  1 sibling, 0 replies; 12+ messages in thread
From: Alexey Petrakov @ 2007-11-30 13:27 UTC (permalink / raw)
  To: shigorin, ALT Linux Sisyphus discussions

On Fri, 30 Nov 2007 19:18:10 +0600, Michael Shigorin <mike@osdn.org.ua>  
wrote:

> Я исключаю из пакета хелпер для
> *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
> метров несколько многовато для скромной искалки).

А может этот хелпер, вместе с зависимостями, просто отдельно завернуть?  
Для пользующихся lyx'ом, думаю, он будет очень приятен.

>> Да и ещё ругается на pstotext, которого естественно в сизифе
>> нет. Он в ps вобще ищет без этого pstotext? Я для себя его
>> собрал, чтобы не видеть ругани.
> Ну так закиньте в сизиф?

В хелпере посвящённом постскрипту можно выбрать что использовать: pstotext  
или ps2ascii (который в сизифе и бранче есть). Я не тестил, т.к. нет  
поблизости постскрипт файлов с русскими буквами, но мне кажется, стоит  
попробовать.


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-11-30 13:18     ` Michael Shigorin
  2007-11-30 13:27       ` Alexey Petrakov
@ 2007-12-01 10:01       ` Чернов Евгений
  2007-12-04 10:31         ` Michael Shigorin
  1 sibling, 1 reply; 12+ messages in thread
From: Чернов Евгений @ 2007-12-01 10:01 UTC (permalink / raw)
  To: shigorin, ALT Linux Sisyphus discussions

[-- Attachment #1: Type: text/plain, Size: 5700 bytes --]

Michael Shigorin wrote:
> On Fri, Nov 30, 2007 at 04:45:08PM +0400, Чернов Евгений wrote:
> А что _не_ проиндексировалось?  Я исключаю из пакета хелпер для
> *.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
> метров несколько многовато для скромной искалки).  Остальное
> вроде входит всё.  Что не входит -- писать надо (дампилки в
> plaintext).
Не индексируется естественно всё что осталось непросмотренное после 
"падения" recollindex.
> 
>> Баги не вешаю потому как весь софт уже не сизифовский может
>> местные баги.
> 
> Тут критична только версия libxapian -- крэш-тест проводился дома
> на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1.
> 
Ну это пересобранное из сизифа для себя.
  $ rpm -qa|grep xapian 

libxapian-1.0.4-alt1
xapian-core-1.0.4-alt1
xapian-core-doc-1.0.4-alt1
libxapian-devel-1.0.4-alt1
  $ rpm -qa|grep recoll 

recoll-1.10.0-alt1

>> Вобщем в моем хоуме лежал файлик обозванный по русски с именем
>> примерно 100 символьным на нём индексация падала(если что - на
>> xfs домашний каталог с koi8-r).
> 
> Мгм.  Можете прислать _имя_?  xfs с koi8-r найдётся ;)
Миш помоему ты ссылку кидал на эту статью 
http://samba.org.ua/articles/?section=1&articleid=26 - я её просто в 
firefox сохранил. Сейчас в отдельный каталог её сохранил и на него 
только натравил recollindex.  Вот вывод с максимальным debug.
  $ recollindex 

:4:../rcldb/rcldb.cpp:613:Db::open: m_isopen 0 m_iswritable 0
:4:../rcldb/stoplist.cpp:22:StopList::StopList: 
file_to_string(/home/jin/.recoll/stoplist.txt) failed: file_to_string: 
open failed: ю
:4:../rcldb/rcldb.cpp:639:Db::open: lastdocid: 374786
:4:../index/indexer.cpp:95:DbIndexer::index: Indexing /home/jin/tmp/test 
into /home/jin/.recoll/xapiandb
:4:../internfile/internfile.cpp:109:FileInterner::FileInterner: 
[/home/jin/tmp/test] mime [(null)] preview 0
:4:../internfile/mimehandler.cpp:102:getMimeHandler: returning 
MimeHandlerUnknown
:4:../internfile/internfile.cpp:170:FileInterner::FileInterner: 
application/x-fsdirectory [/home/jin/tmp/test]
:4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
:4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc 
is text/plain
:4:../rcldb/rcldb.cpp:1154:Db::add: docid 374787 added 
[/home/jin/tmp/test , ]
:4:../internfile/internfile.cpp:109:FileInterner::FileInterner: 
[/home/jin/tmp/test/Использование службы директорий LDAP для 
представления метаинформации в глобальных вычислительных системах (Using 
LDAP directory service for representation of metainformation in global 
computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] mime 
[(null)] preview 0
:4:../internfile/mimehandler.cpp:102:getMimeHandler: returning 
MimeHandlerUnknown
:4:../internfile/internfile.cpp:170:FileInterner::FileInterner: 
application/x-fsdirectory [/home/jin/tmp/test/Использование службы 
директорий LDAP для представления метаинформации в глобальных 
вычислительных системах (Using LDAP directory service for representation 
of metainformation in global computing systems) - Samba & LDAP - Статьи 
- samba.org.ua_files]
:4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
:4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc 
is text/plain
:2:../rcldb/rcldb.cpp:1159:Db::add: replace_document failed: Term too 
long (> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀ 
п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐ 
п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘ 
п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory 
service for representation of metainformation in global computing 
systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
:2:../rcldb/rcldb.cpp:1168:Db::add: add_document failed: Term too long 
(> 245): XSFNп╦я│п©п╬п╩я▄п╥п╬п╡п╟п╫п╦п╣ я│п╩я┐п╤п╠я▀ 
п╢п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п╢п╩я▐ п©я─п╣п╢я│я┌п╟п╡п╩п╣п╫п╦я▐ 
п╪п╣я┌п╟п╦п╫я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п╫я▀я┘ 
п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п╫я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory 
service for representation of metainformation in global computing 
systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
:2:../index/indexer.cpp:120:DbIndexer::index: error while indexing 
/home/jin/tmp/test:
:4:../rcldb/rcldb.cpp:693:Db::i_close(0): m_isopen 1 m_iswritable 1
:4:../rcldb/rcldb.cpp:701:Rcl::Db:close: xapian will close. May take 
some time
:4:../rcldb/rcldb.cpp:705:Rcl::Db:close() xapian close done.
:4:../rcldb/rcldb.cpp:577:Db::~Db: isopen 0 m_iswritable 0
:4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0
$
Естественно после этого больше ничего не проиндексируется дальше.

>> Падает с чем-то вроде key_ too long или term too long на
>> каком-то письме.
> 
> Просьба сохранять вывод и по возможности (если это рассылки
> или другая публичная информация) -- именно те данные, на которых
> падает.  Тут хороший автор, можете и сами к нему сходить, но могу
> и я.
Сегодня времени нет на это, слишком долго индексируется. В понедельник 
натравлю занаво и вывод пришлю.
>> Да и ещё ругается на pstotext, которого естественно в сизифе
>> нет. Он в ps вобще ищет без этого pstotext? Я для себя его
>> собрал, чтобы не видеть ругани.
> 
> Ну так закиньте в сизиф?  Если лень связываться -- бросайте
> src.rpm или .spec, соберу, но почти всегда лучше самому
> присматривать за тем, что интересно.  Особенно если его ещё
> не было.
Я просто не знаю надо этот pstotext ему или нет(может он что другое 
использует, а это так забытые куски кода). В консоли ругается а меня это 
немного напрягает. Вот и собрал 1.9. Там уже никаких обновлений с 2004 
года. spec приложил - переделал из чужого как мог.
Если что ещё пересобрать надо, то в понедельник могу продолжить с ним 
играться.

[-- Attachment #2: pstotext.spec --]
[-- Type: text/plain, Size: 1393 bytes --]

# $Revision: 1.1 $, $Date: 2002/03/06 00:08:27 $
Summary:	PostScript to text converter
Summary(pl):	Konwerter PostScriptu do czystego tekstu
Name:		pstotext
Version:	1.9
Release:	1
License:	Digital's paranoid but open-source license
Group:		Applications/Text
Source0:	ftp://mirror.cs.wisc.edu/pub/mirrors/ghost/contrib/%{name}-%{version}.tar.gz
URL:		http://www.research.digital.com/SRC/virtualpaper/pstotext.html
Requires:	ghostscript

%description
This utility reads in postscript files and outputs an ASCII rendering.
While the rendering is not always accurate, it is often sufficient.

%prep
%setup -q -n %name-%version

%build
%{__make} CC="%{__cc}"

%install
rm -rf $RPM_BUILD_ROOT
install -d $RPM_BUILD_ROOT{%_bindir,%_mandir/man1}

install pstotext $RPM_BUILD_ROOT%_bindir/pstotext
install pstotext.1 $RPM_BUILD_ROOT%_mandir/man1/pstotext.1

gzip -9nf pstotext.txt

%files
%defattr(644,root,root,755)
%doc *.gz
%attr(755,root,root) %_bindir/pstotext
%_mandir/man1/pstotext.1*

%clean
rm -rf $RPM_BUILD_ROOT

%changelog
##* Thu Nov 28 2007 1.9-alt1
##- rebuild for alt

##* %{date} PLD Team <feedback@pld.org.pl>
##All persons listed below can be reached at <cvs_login>@pld.org.pl

##$Log: pstotext.spec,v $
##Revision 1.1  2002/03/06 00:08:27  qboosh
##- new: spec based on old RH-contrib package, but uptated to 1.8g
##  (unfortunately, there is no version information in Source URL)

^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-12-01 10:01       ` Чернов Евгений
@ 2007-12-04 10:31         ` Michael Shigorin
  2007-12-05  4:28           ` Чернов Евгений
  0 siblings, 1 reply; 12+ messages in thread
From: Michael Shigorin @ 2007-12-04 10:31 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussions

On Sat, Dec 01, 2007 at 02:01:45PM +0400, Чернов Евгений wrote:
> >А что _не_ проиндексировалось?  Я исключаю из пакета хелпер для
> >*.lyx (он тащил за собой lyx, который тащил tetex-core -- сто
> >метров несколько многовато для скромной искалки).  Остальное
> >вроде входит всё.  Что не входит -- писать надо (дампилки в
> >plaintext).
> Не индексируется естественно всё что осталось непросмотренное
> после "падения" recollindex.

А, я думал -- по типам.

> >>Баги не вешаю потому как весь софт уже не сизифовский может
> >>местные баги.
> >Тут критична только версия libxapian -- крэш-тест проводился
> >дома на 4.0/branch, libxapian-1.0.3-alt1, recoll-1.10.0-alt1.
> Ну это пересобранное из сизифа для себя.
> libxapian-1.0.4-alt1
> recoll-1.10.0-alt1
> 
> >>Вобщем в моем хоуме лежал файлик обозванный по русски с
> >>именем примерно 100 символьным на нём индексация падала(если
> >>что - на xfs домашний каталог с koi8-r).
> >Мгм.  Можете прислать _имя_?  xfs с koi8-r найдётся ;)
> Миш помоему ты ссылку кидал на эту статью 
> http://samba.org.ua/articles/?section=1&articleid=26 - я её
> просто в firefox сохранил. Сейчас в отдельный каталог её
> сохранил и на него только натравил recollindex.  Вот вывод с
> максимальным debug.
>  $ recollindex 
> 
> :4:../rcldb/rcldb.cpp:613:Db::open: m_isopen 0 m_iswritable 0
> :4:../rcldb/stoplist.cpp:22:StopList::StopList: 
> file_to_string(/home/jin/.recoll/stoplist.txt) failed: file_to_string: 
> open failed: ю
> :4:../rcldb/rcldb.cpp:639:Db::open: lastdocid: 374786
> :4:../index/indexer.cpp:95:DbIndexer::index: Indexing /home/jin/tmp/test 
> into /home/jin/.recoll/xapiandb
> :4:../internfile/internfile.cpp:109:FileInterner::FileInterner: 
> [/home/jin/tmp/test] mime [(null)] preview 0
> :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning 
> MimeHandlerUnknown
> :4:../internfile/internfile.cpp:170:FileInterner::FileInterner: 
> application/x-fsdirectory [/home/jin/tmp/test]
> :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
> :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc 
> is text/plain
> :4:../rcldb/rcldb.cpp:1154:Db::add: docid 374787 added 
> [/home/jin/tmp/test , ]
> :4:../internfile/internfile.cpp:109:FileInterner::FileInterner: 
> [/home/jin/tmp/test/Использование службы директорий LDAP для 
> представления метаинформации в глобальных вычислительных системах (Using 
> LDAP directory service for representation of metainformation in global 
> computing systems) - Samba & LDAP - Статьи - samba.org.ua_files] mime 
> [(null)] preview 0
> :4:../internfile/mimehandler.cpp:102:getMimeHandler: returning 
> MimeHandlerUnknown
> :4:../internfile/internfile.cpp:170:FileInterner::FileInterner: 
> application/x-fsdirectory [/home/jin/tmp/test/Использование службы 
> директорий LDAP для представления метаинформации в глобальных 
> вычислительных системах (Using LDAP directory service for representation 
> of metainformation in global computing systems) - Samba & LDAP - Статьи 
> - samba.org.ua_files]
> :4:../internfile/internfile.cpp:357:FileInterner::internfile. ipath []
> :4:../internfile/internfile.cpp:423:FileInterner::internfile: next_doc 
> is text/plain
> :2:../rcldb/rcldb.cpp:1159:Db::add: replace_document failed: Term too 
> long (> 245): XSFNп╦я│п©п╬п╩я▄п?п╬п╡п╟п?п╦п╣ я│п╩я┐п?п╠я▀ 
> п?п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п?п╩я▐ п©я─п╣п?я│я┌п╟п╡п╩п╣п?п╦я▐ 
> п╪п╣я┌п╟п╦п?я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п?я▀я┘ 
> п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п?я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory 
> service for representation of metainformation in global computing 
> systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
> :2:../rcldb/rcldb.cpp:1168:Db::add: add_document failed: Term too long 
> (> 245): XSFNп╦я│п©п╬п╩я▄п?п╬п╡п╟п?п╦п╣ я│п╩я┐п?п╠я▀ 
> п?п╦я─п╣п╨я┌п╬я─п╦п╦ ldap п?п╩я▐ п©я─п╣п?я│я┌п╟п╡п╩п╣п?п╦я▐ 
> п╪п╣я┌п╟п╦п?я└п╬я─п╪п╟я├п╦п╦ п╡ пЁп╩п╬п╠п╟п╩я▄п?я▀я┘ 
> п╡я▀я┤п╦я│п╩п╦я┌п╣п╩я▄п?я▀я┘ я│п╦я│я┌п╣п╪п╟я┘ (using ldap directory 
> service for representation of metainformation in global computing 
> systems) - samba & ldap - я│я┌п╟я┌я▄п╦ - samba.org.ua_files
> :2:../index/indexer.cpp:120:DbIndexer::index: error while indexing 
> /home/jin/tmp/test:
> :4:../rcldb/rcldb.cpp:693:Db::i_close(0): m_isopen 1 m_iswritable 1
> :4:../rcldb/rcldb.cpp:701:Rcl::Db:close: xapian will close. May take 
> some time
> :4:../rcldb/rcldb.cpp:705:Rcl::Db:close() xapian close done.
> :4:../rcldb/rcldb.cpp:577:Db::~Db: isopen 0 m_iswritable 0
> :4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0
> $
> Естественно после этого больше ничего не проиндексируется дальше.

Оно на этом именно вывалилось или встало в задумчивости?

> >>Падает с чем-то вроде key_ too long или term too long на
> >>каком-то письме.
> >Просьба сохранять вывод и по возможности (если это рассылки
> >или другая публичная информация) -- именно те данные, на
> >которых падает.  Тут хороший автор, можете и сами к нему
> >сходить, но могу и я.
> Сегодня времени нет на это, слишком долго индексируется.
> В понедельник натравлю занаво и вывод пришлю.

tnx

> >>Да и ещё ругается на pstotext, которого естественно в сизифе
> >>нет. Он в ps вобще ищет без этого pstotext? Я для себя его
> >>собрал, чтобы не видеть ругани.
> >Ну так закиньте в сизиф?  Если лень связываться -- бросайте
> >src.rpm или .spec, соберу, но почти всегда лучше самому
> >присматривать за тем, что интересно.  Особенно если его ещё
> >не было.
> Я просто не знаю надо этот pstotext ему или нет(может он что
> другое использует, а это так забытые куски кода). В консоли
> ругается а меня это немного напрягает. Вот и собрал 1.9. Там
> уже никаких обновлений с 2004 года. spec приложил - переделал
> из чужого как мог.  Если что ещё пересобрать надо, то в
> понедельник могу продолжить с ним играться.

Тоже бы неплохо, мне сейчас хватает работы по ALTSP...

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-12-04 10:31         ` Michael Shigorin
@ 2007-12-05  4:28           ` Чернов Евгений
  2007-12-05  8:43             ` Michael Shigorin
  0 siblings, 1 reply; 12+ messages in thread
From: Чернов Евгений @ 2007-12-05  4:28 UTC (permalink / raw)
  To: shigorin, ALT Linux Sisyphus discussions

Michael Shigorin wrote:
<кусь>

>> :4:../rcldb/rcldb.cpp:693:Db::i_close(1): m_isopen 0 m_iswritable 0
>> $
^^^^^^
>> Естественно после этого больше ничего не проиндексируется дальше.
> 
> Оно на этом именно вывалилось или встало в задумчивости?

Ну я же значок доллара в конце оставил:) В консольку вываливается.

>>>> Падает с чем-то вроде key_ too long или term too long на
>>>> каком-то письме.
>>> Просьба сохранять вывод и по возможности (если это рассылки
>>> или другая публичная информация) -- именно те данные, на
>>> которых падает.  Тут хороший автор, можете и сами к нему
>>> сходить, но могу и я.
>> Сегодня времени нет на это, слишком долго индексируется.
>> В понедельник натравлю занаво и вывод пришлю.

Да не получилось ничего. Те файлы я оказывается сразу удалил но 
seamonkey оставли открытую. А после закрытия seamonkey папки сжались и 
соотвественно на самом деле письмо удалилось из mbox. Но скорее всего 
там таже ошибка.
Ещё один вопрос тут возник. Он когда текстовые файлы парсит в какой 
кодировке это делает? Или там автоопределение через что-нибудь типа enca?


^ permalink raw reply	[flat|nested] 12+ messages in thread

* Re: [sisyphus] I: recoll-1.10.0
  2007-12-05  4:28           ` Чернов Евгений
@ 2007-12-05  8:43             ` Michael Shigorin
  0 siblings, 0 replies; 12+ messages in thread
From: Michael Shigorin @ 2007-12-05  8:43 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussions

On Wed, Dec 05, 2007 at 08:28:32AM +0400, Чернов Евгений wrote:
> >Оно на этом именно вывалилось или встало в задумчивости?
> Ну я же значок доллара в конце оставил:) В консольку вываливается.

Ааа :)  Не заметил.

[ну ой]

> Ещё один вопрос тут возник. Он когда текстовые файлы парсит в
> какой кодировке это делает? Или там автоопределение через
> что-нибудь типа enca?

См. defaultcharset в ~/.recoll/recoll.conf (e.g. KOI8-U// --
кажется, это в нотации recode(1)) или новопоявившийся диалог
конфигурации индексера.

Кстати, буду сильно признателен за помощь с переводом --
последние несколько версий не успеваю подновлять.

-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 12+ messages in thread

end of thread, other threads:[~2007-12-05  8:43 UTC | newest]

Thread overview: 12+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2007-11-26 22:47 ` [sisyphus] I: recoll-1.10.0 Michael Shigorin
2007-11-27 19:41   ` Yuriy Shirokov
2007-11-28 10:00     ` Alexey Shabalin
2007-11-28 10:19       ` Alex Karpov
2007-11-28 19:14       ` Yuriy Shirokov
2007-11-30 12:45   ` Чернов Евгений
2007-11-30 13:18     ` Michael Shigorin
2007-11-30 13:27       ` Alexey Petrakov
2007-12-01 10:01       ` Чернов Евгений
2007-12-04 10:31         ` Michael Shigorin
2007-12-05  4:28           ` Чернов Евгений
2007-12-05  8:43             ` Michael Shigorin

ALT Linux Sisyphus discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \
		sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru
	public-inbox-index sisyphus

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.sisyphus


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git