* [sisyphus] pstotext
@ 2005-06-28 15:08 Vitaly Ostanin
2005-06-28 15:24 ` Andrey Rahmatullin
` (2 more replies)
0 siblings, 3 replies; 7+ messages in thread
From: Vitaly Ostanin @ 2005-06-28 15:08 UTC (permalink / raw)
To: ALT Linux Sisyphus discussion list
[-- Attachment #1: Type: text/plain, Size: 230 bytes --]
Здравствуйте.
Не могу найти в Сизифе, в том числе в content_index, утилиты
pstotext. Есть какие-то заменители? Нужно (качественно) выдрать
текст из pdf.
--
Regards, Vyt
mailto: vyt@vzljot.ru
JID: vyt@vzljot.ru
[-- Attachment #2: OpenPGP digital signature --]
[-- Type: application/pgp-signature, Size: 256 bytes --]
^ permalink raw reply [flat|nested] 7+ messages in thread
* Re: [sisyphus] pstotext
2005-06-28 15:08 [sisyphus] pstotext Vitaly Ostanin
@ 2005-06-28 15:24 ` Andrey Rahmatullin
2005-06-28 16:24 ` [sisyphus] pstotext Sergey Bolshakov
2005-06-29 7:38 ` [sisyphus] pstotext Led
2 siblings, 0 replies; 7+ messages in thread
From: Andrey Rahmatullin @ 2005-06-28 15:24 UTC (permalink / raw)
To: sisyphus
[-- Attachment #1: Type: text/plain, Size: 549 bytes --]
On Tue, Jun 28, 2005 at 07:08:09PM +0400, Vitaly Ostanin wrote:
> Не могу найти в Сизифе, в том числе в content_index, утилиты
> pstotext. Есть какие-то заменители? Нужно (качественно) выдрать
> текст из pdf.
$ rpm -qf =pdftotext
xpdf-utils-3.00-alt5pl3
--
WBR, wRAR (ALT Linux Team)
Powered by the ALT Linux fortune(8):
<thresh> бллллин!!! Сижу себе, слушаю вместе с соседями музыку (довольно громко), вдруг слышу мощщный такой звон разбитого стекла. Сразу оглянулся, че уронил. А это KDE, зараза, чего-то сделать не смогла. ААРРГХ.
[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 7+ messages in thread
* [sisyphus] Re: pstotext
2005-06-28 15:08 [sisyphus] pstotext Vitaly Ostanin
2005-06-28 15:24 ` Andrey Rahmatullin
@ 2005-06-28 16:24 ` Sergey Bolshakov
2005-06-29 7:38 ` [sisyphus] pstotext Led
2 siblings, 0 replies; 7+ messages in thread
From: Sergey Bolshakov @ 2005-06-28 16:24 UTC (permalink / raw)
To: sisyphus
>>>>> "Vitaly" == Vitaly Ostanin <vyt-gg1dinuYDACHXe+LvDLADg@public.gmane.org> writes:
> Здравствуйте.
> Не могу найти в Сизифе, в том числе в content_index, утилиты
> pstotext. Есть какие-то заменители? Нужно (качественно) выдрать
> текст из pdf.
pdftotext, xpdf-utils
--
^ permalink raw reply [flat|nested] 7+ messages in thread
* Re: [sisyphus] pstotext
2005-06-28 15:08 [sisyphus] pstotext Vitaly Ostanin
2005-06-28 15:24 ` Andrey Rahmatullin
2005-06-28 16:24 ` [sisyphus] pstotext Sergey Bolshakov
@ 2005-06-29 7:38 ` Led
2005-06-29 9:52 ` Andrey Rahmatullin
2 siblings, 1 reply; 7+ messages in thread
From: Led @ 2005-06-29 7:38 UTC (permalink / raw)
To: ALT Linux Sisyphus discussion list
В сообщении от Вторник 28 Июнь 2005 18:08 Vitaly Ostanin написал(a):
> Здравствуйте.
>
> Не могу найти в Сизифе, в том числе в content_index, утилиты
> pstotext. Есть какие-то заменители? Нужно (качественно) выдрать
> текст из pdf.
ps2ascii?
^ permalink raw reply [flat|nested] 7+ messages in thread
* Re: [sisyphus] pstotext
2005-06-29 7:38 ` [sisyphus] pstotext Led
@ 2005-06-29 9:52 ` Andrey Rahmatullin
2005-06-29 10:14 ` Led
2005-06-29 11:56 ` [sisyphus] pstotext Vitaly Ostanin
0 siblings, 2 replies; 7+ messages in thread
From: Andrey Rahmatullin @ 2005-06-29 9:52 UTC (permalink / raw)
To: sisyphus
[-- Attachment #1: Type: text/plain, Size: 259 bytes --]
On Wed, Jun 29, 2005 at 10:38:51AM +0300, Led wrote:
> ps2ascii?
Для pdf-то?
--
WBR, wRAR (ALT Linux Team)
Powered by the ALT Linux fortune(8):
<Vitls> .oO("У микросхемы есть слои, у людоедов есть слои. У нас обоих есть слои..." (с) почти Шрек)
[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]
^ permalink raw reply [flat|nested] 7+ messages in thread
* Re: [sisyphus] pstotext
2005-06-29 9:52 ` Andrey Rahmatullin
@ 2005-06-29 10:14 ` Led
2005-06-29 11:56 ` [sisyphus] pstotext Vitaly Ostanin
1 sibling, 0 replies; 7+ messages in thread
From: Led @ 2005-06-29 10:14 UTC (permalink / raw)
To: ALT Linux Sisyphus discussion list
В сообщении от Среда 29 Июнь 2005 12:52 Andrey Rahmatullin написал(a):
> On Wed, Jun 29, 2005 at 10:38:51AM +0300, Led wrote:
> > ps2ascii?
>
> Для pdf-то?
$ man ps2ascii
...
ps2ascii - Ghostscript translator from PostScript or PDF to ASCII
...
^ permalink raw reply [flat|nested] 7+ messages in thread
* [sisyphus] Re: pstotext
2005-06-29 9:52 ` Andrey Rahmatullin
2005-06-29 10:14 ` Led
@ 2005-06-29 11:56 ` Vitaly Ostanin
1 sibling, 0 replies; 7+ messages in thread
From: Vitaly Ostanin @ 2005-06-29 11:56 UTC (permalink / raw)
To: ALT Linux Sisyphus discussion list
[-- Attachment #1: Type: text/plain, Size: 464 bytes --]
Andrey Rahmatullin пишет:
> On Wed, Jun 29, 2005 at 10:38:51AM +0300, Led wrote:
>
>>ps2ascii?
> Для pdf-то?
В docbook'овом fo/pdf2index (в Сизифе его нет) указан именно
pstotext, хотя для pdf.
А с pdftotext этот скрипт не работает. Сам pdftotext работает
нормально, только кодировки cp1251 не хватает, так что проблема
явно в скрипте.
Всем спасибо, буду рыть.
<skipped/>
--
Regards, Vyt
mailto: vyt@vzljot.ru
JID: vyt@vzljot.ru
[-- Attachment #2: OpenPGP digital signature --]
[-- Type: application/pgp-signature, Size: 256 bytes --]
^ permalink raw reply [flat|nested] 7+ messages in thread
end of thread, other threads:[~2005-06-29 11:56 UTC | newest]
Thread overview: 7+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2005-06-28 15:08 [sisyphus] pstotext Vitaly Ostanin
2005-06-28 15:24 ` Andrey Rahmatullin
2005-06-28 16:24 ` [sisyphus] pstotext Sergey Bolshakov
2005-06-29 7:38 ` [sisyphus] pstotext Led
2005-06-29 9:52 ` Andrey Rahmatullin
2005-06-29 10:14 ` Led
2005-06-29 11:56 ` [sisyphus] pstotext Vitaly Ostanin
ALT Linux Sisyphus discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \
sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru
public-inbox-index sisyphus
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.sisyphus
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git