ALT Linux Sisyphus discussions
 help / color / mirror / Atom feed
* [sisyphus] pstotext
@ 2005-06-28 15:08 Vitaly Ostanin
  2005-06-28 15:24 ` Andrey Rahmatullin
                   ` (2 more replies)
  0 siblings, 3 replies; 7+ messages in thread
From: Vitaly Ostanin @ 2005-06-28 15:08 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussion list

[-- Attachment #1: Type: text/plain, Size: 230 bytes --]

Здравствуйте.

Не могу найти в Сизифе, в том числе в content_index, утилиты
pstotext. Есть какие-то заменители? Нужно (качественно) выдрать
текст из pdf.

-- 
Regards, Vyt
mailto:  vyt@vzljot.ru
JID:     vyt@vzljot.ru


[-- Attachment #2: OpenPGP digital signature --]
[-- Type: application/pgp-signature, Size: 256 bytes --]

^ permalink raw reply	[flat|nested] 7+ messages in thread

* Re: [sisyphus] pstotext
  2005-06-28 15:08 [sisyphus] pstotext Vitaly Ostanin
@ 2005-06-28 15:24 ` Andrey Rahmatullin
  2005-06-28 16:24 ` [sisyphus] pstotext Sergey Bolshakov
  2005-06-29  7:38 ` [sisyphus] pstotext Led
  2 siblings, 0 replies; 7+ messages in thread
From: Andrey Rahmatullin @ 2005-06-28 15:24 UTC (permalink / raw)
  To: sisyphus

[-- Attachment #1: Type: text/plain, Size: 549 bytes --]

On Tue, Jun 28, 2005 at 07:08:09PM +0400, Vitaly Ostanin wrote:
> Не могу найти в Сизифе, в том числе в content_index, утилиты
> pstotext. Есть какие-то заменители? Нужно (качественно) выдрать
> текст из pdf.
$ rpm -qf =pdftotext
xpdf-utils-3.00-alt5pl3

-- 
WBR, wRAR (ALT Linux Team)
Powered by the ALT Linux fortune(8):

<thresh> бллллин!!! Сижу себе, слушаю вместе с соседями музыку (довольно громко), вдруг слышу мощщный такой звон разбитого стекла. Сразу оглянулся, че уронил. А это KDE, зараза, чего-то сделать не смогла. ААРРГХ.

[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 7+ messages in thread

* [sisyphus] Re: pstotext
  2005-06-28 15:08 [sisyphus] pstotext Vitaly Ostanin
  2005-06-28 15:24 ` Andrey Rahmatullin
@ 2005-06-28 16:24 ` Sergey Bolshakov
  2005-06-29  7:38 ` [sisyphus] pstotext Led
  2 siblings, 0 replies; 7+ messages in thread
From: Sergey Bolshakov @ 2005-06-28 16:24 UTC (permalink / raw)
  To: sisyphus

>>>>> "Vitaly" == Vitaly Ostanin <vyt-gg1dinuYDACHXe+LvDLADg@public.gmane.org> writes:

 > Здравствуйте.
 > Не могу найти в Сизифе, в том числе в content_index, утилиты
 > pstotext. Есть какие-то заменители? Нужно (качественно) выдрать
 > текст из pdf.

pdftotext, xpdf-utils

-- 


^ permalink raw reply	[flat|nested] 7+ messages in thread

* Re: [sisyphus] pstotext
  2005-06-28 15:08 [sisyphus] pstotext Vitaly Ostanin
  2005-06-28 15:24 ` Andrey Rahmatullin
  2005-06-28 16:24 ` [sisyphus] pstotext Sergey Bolshakov
@ 2005-06-29  7:38 ` Led
  2005-06-29  9:52   ` Andrey Rahmatullin
  2 siblings, 1 reply; 7+ messages in thread
From: Led @ 2005-06-29  7:38 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussion list

В сообщении от Вторник 28 Июнь 2005 18:08 Vitaly Ostanin написал(a):
> Здравствуйте.
>
> Не могу найти в Сизифе, в том числе в content_index, утилиты
> pstotext. Есть какие-то заменители? Нужно (качественно) выдрать
> текст из pdf.

ps2ascii?


^ permalink raw reply	[flat|nested] 7+ messages in thread

* Re: [sisyphus] pstotext
  2005-06-29  7:38 ` [sisyphus] pstotext Led
@ 2005-06-29  9:52   ` Andrey Rahmatullin
  2005-06-29 10:14     ` Led
  2005-06-29 11:56     ` [sisyphus] pstotext Vitaly Ostanin
  0 siblings, 2 replies; 7+ messages in thread
From: Andrey Rahmatullin @ 2005-06-29  9:52 UTC (permalink / raw)
  To: sisyphus

[-- Attachment #1: Type: text/plain, Size: 259 bytes --]

On Wed, Jun 29, 2005 at 10:38:51AM +0300, Led wrote:
> ps2ascii?
Для pdf-то?


-- 
WBR, wRAR (ALT Linux Team)
Powered by the ALT Linux fortune(8):

<Vitls> .oO("У микросхемы есть слои, у людоедов есть слои. У нас обоих есть слои..." (с) почти Шрек)

[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 7+ messages in thread

* Re: [sisyphus] pstotext
  2005-06-29  9:52   ` Andrey Rahmatullin
@ 2005-06-29 10:14     ` Led
  2005-06-29 11:56     ` [sisyphus] pstotext Vitaly Ostanin
  1 sibling, 0 replies; 7+ messages in thread
From: Led @ 2005-06-29 10:14 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussion list

В сообщении от Среда 29 Июнь 2005 12:52 Andrey Rahmatullin написал(a):
> On Wed, Jun 29, 2005 at 10:38:51AM +0300, Led wrote:
> > ps2ascii?
>
> Для pdf-то?

$ man ps2ascii
...
ps2ascii - Ghostscript translator from PostScript or PDF to ASCII
...


^ permalink raw reply	[flat|nested] 7+ messages in thread

* [sisyphus] Re: pstotext
  2005-06-29  9:52   ` Andrey Rahmatullin
  2005-06-29 10:14     ` Led
@ 2005-06-29 11:56     ` Vitaly Ostanin
  1 sibling, 0 replies; 7+ messages in thread
From: Vitaly Ostanin @ 2005-06-29 11:56 UTC (permalink / raw)
  To: ALT Linux Sisyphus discussion list

[-- Attachment #1: Type: text/plain, Size: 464 bytes --]

Andrey Rahmatullin пишет:
> On Wed, Jun 29, 2005 at 10:38:51AM +0300, Led wrote:
> 
>>ps2ascii?
> Для pdf-то?

В docbook'овом fo/pdf2index (в Сизифе его нет) указан именно
pstotext, хотя для pdf.

А с pdftotext этот скрипт не работает. Сам pdftotext работает
нормально, только кодировки cp1251 не хватает, так что проблема
явно в скрипте.

Всем спасибо, буду рыть.

<skipped/>

-- 
Regards, Vyt
mailto:  vyt@vzljot.ru
JID:     vyt@vzljot.ru


[-- Attachment #2: OpenPGP digital signature --]
[-- Type: application/pgp-signature, Size: 256 bytes --]

^ permalink raw reply	[flat|nested] 7+ messages in thread

end of thread, other threads:[~2005-06-29 11:56 UTC | newest]

Thread overview: 7+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2005-06-28 15:08 [sisyphus] pstotext Vitaly Ostanin
2005-06-28 15:24 ` Andrey Rahmatullin
2005-06-28 16:24 ` [sisyphus] pstotext Sergey Bolshakov
2005-06-29  7:38 ` [sisyphus] pstotext Led
2005-06-29  9:52   ` Andrey Rahmatullin
2005-06-29 10:14     ` Led
2005-06-29 11:56     ` [sisyphus] pstotext Vitaly Ostanin

ALT Linux Sisyphus discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \
		sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru
	public-inbox-index sisyphus

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.sisyphus


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git