ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] ps (pdf) to djvu
@ 2006-04-03 14:52 Andrei Lomov
  2006-04-03 15:01 ` [Comm] [JT] " Alexei V. Mezin
                   ` (2 more replies)
  0 siblings, 3 replies; 10+ messages in thread
From: Andrei Lomov @ 2006-04-03 14:52 UTC (permalink / raw)
  To: community


Кто-нибудь делал преобразование
ps (pdf) to djvu ?

-- 
Всего доброго,
А.Л.




^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] [JT] ps (pdf) to djvu
  2006-04-03 14:52 [Comm] ps (pdf) to djvu Andrei Lomov
@ 2006-04-03 15:01 ` Alexei V. Mezin
  2006-04-03 15:53   ` Alexej Kryukov
                     ` (3 more replies)
  2006-04-03 17:57 ` [Comm] " Gleb Kulikov
  2006-04-06 14:41 ` spider
  2 siblings, 4 replies; 10+ messages in thread
From: Alexei V. Mezin @ 2006-04-03 15:01 UTC (permalink / raw)
  To: lhome, ALT Linux Community

Andrei Lomov пишет:
> Кто-нибудь делал преобразование
> ps (pdf) to djvu ?
> 

А зачем?
djvu хорошо подходит для сканированных текстов. Т.е. это хитро 
сработанная картинка. А ps/pdf обычно содержат нормальный текст, поэтому 
занимает в разы меньше объема при в разы лучшем качестве.
-- 
Alexei V. Mezin

NT-MDT Co.
Phone: 095-913-5736
Fax: 095-913-573
Email: mezin@ntmdt.ru
URL: http://www.ntmdt.com


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] [JT] ps (pdf) to djvu
  2006-04-03 15:01 ` [Comm] [JT] " Alexei V. Mezin
@ 2006-04-03 15:53   ` Alexej Kryukov
  2006-04-03 17:29   ` some_x
                     ` (2 subsequent siblings)
  3 siblings, 0 replies; 10+ messages in thread
From: Alexej Kryukov @ 2006-04-03 15:53 UTC (permalink / raw)
  To: mezin, ALT Linux Community

On Monday 03 April 2006 19:01, Alexei V. Mezin wrote:
>
> А зачем?
> djvu хорошо подходит для сканированных текстов. Т.е. это хитро
> сработанная картинка. А ps/pdf обычно содержат нормальный текст,
> поэтому занимает в разы меньше объема при в разы лучшем качестве.

Речь, наверное, шла о таких pdf, которые представляют собой обертку
для растровых изображений (напр. отсканированных страниц книги).

-- 
Regards,
Alexey Kryukov <anagnost {at} yandex {dot} ru>

Moscow State University
Historical Faculty


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] [JT] ps (pdf) to djvu
  2006-04-03 15:01 ` [Comm] [JT] " Alexei V. Mezin
  2006-04-03 15:53   ` Alexej Kryukov
@ 2006-04-03 17:29   ` some_x
  2006-04-03 18:03   ` Gleb Kulikov
  2006-04-06 14:55   ` spider
  3 siblings, 0 replies; 10+ messages in thread
From: some_x @ 2006-04-03 17:29 UTC (permalink / raw)
  To: mezin, ALT Linux Community

Alexei V. Mezin wrote:

>Andrei Lomov пишет:
>  
>
>>Кто-нибудь делал преобразование
>>ps (pdf) to djvu ?
>>
>>    
>>
>
>А зачем?
>djvu хорошо подходит для сканированных текстов. Т.е. это хитро 
>сработанная картинка. А ps/pdf обычно содержат нормальный текст, поэтому 
>занимает в разы меньше объема при в разы лучшем качестве.
>  
>
не совсем, djvu создан специально для сканеных изображений, т.е это скан 
+ в точности сомещённый с ним распознаный текст. А pdf это либо тупо 
картинка или очень жёстко форматированный текст, короче сравнивать их 
всё равно что трактор с моторной лодкой.


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] ps (pdf) to djvu
  2006-04-03 14:52 [Comm] ps (pdf) to djvu Andrei Lomov
  2006-04-03 15:01 ` [Comm] [JT] " Alexei V. Mezin
@ 2006-04-03 17:57 ` Gleb Kulikov
  2006-04-06 14:41 ` spider
  2 siblings, 0 replies; 10+ messages in thread
From: Gleb Kulikov @ 2006-04-03 17:57 UTC (permalink / raw)
  To: lhome, ALT Linux Community

В сообщении от Понедельник 03 Апрель 2006 21:52 Andrei Lomov написал:
> Кто-нибудь делал преобразование
> ps (pdf) to djvu ?

регулярно...

1) лучше всего. воспользоваться скриптом djvudigital (идёт в составе 
djvulibre, но в /bin не устанавливается). требует пересборки адаптированного 
gs (я смог нормально собрать только с устаревшей версией), но оно того стоит: 
идеальное качество преобразования, сохраняются цвета, умеет извлекать текст 
из pdf и подкладывать его в djvu.

2) простое преобразование pdf-(gs)-pbn-djvu, без сохранения цветности, без 
учёта фон/преедний план и без соранения текста: готовый скрипт (pdf2djvu.pl) 
легко находится гуглем.

-- 
      Салют, /GLeb

UIN: 15341920
jabber://gleb@asd.iao.ru
skype://gleb_kulikov.tomsk
sip:    20000204@sip.pctel.ru
netmail: 2:5005/78


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] [JT] ps (pdf) to djvu
  2006-04-03 15:01 ` [Comm] [JT] " Alexei V. Mezin
  2006-04-03 15:53   ` Alexej Kryukov
  2006-04-03 17:29   ` some_x
@ 2006-04-03 18:03   ` Gleb Kulikov
  2006-04-06 14:55   ` spider
  3 siblings, 0 replies; 10+ messages in thread
From: Gleb Kulikov @ 2006-04-03 18:03 UTC (permalink / raw)
  To: mezin, ALT Linux Community

В сообщении от Понедельник 03 Апрель 2006 22:01 Alexei V. Mezin написал:

> djvu хорошо подходит для сканированных текстов. Т.е. это хитро
> сработанная картинка. А ps/pdf обычно содержат нормальный текст, поэтому
> занимает в разы меньше объема при в разы лучшем качестве.

не совсем так. хороший djvu, при визуально неразличимом (на д а н н о м  м а с 
с ш т а б е, разумеется, как только это ограничение снимается, говорить 
становится не о чем) качестве, обычно, занимает несколько меньше, чем pdf, а 
если речь идёт  о pdf со сканами -- то сильно меньше.

Но дело не в этом: смысл в том. что с djvu -- удобнее работать: быстрая 
прорисовка (иногда, в разы более быстрая!), удобная лупа. 

-- 
      Салют, /GLeb

UIN: 15341920
jabber://gleb@asd.iao.ru
skype://gleb_kulikov.tomsk
sip:    20000204@sip.pctel.ru
netmail: 2:5005/78


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] ps (pdf) to djvu
  2006-04-03 14:52 [Comm] ps (pdf) to djvu Andrei Lomov
  2006-04-03 15:01 ` [Comm] [JT] " Alexei V. Mezin
  2006-04-03 17:57 ` [Comm] " Gleb Kulikov
@ 2006-04-06 14:41 ` spider
  2 siblings, 0 replies; 10+ messages in thread
From: spider @ 2006-04-06 14:41 UTC (permalink / raw)
  To: lhome, ALT Linux Community

Andrei Lomov wrote:
> Кто-нибудь делал преобразование
> ps (pdf) to djvu ?
> 
Для тех, что есть обертка сканированных документов делаю так:

1. Перегоняю пдф в картинки -- их будет столько, сколько страниц в
документе.

$ pdftoppm -r 300 -mono file.pdf m300

В результате имеем кучу файлов m300-000001.ppm ... m300-000nnn.ppm

2. теперь перегоняем эти картинки в djvu

$ find -name '*.pbm' -exec cjb2 -lossy {} {}.d \;

3. И собираем воедино

Первая страница из первой картинки.
$ djvm -c book.djvu m300-000001.pbm.d

Для правильной сборки остальных делаем скрипт
$ find -name '*.d' -exec echo djvm -i book.djvu {} \; | sort > a.sh

устанавливаем ему флаг выполняемости и запускаем. Все ненужное прибиваем.


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] [JT] ps (pdf) to djvu
  2006-04-03 15:01 ` [Comm] [JT] " Alexei V. Mezin
                     ` (2 preceding siblings ...)
  2006-04-03 18:03   ` Gleb Kulikov
@ 2006-04-06 14:55   ` spider
  2006-04-09 13:19     ` Andrei Lomov
  3 siblings, 1 reply; 10+ messages in thread
From: spider @ 2006-04-06 14:55 UTC (permalink / raw)
  To: mezin, ALT Linux Community

Alexei V. Mezin wrote:
> Andrei Lomov пишет:
> 
>>Кто-нибудь делал преобразование
>>ps (pdf) to djvu ?
>>
> 
> 
> А зачем?
> djvu хорошо подходит для сканированных текстов. Т.е. это хитро 
> сработанная картинка. А ps/pdf обычно содержат нормальный текст, поэтому 
> занимает в разы меньше объема при в разы лучшем качестве.
Если ч/б пдф, изготовленный электронным способом, перегонять в djvu,
имеет место увеличение размера раза в два, редко более. Зато файл
открывается не в разы, а на порядок быстрее. Особенно это заметно на
научных статьях. Что касается качества, то здесь можно поспорить. Что
касается глаз, так от djvu они меньше устают.


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] [JT] ps (pdf) to djvu
  2006-04-06 14:55   ` spider
@ 2006-04-09 13:19     ` Andrei Lomov
  2006-04-09 13:49       ` some_x
  0 siblings, 1 reply; 10+ messages in thread
From: Andrei Lomov @ 2006-04-09 13:19 UTC (permalink / raw)
  To: community

spider wrote:

> касается глаз, так от djvu они меньше устают.

Да, acroread подтормаживает на celeron 1100,
изображение обновляется рывками, глаза невольно напрягаются.

-- 
Всего доброго,
А.Л.




^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] [JT] ps (pdf) to djvu
  2006-04-09 13:19     ` Andrei Lomov
@ 2006-04-09 13:49       ` some_x
  0 siblings, 0 replies; 10+ messages in thread
From: some_x @ 2006-04-09 13:49 UTC (permalink / raw)
  To: lhome, ALT Linux Community

Andrei Lomov wrote:

>spider wrote:
>
>  
>
>>касается глаз, так от djvu они меньше устают.
>>    
>>
>
>Да, acroread подтормаживает на celeron 1100,
>изображение обновляется рывками, глаза невольно напрягаются.
>
>  
>
да и на athlon 2200+ такая же история, журналы(состоящие в основном из 
картинок) вобще смотреть не возможно.


^ permalink raw reply	[flat|nested] 10+ messages in thread

end of thread, other threads:[~2006-04-09 13:49 UTC | newest]

Thread overview: 10+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2006-04-03 14:52 [Comm] ps (pdf) to djvu Andrei Lomov
2006-04-03 15:01 ` [Comm] [JT] " Alexei V. Mezin
2006-04-03 15:53   ` Alexej Kryukov
2006-04-03 17:29   ` some_x
2006-04-03 18:03   ` Gleb Kulikov
2006-04-06 14:55   ` spider
2006-04-09 13:19     ` Andrei Lomov
2006-04-09 13:49       ` some_x
2006-04-03 17:57 ` [Comm] " Gleb Kulikov
2006-04-06 14:41 ` spider

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git