ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] очистка сканов для DJVU
@ 2009-03-09 15:41 Aleksander Gorohovski
  2009-03-09 17:01 ` Sergey Vlasov
  2009-03-10  8:01 ` Gleb Kulikov
  0 siblings, 2 replies; 10+ messages in thread
From: Aleksander Gorohovski @ 2009-03-09 15:41 UTC (permalink / raw)
  To: community

Уважаемое сообщество,
Доброго времени суток!


Подскажите есть ли программа, с помощью которой можно
"подчистить" сканы (в формате TIFF) в пакетном режиме?
для последующего конвертирования в DJVU

Нашел
unpaper - post-processing scanned and photocopied book pages
http://unpaper.berlios.de/#examples

но, к сожалению, она работает с форматами файлов
pbm | pgm

Спасибо.


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] очистка сканов для DJVU
  2009-03-09 15:41 [Comm] очистка сканов для DJVU Aleksander Gorohovski
@ 2009-03-09 17:01 ` Sergey Vlasov
  2009-03-09 17:19   ` Aleksander Gorohovski
  2009-03-10  8:01 ` Gleb Kulikov
  1 sibling, 1 reply; 10+ messages in thread
From: Sergey Vlasov @ 2009-03-09 17:01 UTC (permalink / raw)
  To: community

[-- Attachment #1: Type: text/plain, Size: 590 bytes --]

On Mon, Mar 09, 2009 at 05:41:14PM +0200, Aleksander Gorohovski wrote:
> Подскажите есть ли программа, с помощью 
> которой можно
> "подчистить" сканы (в формате TIFF) в 
> пакетном режиме?
> для последующего конвертирования в DJVU
> 
> Нашел
> unpaper - post-processing scanned and photocopied book pages
> http://unpaper.berlios.de/#examples
> 
> но, к сожалению, она работает с форматами 
> файлов
> pbm | pgm

Так преобразуйте файлы в поддерживаемый формат с помощью tifftopnm
(пакет netpbm) или convert (пакет ImageMagick) - это даже написано в
документации unpaper.

[-- Attachment #2: Digital signature --]
[-- Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] очистка сканов для DJVU
  2009-03-09 17:01 ` Sergey Vlasov
@ 2009-03-09 17:19   ` Aleksander Gorohovski
  2009-03-09 19:34     ` Sergey Vlasov
  0 siblings, 1 reply; 10+ messages in thread
From: Aleksander Gorohovski @ 2009-03-09 17:19 UTC (permalink / raw)
  To: ALT Linux Community general discussions

On Mon, 09 Mar 2009 19:01:06 +0200, Sergey Vlasov wrote:

> On Mon, Mar 09, 2009 at 05:41:14PM +0200, Aleksander Gorohovski wrote:
>> Подскажите есть ли программа, с помощью
>> которой можно
>> "подчистить" сканы (в формате TIFF) в
>> пакетном режиме?
>> для последующего конвертирования в DJVU
>>
>> Нашел
>> unpaper - post-processing scanned and photocopied book pages
>> http://unpaper.berlios.de/#examples
>>
>> но, к сожалению, она работает с форматами
>> файлов
>> pbm | pgm
>
> Так преобразуйте файлы в поддерживаемый формат с помощью tifftopnm
> (пакет netpbm) или convert (пакет ImageMagick) - это даже написано в
> документации unpaper.

Премного благодарен.
Чес.слово читал доку, но наверное  плохо читал.

Одного не пойму почему автор выбрал эти форматы?
Ведь при преобразованиях туда обратно (из tiff а затем опять в tiff) может  
качество пострадать.


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] очистка сканов для DJVU
  2009-03-09 17:19   ` Aleksander Gorohovski
@ 2009-03-09 19:34     ` Sergey Vlasov
  2009-03-09 19:43       ` Aleksander Gorohovski
  0 siblings, 1 reply; 10+ messages in thread
From: Sergey Vlasov @ 2009-03-09 19:34 UTC (permalink / raw)
  To: community

[-- Attachment #1: Type: text/plain, Size: 590 bytes --]

On Mon, Mar 09, 2009 at 07:19:06PM +0200, Aleksander Gorohovski wrote:
> Одного не пойму почему автор выбрал эти форматы?

Скорее всего, из-за их крайней простоты для чтения и записи без
использования дополнительных библиотек.

> Ведь при преобразованиях туда обратно (из tiff а затем опять в
> tiff) может качество пострадать.

Если в TIFF используется сжатие без потерь - не пострадает (хотя
любая дополнительная информация, кроме собственно пикселей
изображения, потеряется - например, разрешение при последующем
преобразовании в другой формат придётся указывать отдельно).

[-- Attachment #2: Digital signature --]
[-- Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] очистка сканов для DJVU
  2009-03-09 19:34     ` Sergey Vlasov
@ 2009-03-09 19:43       ` Aleksander Gorohovski
  2009-03-10  7:00         ` Anton Farygin
  0 siblings, 1 reply; 10+ messages in thread
From: Aleksander Gorohovski @ 2009-03-09 19:43 UTC (permalink / raw)
  To: ALT Linux Community general discussions

On Mon, 09 Mar 2009 21:34:00 +0200, Sergey Vlasov wrote:

> On Mon, Mar 09, 2009 at 07:19:06PM +0200, Aleksander Gorohovski wrote:
>> Одного не пойму почему автор выбрал эти форматы?
>
> Скорее всего, из-за их крайней простоты для чтения и записи без
> использования дополнительных библиотек.
>
>> Ведь при преобразованиях туда обратно (из tiff а затем опять в
>> tiff) может качество пострадать.
>
> Если в TIFF используется сжатие без потерь - не пострадает (хотя
> любая дополнительная информация, кроме собственно пикселей
> изображения, потеряется - например, разрешение при последующем
> преобразовании в другой формат придётся указывать отдельно).

unpaper
потестировал

В целом оказался довольно хороший, полезный инструмент.

Правда пока так и не понял как можно задать срезку слишком широких
полей у сканов
?

p.s.
Хорошо бы unpaper добавить в ALT (в 4.1 не оказалось)


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] очистка сканов для DJVU
  2009-03-09 19:43       ` Aleksander Gorohovski
@ 2009-03-10  7:00         ` Anton Farygin
  2009-03-10  8:52           ` Aleksander N. Gorohovski
  0 siblings, 1 reply; 10+ messages in thread
From: Anton Farygin @ 2009-03-10  7:00 UTC (permalink / raw)
  To: community

Aleksander Gorohovski пишет:
> On Mon, 09 Mar 2009 21:34:00 +0200, Sergey Vlasov wrote:
> 
>> On Mon, Mar 09, 2009 at 07:19:06PM +0200, Aleksander Gorohovski wrote:
>>> Одного не пойму почему автор выбрал эти форматы?
>>
>> Скорее всего, из-за их крайней простоты для чтения и записи без
>> использования дополнительных библиотек.
>>
>>> Ведь при преобразованиях туда обратно (из tiff а затем опять в
>>> tiff) может качество пострадать.
>>
>> Если в TIFF используется сжатие без потерь - не пострадает (хотя
>> любая дополнительная информация, кроме собственно пикселей
>> изображения, потеряется - например, разрешение при последующем
>> преобразовании в другой формат придётся указывать отдельно).
> 
> unpaper
> потестировал
> 
> В целом оказался довольно хороший, полезный инструмент.
> 
> Правда пока так и не понял как можно задать срезку слишком широких
> полей у сканов
> ?

делал буквально вчера, идея примерно такова:

for i in sicp-000???.pbm;do convert -crop 850x1250+170+120 $i crop-$i;done

параметры для crop подбираются экспериментальным путём, на одной картинке.

что бы не мучать документацией: 850x1250 - это размер после crop'а, 
+170+120 - координаты верхнего левого угла.



^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] очистка сканов для DJVU
  2009-03-09 15:41 [Comm] очистка сканов для DJVU Aleksander Gorohovski
  2009-03-09 17:01 ` Sergey Vlasov
@ 2009-03-10  8:01 ` Gleb Kulikov
  2009-03-10  8:42   ` Aleksander N. Gorohovski
  1 sibling, 1 reply; 10+ messages in thread
From: Gleb Kulikov @ 2009-03-10  8:01 UTC (permalink / raw)
  To: ALT Linux Community general discussions

In message [Понедельник 09 марта 2009] from Aleksander Gorohovski was written:
> Уважаемое сообщество,
> Доброго времени суток!
>
>
> Подскажите есть ли программа, с помощью которой можно
> "подчистить" сканы (в формате TIFF) в пакетном режиме?
> для последующего конвертирования в DJVU
>
> Нашел
> unpaper - post-processing scanned and photocopied book pages

посмотри это (сорри, цитата из моего письма, некогда):

================================================
PS: you may be interesting to see "unpaper" utility aimed to process scanned 
images (http://download.berlios.de/unpaper/unpaper-bin-0.3.tar.gz)

You may be interesting also in "Scan Tailor" 
(https://nova-forum.com/topic.cgi?forum=5&topic=27424&start=200), site of the 
Project: http://scantailor.sourceforge.net/

PPS: there is an very an very clever scan preparation software, "Scan 
Kromsator" by bolega@hotmail.ru (freeware for Windows, but closed source, as 
far as i know). It's started on Linux using Wine. It's may be very usefull to 
contact the author and simply take the rights :) 

What about me, i'm prefer DJVU and i'm ceating multipage DJVU documents by 
simple homemade script: 1) i'm scanning documents by "xsane": it can 
autonumber resulting files, then 2) i'm running simple selfwritten script in 
the directory where scanned files resides.
So 1 hour is enough to produce circa of 200 pages (with HP Photosmart C3183 
combined printer-scanner) in bundled DJVU.

If you are interesting, i'll send you my script.

Probably, there are some another scanner front-ends, i need some time to 
remember/find where there are.
================================================

PS: интересно, кстати, а почему это у нас gscan2pdf не делает djvu?


-- 
      Салют, /GLeb

UIN: 15341920
jabber://gleb@asd.iao.ru
sip://2387245@sipnet.ru			(telephony)
skype://gleb_kulikov.tomsk		(telephony)
sip://20000204@sip.pctel.ru		(telephony)
netmail: 2:5005/78


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] очистка сканов для DJVU
  2009-03-10  8:01 ` Gleb Kulikov
@ 2009-03-10  8:42   ` Aleksander N. Gorohovski
  2009-03-11  9:26     ` Eugene Ostapets
  0 siblings, 1 reply; 10+ messages in thread
From: Aleksander N. Gorohovski @ 2009-03-10  8:42 UTC (permalink / raw)
  To: ALT Linux Community general discussions

On Tue, 10 Mar 2009 10:01:44 +0200, Gleb Kulikov  wrote:

> In message [Понедельник 09 марта 2009] from Aleksander Gorohovski was  
> written:
>> Уважаемое сообщество,
>> Доброго времени суток!
>>
>>
>> Подскажите есть ли программа, с помощью которой можно
>> "подчистить" сканы (в формате TIFF) в пакетном режиме?
>> для последующего конвертирования в DJVU
>>
>> Нашел
>> unpaper - post-processing scanned and photocopied book pages
>
> посмотри это (сорри, цитата из моего письма, некогда):

Премного благодарен.
Посмотрел, но собранного Scan Tailor под *nix пока нет,
да и нужено мне не один скан подчистить а в пакете из нескольких сотен...
т.е. нужен консольный вариант а не GUI.

> ================================================
> PS: you may be interesting to see "unpaper" utility aimed to process  
> scanned
> images (http://download.berlios.de/unpaper/unpaper-bin-0.3.tar.gz)
>
> You may be interesting also in "Scan Tailor"
> (https://nova-forum.com/topic.cgi?forum=5&topic=27424&start=200), site  
> of the
> Project: http://scantailor.sourceforge.net/
>
> PPS: there is an very an very clever scan preparation software, "Scan
> Kromsator" by bolega@hotmail.ru (freeware for Windows, but closed  
> source, as
> far as i know). It's started on Linux using Wine. It's may be very  
> usefull to
> contact the author and simply take the rights :)
>
> What about me, i'm prefer DJVU and i'm ceating multipage DJVU documents  
> by
> simple homemade script: 1) i'm scanning documents by "xsane": it can
> autonumber resulting files, then 2) i'm running simple selfwritten  
> script in
> the directory where scanned files resides.
> So 1 hour is enough to produce circa of 200 pages (with HP Photosmart  
> C3183
> combined printer-scanner) in bundled DJVU.
>
> If you are interesting, i'll send you my script.
>
> Probably, there are some another scanner front-ends, i need some time to
> remember/find where there are.
> ================================================
>
> PS: интересно, кстати, а почему это у нас gscan2pdf не делает djvu?


^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] очистка сканов для DJVU
  2009-03-10  7:00         ` Anton Farygin
@ 2009-03-10  8:52           ` Aleksander N. Gorohovski
  0 siblings, 0 replies; 10+ messages in thread
From: Aleksander N. Gorohovski @ 2009-03-10  8:52 UTC (permalink / raw)
  To: ALT Linux Community general discussions

On Tue, 10 Mar 2009 09:00:52 +0200, Anton Farygin wrote:

> Aleksander Gorohovski пишет:
>> On Mon, 09 Mar 2009 21:34:00 +0200, Sergey Vlasov wrote:
>>
>>> On Mon, Mar 09, 2009 at 07:19:06PM +0200, Aleksander Gorohovski wrote:
>>>> Одного не пойму почему автор выбрал эти форматы?
>>>
>>> Скорее всего, из-за их крайней простоты для чтения и записи без
>>> использования дополнительных библиотек.
>>>
>>>> Ведь при преобразованиях туда обратно (из tiff а затем опять в
>>>> tiff) может качество пострадать.
>>>
>>> Если в TIFF используется сжатие без потерь - не пострадает (хотя
>>> любая дополнительная информация, кроме собственно пикселей
>>> изображения, потеряется - например, разрешение при последующем
>>> преобразовании в другой формат придётся указывать отдельно).
>>  unpaper
>> потестировал
>>  В целом оказался довольно хороший, полезный инструмент.
>>  Правда пока так и не понял как можно задать срезку слишком широких
>> полей у сканов
>> ?
>
> делал буквально вчера, идея примерно такова:
>
> for i in sicp-000???.pbm;do convert -crop 850x1250+170+120 $i  
> crop-$i;done
>
> параметры для crop подбираются экспериментальным путём, на одной  
> картинке.
>
> что бы не мучать документацией: 850x1250 - это размер после crop'а,  
> +170+120 - координаты верхнего левого угла.

Премного благодарен. Попробую.

Вчера поразбирался с unpaper
и нашел, что автор предлагает с помощью параметра -S
изменять размеры скана (т.е. фактически срезать лишние поля) и добавить по  
контуру свои.

Вообще понравилась програмка --- параметров-настроек довольно много,
есть встроеныый пакетный режим обработки.

В результате автозачисток у меня получается из
~4Mb TIFF скана -> ~50-70 кб DJVU



^ permalink raw reply	[flat|nested] 10+ messages in thread

* Re: [Comm] очистка сканов для DJVU
  2009-03-10  8:42   ` Aleksander N. Gorohovski
@ 2009-03-11  9:26     ` Eugene Ostapets
  0 siblings, 0 replies; 10+ messages in thread
From: Eugene Ostapets @ 2009-03-11  9:26 UTC (permalink / raw)
  To: ALT Linux Community general discussions

2009/3/10 Aleksander N. Gorohovski <angel feht.dgtu.donetsk.ua>:
> On Tue, 10 Mar 2009 10:01:44 +0200, Gleb Kulikov  wrote:
> Премного благодарен.
> Посмотрел, но собранного Scan Tailor под *nix пока нет,
Забавная прога, уже собрал и отправил в Сизиф:)
> да и нужено мне не один скан подчистить а в пакете из нескольких сотен...
> т.е. нужен консольный вариант а не GUI.
Насколько я просмотрел интерфейс - там расчет именно на пакетную
обработку, но с визуальным контролем...
-- 
С уважением,
Евгений Остапец
uin: 23747217
jid: eugene_ostapets@jabber.ru

^ permalink raw reply	[flat|nested] 10+ messages in thread

end of thread, other threads:[~2009-03-11  9:26 UTC | newest]

Thread overview: 10+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2009-03-09 15:41 [Comm] очистка сканов для DJVU Aleksander Gorohovski
2009-03-09 17:01 ` Sergey Vlasov
2009-03-09 17:19   ` Aleksander Gorohovski
2009-03-09 19:34     ` Sergey Vlasov
2009-03-09 19:43       ` Aleksander Gorohovski
2009-03-10  7:00         ` Anton Farygin
2009-03-10  8:52           ` Aleksander N. Gorohovski
2009-03-10  8:01 ` Gleb Kulikov
2009-03-10  8:42   ` Aleksander N. Gorohovski
2009-03-11  9:26     ` Eugene Ostapets

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git