ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] sane + распознавание
@ 2010-12-04 17:35 Andrey Liakhovets
  2010-12-04 18:41 ` Константин Михайленко
  2010-12-05  5:19 ` Speccyfighter
  0 siblings, 2 replies; 3+ messages in thread
From: Andrey Liakhovets @ 2010-12-04 17:35 UTC (permalink / raw)
  To: community

ALT Linux 5.0.1 Master, текущий p5.

Попробовал вместо gocr вызывать cuneiform из sane.
В настройках sane прописал:
 команда для распознавания -- cuneiform
 параметр для вых. файла -- -o
(и стёр параметр -i для входного файла).

В результате выходного файла нет.

При этом cuneiform -o out.txt in.jpg нормально работает.

Кто-нибудь уже распознавал прямо из sane?
Или рекомендуется yagf?

Есть ли документация на распознавалки (кроме исходников)?
(symmetrica.net смотрел, манов нет, --help они не понимают)

Андрей Ляховец


^ permalink raw reply	[flat|nested] 3+ messages in thread

* Re: [Comm] sane + распознавание
  2010-12-04 17:35 [Comm] sane + распознавание Andrey Liakhovets
@ 2010-12-04 18:41 ` Константин Михайленко
  2010-12-05  5:19 ` Speccyfighter
  1 sibling, 0 replies; 3+ messages in thread
From: Константин Михайленко @ 2010-12-04 18:41 UTC (permalink / raw)
  To: ALT Linux Community general discussions

> Или рекомендуется yagf?

^ permalink raw reply	[flat|nested] 3+ messages in thread

* Re: [Comm] sane + распознавание
  2010-12-04 17:35 [Comm] sane + распознавание Andrey Liakhovets
  2010-12-04 18:41 ` Константин Михайленко
@ 2010-12-05  5:19 ` Speccyfighter
  1 sibling, 0 replies; 3+ messages in thread
From: Speccyfighter @ 2010-12-05  5:19 UTC (permalink / raw)
  To: community

04.12.2010 19:35, Andrey Liakhovets пишет:
> ALT Linux 5.0.1 Master, текущий p5.
>
> Попробовал вместо gocr вызывать cuneiform из sane.
> В настройках sane прописал:
>   команда для распознавания -- cuneiform
>   параметр для вых. файла -- -o
> (и стёр параметр -i для входного файла).
>
> В результате выходного файла нет.
>
> При этом cuneiform -o out.txt in.jpg нормально работает.
>
Попробовать так?
$ scanimage --resolution 300 -t 10 -l 20 -x 180 -y 170 -p --format=tiff 
 > img2.tiff
$
t, l - отступы
x, y - размер сканируемой зоны

$ cuneiform -l ruseng --singlecolumn -o out.txt img2.tiff
$

> Кто-нибудь уже распознавал прямо из sane?
Не пробовал :)

> Или рекомендуется yagf?
В ней проще задавать область распознавания.

> Есть ли документация на распознавалки (кроме исходников)?
> (symmetrica.net смотрел, манов нет, --help они не понимают)
Копипаст с http://habrahabr.ru/blogs/linux/95479/
(тут подсмотрел опцию singlecolumn)

[quote]
Запускать можно со следующими аргрументами:

|-l|
Указывает язык документа. Из возможных: eng(по умолчанию)
ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul
slo lav lit est tur.

|-o|
Сохраняет в файл.

|-f|
Формат полученного текста. Из поддерживаемых: text(по умолчанию),
html, rtf, smarttext(plain text with TeX paragraphs), hocr(hOCR HTML 
format),
native(Cuneiform 2000 format)

|--dotmatrix|
Оптимизация работы скрипта под изображение, распечатанное с помощью 
матричного принтера.

|--fax|
Оптимизация работы скрипта под изображение, распечатанное с помощью факса.

|--singlecolumn|
Отключает анализ страницы и подразумевает, что у нас изображение состоит 
из одной колонки текста.

Пример использования:
|cuneiform -l ruseng -o /our/dir/text.txt /our/dir/book_1.tif|
[/quote]

Ещё есть способы выдирания параметров:
$ cuneiform
Cuneiform for Linux 1.0.0
Usage: cuneiform [-l languagename -f format --dotmatrix --fax -o 
result_file] imagefile

$ cuneiform -l
Cuneiform for Linux 1.0.0
Supported languages: eng ger fra rus swe spa ita ruseng ukr srp hrv pol 
dan por dut cze rum hun bul slo lav lit est tur.

$ cuneiform -f
Cuneiform for Linux 1.0.0
Supported formats:
     html         HTML format
     hocr         hOCR HTML format
     native       Cuneiform 2000 format
     rtf          RTF format
     smarttext    plain text with TeX paragraphs
     text         plain text



^ permalink raw reply	[flat|nested] 3+ messages in thread

end of thread, other threads:[~2010-12-05  5:19 UTC | newest]

Thread overview: 3+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2010-12-04 17:35 [Comm] sane + распознавание Andrey Liakhovets
2010-12-04 18:41 ` Константин Михайленко
2010-12-05  5:19 ` Speccyfighter

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git