From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: X-Spam-Checker-Version: SpamAssassin 3.2.5 (2008-06-10) on sa.int.altlinux.org X-Spam-Level: X-Spam-Status: No, score=-0.4 required=5.0 tests=BAYES_00, DNS_FROM_OPENWHOIS, SPF_PASS,URIBL_RHS_DOB autolearn=no version=3.2.5 DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=yandex.ru; s=mail; t=1291526399; bh=QaCmKF1WmjLK31iOVY3hndvJdd+cfyV6ONPhKWtlovc=; h=Message-ID:Date:From:MIME-Version:To:Subject:References: In-Reply-To:Content-Type:Content-Transfer-Encoding; b=w42HZhABmDprlEJmnFhEDN4/jwZgq5KcocYmeaMoF+XtOMnjrrzt+UzAlS+mtf/Ty 5bZ3zJIgRN4haq0Kgo2hKKx2E6/fcWu8l4mpU+H7T/IlB3OFe5QVTSQgR2CJtsZGIZ RRPV9UB3ywtGLGqMwJ38mWuSv08988G+Pj4Iy4Hc= Message-ID: <4CFB20FE.3020008@yandex.ru> Date: Sun, 05 Dec 2010 07:19:58 +0200 From: Speccyfighter User-Agent: Mozilla/5.0 (X11; U; Linux i686; ru; rv:1.9.2.12) Gecko/20101027 Thunderbird/3.1.6 MIME-Version: 1.0 To: community@lists.altlinux.org References: In-Reply-To: Content-Type: text/plain; charset=KOI8-R; format=flowed Content-Transfer-Encoding: 8bit Subject: Re: [Comm] =?koi8-r?b?c2FuZSArINLB09DP2s7B18HOycU=?= X-BeenThere: community@lists.altlinux.org X-Mailman-Version: 2.1.12 Precedence: list Reply-To: ALT Linux Community general discussions List-Id: ALT Linux Community general discussions List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Sun, 05 Dec 2010 05:20:06 -0000 Archived-At: List-Archive: List-Post: 04.12.2010 19:35, Andrey Liakhovets пишет: > ALT Linux 5.0.1 Master, текущий p5. > > Попробовал вместо gocr вызывать cuneiform из sane. > В настройках sane прописал: > команда для распознавания -- cuneiform > параметр для вых. файла -- -o > (и стёр параметр -i для входного файла). > > В результате выходного файла нет. > > При этом cuneiform -o out.txt in.jpg нормально работает. > Попробовать так? $ scanimage --resolution 300 -t 10 -l 20 -x 180 -y 170 -p --format=tiff > img2.tiff $ t, l - отступы x, y - размер сканируемой зоны $ cuneiform -l ruseng --singlecolumn -o out.txt img2.tiff $ > Кто-нибудь уже распознавал прямо из sane? Не пробовал :) > Или рекомендуется yagf? В ней проще задавать область распознавания. > Есть ли документация на распознавалки (кроме исходников)? > (symmetrica.net смотрел, манов нет, --help они не понимают) Копипаст с http://habrahabr.ru/blogs/linux/95479/ (тут подсмотрел опцию singlecolumn) [quote] Запускать можно со следующими аргрументами: |-l| Указывает язык документа. Из возможных: eng(по умолчанию) ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slo lav lit est tur. |-o| Сохраняет в файл. |-f| Формат полученного текста. Из поддерживаемых: text(по умолчанию), html, rtf, smarttext(plain text with TeX paragraphs), hocr(hOCR HTML format), native(Cuneiform 2000 format) |--dotmatrix| Оптимизация работы скрипта под изображение, распечатанное с помощью матричного принтера. |--fax| Оптимизация работы скрипта под изображение, распечатанное с помощью факса. |--singlecolumn| Отключает анализ страницы и подразумевает, что у нас изображение состоит из одной колонки текста. Пример использования: |cuneiform -l ruseng -o /our/dir/text.txt /our/dir/book_1.tif| [/quote] Ещё есть способы выдирания параметров: $ cuneiform Cuneiform for Linux 1.0.0 Usage: cuneiform [-l languagename -f format --dotmatrix --fax -o result_file] imagefile $ cuneiform -l Cuneiform for Linux 1.0.0 Supported languages: eng ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slo lav lit est tur. $ cuneiform -f Cuneiform for Linux 1.0.0 Supported formats: html HTML format hocr hOCR HTML format native Cuneiform 2000 format rtf RTF format smarttext plain text with TeX paragraphs text plain text