From mboxrd@z Thu Jan  1 00:00:00 1970
Return-Path: <zxwarior@yandex.ru>
X-Spam-Checker-Version: SpamAssassin 3.2.5 (2008-06-10) on sa.int.altlinux.org
X-Spam-Level: *
X-Spam-Status: No, score=1.1 required=5.0 tests=BAYES_50,DNS_FROM_OPENWHOIS,
	SPF_PASS autolearn=no version=3.2.5
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=yandex.ru; s=mail;
	t=1310111152; bh=/KPpHZ+Pzl4Nwb5ieHtM62Sly+17xlXNy3w3LJUqTY0=;
	h=Message-ID:Date:From:MIME-Version:To:Subject:References:
	In-Reply-To:Content-Type:Content-Transfer-Encoding;
	b=II6w3kb3SNb7bBnfmLysCOGWK/6lzcsfzbhZzzAHc3/KS7qoe2ka+ipK9Y3i06mHU
	UpzC021Ds0OrN5OXzwny8ZksOJEsxDHBB3HtgzI6Tl2aE2f5bWk2+4/TOLsQbiaUDg
	Z5jWZ45JTdKHFdrePriJSj/AIM8jKm6fkftDK2EY=
Message-ID: <4E16B5AF.8030708@yandex.ru>
Date: Fri, 08 Jul 2011 10:45:51 +0300
From: Speccyfighter <zxwarior@yandex.ru>
User-Agent: Mozilla/5.0 (X11; U; Linux i686; ru;
	rv:1.9.2.13) Gecko/20101207 Thunderbird/3.1.7
MIME-Version: 1.0
To: community@lists.altlinux.org
References: <58415.194.44.242.194.1310109540.metamail@webmail.meta.ua>
In-Reply-To: <58415.194.44.242.194.1310109540.metamail@webmail.meta.ua>
Content-Type: text/plain; charset=KOI8-R; format=flowed
Content-Transfer-Encoding: 8bit
X-Yandex-Spam: 1
Subject: Re: [Comm] =?koi8-r?b?68HLINUgzsHTIM/C09TP0dQgxMXMwSDTINLB09DP2s7B?=
 =?koi8-r?b?18HOycXNINTFy9PUwT8=?=
X-BeenThere: community@lists.altlinux.org
X-Mailman-Version: 2.1.12
Precedence: list
Reply-To: ALT Linux Community general discussions
	<community@lists.altlinux.org>
List-Id: ALT Linux Community general discussions <community.lists.altlinux.org>
List-Unsubscribe: <https://lists.altlinux.org/mailman/options/community>,
	<mailto:community-request@lists.altlinux.org?subject=unsubscribe>
List-Archive: <http://lists.altlinux.org/pipermail/community>
List-Post: <mailto:community@lists.altlinux.org>
List-Help: <mailto:community-request@lists.altlinux.org?subject=help>
List-Subscribe: <https://lists.altlinux.org/mailman/listinfo/community>,
	<mailto:community-request@lists.altlinux.org?subject=subscribe>
X-List-Received-Date: Fri, 08 Jul 2011 07:45:57 -0000
Archived-At: <http://lore.altlinux.org/community/4E16B5AF.8030708@yandex.ru/>
List-Archive: <http://lore.altlinux.org/community/>
List-Post: <mailto:mandrake-russian@linuxteam.iplabs.ru>

08.07.2011 10:19, Olexander Chernetskyy пишет:

>  Жду советов.

Запросто!

>  Возникла необходимость распознавать текст.

 > Сизиф на запрос ocr сказал:
 > cuneiform, cuneiform-qt, ocrad, yagf
 > Вижу, что самое свежее - cuneiform+yagf

 > Какие еще есть решения?
 > Кто чем и насколько успешно пользуется?
 > Поделитесь, пожалуйста, опытом.

По-нужде надо было распознать газетный текст. Довольно объемный.
yagf - это лучшее что есть в опенсорс.
Распознаёт выделенные участки текста.
cuneiform-qt - нет.
Распознавалка очень чувствительна к вертикальной ориентации текста.
Без GIMP'а ну никак не обойтись.
Много надо делать правок после распознавания.
Нужен механизм коррекции распознавания и занесения символа(ов) в базу. Чего нет (или не увидел?).
С экранным текстом вероятно получше будет.
Но положа руку на сердце, если задача часто используемая, я бы всё-таки FineReader
попользовал.
А раз-два в год текст надо распознавать. Довольно много. :)
Когда-то давно пользовался им, Ридером, через wine.
Не сохраняет форматирования. Нет интеграции с приложениями, - оно и понятно.
Но задачу свою выполняет, а klipper никто не отменял.

Может кто-то ещё опытом поделится?