From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: X-Spam-Checker-Version: SpamAssassin 3.2.5 (2008-06-10) on sa.int.altlinux.org X-Spam-Level: * X-Spam-Status: No, score=1.1 required=5.0 tests=BAYES_50,DNS_FROM_OPENWHOIS, SPF_PASS autolearn=no version=3.2.5 DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=yandex.ru; s=mail; t=1310111152; bh=/KPpHZ+Pzl4Nwb5ieHtM62Sly+17xlXNy3w3LJUqTY0=; h=Message-ID:Date:From:MIME-Version:To:Subject:References: In-Reply-To:Content-Type:Content-Transfer-Encoding; b=II6w3kb3SNb7bBnfmLysCOGWK/6lzcsfzbhZzzAHc3/KS7qoe2ka+ipK9Y3i06mHU UpzC021Ds0OrN5OXzwny8ZksOJEsxDHBB3HtgzI6Tl2aE2f5bWk2+4/TOLsQbiaUDg Z5jWZ45JTdKHFdrePriJSj/AIM8jKm6fkftDK2EY= Message-ID: <4E16B5AF.8030708@yandex.ru> Date: Fri, 08 Jul 2011 10:45:51 +0300 From: Speccyfighter User-Agent: Mozilla/5.0 (X11; U; Linux i686; ru; rv:1.9.2.13) Gecko/20101207 Thunderbird/3.1.7 MIME-Version: 1.0 To: community@lists.altlinux.org References: <58415.194.44.242.194.1310109540.metamail@webmail.meta.ua> In-Reply-To: <58415.194.44.242.194.1310109540.metamail@webmail.meta.ua> Content-Type: text/plain; charset=KOI8-R; format=flowed Content-Transfer-Encoding: 8bit X-Yandex-Spam: 1 Subject: Re: [Comm] =?koi8-r?b?68HLINUgzsHTIM/C09TP0dQgxMXMwSDTINLB09DP2s7B?= =?koi8-r?b?18HOycXNINTFy9PUwT8=?= X-BeenThere: community@lists.altlinux.org X-Mailman-Version: 2.1.12 Precedence: list Reply-To: ALT Linux Community general discussions List-Id: ALT Linux Community general discussions List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Fri, 08 Jul 2011 07:45:57 -0000 Archived-At: List-Archive: List-Post: 08.07.2011 10:19, Olexander Chernetskyy пишет: > Жду советов. Запросто! > Возникла необходимость распознавать текст. > Сизиф на запрос ocr сказал: > cuneiform, cuneiform-qt, ocrad, yagf > Вижу, что самое свежее - cuneiform+yagf > Какие еще есть решения? > Кто чем и насколько успешно пользуется? > Поделитесь, пожалуйста, опытом. По-нужде надо было распознать газетный текст. Довольно объемный. yagf - это лучшее что есть в опенсорс. Распознаёт выделенные участки текста. cuneiform-qt - нет. Распознавалка очень чувствительна к вертикальной ориентации текста. Без GIMP'а ну никак не обойтись. Много надо делать правок после распознавания. Нужен механизм коррекции распознавания и занесения символа(ов) в базу. Чего нет (или не увидел?). С экранным текстом вероятно получше будет. Но положа руку на сердце, если задача часто используемая, я бы всё-таки FineReader попользовал. А раз-два в год текст надо распознавать. Довольно много. :) Когда-то давно пользовался им, Ридером, через wine. Не сохраняет форматирования. Нет интеграции с приложениями, - оно и понятно. Но задачу свою выполняет, а klipper никто не отменял. Может кто-то ещё опытом поделится?