From: Speccyfighter <zxwarior@yandex.ru> To: community@lists.altlinux.org Subject: Re: [Comm] Как у нас обстоят дела с распознаванием текста? Date: Fri, 08 Jul 2011 10:45:51 +0300 Message-ID: <4E16B5AF.8030708@yandex.ru> (raw) In-Reply-To: <58415.194.44.242.194.1310109540.metamail@webmail.meta.ua> 08.07.2011 10:19, Olexander Chernetskyy пишет: > Жду советов. Запросто! > Возникла необходимость распознавать текст. > Сизиф на запрос ocr сказал: > cuneiform, cuneiform-qt, ocrad, yagf > Вижу, что самое свежее - cuneiform+yagf > Какие еще есть решения? > Кто чем и насколько успешно пользуется? > Поделитесь, пожалуйста, опытом. По-нужде надо было распознать газетный текст. Довольно объемный. yagf - это лучшее что есть в опенсорс. Распознаёт выделенные участки текста. cuneiform-qt - нет. Распознавалка очень чувствительна к вертикальной ориентации текста. Без GIMP'а ну никак не обойтись. Много надо делать правок после распознавания. Нужен механизм коррекции распознавания и занесения символа(ов) в базу. Чего нет (или не увидел?). С экранным текстом вероятно получше будет. Но положа руку на сердце, если задача часто используемая, я бы всё-таки FineReader попользовал. А раз-два в год текст надо распознавать. Довольно много. :) Когда-то давно пользовался им, Ридером, через wine. Не сохраняет форматирования. Нет интеграции с приложениями, - оно и понятно. Но задачу свою выполняет, а klipper никто не отменял. Может кто-то ещё опытом поделится?
next prev parent reply other threads:[~2011-07-08 7:45 UTC|newest] Thread overview: 5+ messages / expand[flat|nested] mbox.gz Atom feed top 2011-07-08 7:19 Olexander Chernetskyy 2011-07-08 7:45 ` Speccyfighter [this message] 2011-07-08 19:21 ` Olexander Chernetskyy 2011-07-08 21:42 ` Aleksey Novodvorsky 2011-07-09 14:45 ` Olexander Chernetskyy
Reply instructions: You may reply publicly to this message via plain-text email using any one of the following methods: * Save the following mbox file, import it into your mail client, and reply-to-all from there: mbox Avoid top-posting and favor interleaved quoting: https://en.wikipedia.org/wiki/Posting_style#Interleaved_style * Reply using the --to, --cc, and --in-reply-to switches of git-send-email(1): git send-email \ --in-reply-to=4E16B5AF.8030708@yandex.ru \ --to=zxwarior@yandex.ru \ --cc=community@lists.altlinux.org \ /path/to/YOUR_REPLY https://kernel.org/pub/software/scm/git/docs/git-send-email.html * If your mail client supports setting the In-Reply-To header via mailto: links, try the mailto: link
ALT Linux Community general discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 community community/ http://lore.altlinux.org/community \ mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com public-inbox-index community Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.community AGPL code for this site: git clone https://public-inbox.org/public-inbox.git