From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Date: Thu, 5 Jun 2003 20:19:27 +0300 (EEST) From: yuk@iceb.vinnitsa.com X-X-Sender: yuk@iceb.home.int To: community@altlinux.ru Subject: Re: [Comm] FineReader In-Reply-To: <20030605190536.4121833d.br@gin.ru> Message-ID: References: <3EDB56F8.9060406@iop.kiev.ua> <3EDB7A67.7090305@svitonline.com> <20030603111858.677b489a.avp@altlinux.ru> <3EDC81EA.8060400@svitonline.com> <20030603154143.6970d83f.avp@altlinux.ru> <20030604155827.12749d1b.br@gin.ru> <20030605101821.0624deb7.br@gin.ru> <20030605190536.4121833d.br@gin.ru> MIME-Version: 1.0 Content-Type: TEXT/PLAIN; charset=koi8-u Content-Transfer-Encoding: 8BIT Sender: community-admin@altlinux.ru Errors-To: community-admin@altlinux.ru X-BeenThere: community@altlinux.ru X-Mailman-Version: 2.0.9 Precedence: bulk Reply-To: community@altlinux.ru List-Unsubscribe: , List-Id: List-Post: List-Help: List-Subscribe: , List-Archive: Archived-At: List-Archive: List-Post: В Чтв, 5 Июн 2003, [KOI8-R] Борис Ревякин написал(а): БР> А в чем процесс обучения заключается? Сканируете страницу текста. Подсовываете OCR. Он, естественно, ни одной буквы не знает. По очереди мышкой нажимается на каждую букву на изображении, на клавиатуре - на соответствующую клавишу. (Кажется, были проблемы с вводом кириллицы, решенные с помощью xruskb). Процесс повторяется до тех пор, пока не начнет узнавать каждую букву. В результате создается файл-словарь, который потом надо подключать. БР> Да, и как он буквы "Ы", "Ю", "Й" понимал после обучения, БР> нормально? Были проблемы с буквами, состоящими из более чем одного контура (ё,ы,й, некоторые украинские). Решение описано в документации, я уже не помню нюансов. Ну и в корку валился периодически довольно часто. -- Yura Kalinichenko