* [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
@ 2001-05-22 10:49 ` Диконов Вячеслав
2001-05-22 11:33 ` cornet
` (2 more replies)
0 siblings, 3 replies; 6+ messages in thread
From: Диконов Вячеслав @ 2001-05-22 10:49 UTC (permalink / raw)
To: mandrake-russian
> Date: Sun, 20 May 2001 20:02:06 +0400
> From: Aleksey Novodvorsky <aen@logic.ru>
> Organization: Institute for logic
> To: mandrake-russian@altlinux.ru
> Subject: [mdk-re] Re: [mdk-re]
>
=?koi8-r?Q?=F2=C1=D3=D0=CF=DA=CE=CF=D7=C1=CE=C9=C5=20=D4=C5=CB=D3=D4=C1?=,
> =?koi8-r?Q?=DE=C5=CD=3F?=
> Reply-To: mandrake-russian@altlinux.ru
>
> cornet wrote:
>
> > Hello, всем!
> >
> > Господа, а не подскажет ли кто, какая есть на свете софтина приличного
> > качества, предназначенная для распознавания аглицкого текста из
> > сканированых изображений?
> >
> > Желательно что бы понимала изображения в формате TIFF и колонки текста.
> > Софтина, разумеется, нужна под Линух, желательно, что бы из шелла
> > скриптовалась на множественную обработку кучи файлов.
>
> Приличная есть только коммерческая. Увы, забыл название.
>
> Rgrds, AEN
Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
не работает так как распознавать текст без сетевой карты (спасибо защите)
низзя. Стоит $800, русский не понимает, но обучаема... Может быть возможно
натренировать. Кто ее сломает и выпустит будет герой! И я ему все сделаю
что бы разломанную и работающую заполучить. А может запинать всем
сообществом AABBYYшников? FineReader то наш круче в 10 раз.
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
2001-05-22 10:49 ` [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs Диконов Вячеслав
@ 2001-05-22 11:33 ` cornet
2001-05-22 19:22 ` cornet
2001-05-22 11:44 ` Mikhail Zabaluev
2001-05-25 21:40 ` Michael Shigorin
2 siblings, 1 reply; 6+ messages in thread
From: cornet @ 2001-05-22 11:33 UTC (permalink / raw)
To: mandrake-russian
Диконов Вячеслав wrote:
>
> > Date: Sun, 20 May 2001 20:02:06 +0400
> > From: Aleksey Novodvorsky <aen@logic.ru>
> > Organization: Institute for logic
> > To: mandrake-russian@altlinux.ru
> > Subject: [mdk-re] Re: [mdk-re]
> >
> =?koi8-r?Q?=F2=C1=D3=D0=CF=DA=CE=CF=D7=C1=CE=C9=C5=20=D4=C5=CB=D3=D4=C1?=,
> > =?koi8-r?Q?=DE=C5=CD=3F?=
> > Reply-To: mandrake-russian@altlinux.ru
> >
> > cornet wrote:
> >
> > > Hello, всем!
> > >
> > > Господа, а не подскажет ли кто, какая есть на свете софтина приличного
> > > качества, предназначенная для распознавания аглицкого текста из
> > > сканированых изображений?
> > >
> > > Желательно что бы понимала изображения в формате TIFF и колонки текста.
> > > Софтина, разумеется, нужна под Линух, желательно, что бы из шелла
> > > скриптовалась на множественную обработку кучи файлов.
> >
> > Приличная есть только коммерческая. Увы, забыл название.
> >
> > Rgrds, AEN
>
> Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
> не работает так как распознавать текст без сетевой карты (спасибо защите)
> низзя. Стоит $800, русский не понимает, но обучаема... Может быть возможно
> натренировать. Кто ее сломает и выпустит будет герой! И я ему все сделаю
> что бы разломанную и работающую заполучить. А может запинать всем
> сообществом AABBYYшников? FineReader то наш круче в 10 раз.
Сеньк!
Ну и здорова же она - 12М тарбол, блин!
Качаю помаленьку...
--
******** FIRE & STEEL ********
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
2001-05-22 10:49 ` [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs Диконов Вячеслав
2001-05-22 11:33 ` cornet
@ 2001-05-22 11:44 ` Mikhail Zabaluev
2001-05-22 12:02 ` cornet
2001-05-25 21:40 ` Michael Shigorin
2 siblings, 1 reply; 6+ messages in thread
From: Mikhail Zabaluev @ 2001-05-22 11:44 UTC (permalink / raw)
To: mandrake-russian
Hello Диконов,
On Mon, May 21, 2001 at 06:43:02PM +0300, Диконов Вячеслав wrote:
>
> Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
> не работает так как распознавать текст без сетевой карты (спасибо защите)
> низзя.
Huh? У них привязка к номеру карты?
> Стоит $800, русский не понимает, но обучаема... Может быть возможно
> натренировать. Кто ее сломает и выпустит будет герой! И я ему все сделаю
> что бы разломанную и работающую заполучить. А может запинать всем
> сообществом AABBYYшников? FineReader то наш круче в 10 раз.
Можете попинать еще и моих работодателей (parascript.com). Правда, они
занимаются рукописным текстом.
--
Stay tuned,
MhZ JID: mookid@jabber.org
___________
The whole earth is in jail and we're plotting this incredible jailbreak.
-- Wavy Gravy
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
2001-05-22 11:44 ` Mikhail Zabaluev
@ 2001-05-22 12:02 ` cornet
0 siblings, 0 replies; 6+ messages in thread
From: cornet @ 2001-05-22 12:02 UTC (permalink / raw)
To: mandrake-russian
Mikhail Zabaluev wrote:
>
> Hello Диконов,
>
> On Mon, May 21, 2001 at 06:43:02PM +0300, Диконов Вячеслав wrote:
> >
> > Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
> > не работает так как распознавать текст без сетевой карты (спасибо защите)
> > низзя.
>
> Huh? У них привязка к номеру карты?
Да, версии для коммерческих Юниксов привязываются к серийному номеру
системы через uname, а линуховая версия к MAC адресу карточки.
> > Стоит $800, русский не понимает, но обучаема... Может быть возможно
> > натренировать. Кто ее сломает и выпустит будет герой! И я ему все сделаю
> > что бы разломанную и работающую заполучить. А может запинать всем
> > сообществом AABBYYшников? FineReader то наш круче в 10 раз.
>
> Можете попинать еще и моих работодателей (parascript.com). Правда, они
> занимаются рукописным текстом.
>
> --
> Stay tuned,
> MhZ JID: mookid@jabber.org
> ___________
> The whole earth is in jail and we're plotting this incredible jailbreak.
> -- Wavy Gravy
>
> _______________________________________________
> Mandrake-russian mailing list
> Mandrake-russian@altlinux.ru
> http://altlinux.ru/mailman/listinfo/mandrake-russian
--
******** FIRE & STEEL ********
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
2001-05-22 11:33 ` cornet
@ 2001-05-22 19:22 ` cornet
0 siblings, 0 replies; 6+ messages in thread
From: cornet @ 2001-05-22 19:22 UTC (permalink / raw)
To: mandrake-russian
cornet wrote:
>
> Диконов Вячеслав wrote:
> >
> > > Date: Sun, 20 May 2001 20:02:06 +0400
> > > From: Aleksey Novodvorsky <aen@logic.ru>
> > > Organization: Institute for logic
> > > To: mandrake-russian@altlinux.ru
> > > Subject: [mdk-re] Re: [mdk-re]
> > >
> > =?koi8-r?Q?=F2=C1=D3=D0=CF=DA=CE=CF=D7=C1=CE=C9=C5=20=D4=C5=CB=D3=D4=C1?=,
> > > =?koi8-r?Q?=DE=C5=CD=3F?=
> > > Reply-To: mandrake-russian@altlinux.ru
> > >
> > > cornet wrote:
> > >
> > > > Hello, всем!
> > > >
> > > > Господа, а не подскажет ли кто, какая есть на свете софтина приличного
> > > > качества, предназначенная для распознавания аглицкого текста из
> > > > сканированых изображений?
> > > >
> > > > Желательно что бы понимала изображения в формате TIFF и колонки текста.
> > > > Софтина, разумеется, нужна под Линух, желательно, что бы из шелла
> > > > скриптовалась на множественную обработку кучи файлов.
> > >
> > > Приличная есть только коммерческая. Увы, забыл название.
> > >
> > > Rgrds, AEN
> >
> > Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
> > не работает так как распознавать текст без сетевой карты (спасибо защите)
> > низзя. Стоит $800, русский не понимает, но обучаема... Может быть возможно
> > натренировать. Кто ее сломает и выпустит будет герой! И я ему все сделаю
> > что бы разломанную и работающую заполучить. А может запинать всем
> > сообществом AABBYYшников? FineReader то наш круче в 10 раз.
>
> Сеньк!
> Ну и здорова же она - 12М тарбол, блин!
> Качаю помаленьку...
Ну что же...
Скачал.
Инсталлятор симпатичный но туповатый. К тому же там создаются скрипты с
идентичным содержимым, которые детектят имя вызова и ведут себя
соответственно имени, в приличных домах это делается симлинками на один
файл, а здесь насовали кучу копий одного и того же под разными именами
:-/ суксссььь...
Сама прога - в качестве предельно простой распознавалки - пойдет, но
запрашиваемых за нее 800$ она ни в коем случае не стоит!!! Не тот
уровень.
С монохромными tiff файлами с разрешением 400х400 и текстом в них
порядка 12 пунктов справляется вполне прилично, коэффициент ошибок при
беглом просмотре результата - порядка 2%, что приятно.
Понимает колонки текста, причем да же если на странице есть несколько
рядов колонок с разным их количеством. Понимает атрибуты командной
строки, так что с консоли натравить его разом на кучу файлов можно,
атрибуты весьма богаты, практически полностью дублируют гуевое
междумордие :-)
Однако, результаты сохраняет только в txt, и хотя в пропертях есть куча
выходных форматов, от указания другого формата меняется только
расширение результирующего файла, НО не его содержимое!
Примерно на одном файле из 10 спотыкается без видимой причины, а в доках
номера error code не описаны, по этому что и из за чего происходит - не
понятно. При таких спотыканиях частенько выподает в кору, причем в ейных
логах на тему ошибок и падений нифига не оседает :-(
Опять же, система защиты - идиотская - вешает tcp демона на тачку,
который от nobody держит открытым порт не только на localhost но и на
eth0, что как то хреново и некрасиво :-/
На bmp файлах, которые создал gimp выпадает в кору.
Результат - смею рекомендовать к использованию в демо режиме на 30 дней,
как простенькую распознавалку, за неимением лучшего. Покупать ее -
выбрасывать деньги.
--
******** FIRE & STEEL ********
^ permalink raw reply [flat|nested] 6+ messages in thread
* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
2001-05-22 10:49 ` [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs Диконов Вячеслав
2001-05-22 11:33 ` cornet
2001-05-22 11:44 ` Mikhail Zabaluev
@ 2001-05-25 21:40 ` Michael Shigorin
2 siblings, 0 replies; 6+ messages in thread
From: Michael Shigorin @ 2001-05-25 21:40 UTC (permalink / raw)
To: mandrake-russian
On Mon, 21 May 2001, Диконов Вячеслав wrote:
> защите) низзя. Стоит $800, русский не понимает, но обучаема... Может
> быть возможно натренировать. Кто ее сломает и выпустит будет герой! И
Развелось героев, блин :-\
> я ему все сделаю что бы разломанную и работающую заполучить. А может
> запинать всем сообществом AABBYYшников? FineReader то наш круче в 10
> раз.
Ну так ЗАПИНАЙ или НАПИШИ (хоть с другими, см. тему).
Горе-ломастеры...
--
WBR, Michael Shigorin, webmaster of www.chem.univ.kiev.ua
>Home Page: http://visa.chem.univ.kiev.ua/~mike/ ICQ: 113344029
>Brainbench: http://www.brainbench.com/transcript.jsp?pid=2434729
^ permalink raw reply [flat|nested] 6+ messages in thread
end of thread, other threads:[~2001-05-25 21:40 UTC | newest]
Thread overview: 6+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2001-05-22 10:49 ` [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs Диконов Вячеслав
2001-05-22 11:33 ` cornet
2001-05-22 19:22 ` cornet
2001-05-22 11:44 ` Mikhail Zabaluev
2001-05-22 12:02 ` cornet
2001-05-25 21:40 ` Michael Shigorin
ALT Linux Community general discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
public-inbox-index community
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.community
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git