ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
  @ 2001-05-22 10:49 ` Диконов Вячеслав
  2001-05-22 11:33   ` cornet
                     ` (2 more replies)
  0 siblings, 3 replies; 6+ messages in thread
From: Диконов Вячеслав @ 2001-05-22 10:49 UTC (permalink / raw)
  To: mandrake-russian

> Date: Sun, 20 May 2001 20:02:06 +0400
> From: Aleksey Novodvorsky <aen@logic.ru>
> Organization: Institute for logic
> To: mandrake-russian@altlinux.ru
> Subject: [mdk-re] Re: [mdk-re]
>
=?koi8-r?Q?=F2=C1=D3=D0=CF=DA=CE=CF=D7=C1=CE=C9=C5=20=D4=C5=CB=D3=D4=C1?=,
>  =?koi8-r?Q?=DE=C5=CD=3F?=
> Reply-To: mandrake-russian@altlinux.ru
>
> cornet wrote:
>
> > Hello, всем!
> >
> > Господа, а не подскажет ли кто, какая есть на свете софтина приличного
> > качества, предназначенная для распознавания аглицкого текста из
> > сканированых изображений?
> >
> > Желательно что бы понимала изображения в формате TIFF и колонки текста.
> > Софтина, разумеется, нужна под Линух, желательно, что бы из шелла
> > скриптовалась на множественную обработку кучи файлов.
>
> Приличная есть только коммерческая. Увы, забыл название.
>
> Rgrds, AEN

Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
не работает так как распознавать текст без сетевой карты (спасибо защите)
низзя. Стоит $800, русский не понимает, но обучаема... Может быть возможно
натренировать.  Кто ее сломает и выпустит будет герой! И я ему все сделаю
что бы разломанную и работающую заполучить. А может запинать всем
сообществом AABBYYшников? FineReader то наш круче в 10 раз.





^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
  2001-05-22 10:49 ` [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs Диконов Вячеслав
@ 2001-05-22 11:33   ` cornet
  2001-05-22 19:22     ` cornet
  2001-05-22 11:44   ` Mikhail Zabaluev
  2001-05-25 21:40   ` Michael Shigorin
  2 siblings, 1 reply; 6+ messages in thread
From: cornet @ 2001-05-22 11:33 UTC (permalink / raw)
  To: mandrake-russian

Диконов Вячеслав wrote:
> 
> > Date: Sun, 20 May 2001 20:02:06 +0400
> > From: Aleksey Novodvorsky <aen@logic.ru>
> > Organization: Institute for logic
> > To: mandrake-russian@altlinux.ru
> > Subject: [mdk-re] Re: [mdk-re]
> >
> =?koi8-r?Q?=F2=C1=D3=D0=CF=DA=CE=CF=D7=C1=CE=C9=C5=20=D4=C5=CB=D3=D4=C1?=,
> >  =?koi8-r?Q?=DE=C5=CD=3F?=
> > Reply-To: mandrake-russian@altlinux.ru
> >
> > cornet wrote:
> >
> > > Hello, всем!
> > >
> > > Господа, а не подскажет ли кто, какая есть на свете софтина приличного
> > > качества, предназначенная для распознавания аглицкого текста из
> > > сканированых изображений?
> > >
> > > Желательно что бы понимала изображения в формате TIFF и колонки текста.
> > > Софтина, разумеется, нужна под Линух, желательно, что бы из шелла
> > > скриптовалась на множественную обработку кучи файлов.
> >
> > Приличная есть только коммерческая. Увы, забыл название.
> >
> > Rgrds, AEN
> 
> Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
> не работает так как распознавать текст без сетевой карты (спасибо защите)
> низзя. Стоит $800, русский не понимает, но обучаема... Может быть возможно
> натренировать.  Кто ее сломает и выпустит будет герой! И я ему все сделаю
> что бы разломанную и работающую заполучить. А может запинать всем
> сообществом AABBYYшников? FineReader то наш круче в 10 раз.

Сеньк!
Ну и здорова же она - 12М тарбол, блин!
Качаю помаленьку...

-- 
******** FIRE & STEEL ********



^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
  2001-05-22 10:49 ` [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs Диконов Вячеслав
  2001-05-22 11:33   ` cornet
@ 2001-05-22 11:44   ` Mikhail Zabaluev
  2001-05-22 12:02     ` cornet
  2001-05-25 21:40   ` Michael Shigorin
  2 siblings, 1 reply; 6+ messages in thread
From: Mikhail Zabaluev @ 2001-05-22 11:44 UTC (permalink / raw)
  To: mandrake-russian

Hello Диконов,

On Mon, May 21, 2001 at 06:43:02PM +0300, Диконов Вячеслав wrote:
>
> Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
> не работает так как распознавать текст без сетевой карты (спасибо защите)
> низзя.

Huh? У них привязка к номеру карты?

> Стоит $800, русский не понимает, но обучаема... Может быть возможно
> натренировать.  Кто ее сломает и выпустит будет герой! И я ему все сделаю
> что бы разломанную и работающую заполучить. А может запинать всем
> сообществом AABBYYшников? FineReader то наш круче в 10 раз.

Можете попинать еще и моих работодателей (parascript.com). Правда, они
занимаются рукописным текстом.

-- 
Stay tuned,
  MhZ                                     JID: mookid@jabber.org
___________
The whole earth is in jail and we're plotting this incredible jailbreak.
		-- Wavy Gravy



^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
  2001-05-22 11:44   ` Mikhail Zabaluev
@ 2001-05-22 12:02     ` cornet
  0 siblings, 0 replies; 6+ messages in thread
From: cornet @ 2001-05-22 12:02 UTC (permalink / raw)
  To: mandrake-russian

Mikhail Zabaluev wrote:
> 
> Hello Диконов,
> 
> On Mon, May 21, 2001 at 06:43:02PM +0300, Диконов Вячеслав wrote:
> >
> > Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
> > не работает так как распознавать текст без сетевой карты (спасибо защите)
> > низзя.
> 
> Huh? У них привязка к номеру карты?

Да, версии для коммерческих Юниксов привязываются к серийному номеру
системы через uname, а линуховая версия к MAC адресу карточки.

> > Стоит $800, русский не понимает, но обучаема... Может быть возможно
> > натренировать.  Кто ее сломает и выпустит будет герой! И я ему все сделаю
> > что бы разломанную и работающую заполучить. А может запинать всем
> > сообществом AABBYYшников? FineReader то наш круче в 10 раз.
> 
> Можете попинать еще и моих работодателей (parascript.com). Правда, они
> занимаются рукописным текстом.
> 
> --
> Stay tuned,
>   MhZ                                     JID: mookid@jabber.org
> ___________
> The whole earth is in jail and we're plotting this incredible jailbreak.
>                 -- Wavy Gravy
> 
> _______________________________________________
> Mandrake-russian mailing list
> Mandrake-russian@altlinux.ru
> http://altlinux.ru/mailman/listinfo/mandrake-russian

-- 
******** FIRE & STEEL ********



^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
  2001-05-22 11:33   ` cornet
@ 2001-05-22 19:22     ` cornet
  0 siblings, 0 replies; 6+ messages in thread
From: cornet @ 2001-05-22 19:22 UTC (permalink / raw)
  To: mandrake-russian

cornet wrote:
> 
> Диконов Вячеслав wrote:
> >
> > > Date: Sun, 20 May 2001 20:02:06 +0400
> > > From: Aleksey Novodvorsky <aen@logic.ru>
> > > Organization: Institute for logic
> > > To: mandrake-russian@altlinux.ru
> > > Subject: [mdk-re] Re: [mdk-re]
> > >
> > =?koi8-r?Q?=F2=C1=D3=D0=CF=DA=CE=CF=D7=C1=CE=C9=C5=20=D4=C5=CB=D3=D4=C1?=,
> > >  =?koi8-r?Q?=DE=C5=CD=3F?=
> > > Reply-To: mandrake-russian@altlinux.ru
> > >
> > > cornet wrote:
> > >
> > > > Hello, всем!
> > > >
> > > > Господа, а не подскажет ли кто, какая есть на свете софтина приличного
> > > > качества, предназначенная для распознавания аглицкого текста из
> > > > сканированых изображений?
> > > >
> > > > Желательно что бы понимала изображения в формате TIFF и колонки текста.
> > > > Софтина, разумеется, нужна под Линух, желательно, что бы из шелла
> > > > скриптовалась на множественную обработку кучи файлов.
> > >
> > > Приличная есть только коммерческая. Увы, забыл название.
> > >
> > > Rgrds, AEN
> >
> > Называется Vividata OCR Shop Pro www.vividata.com дают демку которая у меня
> > не работает так как распознавать текст без сетевой карты (спасибо защите)
> > низзя. Стоит $800, русский не понимает, но обучаема... Может быть возможно
> > натренировать.  Кто ее сломает и выпустит будет герой! И я ему все сделаю
> > что бы разломанную и работающую заполучить. А может запинать всем
> > сообществом AABBYYшников? FineReader то наш круче в 10 раз.
> 
> Сеньк!
> Ну и здорова же она - 12М тарбол, блин!
> Качаю помаленьку...

Ну что же...
Скачал.
Инсталлятор симпатичный но туповатый. К тому же там создаются скрипты с
идентичным содержимым, которые детектят имя вызова и ведут себя
соответственно имени, в приличных домах это делается симлинками на один
файл, а здесь насовали кучу копий одного и того же под разными именами
:-/ суксссььь...

Сама прога - в качестве предельно простой распознавалки - пойдет, но
запрашиваемых за нее 800$ она ни в коем случае не стоит!!! Не тот
уровень.

С монохромными tiff файлами с разрешением 400х400 и текстом в них
порядка 12 пунктов справляется вполне прилично, коэффициент ошибок при
беглом просмотре результата  - порядка 2%, что приятно.
Понимает колонки текста, причем да же если на странице есть несколько
рядов колонок с разным их количеством. Понимает атрибуты командной
строки, так что с консоли натравить его разом на кучу файлов можно,
атрибуты весьма богаты, практически полностью дублируют гуевое
междумордие :-)

Однако, результаты сохраняет только в txt, и хотя в пропертях есть куча
выходных форматов, от указания другого формата меняется только
расширение результирующего файла, НО не его содержимое!
Примерно на одном файле из 10 спотыкается без видимой причины, а в доках
номера error code не описаны, по этому что и из за чего происходит - не
понятно. При таких спотыканиях частенько выподает в кору, причем в ейных
логах на тему ошибок и падений нифига не оседает :-(
Опять же, система защиты - идиотская - вешает tcp демона на тачку,
который от nobody держит открытым порт не только на localhost но и на
eth0, что как то хреново и некрасиво :-/
На bmp файлах, которые создал gimp выпадает в кору.

Результат - смею рекомендовать к использованию в демо режиме на 30 дней,
как простенькую распознавалку, за неимением лучшего. Покупать ее -
выбрасывать деньги.

-- 
******** FIRE & STEEL ********



^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs
  2001-05-22 10:49 ` [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs Диконов Вячеслав
  2001-05-22 11:33   ` cornet
  2001-05-22 11:44   ` Mikhail Zabaluev
@ 2001-05-25 21:40   ` Michael Shigorin
  2 siblings, 0 replies; 6+ messages in thread
From: Michael Shigorin @ 2001-05-25 21:40 UTC (permalink / raw)
  To: mandrake-russian

On Mon, 21 May 2001, Диконов Вячеслав wrote:

> защите) низзя. Стоит $800, русский не понимает, но обучаема... Может
> быть возможно натренировать.  Кто ее сломает и выпустит будет герой! И
Развелось героев, блин :-\

> я ему все сделаю что бы разломанную и работающую заполучить. А может
> запинать всем сообществом AABBYYшников? FineReader то наш круче в 10
> раз.
Ну так ЗАПИНАЙ или НАПИШИ (хоть с другими, см. тему).
Горе-ломастеры...

-- 
WBR, Michael Shigorin, webmaster of www.chem.univ.kiev.ua
>Home Page:  http://visa.chem.univ.kiev.ua/~mike/  ICQ: 113344029
>Brainbench: http://www.brainbench.com/transcript.jsp?pid=2434729




^ permalink raw reply	[flat|nested] 6+ messages in thread

end of thread, other threads:[~2001-05-25 21:40 UTC | newest]

Thread overview: 6+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2001-05-22 10:49 ` [mdk-re] Re: Mandrake-russian digest, Vol 1 #1015 - 18 msgs Диконов Вячеслав
2001-05-22 11:33   ` cornet
2001-05-22 19:22     ` cornet
2001-05-22 11:44   ` Mikhail Zabaluev
2001-05-22 12:02     ` cornet
2001-05-25 21:40   ` Michael Shigorin

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git