ALT Linux Team development discussions
 help / color / mirror / Atom feed
* [devel] Различные словари и stardict
@ 2004-06-12 17:43 Vitaly Lipatov
  2004-06-14 11:46 ` Вячеслав Диконов
  0 siblings, 1 reply; 3+ messages in thread
From: Vitaly Lipatov @ 2004-06-12 17:43 UTC (permalink / raw)
  To: ALT Devel discussion list; +Cc: Alex Murygin

Здравствуйте!
Я тут в очередной раз подошёл к проблеме словарей
Проблем как минимум две:
1. Существует достаточно большое количество форматов баз.
2. в src.rpm-пакетах в основном отсутствуют исходники словарей.
Ну к примеру тот же webster для dict. В src.rpm лежат сразу 
dict-файлы для словаря, хотя исходно он в другом формате.

Я собрал для Сизифа WordNet, foldoc и ещё веду engcom в трёх 
форматах (mova, dict, stardict); базы первых двух достаточно 
объёмны, и дублировать их совсем не хочется, а особенно не 
хочется дублировать src.rpm под разные форматы.

Для решения проблем нужно иметь в наличии некий исходный формат 
словаря (не принципиально какой), главное в нём не было потери 
исходной информации, и существовали скрипты преобразования в 
остальные форматы, которые применяются (в частности, для которых 
есть оболочки в Сизифе).

Идеальным (по экономии места) был бы вариант развития плагинов к 
словарям, позволяющих использовать "чуждые" форматы как свои, я 
уж не говорю о том, что форматы некоторых словарей могли бы и 
вовсе не различаться...

Кстати, напомню (вдруг, как и я, кто-нибудь не знает), в Сизифе 
есть (и заливается) словарные базы следующих форматов:
	startdict
		(к нему Мюллер, словники, engcom, foldoc)
	dict
		(Мюллер, словники, Webster, Даль, engcom, eng-deu)
	multitran (консольная оболочка к нему в libmt-utils)
		со словарями проекта www.multitran.ru
	mova
		(Мюллер, engcom)
	wordnet (графическая оболочка к нему в wordnet-tk)

Очень бы хотелось услышать от кого-нибудь знающего, верно ли я 
понимаю ситуацию, и может проблема уже разрешена (будет 
разрешена в ближайшей перспективе).

-- 
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! LaTeX! LyX!


^ permalink raw reply	[flat|nested] 3+ messages in thread

* Re: [devel] Различные словари и stardict
  2004-06-12 17:43 [devel] Различные словари и stardict Vitaly Lipatov
@ 2004-06-14 11:46 ` Вячеслав Диконов
  2004-06-14 12:33   ` Vitaly Lipatov
  0 siblings, 1 reply; 3+ messages in thread
From: Вячеслав Диконов @ 2004-06-14 11:46 UTC (permalink / raw)
  To: ALT Devel discussion list

On Сбт, 2004-06-12 at 21:43 +0400, Vitaly Lipatov wrote:
> Здравствуйте!
> Я тут в очередной раз подошёл к проблеме словарей
> Проблем как минимум две:
> 1. Существует достаточно большое количество форматов баз.
> 2. в src.rpm-пакетах в основном отсутствуют исходники словарей.

> Для решения проблем нужно иметь в наличии некий исходный формат 
> словаря (не принципиально какой), главное в нём не было потери 
> исходной информации, и существовали скрипты преобразования в 
> остальные форматы, которые применяются (в частности, для которых 
> есть оболочки в Сизифе).
Существуют подобные разработки. Однако, все словари надо сначала будет
перевести в этот формат, что довольно трудоемко.

> Идеальным (по экономии места) был бы вариант развития плагинов к 
> словарям, позволяющих использовать "чуждые" форматы как свои, я 
> уж не говорю о том, что форматы некоторых словарей могли бы и 
> вовсе не различаться...
Эта идея лежит на поверхности и давно выдвигалась. 
Например: см. http://slovnik.lrn.ru/ Проект должен был использовать оба
подхода, но был заморожен на стадии планирования. Есть разрозненные
куски кода и страница. В ограниченном виде должно быть реализовано в
новых версиях dict. Проблема - набор поддерживаемых модулями форматов. 

> Очень бы хотелось услышать от кого-нибудь знающего, верно ли я 
> понимаю ситуацию, и может проблема уже разрешена (будет 
> разрешена в ближайшей перспективе).
Мой вывод: Проблема не решена, но может быть решена быстро.


Самая главная проблема - доступ к более ширококому спектру баз данных,
чем минимальный набор в Сизифе. Что делать тем, кому нужну другие
иностранные языки, помимо английского и словари по специальным отраслям?

Самые представительные по количеству баз, широте тематики и качеству
наборы словарей, хоть как-то доступные в среде Linux и поддерживающие
русский язык - multitran и polyglossum 1.x (.pgb). Для первого
существует примитивная тесктовая оболочка, второй поддерживается древним
проектом kdict и новым движком на TCL. Оболочек, пригодных для
повседневной работы с ними нет. Качество данных входящих в Сизиф
"свободных" словарей недостаточно для работы переводчика.

-- 
Вячеслав Диконов <sdiconov@mail.ru>



^ permalink raw reply	[flat|nested] 3+ messages in thread

* Re: [devel] Различные словари и stardict
  2004-06-14 11:46 ` Вячеслав Диконов
@ 2004-06-14 12:33   ` Vitaly Lipatov
  0 siblings, 0 replies; 3+ messages in thread
From: Vitaly Lipatov @ 2004-06-14 12:33 UTC (permalink / raw)
  To: ALT Devel discussion list

On Monday 14 June 2004 15:46, Вячеслав Диконов wrote:
> On Сбт, 2004-06-12 at 21:43 +0400, Vitaly Lipatov wrote:
> > Для решения проблем нужно иметь в наличии некий исходный
> > формат словаря (не принципиально какой), главное в нём не
...
> Существуют подобные разработки. Однако, все словари надо
Есть возможность конкретизировать (если не сложно)?
> сначала будет перевести в этот формат, что довольно трудоемко.
Чтобы уменьшить число перекрёстных конверторов между форматами, 
должна быть обеспечена возможность преобразования:
Родной формат -> Универсальный формат -> Формат словаря

> > Идеальным (по экономии места) был бы вариант развития
> > плагинов к словарям, позволяющих использовать "чуждые"
> > форматы как свои, я уж не говорю о том, что форматы
> > некоторых словарей могли бы и вовсе не различаться...
>
> Эта идея лежит на поверхности и давно выдвигалась.
Это понятно, просто когда видишь что воз и ныне там, хочется 
узнать, что же пытались делать.
> Например: см. http://slovnik.lrn.ru/ Проект должен был
О, спасибо за ссылку, а чего-то совсем о нём забыл...

> использовать оба подхода, но был заморожен на стадии
> планирования. Есть разрозненные куски кода и страница. В
> ограниченном виде должно быть реализовано в новых версиях
> dict. Проблема - набор поддерживаемых модулями форматов.
>
> > Очень бы хотелось услышать от кого-нибудь знающего, верно ли
> > я понимаю ситуацию, и может проблема уже разрешена (будет
> > разрешена в ближайшей перспективе).
>
> Мой вывод: Проблема не решена, но может быть решена быстро.
А ещё вывод - что мешает?

> Самая главная проблема - доступ к более ширококому спектру баз
> данных, чем минимальный набор в Сизифе. Что делать тем, кому
> нужну другие иностранные языки, помимо английского и словари
> по специальным отраслям?
Если существуют доступные для помещения в Сизиф словарные базы,
это вполне возможно сделать, меня сейчас останавливает 
необходимость упаковки в разные форматы. Впрочем, та же проблема 
(со stardict, например), и в Дебиане.

> Самые представительные по количеству баз, широте тематики и
> качеству наборы словарей, хоть как-то доступные в среде Linux
> и поддерживающие русский язык - multitran и polyglossum 1.x
> (.pgb). Для первого существует примитивная тесктовая оболочка,
> второй поддерживается древним проектом kdict и новым движком
> на TCL. Оболочек, пригодных для повседневной работы с ними
> нет. Качество данных входящих в Сизиф "свободных" словарей
> недостаточно для работы переводчика.
Для работы переводчика, подозреваю, обязательно использование 
словарных баз в объёме и качестве, предоставляемых только 
коммерческими поставщиками. Ладно, посмотрим, что будет дальше.

Спасибо за отклик.

-- 
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! LaTeX! LyX!


^ permalink raw reply	[flat|nested] 3+ messages in thread

end of thread, other threads:[~2004-06-14 12:33 UTC | newest]

Thread overview: 3+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2004-06-12 17:43 [devel] Различные словари и stardict Vitaly Lipatov
2004-06-14 11:46 ` Вячеслав Диконов
2004-06-14 12:33   ` Vitaly Lipatov

ALT Linux Team development discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
		devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
	public-inbox-index devel

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.devel


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git