* [devel] Различные словари и stardict
@ 2004-06-12 17:43 Vitaly Lipatov
2004-06-14 11:46 ` Вячеслав Диконов
0 siblings, 1 reply; 3+ messages in thread
From: Vitaly Lipatov @ 2004-06-12 17:43 UTC (permalink / raw)
To: ALT Devel discussion list; +Cc: Alex Murygin
Здравствуйте!
Я тут в очередной раз подошёл к проблеме словарей
Проблем как минимум две:
1. Существует достаточно большое количество форматов баз.
2. в src.rpm-пакетах в основном отсутствуют исходники словарей.
Ну к примеру тот же webster для dict. В src.rpm лежат сразу
dict-файлы для словаря, хотя исходно он в другом формате.
Я собрал для Сизифа WordNet, foldoc и ещё веду engcom в трёх
форматах (mova, dict, stardict); базы первых двух достаточно
объёмны, и дублировать их совсем не хочется, а особенно не
хочется дублировать src.rpm под разные форматы.
Для решения проблем нужно иметь в наличии некий исходный формат
словаря (не принципиально какой), главное в нём не было потери
исходной информации, и существовали скрипты преобразования в
остальные форматы, которые применяются (в частности, для которых
есть оболочки в Сизифе).
Идеальным (по экономии места) был бы вариант развития плагинов к
словарям, позволяющих использовать "чуждые" форматы как свои, я
уж не говорю о том, что форматы некоторых словарей могли бы и
вовсе не различаться...
Кстати, напомню (вдруг, как и я, кто-нибудь не знает), в Сизифе
есть (и заливается) словарные базы следующих форматов:
startdict
(к нему Мюллер, словники, engcom, foldoc)
dict
(Мюллер, словники, Webster, Даль, engcom, eng-deu)
multitran (консольная оболочка к нему в libmt-utils)
со словарями проекта www.multitran.ru
mova
(Мюллер, engcom)
wordnet (графическая оболочка к нему в wordnet-tk)
Очень бы хотелось услышать от кого-нибудь знающего, верно ли я
понимаю ситуацию, и может проблема уже разрешена (будет
разрешена в ближайшей перспективе).
--
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! LaTeX! LyX!
^ permalink raw reply [flat|nested] 3+ messages in thread
* Re: [devel] Различные словари и stardict
2004-06-12 17:43 [devel] Различные словари и stardict Vitaly Lipatov
@ 2004-06-14 11:46 ` Вячеслав Диконов
2004-06-14 12:33 ` Vitaly Lipatov
0 siblings, 1 reply; 3+ messages in thread
From: Вячеслав Диконов @ 2004-06-14 11:46 UTC (permalink / raw)
To: ALT Devel discussion list
On Сбт, 2004-06-12 at 21:43 +0400, Vitaly Lipatov wrote:
> Здравствуйте!
> Я тут в очередной раз подошёл к проблеме словарей
> Проблем как минимум две:
> 1. Существует достаточно большое количество форматов баз.
> 2. в src.rpm-пакетах в основном отсутствуют исходники словарей.
> Для решения проблем нужно иметь в наличии некий исходный формат
> словаря (не принципиально какой), главное в нём не было потери
> исходной информации, и существовали скрипты преобразования в
> остальные форматы, которые применяются (в частности, для которых
> есть оболочки в Сизифе).
Существуют подобные разработки. Однако, все словари надо сначала будет
перевести в этот формат, что довольно трудоемко.
> Идеальным (по экономии места) был бы вариант развития плагинов к
> словарям, позволяющих использовать "чуждые" форматы как свои, я
> уж не говорю о том, что форматы некоторых словарей могли бы и
> вовсе не различаться...
Эта идея лежит на поверхности и давно выдвигалась.
Например: см. http://slovnik.lrn.ru/ Проект должен был использовать оба
подхода, но был заморожен на стадии планирования. Есть разрозненные
куски кода и страница. В ограниченном виде должно быть реализовано в
новых версиях dict. Проблема - набор поддерживаемых модулями форматов.
> Очень бы хотелось услышать от кого-нибудь знающего, верно ли я
> понимаю ситуацию, и может проблема уже разрешена (будет
> разрешена в ближайшей перспективе).
Мой вывод: Проблема не решена, но может быть решена быстро.
Самая главная проблема - доступ к более ширококому спектру баз данных,
чем минимальный набор в Сизифе. Что делать тем, кому нужну другие
иностранные языки, помимо английского и словари по специальным отраслям?
Самые представительные по количеству баз, широте тематики и качеству
наборы словарей, хоть как-то доступные в среде Linux и поддерживающие
русский язык - multitran и polyglossum 1.x (.pgb). Для первого
существует примитивная тесктовая оболочка, второй поддерживается древним
проектом kdict и новым движком на TCL. Оболочек, пригодных для
повседневной работы с ними нет. Качество данных входящих в Сизиф
"свободных" словарей недостаточно для работы переводчика.
--
Вячеслав Диконов <sdiconov@mail.ru>
^ permalink raw reply [flat|nested] 3+ messages in thread
* Re: [devel] Различные словари и stardict
2004-06-14 11:46 ` Вячеслав Диконов
@ 2004-06-14 12:33 ` Vitaly Lipatov
0 siblings, 0 replies; 3+ messages in thread
From: Vitaly Lipatov @ 2004-06-14 12:33 UTC (permalink / raw)
To: ALT Devel discussion list
On Monday 14 June 2004 15:46, Вячеслав Диконов wrote:
> On Сбт, 2004-06-12 at 21:43 +0400, Vitaly Lipatov wrote:
> > Для решения проблем нужно иметь в наличии некий исходный
> > формат словаря (не принципиально какой), главное в нём не
...
> Существуют подобные разработки. Однако, все словари надо
Есть возможность конкретизировать (если не сложно)?
> сначала будет перевести в этот формат, что довольно трудоемко.
Чтобы уменьшить число перекрёстных конверторов между форматами,
должна быть обеспечена возможность преобразования:
Родной формат -> Универсальный формат -> Формат словаря
> > Идеальным (по экономии места) был бы вариант развития
> > плагинов к словарям, позволяющих использовать "чуждые"
> > форматы как свои, я уж не говорю о том, что форматы
> > некоторых словарей могли бы и вовсе не различаться...
>
> Эта идея лежит на поверхности и давно выдвигалась.
Это понятно, просто когда видишь что воз и ныне там, хочется
узнать, что же пытались делать.
> Например: см. http://slovnik.lrn.ru/ Проект должен был
О, спасибо за ссылку, а чего-то совсем о нём забыл...
> использовать оба подхода, но был заморожен на стадии
> планирования. Есть разрозненные куски кода и страница. В
> ограниченном виде должно быть реализовано в новых версиях
> dict. Проблема - набор поддерживаемых модулями форматов.
>
> > Очень бы хотелось услышать от кого-нибудь знающего, верно ли
> > я понимаю ситуацию, и может проблема уже разрешена (будет
> > разрешена в ближайшей перспективе).
>
> Мой вывод: Проблема не решена, но может быть решена быстро.
А ещё вывод - что мешает?
> Самая главная проблема - доступ к более ширококому спектру баз
> данных, чем минимальный набор в Сизифе. Что делать тем, кому
> нужну другие иностранные языки, помимо английского и словари
> по специальным отраслям?
Если существуют доступные для помещения в Сизиф словарные базы,
это вполне возможно сделать, меня сейчас останавливает
необходимость упаковки в разные форматы. Впрочем, та же проблема
(со stardict, например), и в Дебиане.
> Самые представительные по количеству баз, широте тематики и
> качеству наборы словарей, хоть как-то доступные в среде Linux
> и поддерживающие русский язык - multitran и polyglossum 1.x
> (.pgb). Для первого существует примитивная тесктовая оболочка,
> второй поддерживается древним проектом kdict и новым движком
> на TCL. Оболочек, пригодных для повседневной работы с ними
> нет. Качество данных входящих в Сизиф "свободных" словарей
> недостаточно для работы переводчика.
Для работы переводчика, подозреваю, обязательно использование
словарных баз в объёме и качестве, предоставляемых только
коммерческими поставщиками. Ладно, посмотрим, что будет дальше.
Спасибо за отклик.
--
Lav
Виталий Липатов
Санкт-Петербург
GNU! ALT Linux Team! LaTeX! LyX!
^ permalink raw reply [flat|nested] 3+ messages in thread
end of thread, other threads:[~2004-06-14 12:33 UTC | newest]
Thread overview: 3+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2004-06-12 17:43 [devel] Различные словари и stardict Vitaly Lipatov
2004-06-14 11:46 ` Вячеслав Диконов
2004-06-14 12:33 ` Vitaly Lipatov
ALT Linux Team development discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
public-inbox-index devel
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.devel
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git