ALT Linux Community general discussions
 help / color / mirror / Atom feed
From: Sergey Kurakin <sergeykurakin@gmail.com>
To: ALT Linux Community general discussions <community@lists.altlinux.org>
Subject: Re: [Comm] Hunspell & new dicitonary
Date: Sun, 14 Mar 2010 16:40:35 +0300
Message-ID: <4B9CE753.6030100@gmail.com> (raw)
In-Reply-To: <hng7vv$v77$1@dough.gmane.org>

On 03/13/2010 05:37 PM, anyr@tut.by wrote:
> Самой большой проблемой оказалось что, при минимальном количестве правил 
> некоторые не употребляемые (может быть только пока слова) считаются верными.

  Эта проблема возникает, если использовать механизм образования
сложносоставных слов.

> Возможно это можно победить написанием достаточно сложных для поставленной 
> задачи правил аффиксации, но я пока не рискну это сделать.

  Ваш подход как раз и позволяет это победить, но очень трудоемок.
И не понятно, как совместить результат вашей работы с общим словарем.

> Поэтому 
> откладываю незаконченным начатое и пойду по пути, которым ходили уже многие 
> - поиском недостающих слов.

  Вот и правильно!

> Времени на эти развлечения не много, но думаю, что уже к концу месяца поделю 
> небольшим, готовым к использованию, словарем.

  Желаю удачи.
  А по поводу подключения словарей к OOo могу сказать следующее:

  1. Использование нескольких словарей для одного языка в OOo сейчас
невозможно. Смотрел соответствующий код, там это прямо написано
в комментариях. Так что в любом случае придется напрямую добавлять
новые слова в существующий словарь. Другого способа совместить словари
в пределах одного языка в OOo сейчас нет.

  2. Ситуация с выбором рабочего словаря из нескольких системных в OOo
оказалась еще более запутанной. Если установлено несколько словарей для
одного языка, он попросту берет первый попавшийся!

https://bugzilla.altlinux.org/23118

  Поэтому, чтобы исключить неприятные случайности, надо чтобы ваш
словарь оказался единственным русским словарем в /usr/share/myspell/.
Но есть способ лучше.

  3. Можно сделать "словарь как расширение" (dictionary as extension).
Такие словари в формате myspell/hunspell (.dic + .aff) устанавливаются
в домашний каталог пользователя штатными средствами OOo и имеют
приоритет перед всеми системными словарями. Так что путаницы не
возникнет и не придется копаться в системных каталогах. Оформить
"словарь как расширение" на первый взгляд несложно, примеры можно
посмотреть здесь:

http://extensions.services.openoffice.org/dictionary

> P.S.: Добавлять специализированные термины может и имеет смысл в "общий" 
> словарь, но так он будет со временем очень огромным и трудно контролируемым.

  Что касается "словарей общего пользования", то меня здесь волнует
не размер, а "авторитетность". Если в словарь попадает медицинский
термин или малораспространенное слово -- в этом нет ничего плохого.
Плохо, когда словарь содержит слова сомнительные -- они подрывают
его авторитетность. Поэтому я добавляю лишь те слова, существование
и правописание которых могу документально подтвердить.

-- 
WBR,
Sergey Kurakin


  reply	other threads:[~2010-03-14 13:40 UTC|newest]

Thread overview: 19+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2010-03-07 10:58 anyr
2010-03-08 14:33 ` Sergey Kurakin
2010-03-09  7:47   ` anyr
2010-03-10 12:18     ` Sergey Kurakin
2010-03-13 14:37       ` anyr
2010-03-14 13:40         ` Sergey Kurakin [this message]
2010-03-14 20:31           ` anyr
2010-03-16 18:19             ` anyr
2010-03-16 21:07               ` anyr
2010-03-17 18:09                 ` Sergey Kurakin
2010-03-17 17:21               ` Sergey Kurakin
2010-03-17 18:53                 ` anyr
2010-03-17 20:26                   ` Sergey Kurakin
2010-03-20 14:57                     ` anyr
2010-03-21  9:42                       ` Sergey Kurakin
2010-03-21 13:04                         ` anyr
2010-03-21 19:08                           ` Sergey Kurakin
2010-03-22 15:41                             ` Andrey Yurkovsky
2010-03-25 18:53                               ` Andrey Yurkovsky

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=4B9CE753.6030100@gmail.com \
    --to=sergeykurakin@gmail.com \
    --cc=community@lists.altlinux.org \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git