From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: X-Spam-Checker-Version: SpamAssassin 3.2.5 (2008-06-10) on sa.int.altlinux.org X-Spam-Level: X-Spam-Status: No, score=0.8 required=5.0 tests=AWL, BAYES_00, RCVD_IN_SORBS_WEB, RCVD_NUMERIC_HELO,SPF_HELO_PASS,SPF_PASS autolearn=no version=3.2.5 X-Injected-Via-Gmane: http://gmane.org/ To: community@lists.altlinux.org From: anyr@tut.by Followup-To: gmane.linux.altlinux.community Date: Sat, 13 Mar 2010 16:37:50 +0200 Message-ID: References: <4B950AB3.7060606@gmail.com> <4B978E26.9030408@gmail.com> Mime-Version: 1.0 Content-Type: text/plain; charset="UTF-8" Content-Transfer-Encoding: 8Bit X-Complaints-To: usenet@dough.gmane.org X-Gmane-NNTP-Posting-Host: 213.184.237.14 User-Agent: KNode/4.3.4 Subject: Re: [Comm] Hunspell & new dicitonary X-BeenThere: community@lists.altlinux.org X-Mailman-Version: 2.1.12 Precedence: list Reply-To: ALT Linux Community general discussions List-Id: ALT Linux Community general discussions List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Sat, 13 Mar 2010 14:38:08 -0000 Archived-At: List-Archive: List-Post: Sergey Kurakin wrote: > А слово "лимфа" уже есть в базовом словаре с флагом /H. И как такие > конфликты обрабатывать? > > Куда проще дописать к базовому словарю: > лимфорея/H > лимфограмма/I > лимфомодулятор/K > > Вам, конечно, виднее. Но на первый взгляд ваш подход выглядит > как переусложненный. > Эти слова я для примера привел. По поводу сложности полностью согласен. После долгого сидения над совсем небольшим файлом аффиксом я очень сильно застрял на самом словаре :) Самой большой проблемой оказалось что, при минимальном количестве правил некоторые не употребляемые (может быть только пока слова) считаются верными. Возможно это можно победить написанием достаточно сложных для поставленной задачи правил аффиксации, но я пока не рискну это сделать. Поэтому откладываю незаконченным начатое и пойду по пути, которым ходили уже многие - поиском недостающих слов. По вашему совету в качестве основы буду использовать словарь проф. Лебедева. Времени на эти развлечения не много, но думаю, что уже к концу месяца поделю небольшим, готовым к использованию, словарем. P.S.: Добавлять специализированные термины может и имеет смысл в "общий" словарь, но так он будет со временем очень огромным и трудно контролируемым. -- Andrey Yurkovsky