From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Message-ID: <3F8E49D5.4050506@kengu.ru> Date: Thu, 16 Oct 2003 11:33:41 +0400 From: "Aleksey Avdeev" User-Agent: Mozilla/5.0 (X11; U; Linux i686; ru-RU; rv:1.4) Gecko/20030710 X-Accept-Language: ru, ru-ru, be, uk, en-us, en MIME-Version: 1.0 To: oo-discuss@openoffice.ru References: <20031012154604.3EC8248016@lrn.ru> <1066000899.21178.5.camel@localhost> <3F8A866A.8050500@umail.ru> <3F8AB491.9070100@kengu.ru> <1066056524.8720.3.camel@alpha.tirs.ru> In-Reply-To: <1066056524.8720.3.camel@alpha.tirs.ru> X-Enigmail-Version: 0.76.1.0 X-Enigmail-Supports: pgp-inline, pgp-mime Content-Type: multipart/mixed; boundary="------------040007060605010407080705" X-OriginalArrivalTime: 16 Oct 2003 07:33:45.0856 (UTC) FILETIME=[D5033000:01C393B7] Cc: ALT Linux Community , ALT Linux Sisyphus Subject: [sisyphus] Re: [oodisc] =?koi8-r?b?89TSwc7Oz9PUySDTINDSz9fF0svPyiDP0sbPx9LB?= =?koi8-r?b?xsnJIE9PIMkgIE1vemlsbGEu?= X-BeenThere: sisyphus@altlinux.ru X-Mailman-Version: 2.1.2 Precedence: list Reply-To: solo@kengu.ru, sisyphus@altlinux.ru List-Id: List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Thu, 16 Oct 2003 07:29:52 -0000 Archived-At: List-Archive: This is a multi-part message in MIME format. --------------040007060605010407080705 Content-Type: text/plain; charset=KOI8-R; format=flowed Content-Transfer-Encoding: 8bit Вячеслав Диконов пишет: > В Пнд, 13.10.2003, в 18:20, Aleksey Avdeev пишет: > >> >Если кто-то хотел ввести негритянские диалекты, пусть вводит их >> >отдельным словарём :) >> >> Стоит ли о данных словах сообщить куданибудь? Если да - то >>куда? :-) (Правильным ли местом будет http://bugzilla.altlinux.ru/?) > > Сомневаюсь. АЛЬТ не занимается словарями MySpell. Он скорее игнорирует связанные с ними проблемы =|. > Надо самому проверить словарь и прислать латку по указанным в ПРОЧТИМЕНЯ > адресам. Хорошо, так и сделаю. Набросал небольшой скриптик (простейший), который выводит заведомо неверные (и незнакомые мне лично) слова: Ищет в словаре и выводит слова со сдвоенными (из списка) и с строенными буквами (исхожу из того, что не все буквы могут стоять парой в слове, а тройных повторений быть не должно). Файл приложен к письму. Просьба проверить его на корректность, с точки зрения русской орфографии (я далеко не лингвист): Список недопустимых сдвоенных букв, возможно, стоит сузить. Список слов для исключения - тоже (или расширить :-)). Результат работы данного скрипта собираюсь отослать по адресам из файла /usr/lib/openoffice/share/dict/ooo/readme.koi. ЗЫ: Дублирую данное письмо в Sisyphus и Community. Приношу извинения, если это доставит неудобства. -- С уважением. Алексей. --------------040007060605010407080705 Content-Type: text/plain; name="rudichek" Content-Transfer-Encoding: 8bit Content-Disposition: inline; filename="rudichek" #! /bin/bash if [ "x$1" = "x" ]; then echo "Формат команды:" echo "rudichek <файл словаря>" exit fi # Последовательности одинаковых букв Dubli="ё й ш щ ъ ы ч ь" # 2 буквы Tribli="ц у к е н г ш щ з х ф в а п р о л д ж э я с м и т б ю" # 3 буквы # Слова подлежащии исключению Iskluch="мон момушка момсон момо момлент момди момбе момбасу мома/E мом замбы фамы" # Проверка cat "$@" | grep \ $(for I in $Iskluch ; do echo -n " -e ^"$I"$"; done) \ $(for I in $Dubli ; do echo -n " -e " $I$I; done) \ $(for I in $Tribli ; do echo -n " -e " $I$I$I; done) --------------040007060605010407080705--