From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: From: Vitaly Lipatov Organization: ALT Linux Team To: ALT Devel discussion list Date: Sat, 12 Jun 2004 21:43:01 +0400 User-Agent: KMail/1.6.2 MIME-Version: 1.0 Content-Disposition: inline Content-Type: text/plain; charset="koi8-r" Content-Transfer-Encoding: 8bit Message-Id: <200406122143.01540.lav@altlinux.ru> Cc: Alex Murygin Subject: [devel] =?koi8-r?b?8sHazMneztnFINPMz9fB0skgyQ==?= stardict X-BeenThere: devel@altlinux.ru X-Mailman-Version: 2.1.5 Precedence: list Reply-To: ALT Devel discussion list List-Id: ALT Devel discussion list List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Sat, 12 Jun 2004 17:42:06 -0000 Archived-At: List-Archive: List-Post: Здравствуйте! Я тут в очередной раз подошёл к проблеме словарей Проблем как минимум две: 1. Существует достаточно большое количество форматов баз. 2. в src.rpm-пакетах в основном отсутствуют исходники словарей. Ну к примеру тот же webster для dict. В src.rpm лежат сразу dict-файлы для словаря, хотя исходно он в другом формате. Я собрал для Сизифа WordNet, foldoc и ещё веду engcom в трёх форматах (mova, dict, stardict); базы первых двух достаточно объёмны, и дублировать их совсем не хочется, а особенно не хочется дублировать src.rpm под разные форматы. Для решения проблем нужно иметь в наличии некий исходный формат словаря (не принципиально какой), главное в нём не было потери исходной информации, и существовали скрипты преобразования в остальные форматы, которые применяются (в частности, для которых есть оболочки в Сизифе). Идеальным (по экономии места) был бы вариант развития плагинов к словарям, позволяющих использовать "чуждые" форматы как свои, я уж не говорю о том, что форматы некоторых словарей могли бы и вовсе не различаться... Кстати, напомню (вдруг, как и я, кто-нибудь не знает), в Сизифе есть (и заливается) словарные базы следующих форматов: startdict (к нему Мюллер, словники, engcom, foldoc) dict (Мюллер, словники, Webster, Даль, engcom, eng-deu) multitran (консольная оболочка к нему в libmt-utils) со словарями проекта www.multitran.ru mova (Мюллер, engcom) wordnet (графическая оболочка к нему в wordnet-tk) Очень бы хотелось услышать от кого-нибудь знающего, верно ли я понимаю ситуацию, и может проблема уже разрешена (будет разрешена в ближайшей перспективе). -- Lav Виталий Липатов Санкт-Петербург GNU! ALT Linux Team! LaTeX! LyX!