From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: To: mandrake-russian@linuxteam.iplabs.ru Message-ID: <20001209120343.A1503@localhost.localdomain> Mail-Followup-To: mookid@sigent.ru, mandrake-russian@linuxteam.iplabs.ru References: <20001208220207.996095EC55@localhost.localdomain> Mime-Version: 1.0 Content-Type: text/plain; charset=koi8-r Content-Disposition: inline Content-Transfer-Encoding: 8bit User-Agent: Mutt/1.2i In-Reply-To: <20001208220207.996095EC55@localhost.localdomain>; from rromas@mailru.com on Sat, Dec 09, 2000 at 01:02:07AM +0300 From: mookid@sigent.ru (Mikhail Zabaluev) Subject: [mdk-re] Re: =?koi8-r?Q?=5Bre=5D_Re:_=5Bre=5D_HTML_=D7_stuphead=2E?= Sender: mandrake-russian-admin@linuxteam.iplabs.ru Errors-To: mandrake-russian-admin@linuxteam.iplabs.ru X-BeenThere: mandrake-russian@linuxteam.iplabs.ru X-Mailman-Version: 2.0 Precedence: bulk Reply-To: mandrake-russian@linuxteam.iplabs.ru List-Help: List-Post: List-Subscribe: , List-Id: Mandrake/RE discussion list List-Unsubscribe: , List-Archive: Date: Sat Dec 9 20:56:00 2000 X-Original-Date: Sat, 9 Dec 2000 12:03:43 +0300 Archived-At: List-Archive: Hello Roman, On Sat, Dec 09, 2000 at 01:02 +0300, Roman S wrote: > > On Fri, 8 Dec 2000 22:24:22 +0300 (MSK) > Ivan Zakharyaschev wrote: > > > На затронутые вопроосы, наверное, можно взглянуть по-иному, если учитывать > > внутреннее представление сообщений в Unicode (UTF-8). > > Да, становится в общем-то всё просто, за исключением именования чарсетов... > Цепочки в общем-то получается простые - > current OS charset -> Unicode -> target msg charset > msg charset -> unicode -> OS charset. На этапе перекодировки из Unicode в target charset хорошо бы обрабатывать fallback'и - не заменять все "неуставное" знаком безмерного удивления, а пытаться подыскать разумный заменитель. recode это умеет, в glibc в принципе можно добавить (даже для отдельно взятого приложения, см. 'info libc') "нестрогие" версии кодировок. -- Stay tuned, MhZ mailto:mookid@sigent.ru ----------- Boycott meat -- suck your thumb.