From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Date: Fri, 9 Jan 2004 02:55:21 +0300 From: Mikhail Zabaluev To: ALT Devel discussion list Message-ID: <20040108235521.GA1888@mhz.mikhail.zabaluev.name> Mail-Followup-To: Mikhail Zabaluev , ALT Devel discussion list References: <20040107174903.GA15291@mhz.mikhail.zabaluev.name> <20040108211119.72f923c8.vyt@vzljot.ru> Mime-Version: 1.0 Content-Type: multipart/signed; micalg=pgp-sha1; protocol="application/pgp-signature"; boundary="7JfCtLOvnd9MIVvH" Content-Disposition: inline In-Reply-To: <20040108211119.72f923c8.vyt@vzljot.ru> User-Agent: Mutt/1.4.1i Subject: [devel] Re: =?koi8-r?b?/tTPIM3OxSDOxSDO0sHXydTT0SDX?= alternatives X-BeenThere: devel@altlinux.ru X-Mailman-Version: 2.1.3 Precedence: list Reply-To: ALT Devel discussion list List-Id: ALT Devel discussion list List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Thu, 08 Jan 2004 23:55:23 -0000 Archived-At: List-Archive: List-Post: --7JfCtLOvnd9MIVvH Content-Type: text/plain; charset=koi8-r Content-Disposition: inline Content-Transfer-Encoding: 8bit Hello Vitaly, On Thu, Jan 08, 2004 at 09:11:19PM +0300, Vitaly Ostanin wrote: > > > Хранить конфигурацию в XML-файлах -- неплохая идея сама по > > себе, но надо иметь в виду, что имена файлов в POSIX и > > последовательности символов в языке разметки XML -- вовсе не > > одно и то же. Чтобы ощутить разницу, попробуйте создать > > альтернативы на ссылку, в имени которой есть не-ASCII символы > > (допустим, если кодировка имен в файловой системе KOI8-R). > > Libxml при разборе XML-файла конвертируёт текст в UTF-8 > > независимо от исходной кодировки документа. Можно представить, > > что имя файла побайтно корректно именно в исходной кодировке > > документа, но это большая натяжка на семантику XML, официально > > никак не поддерживается, да и с преобразованием обратно в > > исходную кодировку будет геморрой. Я вижу надёжное, пусть и не > > очень грациозное, решение -- кодировать в XML-конфигурации > > имена файлов так же, как они кодируются в URL. Другое, менее > > надежное решение -- иметь возможность указывать кодировку для > > имён файлов (не как кодировку документа, а в виде специального > > атрибута в конфигурации). Между прочим, эта проблема > > затрагивает все приложения, которые представляют имена файлов в > > XML. > > Можно посмотреть на решение этой проблемы для @href в > спецификации HTML. Я об этом же: URL кодируются именно чтобы избежать подобных проблем. В принципе ничто не мешает объявить все имена файлов в существующих конфигурациях закодированными по правилам URL, поскольку никто ещё не смог/захотел выйти за пределы ASCII :) Главное, реальную поддержку обеспечить. -- Stay tuned, MhZ JID: mhz@altlinux.org ___________ Got a dictionary? I want to know the meaning of life. --7JfCtLOvnd9MIVvH Content-Type: application/pgp-signature Content-Disposition: inline -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.2.3 (GNU/Linux) iD8DBQE//e3pTKqCuNPJlLgRAr5VAJ9ImZX178sk9NjUo1JkmqD2G3C8IACeMe1j S9dGXtga4rw/QSBesKPM/gI= =ttPA -----END PGP SIGNATURE----- --7JfCtLOvnd9MIVvH--