On Fri, 28 Mar 2003 02:14:11 +0300 Mikhail Zabaluev wrote: > Более того, наличие в Unicode комбинирующих символов > делает понятия "символ как номер в машинном представлении" > и "символ как единица текста" неэквивалентными, заставляя > прибегать к сложным схемам канонизации. > Насчёт удобства хранения не всё так однозначно: > строки из правильных (32-битных) wchar_t сжирают уж > слишком много места при преимущественном пользовании > ASCII. > > > А для utf-8 роль Единой и Единственной вовсе не подходит. > > Она просто частный случай в зоопарке многобайтовых кодировок. > > Причём один из самых простых частных случаев. > > Замечательные свойства, подмеченные Вами, делают UTF-8 > лучшим из возможных кандидатов на универсальную кодировку. Что подтверждается практическим использованием UTF-8 в качестве внутреннего представления данных в [the] библиотеке для работы с XML :) -- Regards, Vyt mailto: vyt@vzljot.ru JID: vyt@vzljot.ru