From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Date: Mon, 21 Apr 2003 08:44:27 +0500 From: Ilya Kuznecov To: community@altlinux.ru Subject: Re: [Comm] =?KOI8-R?Q?=C0=CE=C9=CB=CF=C4?= Message-Id: <20030421084427.5f073dda.kuznecov@blok-caf.ru> In-Reply-To: <20030421001016.67736ace.noc@mail.spbnit.ru> References: <20030421001016.67736ace.noc@mail.spbnit.ru> Organization: ZAO "SMF Blok" X-Mailer: Sylpheed version 0.8.8 (GTK+ 1.2.10; i586-alt-linux-gnu) X-Operating-System: linux Keywords: 1381332572 Mime-Version: 1.0 Content-Type: text/plain; charset=KOI8-R Content-Transfer-Encoding: 8bit Sender: community-admin@altlinux.ru Errors-To: community-admin@altlinux.ru X-BeenThere: community@altlinux.ru X-Mailman-Version: 2.0.9 Precedence: bulk Reply-To: community@altlinux.ru X-Reply-To: community@altlinux.ru List-Unsubscribe: , List-Id: List-Post: List-Help: List-Subscribe: , List-Archive: Archived-At: List-Archive: List-Post: On Mon, 21 Apr 2003 00:10:16 +0400 "Sergey B." wrote: > Люди, расскажите, плиз о юникоде. О его перспективах и реалиях. Стоит ли на юникодную локаль систему настраивать??? Какие проблемы могут появиться??? Где об этом есть инфа??? Юникод -- способ кодирования текстовых данных таким образом, чтобы обеспечить возможности многоязычных текстов без искусственных указателей языка. В кодировке ASCII7 допустимы лишь английские символы, поэтому все восьмибитные кодировки на основе ASCII7 допускают лишь пары с английскими символами: русско-английские, франко-английские, немецко-английские, и т.д. При передаче текста по сети (выкладывание на http, посылка почтой, и т.д.) информация о том, в какой кодировке написан текст, часто теряется или искажается. Русские виндузоиды часто выкладывают тексты в cp1251, юниксоиды -- в koi8-r, а некоторые хостинги часто вносят свою сумятицу. При тотальном переходе на уникод (например, в виде utf-8) такие проблемы бы автоматически решались, потому что: 1) один язык -- одно языковое пространство. Нет бардака в виде "русский 1251/русский 866/русский koi8-r", все строго расписано. 2) все люди и программы привыкают к многоязычности (сейчас многие привыкли к двуязычности -- "мой родной <кукузский> и ascii-7" Реалии на сегодня: * многие современные ОС и решения или полностью основаны на уникоде (Plan9), или достаточно часто его используют (Linux, XFree86, Windows) * Однако наследие давит и многие программы не понимают уникода из коробки (или благодаря создателям дистрибутивов, или из-за непонимания роли уникода авторами) Поскольку вопрос сформулирован новичком, предлагаю Сергею сперва запустить uxterm (xterm -class UXTerm) и (необязательно) создать тестового пользователя с ~/.i18n вида "LANG=ru_RU.UTF-8". Поработай, пощщупай, сам решишь. Я перешёл на уникод уже с полгода, положительных сторон много, непонимающие уникода программы или выкидываются, или запускаются в восьмибитной кодировке. -- chumpa, Cybernetic Humanoid Used for Mathematics and Potential Assassination kuznecov@blok-caf.ru http://chumpa.izhnet.ru icq 122393064