From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Message-ID: <3E676A26.5050104@altlinux.ru> Date: Thu, 06 Mar 2003 18:32:54 +0300 From: Aleksey Novodvorsky User-Agent: Mozilla/5.0 (X11; U; Linux i686; ru-RU; rv:1.3b) Gecko/20030218 X-Accept-Language: ru, en-us, en MIME-Version: 1.0 To: community@altlinux.ru Subject: Re: [Comm] UTF-8 =?KOI8-R?Q?=C1_Master_2=2E2_=5BJT=5D?= References: <20030306163139.719c46fe.ivan_shmykov@mail.ru> <3E67503A.2020707@altlinux.ru> <87isuw1pyr.fsf_-_@lenin.home> In-Reply-To: <87isuw1pyr.fsf_-_@lenin.home> X-Enigmail-Version: 0.73.1.0 X-Enigmail-Supports: pgp-inline, pgp-mime Content-Type: text/plain; charset=KOI8-R Content-Transfer-Encoding: 8bit Sender: community-admin@altlinux.ru Errors-To: community-admin@altlinux.ru X-BeenThere: community@altlinux.ru X-Mailman-Version: 2.0.9 Precedence: bulk Reply-To: community@altlinux.ru List-Unsubscribe: , List-Id: List-Post: List-Help: List-Subscribe: , List-Archive: Archived-At: List-Archive: List-Post: Anton Kovalenko пишет: >>>>>>Aleksey Novodvorsky writes: >>>>>> >>>>>> > > >> 2. поддержка bash (readline), textutils, fileutils с > >> точки зрения UTF8 > > > Поддержка UTF-8 базовыми утилитами Unix -- большая > > проблема, так как требует их серьезного концептуального > > пересмотра и тщательного аудита. Мое _личное_ мнение -- > > сквозной переход Unix на UTF-8 locales практически > > невозможен, так как приведет к большим проблемам с > > security. > >Это очень странно слышать. Сквозной переход на UTF-8 locales -- >попросту бессмысленен. А вот корректная поддержка multibyte >characters, _частным случаем_ которой является UTF-8 -- уже >становится традицией. > Да, конечно. Но -- не сквозная. Сквозная поддержка multibyte locales приведет к описанным мною ранее проблемам. Сквозная поддержка требует принципиально новых разработок. > >Что же касается security, -- в системе, где имена файлов case >sensitive, да ещё с такой приличной кодировкой, как UTF-8 (где >невозможен \000 в середине строки, где любой встретившийся >символ из диапазона ascii всегда означает самого себя, где >никакой ascii-символ не имеет альтернативного представления) -- >непонятно, откуда возьмутся проблемы. > При чем здесь имена файлов? Когда Вы имеете дело с "символом неопределенной длины" -- проблемы неизбежны. На самом деле, до сих пор всплывают проблемы c security даже при работе в не-POSIX locale. Rgrds, AEN