ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] Использование UTF-локали в ALT Linux
@ 2004-12-28 12:02 Alexander Kuprin
  2004-12-28 16:44 ` Alexej Kryukov
  0 siblings, 1 reply; 22+ messages in thread
From: Alexander Kuprin @ 2004-12-28 12:02 UTC (permalink / raw)
  To: community

Добрый день.

Народ, кто-нибудь настраиваль юникод в качестве системной локали в ALT 
Linux? Может это наглёжь с моей стороны, но если не трудно, не могли бы 
поделится настройками? :-) Как это делается с использованием пакета kbd 
я знаю, а вот, что нужно подкрутить  при помощи console-tools, который 
используется в ALT Linux, не совсем понятно -- документация в 
console-tools не слишком вразумительная. :-\

--
WBR, Alexander Kuprin



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-28 12:02 [Comm] Использование UTF-локали в ALT Linux Alexander Kuprin
@ 2004-12-28 16:44 ` Alexej Kryukov
  2004-12-28 17:44   ` Alexander Kuprin
  2004-12-29  8:22   ` Анатолий Китайкин
  0 siblings, 2 replies; 22+ messages in thread
From: Alexej Kryukov @ 2004-12-28 16:44 UTC (permalink / raw)
  To: community

On Tuesday 28 December 2004 15:02, Alexander Kuprin wrote:
> Добрый день.
>
> Народ, кто-нибудь настраиваль юникод в качестве системной локали в
> ALT Linux? Может это наглёжь с моей стороны, но если не трудно, не
> могли бы поделится настройками? :-) Как это делается с использованием
> пакета kbd я знаю, а вот, что нужно подкрутить  при помощи
> console-tools, который используется в ALT Linux, не совсем понятно --
> документация в console-tools не слишком вразумительная. :-\

У мня, правда, нет под рукой AltLinux, но вопрос для меня интересен,
так что попробую порассуждать логически ;-)

Итак, берем скрипт unicode_start из комплекта kbd. В нем, во-первых,
видим следующее:

kbd_mode -u

Я не знаю, есть ли аналог kbd_mode (и опции -u) в consoletools, но,
впрочем, эта команда почти ничего не делает. Вот комментарий из того
же файла:

# This really does nothing with the way normal keys are handled in              
# the kernel. All it does is:                                                   
# - It is necessary for `dumpkeys' in order to not drop U+XXXX                  
#   entries from the keymaps.                                                   
# - It is necessary for `loadkeys' in order to avoid warnings.                  
# - Unicode characters typed as Alt-x1 ... Alt-xn (where x1,...,xn              
#   are digits on the numeric keypad) will be emitted in UTF-8.                 

Из этих пунктов мне представляется сколько-нибудь существенным 
лишь последний.

Идем дальше:
dumpkeys | loadkeys --unicode

Данная команда должна перевести текущую раскладку в юникодовый
режим, но это корректно работает только для latin1. Так что
можем без нее обойтись, тем более, что специальная юникодовая
раскладка у нас, надо полагать, имеется и прописана в i18n?

Далее на консоль выводится магическая последовательность:
echo -n -e '\033%G'
Вот это ключевой момент: без нее работать ничего не будет.

И, наконец, дальше идет блок установки шрифта, который тоже можем
проигнорировать, т. к. шрифт мы пропишем в i18n.

Очевидно, из этого и надо исходить.
Впрочем, если не секрет, а зачем Вам понадобилась юникодовая локаль?
Опыт показывает, что использовать ее в качестве системной практически
никогда не имеет смысла...


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-28 16:44 ` Alexej Kryukov
@ 2004-12-28 17:44   ` Alexander Kuprin
  2004-12-28 21:31     ` Alexej Kryukov
  2004-12-29  8:22   ` Анатолий Китайкин
  1 sibling, 1 reply; 22+ messages in thread
From: Alexander Kuprin @ 2004-12-28 17:44 UTC (permalink / raw)
  To: community

On Tuesday 28 December 2004 18:44, Alexej Kryukov wrote:

...very big skip...

Спасибо за подсказки.

> Очевидно, из этого и надо исходить.
> Впрочем, если не секрет, а зачем Вам понадобилась юникодовая локаль?
> Опыт показывает, что использовать ее в качестве системной практически
> никогда не имеет смысла...

Хм... Ну, в настоящий момент меня устраивает на сервере локаль cp1251, 
но всё-таки хотелось бы "попробовать воду". К тому же все версии FC 
используют по умолчанию юникод. То же самое наблюдается и в SuSE 
9.1/9.2 (за другие версии не скажу -- не видел). В любом случае 
когда-то переходить на юникод придётся, так ведь?

-- 
WBR, Alexander Kuprin


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-28 17:44   ` Alexander Kuprin
@ 2004-12-28 21:31     ` Alexej Kryukov
  2004-12-29 20:13       ` Vladimir NOVIKOV
  0 siblings, 1 reply; 22+ messages in thread
From: Alexej Kryukov @ 2004-12-28 21:31 UTC (permalink / raw)
  To: community

On Tuesday 28 December 2004 20:44, Alexander Kuprin wrote:
>
> Хм... Ну, в настоящий момент меня устраивает на сервере локаль
> cp1251, но всё-таки хотелось бы "попробовать воду". К тому же все
> версии FC используют по умолчанию юникод. То же самое наблюдается и в
> SuSE 9.1/9.2 (за другие версии не скажу -- не видел). 

Ну, а отчего бы им его не использовать? Для американцев и европейцев
разница ведь практически незаметна, т. к. Unicode лишь расширяет
ISO8859-1, ничего в ней не меняя.

> В любом случае 
> когда-то переходить на юникод придётся, так ведь?

Да вот не уверен я в этом. Во-первых, хранить текстовые
файлы в 8-битной кодировке (неважно, какой) всегда будет 
удобнее, разумеется, если устраивает поддерживаемый ею набор 
символов.

Во-вторых, юникодовые приложения (а таковых теперь большинство:
все, основанные на qt и gtk2, ну и OOo, конечно), по сути, и так
работают в юникодной локали, т. е. для них системная кодировка
некритична. Напротив, все остальные приложения именно в этой
локали будут работать некорректно. Так какой же смысл на нее
переходить? В крайнем случае, можно приспособиться запускать в
ней какие-то определенные программы, но ставить в качестве
системной никакого смысла не вижу.

И, наконец, учтите, что линуксовая консоль к Юникоду приспособлена
отнюдь не лучшим образом: дает себя знать ограничение на количество
символов в шрифте. Так что именно в консоли от UTF-8 удовольствия
никакого не получите, а проблем будет много.



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-28 16:44 ` Alexej Kryukov
  2004-12-28 17:44   ` Alexander Kuprin
@ 2004-12-29  8:22   ` Анатолий Китайкин
  1 sibling, 0 replies; 22+ messages in thread
From: Анатолий Китайкин @ 2004-12-29  8:22 UTC (permalink / raw)
  To: community

Alexej Kryukov пишет:

>Впрочем, если не секрет, а зачем Вам понадобилась юникодовая локаль?
>Опыт показывает, что использовать ее в качестве системной практически
>никогда не имеет смысла...
>
Вопрос с именами файлов.

1) Неюникодовая локаль именно системная? Можно ли отдельному(-ым)
пользователям назначить локаль, отличную от системной? Подозреваю,
что ~/.i18n для этого и предназначен, в смысле можно = разрешено.
А вот как этот отдельный пользователь будет воспринимать созданные
другими файлы с русскими (напр.) именами?

2) В настройках самбы по умолчанию unix charset = utf8, при этом,
насколько я понял, самба создает имена файлов в юникоде, а
отдает в локали клиента (юникод или dos charset =). А как эти имена
будут восприниматься локальными (линуксовыми) пользователями?

            С уважением,
                        Анатолий Китайкин

PS: С наступающим!






^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-28 21:31     ` Alexej Kryukov
@ 2004-12-29 20:13       ` Vladimir NOVIKOV
  2004-12-29 21:08         ` Alexej Kryukov
  0 siblings, 1 reply; 22+ messages in thread
From: Vladimir NOVIKOV @ 2004-12-29 20:13 UTC (permalink / raw)
  To: community

Привет,
Alexej Kryukov wrote:

> Ну, а отчего бы им его не использовать? Для американцев и европейцев
> разница ведь практически незаметна, т. к. Unicode лишь расширяет
> ISO8859-1, ничего в ней не меняя.

В общем, да, но теперь у единой Европы и единая кодировка, в которую 
укладывается евро, символы западной и восточной части, арабского и 
турецкого языков (очень актуально соответственно во Франции и Германии).

> Да вот не уверен я в этом. Во-первых, хранить текстовые
> файлы в 8-битной кодировке (неважно, какой) всегда будет 
> удобнее, разумеется, если устраивает поддерживаемый ею набор 
> символов.

Да ладно, дисковое пространство ничего не стоит сегодня.

> Во-вторых, юникодовые приложения (а таковых теперь большинство:
> все, основанные на qt и gtk2, ну и OOo, конечно), по сути, и так
> работают в юникодной локали, т. е. для них системная кодировка
> некритична. Напротив, все остальные приложения именно в этой
> локали будут работать некорректно. Так какой же смысл на нее
> переходить? В крайнем случае, можно приспособиться запускать в
> ней какие-то определенные программы, но ставить в качестве
> системной никакого смысла не вижу.

Конкретный пример. В Windows и Mac OS X у меня стоят русская и US 
International клавиатуры, которая иной раз называется US with accents. В 
ней все дополнительные символы делаются через мёртвые клавиши и через 
AltGr. Плюс стоит греческая, так как иногда надо набирать некоторые 
буквы греческого алфавита.

Так вот, в Xfree это просто не катит без юникодной системной локали. 
Мёртвые клавиши просто не работают и US International становится просто 
US. Кстати, вариант русская + французская клавиатуры также плох, ни 
мёртвые клавиши, ни буквы с аксанами не вводятся. А уж греческая третьей...

Надо попробовать в последнем xorg, Иван Паскаль писал, что там внесены 
изменения в управление драйверами клавиатуры, равно как и обновлены сами 
драйвера.

Пока же без юникодной локали я просто не могу набирать тексты, хотя 
приложения и работают в юникоде. А при наборе исключительно 
русско-английских текстов мне юникод и вправду был бы не нужен ;-)

> И, наконец, учтите, что линуксовая консоль к Юникоду приспособлена
> отнюдь не лучшим образом: дает себя знать ограничение на количество
> символов в шрифте. Так что именно в консоли от UTF-8 удовольствия
> никакого не получите, а проблем будет много.

Если много использовать консоль, то да, возникают проблемы.

С другой стороны, я где-то видел описание выхода из положения. Системная 
локаль была en_US.UTF-8, для root и одного из пользователей сделали С. К 
сожалению, не могу найти ссылку.

Пока,

Владимир


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-29 20:13       ` Vladimir NOVIKOV
@ 2004-12-29 21:08         ` Alexej Kryukov
  2004-12-30 10:55           ` Denis Smirnov
  2004-12-30 11:24           ` Vladimir NOVIKOV
  0 siblings, 2 replies; 22+ messages in thread
From: Alexej Kryukov @ 2004-12-29 21:08 UTC (permalink / raw)
  To: community

On Wednesday 29 December 2004 23:13, Vladimir NOVIKOV wrote:

> > Да вот не уверен я в этом. Во-первых, хранить текстовые
> > файлы в 8-битной кодировке (неважно, какой) всегда будет
> > удобнее, разумеется, если устраивает поддерживаемый ею набор
> > символов.
>
> Да ладно, дисковое пространство ничего не стоит сегодня.

Да я, в общем-то, не про дисковое пространство. Просто соотношение
(1 байт == 1 символ) удобно во многих отношениях, да к тому же
приятнее из чисто эстетических соображений. По крайней мере,
в сравнении с UTF-8.

> Так вот, в Xfree это просто не катит без юникодной системной локали.
> Мёртвые клавиши просто не работают и US International становится
> просто US. Кстати, вариант русская + французская клавиатуры также
> плох, ни мёртвые клавиши, ни буквы с аксанами не вводятся. А уж
> греческая третьей...

Ха! Знаем, проходили :) И я именно по этой причине имел привычку
запускать OOo всегда в юникодной локали... пока не прочел у того
же Паскаля, как сделать локаленезависимый Compose. И, подложив его
к своей любимой ru_RU.CP1251, понял, что ru_RU.UTF-8 мне теперь,
собственно говоря, без надобности.

> Надо попробовать в последнем xorg, Иван Паскаль писал, что там
> внесены изменения в управление драйверами клавиатуры, равно как и
> обновлены сами драйвера.

В X 4.4 / X.org основное усовершенствование заключается в том,
что этот самый Compose теперь можно держать в домашнем каталоге,
а не подкладывать к той или иной локали. Это и в самом деле намного
удобнее, но принципиально новых возможностей, как видите, не
добавляет.

Кстати, вот неплохая задача для разработчиков дистрибутива: 
почему бы не изготовить некий стандартный .XCompose (я 
мог бы в этой работе принять участие) и не включить его в 
скелет пользовательских каталогов, чтобы у пользователей вся 
i18n работала "из коробки"?

> > И, наконец, учтите, что линуксовая консоль к Юникоду приспособлена
> > отнюдь не лучшим образом: дает себя знать ограничение на количество
> > символов в шрифте. Так что именно в консоли от UTF-8 удовольствия
> > никакого не получите, а проблем будет много.
>
> Если много использовать консоль, то да, возникают проблемы.
>
> С другой стороны, я где-то видел описание выхода из положения.
> Системная локаль была en_US.UTF-8, для root и одного из пользователей
> сделали С. К сожалению, не могу найти ссылку.

То есть, собственно, не выход из положения, а откат на C для тех, кого
не устраивала UTF-8? К сожалению, в наших условиях наличие пользователей
с разными локалями неприемлемо из-за дурной привычки давать файлам
русские имена ;-) Соответственно, получается, что при системной локали
ru_RU.UTF-8 и у рута должна быть тоже не C, а, например, en_US.UTF-8,
если, конечно, он не хочет ломать голову над именами файлов.



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-29 21:08         ` Alexej Kryukov
@ 2004-12-30 10:55           ` Denis Smirnov
  2004-12-30 21:16             ` Alexej Kryukov
  2004-12-30 11:24           ` Vladimir NOVIKOV
  1 sibling, 1 reply; 22+ messages in thread
From: Denis Smirnov @ 2004-12-30 10:55 UTC (permalink / raw)
  To: Alexej Kryukov; +Cc: community

On Thu, Dec 30, 2004 at 12:08:24AM +0300, Alexej Kryukov wrote:

>> Да ладно, дисковое пространство ничего не стоит сегодня.
AK> Да я, в общем-то, не про дисковое пространство. Просто соотношение
AK> (1 байт == 1 символ) удобно во многих отношениях, да к тому же
AK> приятнее из чисто эстетических соображений. По крайней мере,
AK> в сравнении с UTF-8.

А почему сразу байт?
Для внутреннего представления вполне хватит UCS-4. То есть dword.
А UTF-8 это исключительно формат для передачи через каналы связи (ну и,
возможно, для хранения).

>> Так вот, в Xfree это просто не катит без юникодной системной локали.
>> Мёртвые клавиши просто не работают и US International становится
>> просто US. Кстати, вариант русская + французская клавиатуры также
>> плох, ни мёртвые клавиши, ни буквы с аксанами не вводятся. А уж
>> греческая третьей...
AK> Ха! Знаем, проходили :) И я именно по этой причине имел привычку
AK> запускать OOo всегда в юникодной локали... пока не прочел у того
AK> же Паскаля, как сделать локаленезависимый Compose. И, подложив его
AK> к своей любимой ru_RU.CP1251, понял, что ru_RU.UTF-8 мне теперь,
AK> собственно говоря, без надобности.

Как локаль он, увы, действительно _сейчас_ без надобности. Просто потому
как почти не работает.

AK> Кстати, вот неплохая задача для разработчиков дистрибутива: 
AK> почему бы не изготовить некий стандартный .XCompose (я 
AK> мог бы в этой работе принять участие) и не включить его в 
AK> скелет пользовательских каталогов, чтобы у пользователей вся 
AK> i18n работала "из коробки"?

Хорошая идея. Может сделаешь черновой вариант, а потом его скопом
допинаем?

AK> То есть, собственно, не выход из положения, а откат на C для тех, кого
AK> не устраивала UTF-8? К сожалению, в наших условиях наличие пользователей
AK> с разными локалями неприемлемо из-за дурной привычки давать файлам
AK> русские имена ;-) Соответственно, получается, что при системной локали
AK> ru_RU.UTF-8 и у рута должна быть тоже не C, а, например, en_US.UTF-8,
AK> если, конечно, он не хочет ломать голову над именами файлов.

Увы.

-- 
С уважением, Денис

http://freesource.info



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-29 21:08         ` Alexej Kryukov
  2004-12-30 10:55           ` Denis Smirnov
@ 2004-12-30 11:24           ` Vladimir NOVIKOV
  2004-12-30 11:31             ` Serge Polkovnikov
  2004-12-30 21:19             ` [Comm] " Alexej Kryukov
  1 sibling, 2 replies; 22+ messages in thread
From: Vladimir NOVIKOV @ 2004-12-30 11:24 UTC (permalink / raw)
  To: community

Привет,

Alexej Kryukov wrote:

> Да я, в общем-то, не про дисковое пространство. Просто соотношение
> (1 байт == 1 символ) удобно во многих отношениях, да к тому же
> приятнее из чисто эстетических соображений. По крайней мере,
> в сравнении с UTF-8.

Удобно сегодня, так как многие программы не умеют толком обрабатывать 
такие файлы, завтра это будет по фигу. С другой стороны, одноязычные 
тексты действительно можно хранить в восьмибитной кодировке. Проблема 
появляется, когда в глобально русскоязычный файл надо вставить два 
французских слова ;-)
Но если файл одноязычный и призван таким осталься (модель договора, к 
примеру), why not? Хотя именно такой случай у меня был. Составлял 
контракт на русском языке между российской и французской фирмами, 
требовалось только вставить название фирмы и адрес. Модель была в КОИ8 
на русском, а в названии и адресе, как на грех, полно аксанов. Пришлось 
переводить файл в UTF-8.

> Ха! Знаем, проходили :) И я именно по этой причине имел привычку
> запускать OOo всегда в юникодной локали... пока не прочел у того
> же Паскаля, как сделать локаленезависимый Compose. И, подложив его
> к своей любимой ru_RU.CP1251, понял, что ru_RU.UTF-8 мне теперь,
> собственно говоря, без надобности.

А где про это прочитать? На его сайте в разделе про  xkb я что-то не 
нашел. И почему любимая локаль 1251? Чем мотивируете, какие достоинства? 
Нет ли проблем с манами или чем-то ещё? Есть ли недостатки по сравнению 
с кои?

> В X 4.4 / X.org основное усовершенствование заключается в том,
> что этот самый Compose теперь можно держать в домашнем каталоге,
> а не подкладывать к той или иной локали. Это и в самом деле намного
> удобнее, но принципиально новых возможностей, как видите, не
> добавляет.

М-да, до Windows ещё далеко-далеко в этом плане. На самом деле, у меня 
клавиатур значительно больше. Просто привык, даже общаясь на русском с 
украинцами или сербами, а на английском или французском с 
чехами/словаками/поляками/шведами и прочими литовцами, правильно хотя бы 
их имена писать, со всеми значками.

В иксах такое сегодня весьма затруднительно. В Windows или на Маке 
просто щёлкаешь мышкой и выбираешь нужную раскладку. Потом можно убрать, 
если мешает.

> То есть, собственно, не выход из положения, а откат на C для тех, кого
> не устраивала UTF-8? К сожалению, в наших условиях наличие пользователей
> с разными локалями неприемлемо из-за дурной привычки давать файлам
> русские имена ;-) Соответственно, получается, что при системной локали
> ru_RU.UTF-8 и у рута должна быть тоже не C, а, например, en_US.UTF-8,
> если, конечно, он не хочет ломать голову над именами файлов.

За русские имена файлов - мочить в сортире (tm).
С другой стороны, при системной ru_RU.UTF-8, у рута en_US.UTF-8 можно 
ещё создать пользователя с локалью С, чтобы мог работать с некоторыми 
консольными программами, которые неправильно обрабатывают Unicode. 
Согласен, что это костыли, но что делать, кому сейчас легко?


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-30 11:24           ` Vladimir NOVIKOV
@ 2004-12-30 11:31             ` Serge Polkovnikov
  2004-12-30 11:51               ` Denis Smirnov
  2004-12-30 21:19             ` [Comm] " Alexej Kryukov
  1 sibling, 1 reply; 22+ messages in thread
From: Serge Polkovnikov @ 2004-12-30 11:31 UTC (permalink / raw)
  To: community

четвер 30 грудень 2004 13:24, Vladimir NOVIKOV Ви написали:
> За русские имена файлов - мочить в сортире (tm).
Очень спорная фраза...
-- 
Сергей Полковников


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-30 11:31             ` Serge Polkovnikov
@ 2004-12-30 11:51               ` Denis Smirnov
  2004-12-30 11:52                 ` [Comm] [JT] " Serge Polkovnikov
  0 siblings, 1 reply; 22+ messages in thread
From: Denis Smirnov @ 2004-12-30 11:51 UTC (permalink / raw)
  To: Serge Polkovnikov; +Cc: community

On Thu, Dec 30, 2004 at 01:31:44PM +0200, Serge Polkovnikov wrote:

>> За русские имена файлов - мочить в сортире (tm).
SP> Очень спорная фраза...

Правильная с точки зрения IT'шника -- "мы знаем что будут проблемы"
Идиотичная с точки зрения пользователя -- "я английский не знаю и знать не
хочу, и пусть эти грёбаные компьютерщики сделают так как МНЕ удобно"

:(

-- 
С уважением, Денис

http://freesource.info



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] [JT] Использование UTF-локали в ALT Linux
  2004-12-30 11:51               ` Denis Smirnov
@ 2004-12-30 11:52                 ` Serge Polkovnikov
  2004-12-30 11:58                   ` Denis Smirnov
  2004-12-30 12:03                   ` Andriy Dobrovol's'kii
  0 siblings, 2 replies; 22+ messages in thread
From: Serge Polkovnikov @ 2004-12-30 11:52 UTC (permalink / raw)
  To: Denis Smirnov, community

четвер 30 грудень 2004 13:51, Denis Smirnov Ви написали:
> On Thu, Dec 30, 2004 at 01:31:44PM +0200, Serge Polkovnikov wrote:
> >> За русские имена файлов - мочить в сортире (tm).
>
> SP> Очень спорная фраза...
>
> Правильная с точки зрения IT'шника -- "мы знаем что будут проблемы"
> Идиотичная с точки зрения пользователя -- "я английский не знаю и знать не
> хочу, и пусть эти грёбаные компьютерщики сделают так как МНЕ удобно"
>
> :(
Не, не так:
Правильная с точки зрения IT'шника -- "мы знаем что *на данный момент в нашей 
системе с этим* будут проблемы. *Это плохо и мы с этим будем бороться*"

_Правильная_ с точки зрения пользователя -- "я английский не знаю и знать не
 хочу, и пусть эти грёбаные компьютерщики сделают так как МНЕ удобно"

-- 
Сергей Полковников


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] [JT] Использование UTF-локали в ALT Linux
  2004-12-30 11:52                 ` [Comm] [JT] " Serge Polkovnikov
@ 2004-12-30 11:58                   ` Denis Smirnov
  2004-12-30 12:03                     ` Serge Polkovnikov
  2004-12-30 12:03                   ` Andriy Dobrovol's'kii
  1 sibling, 1 reply; 22+ messages in thread
From: Denis Smirnov @ 2004-12-30 11:58 UTC (permalink / raw)
  To: Serge Polkovnikov; +Cc: community

On Thu, Dec 30, 2004 at 01:52:31PM +0200, Serge Polkovnikov wrote:

> >>> За русские имена файлов - мочить в сортире (tm).
> SP>> Очень спорная фраза...
>> Правильная с точки зрения IT'шника -- "мы знаем что будут проблемы"
>> Идиотичная с точки зрения пользователя -- "я английский не знаю и знать не
>> хочу, и пусть эти грёбаные компьютерщики сделают так как МНЕ удобно"
>> :(
SP> Не, не так:
SP> Правильная с точки зрения IT'шника -- "мы знаем что *на данный момент в нашей 
SP> системе с этим* будут проблемы. *Это плохо и мы с этим будем бороться*"
SP> _Правильная_ с точки зрения пользователя -- "я английский не знаю и знать не
SP>  хочу, и пусть эти грёбаные компьютерщики сделают так как МНЕ удобно"

Я имел в виду правильность/идиотичность первой фразы в цитировании :)
А под сказаным вами готов подписаться.

-- 
С уважением, Денис

http://freesource.info



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] [JT] Использование UTF-локали в ALT Linux
  2004-12-30 11:52                 ` [Comm] [JT] " Serge Polkovnikov
  2004-12-30 11:58                   ` Denis Smirnov
@ 2004-12-30 12:03                   ` Andriy Dobrovol's'kii
  2004-12-30 12:10                     ` Serge Polkovnikov
  2004-12-30 12:18                     ` Denis Smirnov
  1 sibling, 2 replies; 22+ messages in thread
From: Andriy Dobrovol's'kii @ 2004-12-30 12:03 UTC (permalink / raw)
  To: community

Serge Polkovnikov wrote:
 > четвер 30 грудень 2004 13:51, Denis Smirnov Ви написали:
 >
 >>On Thu, Dec 30, 2004 at 01:31:44PM +0200, Serge Polkovnikov wrote:
 >>
 >>>>За русские имена файлов - мочить в сортире (tm).
 >>
 >>SP> Очень спорная фраза...
 >>
 >>Правильная с точки зрения IT'шника -- "мы знаем что будут проблемы"
 >>Идиотичная с точки зрения пользователя -- "я английский не знаю и 
знать не
 >>хочу, и пусть эти грёбаные компьютерщики сделают так как МНЕ удобно"
 >>
 >>:(
 >
 > Не, не так:
 > Правильная с точки зрения IT'шника -- "мы знаем что *на данный 
момент в нашей
 > системе с этим* будут проблемы. *Это плохо и мы с этим будем 
бороться*"
 >
Да.
 > _Правильная_ с точки зрения пользователя -- "я английский не знаю 
и знать не
 >  хочу, и пусть эти грёбаные компьютерщики сделают так как МНЕ удобно"
 >
Не, не так. :)
"я английский не знаю и знать не хочу, но я дорожу своими данными. И
пока эти грёбаные компьютерщики не сделают как мне удобно, буду
давать файлам имена транслитом..." ;)
Всё остальное блажь. За которую нужно "мочить в сортире"((С) известный).

-- 
Rgrds,
Andriy
*********************************************************************
email: dobr at iop dot kiev dot ua            Kyiv, Ukraine
Phone: (380-44)   265-7824            Department of Gas Electronics
Fax:   (380-44)   265-2329             Institute of Physics of NASU
*********************************************************************


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] [JT] Использование UTF-локали в ALT Linux
  2004-12-30 11:58                   ` Denis Smirnov
@ 2004-12-30 12:03                     ` Serge Polkovnikov
  2004-12-30 12:17                       ` Denis Smirnov
  0 siblings, 1 reply; 22+ messages in thread
From: Serge Polkovnikov @ 2004-12-30 12:03 UTC (permalink / raw)
  To: community

четвер 30 грудень 2004 13:58, Denis Smirnov Ви написали:
> On Thu, Dec 30, 2004 at 01:52:31PM +0200, Serge Polkovnikov wrote:
> > >>> За русские имена файлов - мочить в сортире (tm).
> >
> > SP>> Очень спорная фраза...
> >
> >> Правильная с точки зрения IT'шника -- "мы знаем что будут проблемы"
> >> Идиотичная с точки зрения пользователя -- "я английский не знаю и знать
> >> не хочу, и пусть эти грёбаные компьютерщики сделают так как МНЕ удобно"
> >>
> >> :(
>
> SP> Не, не так:
> SP> Правильная с точки зрения IT'шника -- "мы знаем что *на данный момент в
> нашей SP> системе с этим* будут проблемы. *Это плохо и мы с этим будем
> бороться*" SP> _Правильная_ с точки зрения пользователя -- "я английский не
> знаю и знать не SP>  хочу, и пусть эти грёбаные компьютерщики сделают так
> как МНЕ удобно"
>
> Я имел в виду правильность/идиотичность первой фразы в цитировании :)
А в этом смысле, да. Потому и написал, что спорная, тем более, что 
характеристики   "IT'шник" и "пользователь" друг друга не исключают...
Я, например, свои "пользовательские" файлы обзываю русскими именами.
> А под сказаным вами готов подписаться.

-- 
Сергей Полковников


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] [JT] Использование UTF-локали в ALT Linux
  2004-12-30 12:03                   ` Andriy Dobrovol's'kii
@ 2004-12-30 12:10                     ` Serge Polkovnikov
  2004-12-30 12:18                     ` Denis Smirnov
  1 sibling, 0 replies; 22+ messages in thread
From: Serge Polkovnikov @ 2004-12-30 12:10 UTC (permalink / raw)
  To: community

четвер 30 грудень 2004 14:03, Andriy Dobrovol's'kii Ви написали:
>  > _Правильная_ с точки зрения пользователя -- "я английский не знаю
>  > и знать не хочу, и пусть эти грёбаные компьютерщики сделают так
>  > как МНЕ удобно" 
>  >

> "я английский не знаю и знать не хочу, но я дорожу своими данными. И
> пока эти грёбаные компьютерщики не сделают как мне удобно, буду
> давать файлам имена транслитом..." ;)
> Всё остальное блажь. За которую нужно "мочить в сортире"((С) известный).

Эта фраза не исключает процитированную... :)
-- 
Сергей Полковников


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] [JT] Использование UTF-локали в ALT Linux
  2004-12-30 12:03                     ` Serge Polkovnikov
@ 2004-12-30 12:17                       ` Denis Smirnov
  0 siblings, 0 replies; 22+ messages in thread
From: Denis Smirnov @ 2004-12-30 12:17 UTC (permalink / raw)
  To: Serge Polkovnikov; +Cc: community

On Thu, Dec 30, 2004 at 02:03:27PM +0200, Serge Polkovnikov wrote:

>> Я имел в виду правильность/идиотичность первой фразы в цитировании :)
SP> А в этом смысле, да. Потому и написал, что спорная, тем более, что 
SP> характеристики   "IT'шник" и "пользователь" друг друга не исключают...
SP> Я, например, свои "пользовательские" файлы обзываю русскими именами.

Я также :)

-- 
С уважением, Денис

http://freesource.info



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] [JT] Использование UTF-локали в ALT Linux
  2004-12-30 12:03                   ` Andriy Dobrovol's'kii
  2004-12-30 12:10                     ` Serge Polkovnikov
@ 2004-12-30 12:18                     ` Denis Smirnov
  1 sibling, 0 replies; 22+ messages in thread
From: Denis Smirnov @ 2004-12-30 12:18 UTC (permalink / raw)
  To: Andriy Dobrovol's'kii; +Cc: community

On Thu, Dec 30, 2004 at 02:03:20PM +0200, Andriy Dobrovol's'kii wrote:

ADsk> Не, не так. :)
ADsk> "я английский не знаю и знать не хочу, но я дорожу своими данными. И
ADsk> пока эти грёбаные компьютерщики не сделают как мне удобно, буду
ADsk> давать файлам имена транслитом..." ;)
ADsk> Всё остальное блажь. За которую нужно "мочить в сортире"((С) известный).

Блажь это то, что "долбаные компьютерщики" непонятно какого хрена не могут
обеспечить пользователям удобство использования в таких простейших вещах
вот уже чёрт знает сколько лет.

-- 
С уважением, Денис

http://freesource.info



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-30 10:55           ` Denis Smirnov
@ 2004-12-30 21:16             ` Alexej Kryukov
  2005-01-02 12:21               ` Denis Smirnov
  0 siblings, 1 reply; 22+ messages in thread
From: Alexej Kryukov @ 2004-12-30 21:16 UTC (permalink / raw)
  To: Denis Smirnov, community

On Thursday 30 December 2004 13:55, Denis Smirnov wrote:
>
> AK> Да я, в общем-то, не про дисковое пространство. Просто
> соотношение AK> (1 байт == 1 символ) удобно во многих отношениях, да
> к тому же AK> приятнее из чисто эстетических соображений. По крайней
> мере, AK> в сравнении с UTF-8.
>
> А почему сразу байт?
> Для внутреннего представления вполне хватит UCS-4. То есть dword.

Если бы... Но вот, к примеру, Kevin Hendrics напрочь отказывается
переделывать myspell под Юникод: у меня, говорит, слова хранятся
в массивах байтов, а потому идите все подальше :)

> А UTF-8 это исключительно формат для передачи через каналы связи (ну
> и, возможно, для хранения).

Так вот я и говорю о хранении, и о тех чисто эстетических чувствах,
которые могут вызывать файлы в UTF-8, хранящиеся на диске :) М. б. M$ и
права, что всюду проталкивает UCS-2 LE...

> Как локаль он, увы, действительно _сейчас_ без надобности. 
> Просто  потому как почти не работает.

Ну, это преувеличение... Вполне можно прожить в юникодовой локали,
если обходиться только определенным кругом приложений (каковых,
впрочем, сейчас большинство). Но дело, повторяю, в том, что именно 
для тех приложений, которые только и могут нормально работать в
юникодной локали, системная кодировка как раз некритична. И поскольку
данное положение является хорошим и правильным, то едва ли использование
такой локали в качестве системной когда-либо приобретет больший смысл,
чем теперь.

Хотя существовать такая локаль, безусловно, должна, хотя бы для
всяческих отладочно-страховочных целей...

> AK> Кстати, вот неплохая задача для разработчиков дистрибутива:
> AK> почему бы не изготовить некий стандартный .XCompose (я
> AK> мог бы в этой работе принять участие) и не включить его в
> AK> скелет пользовательских каталогов, чтобы у пользователей вся
> AK> i18n работала "из коробки"?
>
> Хорошая идея. Может сделаешь черновой вариант, а потом его скопом
> допинаем?

OK, попробую заняться, когда будет время.


^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-30 11:24           ` Vladimir NOVIKOV
  2004-12-30 11:31             ` Serge Polkovnikov
@ 2004-12-30 21:19             ` Alexej Kryukov
  2005-01-02 12:43               ` Denis Smirnov
  1 sibling, 1 reply; 22+ messages in thread
From: Alexej Kryukov @ 2004-12-30 21:19 UTC (permalink / raw)
  To: community

On Thursday 30 December 2004 14:24, Vladimir NOVIKOV wrote:
> Привет,
>
> Но если файл одноязычный и призван таким осталься (модель договора, к
> примеру), why not? Хотя именно такой случай у меня был. Составлял
> контракт на русском языке между российской и французской фирмами,
> требовалось только вставить название фирмы и адрес. Модель была в
> КОИ8 на русском, а в названии и адресе, как на грех, полно аксанов.
> Пришлось переводить файл в UTF-8.

Вот и я о том же: why not?

Более характерный пример -- повествовательные тексты, взятые, например,
из электронных библиотек. Естественно, я предпочитаю их держать в
текстовом формате (ну не в doc'ах же!), и при этом люблю оформлять
в стиле Лексикона, т. е. с разбивкой на строки одинаковой длины.
А представьте, что файл в UTF-8: визуально строки одинаковые, но
в байтах-то -- нет! Непорядок, однако :)

Разумеется, я не говорю о том случае, когда текст действительно содержит
специфические символы разных языков: тут я сам первый буду выступать
за Юникод :)

> А где про это прочитать? На его сайте в разделе про  xkb я что-то не
> нашел. 

Я, собственно, имел в виду вот этот его пост:
http://www.mail-archive.com/i18n@xfree86.org/msg01562.html
Кстати, я как-то уже давал эту ссылку, отвечая Вам же...

Практически же локаленезависимый Compose легко получить следующим
образом: берем файл от en_US.UTF-8 и удаляем (с помощью sed'а
или как-то еще) все закавыченные строки. Это проверено и работает.

> И почему любимая локаль 1251? Чем мотивируете, какие 
> достоинства? 

Так это же очевидно: достаточно просто сравнить две таблицы 
кодировки.

В самом деле, cp1251:

-- является не чисто русской, а общеславянской;
-- содержит типографские символы, в т. ч. парные кавычки и знак номера;
-- русские буквы в ней расположены в алфавитном порядке;
-- заглавные предшествуют строчным, как это сделано практически
во всех кодировках, кроме koi.

Плюс совместимость с виндой как немаловажный довесок.

> Нет ли проблем с манами или чем-то ещё? Есть ли 
> недостатки по сравнению с кои?

Ну, были проблемы с неграмотно написанными (без явного указания 
кодировки) *.po-файлами в koi8: естественно, при локали cp1251
в интерфейсе программы получается бНОПНЯ наоборот. Но сейчас
таких программ практически не осталось, поскольку основным 
источником проблем был Gnome 1.* со своими приложениями.

> М-да, до Windows ещё далеко-далеко в этом плане.  На самом деле, у 
> меня клавиатур значительно больше. Просто привык, даже общаясь на
> русском с украинцами или сербами, а на английском или французском с
> чехами/словаками/поляками/шведами и прочими литовцами, правильно хотя
> бы их имена писать, со всеми значками.

Я здесь как-то писал о том, что в Windows действительно намного
удобнее работать с многоязычными текстами в неюникодовых приложениях
типа Word 7, PageMaker или QuarkXpress. Что же касается юникодовых,
то настоящая загвоздка была только в Compose, и по устранении ее
иксы IMHO ничем не уступают Windows. 

> В иксах такое сегодня весьма затруднительно. В Windows или на Маке
> просто щёлкаешь мышкой и выбираешь нужную раскладку. Потом можно
> убрать, если мешает.

Ну так а командная строка на что? setxkbmap с нужными параметрами,
и все дела. Или настраивайте стандартный переключатель в KDE либо
Gnome (который делает именно это -- выполняет setxkbmap на каждое
переключение раскладки).



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-30 21:16             ` Alexej Kryukov
@ 2005-01-02 12:21               ` Denis Smirnov
  0 siblings, 0 replies; 22+ messages in thread
From: Denis Smirnov @ 2005-01-02 12:21 UTC (permalink / raw)
  To: Alexej Kryukov; +Cc: community

On Fri, Dec 31, 2004 at 12:16:52AM +0300, Alexej Kryukov wrote:

>> А почему сразу байт?
>> Для внутреннего представления вполне хватит UCS-4. То есть dword.
AK> Если бы... Но вот, к примеру, Kevin Hendrics напрочь отказывается
AK> переделывать myspell под Юникод: у меня, говорит, слова хранятся
AK> в массивах байтов, а потому идите все подальше :)

Это называется невменяемый автор. В таких случаях, IMHO, есть смысл делать
форк.

>> А UTF-8 это исключительно формат для передачи через каналы связи (ну
>> и, возможно, для хранения).
AK> Так вот я и говорю о хранении, и о тех чисто эстетических чувствах,
AK> которые могут вызывать файлы в UTF-8, хранящиеся на диске :) М. б. M$ и
AK> права, что всюду проталкивает UCS-2 LE...

Знаешь, лично мне давно пофиг в чём у меня текстовые файлы. Просто потому,
что моему vim'у на это пофиг. Так что это не имеет никакого значения.
Конвертировать элементарно, внутреннее представление всё равно отличается
от представления на диске, так что слой перекодирования всё равно есть.

>> Как локаль он, увы, действительно _сейчас_ без надобности. 
>> Просто  потому как почти не работает.
AK> Ну, это преувеличение... Вполне можно прожить в юникодовой локали,
AK> если обходиться только определенным кругом приложений (каковых,
AK> впрочем, сейчас большинство). Но дело, повторяю, в том, что именно 
AK> для тех приложений, которые только и могут нормально работать в
AK> юникодной локали, системная кодировка как раз некритична. И поскольку
AK> данное положение является хорошим и правильным, то едва ли использование
AK> такой локали в качестве системной когда-либо приобретет больший смысл,
AK> чем теперь.
AK> Хотя существовать такая локаль, безусловно, должна, хотя бы для
AK> всяческих отладочно-страховочных целей...

Дело в том, что сейчас имена файлов в текущей системной локали. И если
пользователю надо работать в консоли с многоязычными документами, он может
здорово обломаться.

> AK>> Кстати, вот неплохая задача для разработчиков дистрибутива:
> AK>> почему бы не изготовить некий стандартный .XCompose (я
> AK>> мог бы в этой работе принять участие) и не включить его в
> AK>> скелет пользовательских каталогов, чтобы у пользователей вся
> AK>> i18n работала "из коробки"?
>> Хорошая идея. Может сделаешь черновой вариант, а потом его скопом
>> допинаем?
AK> OK, попробую заняться, когда будет время.

Замечательно.

-- 
С уважением, Денис

http://freesource.info



^ permalink raw reply	[flat|nested] 22+ messages in thread

* Re: [Comm] Использование UTF-локали в ALT Linux
  2004-12-30 21:19             ` [Comm] " Alexej Kryukov
@ 2005-01-02 12:43               ` Denis Smirnov
  0 siblings, 0 replies; 22+ messages in thread
From: Denis Smirnov @ 2005-01-02 12:43 UTC (permalink / raw)
  To: Alexej Kryukov; +Cc: community

On Fri, Dec 31, 2004 at 12:19:24AM +0300, Alexej Kryukov wrote:

AK> Более характерный пример -- повествовательные тексты, взятые, например,
AK> из электронных библиотек. Естественно, я предпочитаю их держать в
AK> текстовом формате (ну не в doc'ах же!), и при этом люблю оформлять
AK> в стиле Лексикона, т. е. с разбивкой на строки одинаковой длины.
AK> А представьте, что файл в UTF-8: визуально строки одинаковые, но
AK> в байтах-то -- нет! Непорядок, однако :)

А какая разница что там в байтах?

AK> Разумеется, я не говорю о том случае, когда текст действительно содержит
AK> специфические символы разных языков: тут я сам первый буду выступать
AK> за Юникод :)

Дык дело в единообразии.

Факт -- юникод _нужен_. Пусть не всем, но заметной части пользователей.
Если его вводить, то проще всё на него перетаскивать. Геморрою меньше
будет.


AK> -- является не чисто русской, а общеславянской;
AK> -- содержит типографские символы, в т. ч. парные кавычки и знак номера;
AK> -- русские буквы в ней расположены в алфавитном порядке;
AK> -- заглавные предшествуют строчным, как это сделано практически
AK> во всех кодировках, кроме koi.

Реально имеют значение (и очень большое) первые два пункта. Остальное не
важна. Правильно написаная программа не должна обращать внимания на такие
мелочи :)

-- 
С уважением, Денис

http://freesource.info



^ permalink raw reply	[flat|nested] 22+ messages in thread

end of thread, other threads:[~2005-01-02 12:43 UTC | newest]

Thread overview: 22+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2004-12-28 12:02 [Comm] Использование UTF-локали в ALT Linux Alexander Kuprin
2004-12-28 16:44 ` Alexej Kryukov
2004-12-28 17:44   ` Alexander Kuprin
2004-12-28 21:31     ` Alexej Kryukov
2004-12-29 20:13       ` Vladimir NOVIKOV
2004-12-29 21:08         ` Alexej Kryukov
2004-12-30 10:55           ` Denis Smirnov
2004-12-30 21:16             ` Alexej Kryukov
2005-01-02 12:21               ` Denis Smirnov
2004-12-30 11:24           ` Vladimir NOVIKOV
2004-12-30 11:31             ` Serge Polkovnikov
2004-12-30 11:51               ` Denis Smirnov
2004-12-30 11:52                 ` [Comm] [JT] " Serge Polkovnikov
2004-12-30 11:58                   ` Denis Smirnov
2004-12-30 12:03                     ` Serge Polkovnikov
2004-12-30 12:17                       ` Denis Smirnov
2004-12-30 12:03                   ` Andriy Dobrovol's'kii
2004-12-30 12:10                     ` Serge Polkovnikov
2004-12-30 12:18                     ` Denis Smirnov
2004-12-30 21:19             ` [Comm] " Alexej Kryukov
2005-01-02 12:43               ` Denis Smirnov
2004-12-29  8:22   ` Анатолий Китайкин

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git