ALT Linux Team development discussions
 help / color / mirror / Atom feed
* Re: [devel] russian encodings in rpm
  2000-12-03 11:29 [devel] russian encodings in rpm Aleksey Novodvorsky
@ 2000-12-03 11:27 ` Ivan Zakharyaschev
  2000-12-03 12:01   ` Alexander Bokovoy
  2000-12-04 13:58   ` aen
  0 siblings, 2 replies; 7+ messages in thread
From: Ivan Zakharyaschev @ 2000-12-03 11:27 UTC (permalink / raw)
  To: devel

	Здравствуйте!

У меня возникли побочные вопросы.

On Sun, 3 Dec 2000, Aleksey Novodvorsky wrote:

> Уважаемые коллеги, предлагаю обсудить очередную локализационную
> проблему.
> Русские po файлы в glibc-2.2, как это уже говорилось, счастливо
> перекодируются в нужную кодировку.

А как? Я обратил внимание на то, что в них есть такие поля:
Content-Type: text/plain; charset=koi8-r
Content-Transfer-Encoding: 8bit

Они подразумевают использование названий, зарегистрированных для Internet.
Среди них cp1251 нет, а есть windows-1251. Но glibc такого названия не
знает -- значит ли это, что перекодирование -- односторонний процесс: в
результате перекодирования сообщений получается текст, который уже не
может служить в качестве po-файла (из-за другого набора свойств: у
исходного po есть charset, а у полученного текста можно указать только
название "системной" кодировки)? А что если исходные сообщения будут в
cp1251 -- как это должно быть указано в po-файле?

> Проблему c man-pages будем, видимо, решать (пока) удвоением, хоть и
> грустно.
> Остается вопрос с переводимыми полями spec-файлов. Принципиально я вижу
> одно решение -- считать  ru сокращением от ru_RU.KOI8-R и

Включение поля Group(ru) в spec-файл (пакет) -- дело пишущего spec-файл?

-- 
Best regards,
      Ivan Z.

_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 7+ messages in thread

* [devel] russian encodings in rpm
@ 2000-12-03 11:29 Aleksey Novodvorsky
  2000-12-03 11:27 ` Ivan Zakharyaschev
  0 siblings, 1 reply; 7+ messages in thread
From: Aleksey Novodvorsky @ 2000-12-03 11:29 UTC (permalink / raw)
  To: devel

Уважаемые коллеги, предлагаю обсудить очередную локализационную
проблему.
Русские po файлы в glibc-2.2, как это уже говорилось, счастливо
перекодируются в нужную кодировку.
Проблему c man-pages будем, видимо, решать (пока) удвоением, хоть и
грустно.
Остается вопрос с переводимыми полями spec-файлов. Принципиально я вижу
одно решение -- считать  ru сокращением от ru_RU.KOI8-R и перекодировать
соответственно (требуется модификация rpm).  Возможно использование и
полного имени locale, но полагаться только на это вряд ли стоит. По
сути, создется  locale.alias, аналогичный тому, что в X (в glibc в
принципе, тот же по структуре). Надеюсь, что все программы вытаскивают
эту информацию из базы или из пакета стандартными функциями. Если не
так, то будут проблемы.
Отдельная песня -- программа установки. Так как персобирать rpm для нее
пока нет охоты, то придется использовать единые шрифты/переводы для
установок разных русских (украинских?) кодировок. Вообще говоря, хорошо
бы разделить язык установки и язык устанавливаемой системы и на уровне
пользовательского интерфейса, но ресурсов на это у нас сейчас вряд ли
хватит.
В перспективе, мне кажется, надо бы, следуя стандартам KDE, хранить эту
информацию в UTF-8.  Представление в UTF-8 может быть лишь внутренним,
то есть spec пишется в кодировках, задаваемыми  некоторыми
переменными/таблицей/ключами. При этом не возникнет несовместимости, так
как символы UTF-8  легко определяются. Хорошо бы распространить это в
перспективе  на man и info.

Мнения?

Rgrds, Алексей

_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 7+ messages in thread

* Re: [devel] russian encodings in rpm
  2000-12-03 11:27 ` Ivan Zakharyaschev
@ 2000-12-03 12:01   ` Alexander Bokovoy
  2000-12-03 14:23     ` Ivan Zakharyaschev
  2000-12-04 13:58   ` aen
  1 sibling, 1 reply; 7+ messages in thread
From: Alexander Bokovoy @ 2000-12-03 12:01 UTC (permalink / raw)
  To: devel

Доброго времени суток!

On Sun, 3 Dec 2000, Ivan Zakharyaschev wrote:
> 	Здравствуйте!
> 
> У меня возникли побочные вопросы.
> 
> On Sun, 3 Dec 2000, Aleksey Novodvorsky wrote:
> 
> > Уважаемые коллеги, предлагаю обсудить очередную локализационную
> > проблему.
> > Русские po файлы в glibc-2.2, как это уже говорилось, счастливо
> > перекодируются в нужную кодировку.
> 
> А как? Я обратил внимание на то, что в них есть такие поля:
> Content-Type: text/plain; charset=koi8-r
> Content-Transfer-Encoding: 8bit
> 
> Они подразумевают использование названий, зарегистрированных для Internet.
> Среди них cp1251 нет, а есть windows-1251. Но glibc такого названия не
> знает -- значит ли это, что перекодирование -- односторонний процесс: в
> результате перекодирования сообщений получается текст, который уже не
> может служить в качестве po-файла (из-за другого набора свойств: у
> исходного po есть charset, а у полученного текста можно указать только
> название "системной" кодировки)? А что если исходные сообщения будут в
> cp1251 -- как это должно быть указано в po-файле?
Дело в том, что это перекодирование происходит на лету, в момент запроса
данных (переводов) приложением. Писать windows-1251 можно, поскольку это 
наименование внесено в /usr/lib/gconv/gconv-modules  как синоним cp1251.
Дальше, поскольку перекодирование идет "на лету", то этот текст и не предназначается
для получения po файла из mo, который подвергается этому преобразованию. Это
просто разные этапы.

> 
> > Проблему c man-pages будем, видимо, решать (пока) удвоением, хоть и
> > грустно.
> > Остается вопрос с переводимыми полями spec-файлов. Принципиально я вижу
> > одно решение -- считать  ru сокращением от ru_RU.KOI8-R и
> 
> Включение поля Group(ru) в spec-файл (пакет) -- дело пишущего spec-файл?
Конечно.
Sincerely yours, Alexander Bokovoy 
  The Midgard Project   | www.midgard-project.org |    Aurora R&D team 
Minsk Linux Users Group |    www.minsk-lug.net    |  www.aurora-linux.com  
   IPLabs Linux Team    |     linux.iplabs.ru     | Architecte Open Source
-- Scintillation is not always identification for an auric substance.

_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 7+ messages in thread

* Re: [devel] russian encodings in rpm
  2000-12-03 12:01   ` Alexander Bokovoy
@ 2000-12-03 14:23     ` Ivan Zakharyaschev
  2000-12-04  1:51       ` Dmitry V. Levin
  0 siblings, 1 reply; 7+ messages in thread
From: Ivan Zakharyaschev @ 2000-12-03 14:23 UTC (permalink / raw)
  To: devel

On Sun, 3 Dec 2000, Alexander Bokovoy wrote:

> > Включение поля Group(ru) в spec-файл (пакет) -- дело пишущего
> spec-файл?
> Конечно.

Но названия групп более менее стандартизированы. Можно было бы
автоматизировать это. Как на этапе создания пакета, так и на этапе запроса
информации о пакете.
Пользователям во всех странах хотелось бы видеть названия групп на родном
языке, а packager вручную не может включать названия групп для всех
возможных языков, да и это будет лишним утолщением spec-файла.

Правда, с другими полями, требующими более творческого подхода, так не
сделать.

Получается, что пакет либо локализован, либо его packager должен быть
полиглотом и не лениться переводить все поля на все языки при
внесении в их содержание изменений. Нет возможности как-нибудь отделять
переводы полей от самого пакета?

-- 
Best regards,
      Ivan Z.

_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 7+ messages in thread

* Re: [devel] russian encodings in rpm
  2000-12-03 14:23     ` Ivan Zakharyaschev
@ 2000-12-04  1:51       ` Dmitry V. Levin
  0 siblings, 0 replies; 7+ messages in thread
From: Dmitry V. Levin @ 2000-12-04  1:51 UTC (permalink / raw)
  To: devel

[-- Attachment #1: Type: text/plain, Size: 2419 bytes --]

On Sun, Dec 03, 2000 at 05:23:35PM +0300, Ivan Zakharyaschev wrote:
> > > Включение поля Group(ru) в spec-файл (пакет) -- дело пишущего
> > spec-файл?
> > Конечно.
> 
> Но названия групп более менее стандартизированы. Можно было бы
> автоматизировать это. Как на этапе создания пакета, так и на этапе запроса
> информации о пакете.
> Пользователям во всех странах хотелось бы видеть названия групп на родном
> языке, а packager вручную не может включать названия групп для всех
> возможных языков, да и это будет лишним утолщением spec-файла.

Отличная идея!

Мне удалось реализовать поддержку такой перекодировки в rpm.
Другими словами, если в .po-файл добавить переводы всех наименований
групп, то rpmlib (и rpm) будут возвращать локализованную версию.

Так что можете смело выкидывать все переводы групп, для перекодировки
достаточно сконвертировать GROUPS.lang в rpm-3.0.6/po/lang.po

Как только мне удастся подключить HDD с записанным туда Sisyphus, я
сделаю нормальную поддержку различных версий python в rpm, добавлю этот
патч и переводы из GROUPS.ru, после чего будет анонс новой версии.

Внимание: посмотрите /usr/share/doc/rpm-3.0.6/GROUPS.ru и помогите
перевести недопереведенные имена групп.

Между прочим, в этом ракурсе переводы для lang != ru тоже приветствуются.
За основу можно будет взять ru.po

Вопрос: можно ли это достижение использовать в дремучей программе
установки? Достаточно ли для этого пересобрать rpm/rpmlib?

> Правда, с другими полями, требующими более творческого подхода, так не
> сделать.
> 
> Получается, что пакет либо локализован, либо его packager должен быть
> полиглотом и не лениться переводить все поля на все языки при
> внесении в их содержание изменений. Нет возможности как-нибудь отделять
> переводы полей от самого пакета?

Есть, но они слабо документированы. Если кто-то в этом разберется, будет
просто здорово. Hint: архивы списка rpm-list + исходный код rpm.


Regards,
	Dmitry

+-------------------------------------------------------------------------+
Dmitry V. Levin     mailto://ldv@fandra.org
Software Engineer   PGP pubkey http://www.fandra.org/users/ldv/pgpkeys.html
IPLabs Linux Team   http://linux.iplabs.ru
Fandra Project      http://www.fandra.org
+-------------------------------------------------------------------------+
UNIX is user friendly. It's just very selective about who its friends are.

[-- Attachment #2: Type: application/pgp-signature, Size: 232 bytes --]

^ permalink raw reply	[flat|nested] 7+ messages in thread

* Re: [devel] russian encodings in rpm
  2000-12-03 11:27 ` Ivan Zakharyaschev
  2000-12-03 12:01   ` Alexander Bokovoy
@ 2000-12-04 13:58   ` aen
  2000-12-08 19:20     ` Ivan Zakharyaschev
  1 sibling, 1 reply; 7+ messages in thread
From: aen @ 2000-12-04 13:58 UTC (permalink / raw)
  To: devel

Ivan Zakharyaschev wrote:
> 
>         Здравствуйте!
> 
> У меня возникли побочные вопросы.
> 
> On Sun, 3 Dec 2000, Aleksey Novodvorsky wrote:
> 
> > Уважаемые коллеги, предлагаю обсудить очередную локализационную
> > проблему.
> > Русские po файлы в glibc-2.2, как это уже говорилось, счастливо
> > перекодируются в нужную кодировку.
> 
> А как? Я обратил внимание на то, что в них есть такие поля:
> Content-Type: text/plain; charset=koi8-r
> Content-Transfer-Encoding: 8bit
> 
> Они подразумевают использование названий, зарегистрированных для Internet.
??? Откуда такие сведения? Я не встречал ни одного po-файла с
windows-1251.
> Среди них cp1251 нет, а есть windows-1251. Но glibc такого названия не
> знает -- значит ли это, что перекодирование -- односторонний процесс: в
> результате перекодирования сообщений получается текст, который уже не
> может служить в качестве po-файла (из-за другого набора свойств: у
> исходного po есть charset, а у полученного текста можно указать только
> название "системной" кодировки)? А что если исходные сообщения будут в
> cp1251 -- как это должно быть указано в po-файле?
> 
> > Проблему c man-pages будем, видимо, решать (пока) удвоением, хоть и
> > грустно.
> > Остается вопрос с переводимыми полями spec-файлов. Принципиально я вижу
> > одно решение -- считать  ru сокращением от ru_RU.KOI8-R и
> 
> Включение поля Group(ru) в spec-файл (пакет) -- дело пишущего spec-файл?
Сделаем автоматически.

Rgrds, Алексей.

> 
> --
> Best regards,
>       Ivan Z.
> 
> _______________________________________________
> Devel mailing list
> Devel@linux.iplabs.ru
> http://www.logic.ru/mailman/listinfo/devel
_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 7+ messages in thread

* Re: [devel] russian encodings in rpm
  2000-12-04 13:58   ` aen
@ 2000-12-08 19:20     ` Ivan Zakharyaschev
  0 siblings, 0 replies; 7+ messages in thread
From: Ivan Zakharyaschev @ 2000-12-08 19:20 UTC (permalink / raw)
  To: devel

	Добрый вечер!

On Mon, 4 Dec 2000, aen wrote:

> Ivan Zakharyaschev wrote:

> > > Русские po файлы в glibc-2.2, как это уже говорилось, счастливо
> > > перекодируются в нужную кодировку.
> >
> > А как? Я обратил внимание на то, что в них есть такие поля:
> > Content-Type: text/plain; charset=koi8-r
> > Content-Transfer-Encoding: 8bit
> >
> > Они подразумевают использование названий, зарегистрированных для
> Internet.
> ??? Откуда такие сведения? Я не встречал ни одного po-файла с
> windows-1251.

У меня таких сведений нет, я сказал "подразумевает", потому что заголовок
Content-Type (и не только он один из тех, которые есть в файлах с
переводами сообщений) используется в HTTP и email-сообщениях, а там его
значения -- это обычно такие кодировки (например, windows-1251).

> > Среди них cp1251 нет, а есть windows-1251. Но glibc такого названия
> не
> > знает -- значит ли это, что перекодирование -- односторонний процесс:

-- 
Best regards,
      Ivan Z.

_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 7+ messages in thread

end of thread, other threads:[~2000-12-08 19:20 UTC | newest]

Thread overview: 7+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2000-12-03 11:29 [devel] russian encodings in rpm Aleksey Novodvorsky
2000-12-03 11:27 ` Ivan Zakharyaschev
2000-12-03 12:01   ` Alexander Bokovoy
2000-12-03 14:23     ` Ivan Zakharyaschev
2000-12-04  1:51       ` Dmitry V. Levin
2000-12-04 13:58   ` aen
2000-12-08 19:20     ` Ivan Zakharyaschev

ALT Linux Team development discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
		devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
	public-inbox-index devel

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.devel


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git