ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [mdk-re] Re: XML parser encodings
  @ 2001-11-12  8:05 ` Oleg A. Paraschenko
  2001-11-12 12:39   ` Alexander Bokovoy
  0 siblings, 1 reply; 18+ messages in thread
From: Oleg A. Paraschenko @ 2001-11-12  8:05 UTC (permalink / raw)
  To: mandrake-russian

  Привет!

> Date: Sun, 11 Nov 2001 22:52:29 +0200
> From: Alexander Bokovoy <a.bokovoy@sam-solutions.net>

> > Интересно, а почему для XML::Parser нет кодировки koi8-r?! 8-0
> > См. rpm -ql perl-XML-Parser | grep .enc
> Не обращайте внимание, maintainer пакета работает над переводом его на
> поддержку iconv(3), тогда будут все >180 кодировок, доступные в glibc.

  А можно подробнее -- кто работает и будет ли результат на CPAN'e?

----
Олег






^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] Re: XML parser encodings
  2001-11-12  8:05 ` [mdk-re] Re: XML parser encodings Oleg A. Paraschenko
@ 2001-11-12 12:39   ` Alexander Bokovoy
  2001-11-13  1:40     ` Mikhail Zabaluev
  0 siblings, 1 reply; 18+ messages in thread
From: Alexander Bokovoy @ 2001-11-12 12:39 UTC (permalink / raw)
  To: mandrake-russian

On Mon, Nov 12, 2001 at 08:13:46AM +0300, Oleg A. Paraschenko wrote:
>   Привет!
> 
> > Date: Sun, 11 Nov 2001 22:52:29 +0200
> > From: Alexander Bokovoy <a.bokovoy@sam-solutions.net>
> 
> > > Интересно, а почему для XML::Parser нет кодировки koi8-r?! 8-0
> > > См. rpm -ql perl-XML-Parser | grep .enc
> > Не обращайте внимание, maintainer пакета работает над переводом его на
> > поддержку iconv(3), тогда будут все >180 кодировок, доступные в glibc.
> 
>   А можно подробнее -- кто работает и будет ли результат на CPAN'e?
Maintainer perl-XML-Parser в ALT Linux -- Григорий Милев. У меня есть
ранее разработанный модуль расширения Expat для обработки произвольных
кодировок через iconv(3), вот его он и интегрирует в скором будущем.
А будет ли это на CPAN -- зависит от авторов XML::Parser и Expat, они
могут не захотеть принять, все-таки iconv(3) определен только в XPG/6,
который не все libc поддерживают.
-- 
/ Alexander Bokovoy
$ cat /proc/identity >~/.signature
  `Senior software developer and analyst for SaM-Solutions Ltd.`
---
A penny saved kills your career in government.



^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] Re: XML parser encodings
  2001-11-12 12:39   ` Alexander Bokovoy
@ 2001-11-13  1:40     ` Mikhail Zabaluev
  2001-11-13 12:48       ` Alexander Bokovoy
  2001-11-13 20:30       ` Alexei Takaseev
  0 siblings, 2 replies; 18+ messages in thread
From: Mikhail Zabaluev @ 2001-11-13  1:40 UTC (permalink / raw)
  To: mandrake-russian

Hello Alexander,

On Mon, Nov 12, 2001 at 11:51:31AM +0200, Alexander Bokovoy wrote:
>
> >   А можно подробнее -- кто работает и будет ли результат на CPAN'e?
> Maintainer perl-XML-Parser в ALT Linux -- Григорий Милев. У меня есть
> ранее разработанный модуль расширения Expat для обработки произвольных
> кодировок через iconv(3), вот его он и интегрирует в скором будущем.
> А будет ли это на CPAN -- зависит от авторов XML::Parser и Expat, они
> могут не захотеть принять, все-таки iconv(3) определен только в XPG/6,
> который не все libc поддерживают.

Для тех libc, что не в танке, есть libiconv. Так что, думаю,
предлагать можно настойчиво, особенно если предусмотреть
aclocal-скрипт поиска реализации iconv, который можно стянуть из
доброго десятка других пакетов. Лучший, по-моему, в mutt.

-- 
Stay tuned,
  MhZ                                     JID: mookid@jabber.org
___________
Can you MAIL a BEAN CAKE?



^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] Re: XML parser encodings
  2001-11-13  1:40     ` Mikhail Zabaluev
@ 2001-11-13 12:48       ` Alexander Bokovoy
  2001-11-13 20:30       ` Alexei Takaseev
  1 sibling, 0 replies; 18+ messages in thread
From: Alexander Bokovoy @ 2001-11-13 12:48 UTC (permalink / raw)
  To: mandrake-russian

On Tue, Nov 13, 2001 at 01:50:43AM +0300, Mikhail Zabaluev wrote:
> Hello Alexander,
> 
> On Mon, Nov 12, 2001 at 11:51:31AM +0200, Alexander Bokovoy wrote:
> >
> > >   А можно подробнее -- кто работает и будет ли результат на CPAN'e?
> > Maintainer perl-XML-Parser в ALT Linux -- Григорий Милев. У меня есть
> > ранее разработанный модуль расширения Expat для обработки произвольных
> > кодировок через iconv(3), вот его он и интегрирует в скором будущем.
> > А будет ли это на CPAN -- зависит от авторов XML::Parser и Expat, они
> > могут не захотеть принять, все-таки iconv(3) определен только в XPG/6,
> > который не все libc поддерживают.
> 
> Для тех libc, что не в танке, есть libiconv. Так что, думаю,
> предлагать можно настойчиво, особенно если предусмотреть
> aclocal-скрипт поиска реализации iconv, который можно стянуть из
> доброго десятка других пакетов. Лучший, по-моему, в mutt.
По-моему, в Midgard. :-))) Но это каждый свое хвалит. Во всяком случае,
наш ловит сейчас всех мышей -- включая ситуации, когда в системе
одновременно стоят libiconv, libgconv и отсутствует iconv(3) в libc.
-- 
/ Alexander Bokovoy
$ cat /proc/identity >~/.signature
  `Senior software developer and analyst for SaM-Solutions Ltd.`
---
A penny saved kills your career in government.



^ permalink raw reply	[flat|nested] 18+ messages in thread

* Re: [mdk-re] Re: XML parser encodings
  2001-11-13  1:40     ` Mikhail Zabaluev
  2001-11-13 12:48       ` Alexander Bokovoy
@ 2001-11-13 20:30       ` Alexei Takaseev
  2001-11-13 20:38         ` Alexander Bokovoy
                           ` (2 more replies)
  1 sibling, 3 replies; 18+ messages in thread
From: Alexei Takaseev @ 2001-11-13 20:30 UTC (permalink / raw)
  To: mandrake-russian

On Tue, 13 Nov 2001, Mikhail Zabaluev wrote:

> Для тех libc, что не в танке, есть libiconv. Так что, думаю,
> предлагать можно настойчиво, особенно если предусмотреть
> aclocal-скрипт поиска реализации iconv, который можно стянуть из
> доброго десятка других пакетов. Лучший, по-моему, в mutt.

Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
чтоб он его просто пропускал, и топал дальше текст жевать?




^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] Re: XML parser encodings
  2001-11-13 20:30       ` Alexei Takaseev
@ 2001-11-13 20:38         ` Alexander Bokovoy
  2001-11-13 20:47           ` [mdk-re] iconv -r ôÕÒÂÉÎ áÌÅËÓÅÊ
  2001-11-13 20:49           ` [mdk-re] Re: XML parser encodings Sergey Vlasov
  2001-11-13 20:50         ` Aleksey Novodvorsky
  2001-11-14  7:02         ` Yura Gusev
  2 siblings, 2 replies; 18+ messages in thread
From: Alexander Bokovoy @ 2001-11-13 20:38 UTC (permalink / raw)
  To: mandrake-russian

On Wed, Nov 14, 2001 at 12:43:52AM +0800, Alexei Takaseev wrote:
> On Tue, 13 Nov 2001, Mikhail Zabaluev wrote:
> 
> > Для тех libc, что не в танке, есть libiconv. Так что, думаю,
> > предлагать можно настойчиво, особенно если предусмотреть
> > aclocal-скрипт поиска реализации iconv, который можно стянуть из
> > доброго десятка других пакетов. Лучший, по-моему, в mutt.
> 
> Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
> встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
> чтоб он его просто пропускал, и топал дальше текст жевать?
Если речь идет об утилите командной строки, то ключик --replace=SYMBOL,
если о функции, то смотрите исходники утилиты командной строки.
-- 
/ Alexander Bokovoy
$ cat /proc/identity >~/.signature
  `Senior software developer and analyst for SaM-Solutions Ltd.`
---
A penny saved kills your career in government.



^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] iconv -r
  2001-11-13 20:38         ` Alexander Bokovoy
@ 2001-11-13 20:47           ` ôÕÒÂÉÎ áÌÅËÓÅÊ
  2001-11-13 20:49           ` [mdk-re] Re: XML parser encodings Sergey Vlasov
  1 sibling, 0 replies; 18+ messages in thread
From: ôÕÒÂÉÎ áÌÅËÓÅÊ @ 2001-11-13 20:47 UTC (permalink / raw)
  To: mandrake-russian

> Если речь идет об утилите командной строки, то ключик --replace=SYMBOL,
> если о функции, то смотрите исходники утилиты командной строки.

Да. Можно даже писать просто -r и будет заменяться на знак вопроса.

__
AT




^ permalink raw reply	[flat|nested] 18+ messages in thread

* Re: [mdk-re] Re: XML parser encodings
  2001-11-13 20:38         ` Alexander Bokovoy
  2001-11-13 20:47           ` [mdk-re] iconv -r ôÕÒÂÉÎ áÌÅËÓÅÊ
@ 2001-11-13 20:49           ` Sergey Vlasov
  2001-11-13 21:00             ` Alexander Bokovoy
  2001-11-15  2:48             ` Mikhail Zabaluev
  1 sibling, 2 replies; 18+ messages in thread
From: Sergey Vlasov @ 2001-11-13 20:49 UTC (permalink / raw)
  To: mandrake-russian

On Tue, 13 Nov 2001 19:50:16 +0200
Alexander Bokovoy <a.bokovoy@sam-solutions.net> wrote:

> On Wed, Nov 14, 2001 at 12:43:52AM +0800, Alexei Takaseev wrote:
> > On Tue, 13 Nov 2001, Mikhail Zabaluev wrote:
> > 
> > > Для тех libc, что не в танке, есть libiconv. Так что, думаю,
> > > предлагать можно настойчиво, особенно если предусмотреть
> > > aclocal-скрипт поиска реализации iconv, который можно стянуть из
> > > доброго десятка других пакетов. Лучший, по-моему, в mutt.
> > 
> > Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
> > встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
> > чтоб он его просто пропускал, и топал дальше текст жевать?
> Если речь идет об утилите командной строки, то ключик --replace=SYMBOL,
> если о функции, то смотрите исходники утилиты командной строки.

В эти исходники я заглядывал - лучше не смотреть, там все жестко
привязано к реализации iconv() в glibc (используются внутренние
структуры, даже не описанные в устанавливаемых файлах
заголовков). Оно и понятно - iconv --list вообще невозможно
реализовать стандартными средствами, не зависящими от реализации
iconv().

Лучше посмотреть на реализацию функции g_convert_with_fallback()
в GLib-1.3.x (pre-2.0) - там переносимая реализация. Основной
принцип - при ошибке преобразования исходная строка
преобразуется в UTF-8 (что должно пройти в любом случае), а
затем производится посимвольное преобразование из UTF-8 в
требуемую кодировку, с заменой символов, которые не удается
преобразовать.



^ permalink raw reply	[flat|nested] 18+ messages in thread

* Re: [mdk-re] Re: XML parser encodings
  2001-11-13 20:30       ` Alexei Takaseev
  2001-11-13 20:38         ` Alexander Bokovoy
@ 2001-11-13 20:50         ` Aleksey Novodvorsky
  2001-11-13 21:06           ` Dmitry V. Levin
  2001-11-14  7:02         ` Yura Gusev
  2 siblings, 1 reply; 18+ messages in thread
From: Aleksey Novodvorsky @ 2001-11-13 20:50 UTC (permalink / raw)
  To: mandrake-russian

Alexei Takaseev wrote:

> On Tue, 13 Nov 2001, Mikhail Zabaluev wrote:
>
> > Для тех libc, что не в танке, есть libiconv. Так что, думаю,
> > предлагать можно настойчиво, особенно если предусмотреть
> > aclocal-скрипт поиска реализации iconv, который можно стянуть из
> > доброго десятка других пакетов. Лучший, по-моему, в mutt.
>
> Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
> встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
> чтоб он его просто пропускал, и топал дальше текст жевать?

Если у Вас ALT, то -c

Rgrds, AEN




^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] Re: XML parser encodings
  2001-11-13 20:49           ` [mdk-re] Re: XML parser encodings Sergey Vlasov
@ 2001-11-13 21:00             ` Alexander Bokovoy
  2001-11-15  2:48             ` Mikhail Zabaluev
  1 sibling, 0 replies; 18+ messages in thread
From: Alexander Bokovoy @ 2001-11-13 21:00 UTC (permalink / raw)
  To: mandrake-russian

On Tue, Nov 13, 2001 at 09:05:55PM +0300, Sergey Vlasov wrote:
> On Tue, 13 Nov 2001 19:50:16 +0200
> Alexander Bokovoy <a.bokovoy@sam-solutions.net> wrote:
> 
> > On Wed, Nov 14, 2001 at 12:43:52AM +0800, Alexei Takaseev wrote:
> > > On Tue, 13 Nov 2001, Mikhail Zabaluev wrote:
> > > 
> > > > Для тех libc, что не в танке, есть libiconv. Так что, думаю,
> > > > предлагать можно настойчиво, особенно если предусмотреть
> > > > aclocal-скрипт поиска реализации iconv, который можно стянуть из
> > > > доброго десятка других пакетов. Лучший, по-моему, в mutt.
> > > 
> > > Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
> > > встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
> > > чтоб он его просто пропускал, и топал дальше текст жевать?
> > Если речь идет об утилите командной строки, то ключик --replace=SYMBOL,
> > если о функции, то смотрите исходники утилиты командной строки.
> 
> В эти исходники я заглядывал - лучше не смотреть, там все жестко
> привязано к реализации iconv() в glibc (используются внутренние
> структуры, даже не описанные в устанавливаемых файлах
> заголовков). Оно и понятно - iconv --list вообще невозможно
> реализовать стандартными средствами, не зависящими от реализации
> iconv().
> 
> Лучше посмотреть на реализацию функции g_convert_with_fallback()
> в GLib-1.3.x (pre-2.0) - там переносимая реализация. Основной
> принцип - при ошибке преобразования исходная строка
> преобразуется в UTF-8 (что должно пройти в любом случае), а
> затем производится посимвольное преобразование из UTF-8 в
> требуемую кодировку, с заменой символов, которые не удается
> преобразовать.
Тоже верно. Осталось дождаться выхода стабильной версии Glib 2.0.

-- 
/ Alexander Bokovoy
$ cat /proc/identity >~/.signature
  `Senior software developer and analyst for SaM-Solutions Ltd.`
---
A penny saved kills your career in government.



^ permalink raw reply	[flat|nested] 18+ messages in thread

* Re: [mdk-re] Re: XML parser encodings
  2001-11-13 20:50         ` Aleksey Novodvorsky
@ 2001-11-13 21:06           ` Dmitry V. Levin
  2001-11-13 21:23             ` John Profic
  0 siblings, 1 reply; 18+ messages in thread
From: Dmitry V. Levin @ 2001-11-13 21:06 UTC (permalink / raw)
  To: ALT Linux Spring mailing list

[-- Attachment #1: Type: text/plain, Size: 1166 bytes --]

On Tue, Nov 13, 2001 at 09:08:38PM +0300, Aleksey Novodvorsky wrote:
> > > Для тех libc, что не в танке, есть libiconv. Так что, думаю,
> > > предлагать можно настойчиво, особенно если предусмотреть
> > > aclocal-скрипт поиска реализации iconv, который можно стянуть из
> > > доброго десятка других пакетов. Лучший, по-моему, в mutt.
> >
> > Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
> > встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
> > чтоб он его просто пропускал, и топал дальше текст жевать?
> 
> Если у Вас ALT, то -c

Не совсем:
У всех (glibc >= 2.2.2, кажется) есть "iconv -c"
В ALT (glibc >= 2.2-ipl2mdk) для однобайтных target-кодировок есть
"iconv -r".

Что именно умеет iconv в Вашей системе, см. "iconv --help"


Regards,
	Dmitry

+-------------------------------------------------------------------------+
Dmitry V. Levin     mailto://ldv@alt-linux.org
ALT Linux Team      http://www.altlinux.ru/
Fandra Project      http://www.fandra.org/
+-------------------------------------------------------------------------+
UNIX is user friendly. It's just very selective about who its friends are.

[-- Attachment #2: Type: application/pgp-signature, Size: 232 bytes --]

^ permalink raw reply	[flat|nested] 18+ messages in thread

* Re: [mdk-re] Re: XML parser encodings
  2001-11-13 21:06           ` Dmitry V. Levin
@ 2001-11-13 21:23             ` John Profic
  0 siblings, 0 replies; 18+ messages in thread
From: John Profic @ 2001-11-13 21:23 UTC (permalink / raw)
  To: mandrake-russian

Dmitry V. Levin wrote:

> On Tue, Nov 13, 2001 at 09:08:38PM +0300, Aleksey Novodvorsky wrote:
>>>>Для тех libc, что не в танке, есть libiconv. Так что, думаю,
>>>>предлагать можно настойчиво, особенно если предусмотреть
>>>>aclocal-скрипт поиска реализации iconv, который можно стянуть из
>>>>доброго десятка других пакетов. Лучший, по-моему, в mutt.
>>>Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
>>>встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
>>>чтоб он его просто пропускал, и топал дальше текст жевать?
>>Если у Вас ALT, то -c
> Не совсем:
> У всех (glibc >= 2.2.2, кажется) есть "iconv -c"
> В ALT (glibc >= 2.2-ipl2mdk) для однобайтных target-кодировок есть
> "iconv -r".
> Что именно умеет iconv в Вашей системе, см. "iconv --help"
Гы, моя система обозначена в подписи

так вот:
[root@server /]# iconv --help | grep --  "-r"
   -r, --replace[=SYMBOL]     replace invalid characters with specified 
symbol

Большое спасибо AEN-у за наше счастливое дество :) Без его патчей к 

многим прогам мне в системе с локалью ru_RU.CP1251 пришлось бы туго :)

А так берем src.rpm, вытаскиваем исходники, патчи, и собираем :)


Еще раз большое спасибо комманде ALTLinux и AEN-у в частности :)
-- 
Best regards,
  John Profic <profic@lrn.ru>
Written by Mozilla 0.9.5
using SelfMake! Linux v0.9 based on ASPLinux release 1.1
with locale ru_RU.CP1251,
system: kernel 2.4.10-xfs-p1; glibc 2.2.4; gcc 3.0.1; XFree86 4.1.0;





^ permalink raw reply	[flat|nested] 18+ messages in thread

* Re: [mdk-re] Re: XML parser encodings
  2001-11-13 20:30       ` Alexei Takaseev
  2001-11-13 20:38         ` Alexander Bokovoy
  2001-11-13 20:50         ` Aleksey Novodvorsky
@ 2001-11-14  7:02         ` Yura Gusev
  2001-11-15  2:50           ` Mikhail Zabaluev
  2 siblings, 1 reply; 18+ messages in thread
From: Yura Gusev @ 2001-11-14  7:02 UTC (permalink / raw)
  To: mandrake-russian

On Wed, 14 Nov 2001, Alexei Takaseev wrote:

> On Tue, 13 Nov 2001, Mikhail Zabaluev wrote:
>
> > Для тех libc, что не в танке, есть libiconv. Так что, думаю,
> > предлагать можно настойчиво, особенно если предусмотреть
> > aclocal-скрипт поиска реализации iconv, который можно стянуть из
> > доброго десятка других пакетов. Лучший, по-моему, в mutt.
>
> Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
> встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
> чтоб он его просто пропускал, и топал дальше текст жевать?

Кстати плохо конвертит. Пробывал ради прикола поинт лист фидошный в кои8
сконвертить. Выдало ошибок 15(с остановкой конвертации) да псевдографика
вся убилась.

-- 
 11:06pm  up 28 days, 12:03,  2 users,  load average: 0.00, 0.00, 0.00
            __
         | /  \ |        Iouri Goussev            //  \\
        \_\\  //_/       elendal@w4.ca           _\\()//_
         .'/()\'.           Foo-Bar             / //  \\ \
   jgs    \\  //   http://foobar.irc-unix.net    | \__/ |
    I am not 31337. But I can use the Vi editor... ;-0




^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] Re: XML parser encodings
  2001-11-13 20:49           ` [mdk-re] Re: XML parser encodings Sergey Vlasov
  2001-11-13 21:00             ` Alexander Bokovoy
@ 2001-11-15  2:48             ` Mikhail Zabaluev
  2001-11-15 17:37               ` Sergey Vlasov
  1 sibling, 1 reply; 18+ messages in thread
From: Mikhail Zabaluev @ 2001-11-15  2:48 UTC (permalink / raw)
  To: mandrake-russian

Hello Sergey,

On Tue, Nov 13, 2001 at 09:05:55PM +0300, Sergey Vlasov wrote:
>
> > > Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
> > > встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
> > > чтоб он его просто пропускал, и топал дальше текст жевать?
> > Если речь идет об утилите командной строки, то ключик --replace=SYMBOL,
> > если о функции, то смотрите исходники утилиты командной строки.
> 
> В эти исходники я заглядывал - лучше не смотреть, там все жестко
> привязано к реализации iconv() в glibc (используются внутренние
> структуры, даже не описанные в устанавливаемых файлах
> заголовков). Оно и понятно - iconv --list вообще невозможно
> реализовать стандартными средствами, не зависящими от реализации
> iconv().
> 
> Лучше посмотреть на реализацию функции g_convert_with_fallback()
> в GLib-1.3.x (pre-2.0) - там переносимая реализация. Основной
> принцип - при ошибке преобразования исходная строка
> преобразуется в UTF-8 (что должно пройти в любом случае), а
> затем производится посимвольное преобразование из UTF-8 в
> требуемую кодировку, с заменой символов, которые не удается
> преобразовать.

Сие грамотно, разве что так тщательно нужно перекодировать только то
место, где iconv спотыкается -- ведь функция сама двигает указатели,
пока все OK.

-- 
Stay tuned,
  MhZ                                     JID: mookid@jabber.org
___________
After all, all he did was string together a lot of old, well-known quotations.
		-- H.L. Mencken, on Shakespeare



^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] Re: XML parser encodings
  2001-11-14  7:02         ` Yura Gusev
@ 2001-11-15  2:50           ` Mikhail Zabaluev
  0 siblings, 0 replies; 18+ messages in thread
From: Mikhail Zabaluev @ 2001-11-15  2:50 UTC (permalink / raw)
  To: mandrake-russian

Hello Yura,

On Tue, Nov 13, 2001 at 11:09:11PM -0500, Yura Gusev wrote:
>
> On Wed, 14 Nov 2001, Alexei Takaseev wrote:
> 
> > On Tue, 13 Nov 2001, Mikhail Zabaluev wrote:
> >
> > > Для тех libc, что не в танке, есть libiconv. Так что, думаю,
> > > предлагать можно настойчиво, особенно если предусмотреть
> > > aclocal-скрипт поиска реализации iconv, который можно стянуть из
> > > доброго десятка других пакетов. Лучший, по-моему, в mutt.
> >
> > Да, кстати, а как сказать iconv, чтобы он не ругался на некоторые символы,
> > встречающиеся в текстах как "В данной кодировке таких символов нетути!" а
> > чтоб он его просто пропускал, и топал дальше текст жевать?
> 
> Кстати плохо конвертит. Пробывал ради прикола поинт лист фидошный в кои8
> сконвертить. Выдало ошибок 15(с остановкой конвертации) да псевдографика
> вся убилась.

Странно, в KOI8-R она вроде бы должна быть...

-- 
Stay tuned,
  MhZ                                     JID: mookid@jabber.org
___________
A horse!  A horse!  My kingdom for a horse!
		-- Wm. Shakespeare, "Henry VI"



^ permalink raw reply	[flat|nested] 18+ messages in thread

* Re: [mdk-re] Re: XML parser encodings
  2001-11-15  2:48             ` Mikhail Zabaluev
@ 2001-11-15 17:37               ` Sergey Vlasov
  2001-11-16 12:27                 ` Mikhail Zabaluev
  0 siblings, 1 reply; 18+ messages in thread
From: Sergey Vlasov @ 2001-11-15 17:37 UTC (permalink / raw)
  To: mandrake-russian

On Thu, 15 Nov 2001 02:59:00 +0300
Mikhail Zabaluev <mhz@alt-linux.org> wrote:

> > Лучше посмотреть на реализацию функции g_convert_with_fallback()
> > в GLib-1.3.x (pre-2.0) - там переносимая реализация. Основной
> > принцип - при ошибке преобразования исходная строка
> > преобразуется в UTF-8 (что должно пройти в любом случае), а
> > затем производится посимвольное преобразование из UTF-8 в
> > требуемую кодировку, с заменой символов, которые не удается
> > преобразовать.
> 
> Сие грамотно, разве что так тщательно нужно перекодировать только то
> место, где iconv спотыкается -- ведь функция сама двигает указатели,
> пока все OK.

В общем случае это не проходит - исходная кодировка может быть
хитрой многобайтовой, поэтому пропустить мешающий символ сложно.
В UTF-8 такой проблемы нет. Впрочем, все это используется только
если строка не перекодировалась напрямую.



^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] Re: XML parser encodings
  2001-11-15 17:37               ` Sergey Vlasov
@ 2001-11-16 12:27                 ` Mikhail Zabaluev
  2001-11-16 12:51                   ` Mikhail Zabaluev
  0 siblings, 1 reply; 18+ messages in thread
From: Mikhail Zabaluev @ 2001-11-16 12:27 UTC (permalink / raw)
  To: mandrake-russian

Hello Sergey,

On Thu, Nov 15, 2001 at 05:54:09PM +0300, Sergey Vlasov wrote:
>
> On Thu, 15 Nov 2001 02:59:00 +0300
> Mikhail Zabaluev <mhz@alt-linux.org> wrote:
> 
> > > Лучше посмотреть на реализацию функции g_convert_with_fallback()
> > > в GLib-1.3.x (pre-2.0) - там переносимая реализация. Основной
> > > принцип - при ошибке преобразования исходная строка
> > > преобразуется в UTF-8 (что должно пройти в любом случае), а
> > > затем производится посимвольное преобразование из UTF-8 в
> > > требуемую кодировку, с заменой символов, которые не удается
> > > преобразовать.
> > 
> > Сие грамотно, разве что так тщательно нужно перекодировать только то
> > место, где iconv спотыкается -- ведь функция сама двигает указатели,
> > пока все OK.
> 
> В общем случае это не проходит - исходная кодировка может быть
> хитрой многобайтовой, поэтому пропустить мешающий символ сложно.
> В UTF-8 такой проблемы нет.

Тогда уж лучше в UCS-4, чтобы потом легко скакать по 32-битным словам.
Минимизировать работу по трехступенчатой схеме все же можно: сделать
lookahead на "сложном месте" байт в 6-8, чтобы любой известный науке
многобайтовый символ мог проскочить. А потом продолжить прямую
перекодировку с того места, где остановились указатели.

-- 
Stay tuned,
  MhZ                                     JID: mookid@jabber.org
___________
That government is best which governs least.
		-- Henry David Thoreau, "Civil Disobedience"



^ permalink raw reply	[flat|nested] 18+ messages in thread

* [mdk-re] Re: XML parser encodings
  2001-11-16 12:27                 ` Mikhail Zabaluev
@ 2001-11-16 12:51                   ` Mikhail Zabaluev
  0 siblings, 0 replies; 18+ messages in thread
From: Mikhail Zabaluev @ 2001-11-16 12:51 UTC (permalink / raw)
  To: mandrake-russian

Hello mandrake-russian,

On Fri, Nov 16, 2001 at 12:38:03PM +0300, Mikhail Zabaluev wrote:
>
> > > Сие грамотно, разве что так тщательно нужно перекодировать только то
> > > место, где iconv спотыкается -- ведь функция сама двигает указатели,
> > > пока все OK.
> > 
> > В общем случае это не проходит - исходная кодировка может быть
> > хитрой многобайтовой, поэтому пропустить мешающий символ сложно.
> > В UTF-8 такой проблемы нет.
> 
> Тогда уж лучше в UCS-4, чтобы потом легко скакать по 32-битным словам.
> Минимизировать работу по трехступенчатой схеме все же можно: сделать
> lookahead на "сложном месте" байт в 6-8, чтобы любой известный науке
> многобайтовый символ мог проскочить. А потом продолжить прямую
> перекодировку с того места, где остановились указатели.

Подумав еще немного: нет, все же две разные перекодировки на одном месте
использовать опасно.

-- 
Stay tuned,
  MhZ                                     JID: mookid@jabber.org
___________
No one knows what he can do till he tries.
		-- Publilius Syrus



^ permalink raw reply	[flat|nested] 18+ messages in thread

end of thread, other threads:[~2001-11-16 12:51 UTC | newest]

Thread overview: 18+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2001-11-12  8:05 ` [mdk-re] Re: XML parser encodings Oleg A. Paraschenko
2001-11-12 12:39   ` Alexander Bokovoy
2001-11-13  1:40     ` Mikhail Zabaluev
2001-11-13 12:48       ` Alexander Bokovoy
2001-11-13 20:30       ` Alexei Takaseev
2001-11-13 20:38         ` Alexander Bokovoy
2001-11-13 20:47           ` [mdk-re] iconv -r ôÕÒÂÉÎ áÌÅËÓÅÊ
2001-11-13 20:49           ` [mdk-re] Re: XML parser encodings Sergey Vlasov
2001-11-13 21:00             ` Alexander Bokovoy
2001-11-15  2:48             ` Mikhail Zabaluev
2001-11-15 17:37               ` Sergey Vlasov
2001-11-16 12:27                 ` Mikhail Zabaluev
2001-11-16 12:51                   ` Mikhail Zabaluev
2001-11-13 20:50         ` Aleksey Novodvorsky
2001-11-13 21:06           ` Dmitry V. Levin
2001-11-13 21:23             ` John Profic
2001-11-14  7:02         ` Yura Gusev
2001-11-15  2:50           ` Mikhail Zabaluev

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git