* Re: [re] HTML × stuphead.
@ 2000-12-08 14:16 Roman S
2000-12-08 17:31 ` [re] HTML в stuphead aen
` (2 more replies)
0 siblings, 3 replies; 8+ messages in thread
From: Roman S @ 2000-12-08 14:16 UTC (permalink / raw)
To: mandrake-russian
Цитирую aen <aen@logic.ru>:
> Я так пишу потому, что кодировки были удалены.
> Rgrds, AEN
Я хочу вструнить туда единый рекодирующий модуль,
который будет работать со всеми кодировками, которые в
состоянии обеспечить ОС.
Кодировки должно быть всего 2
1) все однобайтовые
2) Unicode
Rgds!
Roman Savelyev
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [re] HTML в stuphead. 2000-12-08 14:16 [re] HTML × stuphead Roman S @ 2000-12-08 17:31 ` aen 2000-12-08 18:14 ` [re] " Alexander Bokovoy 2000-12-08 22:30 ` Ivan Zakharyaschev 2 siblings, 0 replies; 8+ messages in thread From: aen @ 2000-12-08 17:31 UTC (permalink / raw) To: mandrake-russian Roman S wrote: > > Цитирую aen <aen@logic.ru>: > > > Я так пишу потому, что кодировки были удалены. > > Rgrds, AEN > > Я хочу вструнить туда единый рекодирующий модуль, > который будет работать со всеми кодировками, которые в > состоянии обеспечить ОС. > Кодировки должно быть всего 2 > 1) все однобайтовые > 2) Unicode UTF-8? > Именно! Rgrds, AEN ^ permalink raw reply [flat|nested] 8+ messages in thread
* [re] Re: [re] HTML в stuphead. 2000-12-08 14:16 [re] HTML × stuphead Roman S 2000-12-08 17:31 ` [re] HTML в stuphead aen @ 2000-12-08 18:14 ` Alexander Bokovoy 2000-12-08 22:30 ` Ivan Zakharyaschev 2 siblings, 0 replies; 8+ messages in thread From: Alexander Bokovoy @ 2000-12-08 18:14 UTC (permalink / raw) To: mandrake-russian On Fri, Dec 08, 2000 at 02:18:26PM +0300, Roman S wrote: > Цитирую aen <aen@logic.ru>: > > > Я так пишу потому, что кодировки были удалены. > > Rgrds, AEN > > Я хочу вструнить туда единый рекодирующий модуль, > который будет работать со всеми кодировками, которые в > состоянии обеспечить ОС. > Кодировки должно быть всего 2 > 1) все однобайтовые > 2) Unicode И что Вы подразумеваете под Unicode в таком случае? Какое из стандартных представлений Unicode собираетесь использовать: UTF-8, UTF-16, UCS-2, UCS-4? -- Sincerely yours, Alexander Bokovoy The Midgard Project | www.midgard-project.org | Aurora R&D team Minsk Linux Users Group | www.minsk-lug.net | www.aurora-linux.com IPLabs Linux Team | linux.iplabs.ru | Architecte Open Source -- When I left you, I was but the pupil. Now, I am the master. - Darth Vader ^ permalink raw reply [flat|nested] 8+ messages in thread
* [re] Re: [re] HTML в stuphead. 2000-12-08 14:16 [re] HTML × stuphead Roman S 2000-12-08 17:31 ` [re] HTML в stuphead aen 2000-12-08 18:14 ` [re] " Alexander Bokovoy @ 2000-12-08 22:30 ` Ivan Zakharyaschev 2000-12-08 22:30 ` Ivan Zakharyaschev 2 siblings, 1 reply; 8+ messages in thread From: Ivan Zakharyaschev @ 2000-12-08 22:30 UTC (permalink / raw) To: mandrake-russian Hello, Roman! On Fri, 8 Dec 2000, Roman S wrote: > Я хочу вструнить туда единый рекодирующий модуль, > который будет работать со всеми кодировками, которые в > состоянии обеспечить ОС. Что-то похожее было сделано Львом Левитиным с PINE: туда была встроена возможность перекодировки сообщений для разных целей (показ, сохранение, цитирование, пересылка -- не все из этого гладко работает). PINE с такими усовершентствованиями -- 4.21L, вошедший в Mdk RE 7.0. Сейчас я вроде стал maintainer'ом этой "фичи" в нашем PINE. Можно было бы скоординировать развитие такой фичи в MUA. В принципе, договариваться почти не о чем, так как все довольно просто. Надеюсь, никакой розни между разработчиками/пользователями разных MUA, в частности Stuphead и PINE, я этим сообщением не разожгу. Дальше идут подробности. Те, кому неинтересно, могут смело не читать и перейти к следующему сообщению. Есть собственно перекодирующий модуль, который очень прост (если он основан на iconv, как в PINE). Выделять его в отдельную библиотеку нет смысла. (Основная сложность при расширении PINE была не в создании этого модуля, а во встраивании его в программу.) В PINE этот модуль -- небольшая надстройка над стандартным iconv; особенности такие: 1. перекодировка задается не двумя параметрами (исходная и конечная кодировка), а цепочкой правил (enc1->enc2,enc3->enc4,...,encN->encN+1); 2. другие названия кодировок; они преобразуются перед передачей их iconv: например, windows-1251 становится cp1251. Не знаю, нужна ли реально надстройка 1 (цепочки правил): понятно, что с точки зрения реализации она не нужна, но, возможно, она придает некоторую гибкость в обращении с модулем при использовании этой "фичи". По крайней мере, никаких неудобств это не вызывает. Вторая надстройка появилось из-за того, что в сообщениях в поле Content-Type: названия кодировок используются не те же, что известны системе. Получается, что каждой программе, имеющей дело с документами, где кодировка указана по регистру IANA, и желающей использовать системные функции перекодировки, нужно знать соответсвия между этими названиями и системными. Я до сих пор еще не понял, как обычно решается эта проблема -- вот здесь можно было бы создать отдельную библиотеку, знающую эти соответсвия, или научить glibc (интересно, по каким соображениям в нее включались названия кодировок?). Другая сторона -- это возможности пользователя по управлению перекодировкой и воздействие перекодировки на сообщение. Пользователю может понадобиться перекодировка в нескольких целях: - сохранить сообщение - процитировать/переслать - и самая частая: просмотреть. Последний случай особый. Перекодировку при просмотре было бы правильнее сделать задачей не модуля перекодировки сообщений. Сейчас в PINE пользователь определяет цепочку преобразований для совершения перекодировки. Перекодировка может совершаться в двух (или трех) режимах: автоматическая (из кодировки, укзанной в сообщении, в кодировку по умолчанию) и ручная (по заданной цепочке правил) (и можно как особый третий случай выделить "никакую", т.е. ручную с пустым набором правил). Эти режимы применимы не только при просмотре, но и при других действиях (более того, при просмотре аналогичные режимы должны реализовываться по-другому). Какой выбор кодировок предоставлять пользователю? Давать ему сразу огромный список не надо, но любая кодировка должна быть ему доступна. (Этого в PINE пока нет.) Как перекодировка отражается на сообщении? Во-первых, можно отдельно перекодировать заголовки и тело. Во-вторых, в заголовках ведется слежение за совершаемыми преобразованиями: PINE сейчас добавляет в новое сообщение заголовки типа X-Recoded-From, X-Recoded-To, X-Recoded-By (по-моему, это перестало работать, поэтому я не смог проверить) и меняет значение Content-Type. Сказанное тут -- смесь из того, что есть в нашем PINE на самом деле, и еще нереализованных моих идей. Согласовать, по-моему, стоит то, как перекодировка отражается на заголовках. Еще хотелось бы иметь единое решение для установления соответствия между названиями кодировок документов и системными кодировками. Посмотреть бы еще на то, как перекодируют разные браузеры/MUA и другие схожие программы. Какие есть мнения, комментарии? -- С наилучшими пожеланиями, Ivan Z. ^ permalink raw reply [flat|nested] 8+ messages in thread
* [re] Re: [re] HTML в stuphead. 2000-12-08 22:30 ` Ivan Zakharyaschev @ 2000-12-08 22:30 ` Ivan Zakharyaschev 2000-12-09 1:44 ` [re] Re: [re] HTML × stuphead Roman S 0 siblings, 1 reply; 8+ messages in thread From: Ivan Zakharyaschev @ 2000-12-08 22:30 UTC (permalink / raw) To: mandrake-russian На затронутые вопроосы, наверное, можно взглянуть по-иному, если учитывать внутреннее представление сообщений в Unicode (UTF-8). On Fri, 8 Dec 2000, Ivan Zakharyaschev wrote: > On Fri, 8 Dec 2000, Roman S wrote: > > > Я хочу вструнить туда единый рекодирующий модуль, > > который будет работать со всеми кодировками, которые в > > состоянии обеспечить ОС. > > Что-то похожее было сделано Львом Левитиным с PINE: туда была встроена > возможность перекодировки сообщений для разных целей (показ, > сохранение, > цитирование, пересылка -- не все из этого гладко работает). PINE с > такими > усовершентствованиями -- 4.21L, вошедший в Mdk RE 7.0. Сейчас я вроде > стал > maintainer'ом этой "фичи" в нашем PINE. > > Можно было бы скоординировать развитие такой фичи в MUA. В принципе, > договариваться почти не о чем, так как все довольно просто. > Дальше идут подробности. Те, кому неинтересно, могут смело не читать и > перейти к следующему сообщению. -- С наилучшими пожеланиями, Ivan Z. ^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [re] Re: [re] HTML × stuphead. 2000-12-08 22:30 ` Ivan Zakharyaschev @ 2000-12-09 1:44 ` Roman S 2000-12-09 1:55 ` [re] Re: [re] HTML в stuphead aen 2000-12-09 20:56 ` [mdk-re] " Mikhail Zabaluev 0 siblings, 2 replies; 8+ messages in thread From: Roman S @ 2000-12-09 1:44 UTC (permalink / raw) To: mandrake-russian On Fri, 8 Dec 2000 22:24:22 +0300 (MSK) Ivan Zakharyaschev <vanyaz@mccme.ru> wrote: > На затронутые вопроосы, наверное, можно взглянуть по-иному, если учитывать > внутреннее представление сообщений в Unicode (UTF-8). Да, становится в общем-то всё просто, за исключением именования чарсетов... Цепочки в общем-то получается простые - current OS charset -> Unicode -> target msg charset msg charset -> unicode -> OS charset. Rgds! Roman Savelyev ^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [re] Re: [re] HTML в stuphead. 2000-12-09 1:44 ` [re] Re: [re] HTML × stuphead Roman S @ 2000-12-09 1:55 ` aen 2000-12-09 20:56 ` [mdk-re] " Mikhail Zabaluev 1 sibling, 0 replies; 8+ messages in thread From: aen @ 2000-12-09 1:55 UTC (permalink / raw) To: mandrake-russian Roman S wrote: > > On Fri, 8 Dec 2000 22:24:22 +0300 (MSK) > Ivan Zakharyaschev <vanyaz@mccme.ru> wrote: > > > На затронутые вопроосы, наверное, можно взглянуть по-иному, если учитывать > > внутреннее представление сообщений в Unicode (UTF-8). > > Да, становится в общем-то всё просто, за исключением именования чарсетов... А какие здесь проблемы? Есть два источника: имена в libc и IANA. В письмах должно быть по IANA. Да и все отклонения можно задавать в таблице алиасов. Только пусть она будет внешней... Rgrds, Алексей. ^ permalink raw reply [flat|nested] 8+ messages in thread
* [mdk-re] Re: [re] Re: [re] HTML в stuphead. 2000-12-09 1:44 ` [re] Re: [re] HTML × stuphead Roman S 2000-12-09 1:55 ` [re] Re: [re] HTML в stuphead aen @ 2000-12-09 20:56 ` Mikhail Zabaluev 1 sibling, 0 replies; 8+ messages in thread From: Mikhail Zabaluev @ 2000-12-09 20:56 UTC (permalink / raw) To: mandrake-russian Hello Roman, On Sat, Dec 09, 2000 at 01:02 +0300, Roman S wrote: > > On Fri, 8 Dec 2000 22:24:22 +0300 (MSK) > Ivan Zakharyaschev <vanyaz@mccme.ru> wrote: > > > На затронутые вопроосы, наверное, можно взглянуть по-иному, если учитывать > > внутреннее представление сообщений в Unicode (UTF-8). > > Да, становится в общем-то всё просто, за исключением именования чарсетов... > Цепочки в общем-то получается простые - > current OS charset -> Unicode -> target msg charset > msg charset -> unicode -> OS charset. На этапе перекодировки из Unicode в target charset хорошо бы обрабатывать fallback'и - не заменять все "неуставное" знаком безмерного удивления, а пытаться подыскать разумный заменитель. recode это умеет, в glibc в принципе можно добавить (даже для отдельно взятого приложения, см. 'info libc') "нестрогие" версии кодировок. -- Stay tuned, MhZ mailto:mookid@sigent.ru ----------- Boycott meat -- suck your thumb. ^ permalink raw reply [flat|nested] 8+ messages in thread
end of thread, other threads:[~2000-12-09 20:56 UTC | newest] Thread overview: 8+ messages (download: mbox.gz / follow: Atom feed) -- links below jump to the message on this page -- 2000-12-08 14:16 [re] HTML × stuphead Roman S 2000-12-08 17:31 ` [re] HTML в stuphead aen 2000-12-08 18:14 ` [re] " Alexander Bokovoy 2000-12-08 22:30 ` Ivan Zakharyaschev 2000-12-08 22:30 ` Ivan Zakharyaschev 2000-12-09 1:44 ` [re] Re: [re] HTML × stuphead Roman S 2000-12-09 1:55 ` [re] Re: [re] HTML в stuphead aen 2000-12-09 20:56 ` [mdk-re] " Mikhail Zabaluev
ALT Linux Community general discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 community community/ http://lore.altlinux.org/community \ mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com public-inbox-index community Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.community AGPL code for this site: git clone https://public-inbox.org/public-inbox.git