From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Date: Tue, 14 Oct 2003 16:07:17 +0600 From: Alexander Kirey To: sisyphus@altlinux.ru Message-Id: <20031014160717.225f0483.kirey@mmk.ru> X-Mailer: Sylpheed version 0.8.11 (GTK+ 1.2.10; i586-alt-linux-gnu) X-Face: Mime-Version: 1.0 Content-Type: text/plain; charset=KOI8-R Content-Transfer-Encoding: 8bit X-MDRemoteIP: 161.8.43.67 X-Return-Path: kirey@mmk.ru X-MDaemon-Deliver-To: sisyphus@altlinux.ru Subject: [sisyphus] Emacs and UTF-8 again X-BeenThere: sisyphus@altlinux.ru X-Mailman-Version: 2.1.2 Precedence: list Reply-To: sisyphus@altlinux.ru List-Id: List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Tue, 14 Oct 2003 12:07:40 -0000 Archived-At: List-Archive: Здравствуйте! Анализируя список рассылки community и sisyphus, ссылки в разных письмах по этой теме в названных maillists, и google, я кажись запутался. Просто я не следил за этой темой и поэтому сорри за "кашу"... Как я понял, UTF-8 Emacs как бы и не UTF вовсе? То есть это некая возможность содержать разнокодировочные куски текста в одном файле? Для теста я взял документ /usr/share/doc/emacs-mule-ucs-0.85rc1/type.txt и документ /usr/share/yudit/doc/ru/FAQ.TXT. Если просматривать просто по F3 в mc то они и выглядят то по разному. И документ /usr/share/yudit/doc/ru/FAQ.TXT нормально читается как и в самом yudit и gedit, чего не скажешь про Emacs. Вот цитата из HOWTO Е.Балдина, которая подтверждает мои догадки: >Идём в Mule, Set Language Environment, Cyrillic и устанавливаем один >из 3-х вариантов. Какой -- по большому счету без разницы. >Это будет влиять только на общение емакс'а с внешним миром -- если >захотим Cyrillic-ISO, то текст будет сохраняться в ISO и в буфер >обмена будет копироваться текст в кодировке ISO. То же самое с KOI8. >Чтобы сделать изменение постоянным, запишите в ~/.emacs. И как я понял, Emacs внутри себя "говорит" на iso-8859-5 относительно русского текста? Загружаю файл mule HELLO (Show multi-lingual text) C-h h, затем навожу курсор на надпись "Russian (Русский) Здравствуйте!", затем "C-u C-x =" и в окне Help: character: З (07067, 3639, 0xe37) charset: cyrillic-iso8859-5 (Right-Hand Part of Latin/Cyrillic Alphabet (ISO/IEC 8859-5): ISO-IR-144) code point: 55 syntax: word category: y:Cyrillic buffer code: 0x8C 0xB7 file code: ESC 2C 4C 37 (encoded by coding system iso-2022-7bit-unix) font: -Misc-Fixed-Medium-R-Normal--15-140-75-75-C-90-microsoft-cp1251 Вот нашёл такие ресурсы позднее: http://www.win.tue.nl/~ocheong/Mule/, и цитирую: >For historic reasons, Mule has defined its own character set and >encoding (when Mule was designed, Unicode simply didn't exist). >Sooner or later, Emacs will migrate to using Unicode internally, >but in the meantime, we need to define an encoding that will >convert between Unicode externally and Emacs' Mule encoding >internally. http://www.cl.cam.ac.uk/~mgk25/unicode.html >Emacs 21.2 provides basic UTF-8 support in the form of a new coding >system mule-utf-8. This is expected to improve significantly once >ongoing work to change the internal encoding of Emacs/MULE entirely >to UTF-8 is completed (this is planned to happen for Emacs 22). Здесь, также имеется тестовый документ, gedit русскую составляющую видит нормально ну и теперь очевидно, что Emacs нет. http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt http://www.cl.cam.ac.uk/~mgk25/ucs/examples/quickbrown.txt ("В чащах юга жил бы цитрус? Да, но фальшивый экземпляр!" знакомый текст, однако :)) Немного о http://www.win.tue.nl/~ocheong/Mule/. Как я понял, что эта штуковина переводит кодировку mule в реальный utf-8, что позволяет читать потом документы другими редакторами с поддержкой utf-8. Но почему то это только справедливо для версии 20: "The package described here is for GNU Emacs 20. It does not work with GNU Emacs 21 or any version of XEmacs." Ну вот теперь стало немного понятно... Непонятно другое: что имели ввиду те подписчики community и sisyphus когда говорили что они нормально читают документы на UTF в Emacs. Я что-то не понял, или что-то не установил дополнительно? Не получилось воспользоваться и советом Alex Ott: >Для правильного отображения текстов необходимо установить для >начертания default (это можно сделать с помощью команды M-x >customize-face) шрифт, который содержит большой набор кодировок, >включая кодировку для отображения utf-8 (например, misc-fixed). >Такая настройка позволит, например, нормально работать с русскими >и немецкими словарями в одном буфере Emacs. Повторюсь, что в своём .emacs я ничего не добавлял, кроме активизации speedbar. Простите неофита за возможное непонимание, приведшее к неправильным выводам... -- Александр Кирей