From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: From: Alexej Kryukov To: community@altlinux.ru Subject: Re: [Comm] =?koi8-r?b?ydPQz8zY2s/Xwc7JxQ==?= UTF Date: Mon, 4 Oct 2004 18:01:44 +0400 User-Agent: KMail/1.6.2 References: <20041004155518.429341db.genix@list.ru> In-Reply-To: <20041004155518.429341db.genix@list.ru> MIME-Version: 1.0 Content-Disposition: inline Content-Type: text/plain; charset="koi8-r" Content-Transfer-Encoding: 8bit Message-Id: <200410041801.45208.akrioukov@mail.ru> X-BeenThere: community@altlinux.ru X-Mailman-Version: 2.1.5 Precedence: list Reply-To: community@altlinux.ru List-Id: Mailing list for ALT Linux users List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Mon, 04 Oct 2004 14:11:24 -0000 Archived-At: List-Archive: List-Post: On Monday 04 October 2004 15:55, Genix wrote: > Приветствую! > > 1) Подскажите, как узнать код буквы (например "а"-русская) в > юникодной кодировке? Если нужен именно Юникод, то можно, например, взять таблицы в формате pdf с www.unicode.org/charts/. Или посмотреть таблицу символов в любом юникодовом приложении, где таковая имеется (хоть тот же OOo). Если же нужно *представление* юникода в виде UTF-8, то дополнительно нужно знать алгоритм преобразования (впрочем, он а) несложный и б) известен многим программам, так что самому разбираться обычно нет необходимости). > 2) Как можно преобразовать строку вида "D09CD0B0D0BCD0B0" (по > русски это было Мама) к человеческому виду (желательно средствами > QT)? В какой кодировке это может быть? Видно, что буква а в этом > слове имеет "код" D0B0. Это, конечно, UTF-8, как она должна была бы выглядеть в шестнадцатеричном редакторе. Если же Вы видите такое в обычном текстовом файле (не в режиме шестнадцатеричного просмотра), то, значит, задача сводится к разбиению строки на пары символов (каждая пара будет представлять собой шестнадцатеричное число с кодом от 00 до FF) и замене каждой пары на байт с таким кодом. Полученный текст UTF-8 можно открывать в чем угодно. Насчет QT ничего не скажу, но скриптик такой на любом языке сделать, конечно, ничего не стоит.