From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: From: Mikhail Zabaluev To: mandrake-russian@altlinux.ru Message-ID: <20011116095810.GL2040@localhost.localdomain> Mail-Followup-To: Mikhail Zabaluev , mandrake-russian@altlinux.ru References: <20011112225043.GB1936@localhost.localdomain> <20011113175016.GO1754@pc152.belcaf.minsk.by> <20011113210555.4db73470.vsu@mivlgu.murom.ru> <20011114235900.GL1995@localhost.localdomain> <20011115175409.122d1e43.vsu@mivlgu.murom.ru> <20011116093803.GH2040@localhost.localdomain> Mime-Version: 1.0 Content-Type: text/plain; charset=koi8-r Content-Disposition: inline Content-Transfer-Encoding: 8bit In-Reply-To: <20011116093803.GH2040@localhost.localdomain> User-Agent: Mutt/1.3.23.1i Subject: [mdk-re] Re: XML parser encodings Sender: mandrake-russian-admin@altlinux.ru Errors-To: mandrake-russian-admin@altlinux.ru X-BeenThere: mandrake-russian@altlinux.ru X-Mailman-Version: 2.0 Precedence: bulk Reply-To: mandrake-russian@altlinux.ru List-Help: List-Post: List-Subscribe: , List-Id: Linux-Mandrake RE / ALT Linux discussion list List-Unsubscribe: , List-Archive: Date: Fri Nov 16 12:51:16 2001 X-Original-Date: Fri, 16 Nov 2001 12:58:10 +0300 Archived-At: List-Archive: List-Post: Hello mandrake-russian, On Fri, Nov 16, 2001 at 12:38:03PM +0300, Mikhail Zabaluev wrote: > > > > Сие грамотно, разве что так тщательно нужно перекодировать только то > > > место, где iconv спотыкается -- ведь функция сама двигает указатели, > > > пока все OK. > > > > В общем случае это не проходит - исходная кодировка может быть > > хитрой многобайтовой, поэтому пропустить мешающий символ сложно. > > В UTF-8 такой проблемы нет. > > Тогда уж лучше в UCS-4, чтобы потом легко скакать по 32-битным словам. > Минимизировать работу по трехступенчатой схеме все же можно: сделать > lookahead на "сложном месте" байт в 6-8, чтобы любой известный науке > многобайтовый символ мог проскочить. А потом продолжить прямую > перекодировку с того места, где остановились указатели. Подумав еще немного: нет, все же две разные перекодировки на одном месте использовать опасно. -- Stay tuned, MhZ JID: mookid@jabber.org ___________ No one knows what he can do till he tries. -- Publilius Syrus