From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: From: Dmitry Alexeyev To: sisyphus@altlinux.ru Subject: Re: [sisyphus] Mozilla SIGSEGV Date: Sun, 7 Sep 2003 15:09:48 +0400 User-Agent: KMail/1.5.2 References: <200309060111.08529.dmi_a@qnx.org.ru> <3F5A54E3.30601@beltel.ru> <200309071029.38336.crazymik@online.ru> In-Reply-To: <200309071029.38336.crazymik@online.ru> MIME-Version: 1.0 Content-Type: text/plain; charset="koi8-r" Content-Transfer-Encoding: 8bit Content-Disposition: inline Message-Id: <200309071509.48556.dmi_a@qnx.org.ru> X-Spam-Status: No, hits=-0.3 required=5.0 tests=HTML_10_20,HTML_MESSAGE,HTML_TAG_BALANCE_BODY,IN_REP_TO, QUOTED_EMAIL_TEXT,REFERENCES,REPLY_WITH_QUOTES, USER_AGENT_KMAIL version=2.55 X-Spam-Checker-Version: SpamAssassin 2.55 (1.174.2.19-2003-05-19-exp) X-BeenThere: sisyphus@altlinux.ru X-Mailman-Version: 2.1.2 Precedence: list Reply-To: sisyphus@altlinux.ru List-Id: List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Sun, 07 Sep 2003 11:11:19 -0000 Archived-At: List-Archive: День добрый! Оказалось, что я окончательно всех запутал. Я очень долго не мог понять, что кодировка изначального файла - utf-16. Просто я не поверил в то, что cat понимает utf-16 и корректно его отображает. Я открыл файл в mcedit и сделал следующее: 1) убрал первые два лишних символа перед DOCTYPE 2) убрал (при этом задев ) 3) покорёжил кодировку с unicode на unknown (там должно быть utf-16 по всем правилам) После этого Mozilla стала падать при запросе этого файла. Почему? Не знаю. Вероятно из-за того, что unknown написано unibyte'ом поверх mulitbyte'а, т.е. выход за границы памяти шрифта (это только мои подозрения, я ничего не тестировал). WBR, Dmitry > В сообщении от Воскресенье 07 Сентябрь 2003 01:42 Sergey Degtyaryov > > написал(a): > > Mikhail Arkhipov wrote: > > > В сообщении от Суббота 06 Сентябрь 2003 22:27 Alexey Lubimov написал(a): > > >>>------------------- > > >>>Т.е. сервер отдаёт это в нормальной кодировке. > > >>>(Файл я взял оригинальный, на нём ничего не падает. Падать > > >>> стало, когда я кодировку в unknown изменил и первые два символа > > >>> удалил) > > >>> > > >>>Дальше: > > >>>------------ > > >>>cat links-orig.htm |more > > >>>ЪЧ > > >>>JB Lab QNX Links > > >>> > >>> http-equiv=Content-Type> > > >>>------------- > > >> > > >> > > > > > > Мозила 1.2.1 из АЛМ 2.2 не упала и выдала текст аналогично > > > Konq-r. В редакторе последнего просматривается строчка: > > > JB Lab QNX Links > > > ^^^^^^^ на лицо нестандартное написание тега. Закрывается > > > он правильным . > > > > Element names are written in uppercase letters (e.g., BODY). > > Attribute names are written in lowercase letters (e.g., lang, > > onsubmit). Recall that in HTML, element and attribute names are > > case-insensitive; the convention is meant to encourage readability. > > > > http://www.w3.org/TR/html4/about.html#h-1.2.1 > > С этим непоспоришь, но случаи всякие бывают. Не зря рекомендуют > не смешивать регистры в написаниях тегов. IMHO, истина конечно > где-то рядом, и дело не в , иначе локальная копия вела бы > себя аналогично. Просто приведенная ранее строчка > > JB Lab QNX Links > > несколько отличается от увиденного в редакторе K-r. > Думаю, что виноват сервер, может связано с идентификацией браузера? > > С уважением, Михаил.