From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: From: Mikhail Zabaluev To: mandrake-russian@altlinux.ru Message-ID: <20010601112657.C2454@localhost.localdomain> Mail-Followup-To: Mikhail Zabaluev , mandrake-russian@altlinux.ru References: <3B0E4CB7.1010506@altlinux.ru> <6706.010525@globetravel.spb.ru> <3B1116CA.1C3C695E@altlinux.ru> <20010601055103.B83EAE6@abr.tool.ru> <3B173F2E.E0F3E2F3@altlinux.ru> Mime-Version: 1.0 Content-Type: text/plain; charset=koi8-r Content-Disposition: inline Content-Transfer-Encoding: 8bit User-Agent: Mutt/1.2.5i In-Reply-To: <3B173F2E.E0F3E2F3@altlinux.ru>; from rider@altlinux.ru on Fri, Jun 01, 2001 at 11:07:26AM +0400 Subject: [mdk-re] Re: =?koi8-r?B?W21kay1yZV0gUmU6IM/G1M/QycsgLSDSxcfVzNHSztnFINfZ0sHWxc7J0Q==?= Sender: mandrake-russian-admin@altlinux.ru Errors-To: mandrake-russian-admin@altlinux.ru X-BeenThere: mandrake-russian@altlinux.ru X-Mailman-Version: 2.0 Precedence: bulk Reply-To: mandrake-russian@altlinux.ru List-Help: List-Post: List-Subscribe: , List-Id: Linux-Mandrake RE / ALT Linux discussion list List-Unsubscribe: , List-Archive: Date: Fri Jun 1 11:18:01 2001 X-Original-Date: Fri, 1 Jun 2001 11:26:57 +0400 Archived-At: List-Archive: List-Post: Hello Anton, On Fri, Jun 01, 2001 at 11:07:26AM +0400, Anton Farygin wrote: > > Andrey Brindeew wrote: > > > On Sun, 27 May 2001 19:01:30 +0400 > > Anton Farygin wrote: > > > > AF> cat man_test.html |perl -p -e 's/(<)(.*?)(\n)/\1\2/gs'' > > AF> Убирает первый перевод строки. А вот как убрать все последующие? > > AF> Убрать их вообще во всех тегах. Т.е. между "<" и ">" > > AF> > > AF> Запускать это выражения я буду в PHP. Соответсвенно перловые > > AF> конструкции не катят :-( > > AF> > > AF> Работают только регулярные выражения. > > > > Сэр собрался разбирать вложенные структуры регулярными выражениями? > > Оно политически неграмотно - эти самые регулярные выражения не для этого > > делались. Для html есть прекрасный (перловый) модуль HTML::Parser. > > > > А в PHP? ;-) > См. выше. Накопить все между уголками в строке и сделать над ней s/\n/ /g Тут есть одна тонкость - в общем случае, внутри значений атрибутов в кавычках тоже могут присутствовать ">". Так что нужно все же парсерообразное решение либо проверка содержимого уголков регвыражением, которое я без поллитры не напишу :). Вообще, на разбор HTML в промышленных масштабах лучше забить и рыть в сторону XML. -- Stay tuned, MhZ JID: mookid@jabber.org ___________ When does summertime come to Minnesota, you ask? Well, last year, I think it was a Tuesday.