ALT Linux Team development discussions
 help / color / mirror / Atom feed
* [devel] RegExp: проблема, нужна помощь
@ 2001-05-25 11:49 Anton Farygin
  2001-05-25 11:57 ` [devel] " Alexander Bokovoy
  2001-05-31  6:45 ` Sir Raorn
  0 siblings, 2 replies; 6+ messages in thread
From: Anton Farygin @ 2001-05-25 11:49 UTC (permalink / raw)
  To: devel

Господа, если среди нас знатоки регулярных выражений?

Возникла проблема, которую я не смог разрешить.

Суть ее в том, что внутри тегов (< >) нужно удалить с помощью перла все 
переводы строк (\n). А удаляется только первый.

Текст примерно такой:
<HTML
 ><HEAD
 ><TITLE
 >  Rule Set Based Access Control (RSBAC) для Linux - Модели
</TITLE
 ><META
NAME=\"GENERATOR\"
CONTENT=\"Modular DocBook HTML Stylesheet Version 1.57\">
<META HTTP-EQUIV=\"Content-type\" content=\"text/html; charset=koi8-r\">
</HEAD>
<BODY
CLASS=\"ARTICLE\"
 ><DIV
CLASS=\"ARTICLE\"
 ><DIV
CLASS=\"TITLEPAGE\"
 ><H1
CLASS=\"TITLE\"
 ><A
NAME=\"AEN2\"
 >Rule Set Based Access Control (RSBAC) для Linux - Модели</A
 ></H1
 ><DIV
 >

Может быть знает кто-нибуть решение?

Rgds
Rider


_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 6+ messages in thread

* [devel] Re: [devel] RegExp: проблема, нужна помощь
  2001-05-25 11:49 [devel] RegExp: проблема, нужна помощь Anton Farygin
@ 2001-05-25 11:57 ` Alexander Bokovoy
  2001-05-25 12:16   ` Anton Farygin
  2001-05-31  6:45 ` Sir Raorn
  1 sibling, 1 reply; 6+ messages in thread
From: Alexander Bokovoy @ 2001-05-25 11:57 UTC (permalink / raw)
  To: devel

On Fri, May 25, 2001 at 03:49:35PM +0400, Anton Farygin wrote:
> Господа, если среди нас знатоки регулярных выражений?
> 
> Возникла проблема, которую я не смог разрешить.
> 
> Суть ее в том, что внутри тегов (< >) нужно удалить с помощью перла все 
> переводы строк (\n). А удаляется только первый.
/g не пробовал в конце регеэкспа?

> 
> Текст примерно такой:
> <HTML
>  ><HEAD
>  ><TITLE
>  >  Rule Set Based Access Control (RSBAC) для Linux - Модели
> </TITLE
>  ><META
> NAME=\"GENERATOR\"
> CONTENT=\"Modular DocBook HTML Stylesheet Version 1.57\">
> <META HTTP-EQUIV=\"Content-type\" content=\"text/html; charset=koi8-r\">
> </HEAD>
> <BODY
> CLASS=\"ARTICLE\"
>  ><DIV
> CLASS=\"ARTICLE\"
>  ><DIV
> CLASS=\"TITLEPAGE\"
>  ><H1
> CLASS=\"TITLE\"
>  ><A
> NAME=\"AEN2\"
>  >Rule Set Based Access Control (RSBAC) для Linux - Модели</A
>  ></H1
>  ><DIV
>  >
> 
> Может быть знает кто-нибуть решение?
> 
> Rgds
> Rider
> 
> 
> _______________________________________________
> Devel mailing list
> Devel@linux.iplabs.ru
> http://www.logic.ru/mailman/listinfo/devel

-- 
--
Sincerely yours, Alexander Bokovoy 
  The Midgard Project   | www.midgard-project.org | ALT Linux Team
Minsk Linux Users Group |    www.minsk-lug.net    | www.altlinux.ru
-- Sweet April showers do spring May flowers.
		-- Thomas Tusser
_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [devel] Re: [devel] RegExp: проблема,  нужна помощь
  2001-05-25 11:57 ` [devel] " Alexander Bokovoy
@ 2001-05-25 12:16   ` Anton Farygin
  2001-05-25 12:22     ` [devel] " Alexander Bokovoy
  2001-05-26  3:02     ` Alex Sergeyev
  0 siblings, 2 replies; 6+ messages in thread
From: Anton Farygin @ 2001-05-25 12:16 UTC (permalink / raw)
  To: devel

Alexander Bokovoy wrote:

> On Fri, May 25, 2001 at 03:49:35PM +0400, Anton Farygin wrote:
> 
>>Господа, если среди нас знатоки регулярных выражений?
>>
>>Возникла проблема, которую я не смог разрешить.
>>
>>Суть ее в том, что внутри тегов (< >) нужно удалить с помощью перла все 
>>переводы строк (\n). А удаляется только первый.
>>
> /g не пробовал в конце регеэкспа?

:-)
/g конечно пробовал. Но дело не в этом - вся загвоздка в том, что 
обрабатывать приходится шаблон, распространяющийся на несколько строк.


> 
> 
>>Текст примерно такой:
>><HTML
>> ><HEAD
>> ><TITLE
>> >  Rule Set Based Access Control (RSBAC) для Linux - Модели
>></TITLE
>> ><META
>>NAME=\"GENERATOR\"
>>CONTENT=\"Modular DocBook HTML Stylesheet Version 1.57\">
>><META HTTP-EQUIV=\"Content-type\" content=\"text/html; charset=koi8-r\">
>></HEAD>
>><BODY
>>CLASS=\"ARTICLE\"
>> ><DIV
>>CLASS=\"ARTICLE\"
>> ><DIV
>>CLASS=\"TITLEPAGE\"
>> ><H1
>>CLASS=\"TITLE\"
>> ><A
>>NAME=\"AEN2\"
>> >Rule Set Based Access Control (RSBAC) для Linux - Модели</A
>> ></H1
>> ><DIV
>> >
>>
>>Может быть знает кто-нибуть решение?
>>
>>Rgds
>>Rider
>>
>>
>>_______________________________________________
>>Devel mailing list
>>Devel@linux.iplabs.ru
>>http://www.logic.ru/mailman/listinfo/devel
>>
> 



_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 6+ messages in thread

* [devel] Re: [devel] Re: [devel] RegExp: проблема, нужна помощь
  2001-05-25 12:16   ` Anton Farygin
@ 2001-05-25 12:22     ` Alexander Bokovoy
  2001-05-26  3:02     ` Alex Sergeyev
  1 sibling, 0 replies; 6+ messages in thread
From: Alexander Bokovoy @ 2001-05-25 12:22 UTC (permalink / raw)
  To: devel

On Fri, May 25, 2001 at 04:16:00PM +0400, Anton Farygin wrote:
> Alexander Bokovoy wrote:
> 
> > On Fri, May 25, 2001 at 03:49:35PM +0400, Anton Farygin wrote:
> > 
> >>Господа, если среди нас знатоки регулярных выражений?
> >>
> >>Возникла проблема, которую я не смог разрешить.
> >>
> >>Суть ее в том, что внутри тегов (< >) нужно удалить с помощью перла все 
> >>переводы строк (\n). А удаляется только первый.
> >>
> > /g не пробовал в конце регеэкспа?
> 
> :-)
> /g конечно пробовал. Но дело не в этом - вся загвоздка в том, что 
> обрабатывать приходится шаблон, распространяющийся на несколько строк.
Дык /m в руки.
--
Sincerely yours, Alexander Bokovoy 
  The Midgard Project   | www.midgard-project.org | ALT Linux Team
Minsk Linux Users Group |    www.minsk-lug.net    | www.altlinux.ru
-- Do not underestimate the value of print statements for debugging.
_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 6+ messages in thread

* Re: [devel] Re: [devel] RegExp: проблема,  нужна помощь
  2001-05-25 12:16   ` Anton Farygin
  2001-05-25 12:22     ` [devel] " Alexander Bokovoy
@ 2001-05-26  3:02     ` Alex Sergeyev
  1 sibling, 0 replies; 6+ messages in thread
From: Alex Sergeyev @ 2001-05-26  3:02 UTC (permalink / raw)
  To: devel

Привет Антон

>>>Суть ее в том, что внутри тегов (< >) нужно удалить с помощью перла
>>>переводы строк (\n). А удаляется только первый.
>> /g не пробовал в конце регеэкспа?
>/g конечно пробовал. Но дело не в этом - вся загвоздка в том, что 
>обрабатывать приходится шаблон, распространяющийся на несколько строк.

Скорее всего тебе уже ответили надо
$template =~ s/\n//sg;

Кстати можно извращаться и делать например замену \n на ' ' (пробел)
Иногда это даже полезнее потому что пробелы в HTML нужны кое где вместо 
перевода строки

-- 
Sincerely, Alex


_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 6+ messages in thread

* [devel] Re: [devel] RegExp: проблема, нужна помощь
  2001-05-25 11:49 [devel] RegExp: проблема, нужна помощь Anton Farygin
  2001-05-25 11:57 ` [devel] " Alexander Bokovoy
@ 2001-05-31  6:45 ` Sir Raorn
  1 sibling, 0 replies; 6+ messages in thread
From: Sir Raorn @ 2001-05-31  6:45 UTC (permalink / raw)
  To: devel

On Fri, May 25, 2001 at 03:49:35PM +0400, Anton Farygin wrote:
> Суть ее в том, что внутри тегов (< >) нужно удалить с помощью перла все 
> переводы строк (\n). А удаляется только первый.

my $in_tag=0;

while(<>) {
	if ($in_tag) {
		if (! m/\>[^<>]*$/) {
			$in_tag=0;
		} else {
			s/\n/ /g; # или какие там ему надо?
		}
	} else {
		if (m/\<[^<]*$/) {
			$in_tag=1;
			s/\n/ /g;
		}
	}
}

В общем примерно что-то в этом роде :-)

-- 
                                      Regards, Sir Raorn.
,-----------------------------------.----------------------.
|   Registered Linux user #177282   |  ICQ UIN #68527095   |
`-----------------------------------^----------------------'
_______________________________________________
Devel mailing list
Devel@linux.iplabs.ru
http://www.logic.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 6+ messages in thread

end of thread, other threads:[~2001-05-31  6:45 UTC | newest]

Thread overview: 6+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2001-05-25 11:49 [devel] RegExp: проблема, нужна помощь Anton Farygin
2001-05-25 11:57 ` [devel] " Alexander Bokovoy
2001-05-25 12:16   ` Anton Farygin
2001-05-25 12:22     ` [devel] " Alexander Bokovoy
2001-05-26  3:02     ` Alex Sergeyev
2001-05-31  6:45 ` Sir Raorn

ALT Linux Team development discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
		devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
	public-inbox-index devel

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.devel


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git