From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Content-Type: text/plain; charset="koi8-r" From: NoWayOut Organization: Magic Land To: community@altlinux.ru Subject: Re: [Comm] Re: =?koi8-r?b?78LSwcLP1MvB?= =?koi8-r?b?INTFy9PUwQ==?= Date: Fri, 13 Sep 2002 16:00:44 +0400 User-Agent: KMail/1.4.1 References: <200209100852.53993.kvinokurov@tut.by> <20020913081007.GG78155@osdn.org.ua> In-Reply-To: <20020913081007.GG78155@osdn.org.ua> MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Message-Id: <200209131600.44164.nowayout@pisem.net> Sender: community-admin@altlinux.ru Errors-To: community-admin@altlinux.ru X-BeenThere: community@altlinux.ru X-Mailman-Version: 2.0.9 Precedence: bulk Reply-To: community@altlinux.ru List-Unsubscribe: , List-Id: List-Post: List-Help: List-Subscribe: , List-Archive: Archived-At: List-Archive: List-Post: В сообщении от Пятница 13 Сентябрь 2002 12:10 Michael Shigorin написал: > On Tue, Sep 10, 2002 at 08:52:53AM +0300, Konstantin wrote: > > У меня возникла необходимость обработки текста (что-то около > > 100М в html) следующим образом: > > sed, awk, perl; find > ... > но этот путь крайне неблагодарен, т.к. теги могут быть (у меня > были) порваны по строкам, что sed'ом не отлавливается >(тривиально, по крайней мере). Проще наверно будет на perl, почитать O'Reilly'вскую книжку (главу про шаблоны :) NoWayOut