From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Date: Sun, 24 Oct 2004 19:17:24 +0300 From: Michael Shigorin To: community@altlinux.ru Message-ID: <20041024161724.GV2122@osdn.org.ua> Mail-Followup-To: community@altlinux.ru References: <373546825.20041020120452@mail.ru> Mime-Version: 1.0 Content-Type: text/plain; charset=koi8-r Content-Disposition: inline Content-Transfer-Encoding: 8bit In-Reply-To: User-Agent: Mutt/1.4.2.1i Subject: [Comm] =?koi8-r?b?x80uLi4=?= (was: strage script needed) X-BeenThere: community@altlinux.ru X-Mailman-Version: 2.1.5 Precedence: list Reply-To: community@altlinux.ru List-Id: Mailing list for ALT Linux users List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Sun, 24 Oct 2004 16:17:27 -0000 Archived-At: List-Archive: List-Post: On Wed, Oct 20, 2004 at 01:09:51PM +0400, Aleksander N. Gorohovski wrote: > >Имеется список в фомате хтмл, вида > >ссылка тексттексттексттекст > >ссылка тексттексттексттекст > >ссылка тексттексттексттекст > >ссылка тексттексттексттекст > >ссылка тексттексттексттекст > >необходима программа, которая обработает каждую запись списка > >следующим образом: пройдя по ссылке найдёт на страничке определённый > >текст по шаблону (наверное, регулярное выражение) и вставит этот текст > >в конец строки. > >Чем бы это сделать ? > Думаю лучше чем Perl, ничто ни справится! Ну почему. Ruby, например. :) По мотивам /usr/share/doc/ruby-doc-extra-0.1/ProgrammingRuby-0.3a/html/tut_io.html: --- #!/usr/bin/ruby require 'net/http' while line = gets pattern = Regex.new('http://[a-zA-Z0-9_.]+(:\d+)?(/\S+*)\s+(.*)$') host, port, path, rest = line.scan(pattern) next unless host port = 80 unless port path = "/" unless path begin conn = Net::HTTP.new(host, port) resp, data = conn.get(path, nil) if resp.message == "OK" data.scan(/ ------ Linux.Kiev http://www.linux.kiev.ua/