ALT Linux Community general discussions
 help / color / mirror / Atom feed
* Re: [Comm] <JT> strage script needed
  2004-10-20 10:04 [Comm] <JT> strage script needed Grigory Tuboltsev
@ 2004-10-20  9:09 ` Aleksander N. Gorohovski
  2004-10-24 16:17   ` [Comm] гм... (was: strage script needed) Michael Shigorin
  2004-10-20 10:06 ` [Comm] <JT> strage script needed Nick S. Grechukh
  1 sibling, 1 reply; 4+ messages in thread
From: Aleksander N. Gorohovski @ 2004-10-20  9:09 UTC (permalink / raw)
  To: community

On Wed, 20 Oct 2004 12:04:52 +0200, Grigory Tuboltsev <gtubolcev@mail.ru>  
wrote:

> День добрый,
> Извините за предыдущее недописанное письмо.
>
> Подскажите пожалуйста, как решить вот такую странную задачу:
> (вероятно, в линуксе).
>
> Имеется список в фомате хтмл, вида
>
> ссылка  тексттексттексттекст
> ссылка  тексттексттексттекст
> ссылка  тексттексттексттекст
> ссылка  тексттексттексттекст
> ссылка  тексттексттексттекст
>
> необходима программа, которая обработает каждую запись списка
> следующим образом: пройдя по ссылке найдёт на страничке определённый
> текст по шаблону (наверное, регулярное выражение) и вставит этот текст
> в конец строки.
>
> Чем бы это сделать ?

Думаю лучше чем Perl, ничто ни справится!


^ permalink raw reply	[flat|nested] 4+ messages in thread

* [Comm] <JT> strage script needed
@ 2004-10-20 10:04 Grigory Tuboltsev
  2004-10-20  9:09 ` Aleksander N. Gorohovski
  2004-10-20 10:06 ` [Comm] <JT> strage script needed Nick S. Grechukh
  0 siblings, 2 replies; 4+ messages in thread
From: Grigory Tuboltsev @ 2004-10-20 10:04 UTC (permalink / raw)
  To: community

День добрый,
Извините за предыдущее недописанное письмо.

Подскажите пожалуйста, как решить вот такую странную задачу:
(вероятно, в линуксе).

Имеется список в фомате хтмл, вида

ссылка  тексттексттексттекст
ссылка  тексттексттексттекст
ссылка  тексттексттексттекст
ссылка  тексттексттексттекст
ссылка  тексттексттексттекст

необходима программа, которая обработает каждую запись списка
следующим образом: пройдя по ссылке найдёт на страничке определённый
текст по шаблону (наверное, регулярное выражение) и вставит этот текст
в конец строки.

Чем бы это сделать ?
Заранее большое спасибо,

С уважением,
Григорий Тубольцев



^ permalink raw reply	[flat|nested] 4+ messages in thread

* Re: [Comm] <JT> strage script needed
  2004-10-20 10:04 [Comm] <JT> strage script needed Grigory Tuboltsev
  2004-10-20  9:09 ` Aleksander N. Gorohovski
@ 2004-10-20 10:06 ` Nick S. Grechukh
  1 sibling, 0 replies; 4+ messages in thread
From: Nick S. Grechukh @ 2004-10-20 10:06 UTC (permalink / raw)
  To: community

[-- Attachment #1: Type: text/plain, Size: 949 bytes --]

В сообщении от Среда 20 Октябрь 2004 13:04 Grigory Tuboltsev написал(a):
> День добрый,
> Извините за предыдущее недописанное письмо.
>
> Подскажите пожалуйста, как решить вот такую странную задачу:
> (вероятно, в линуксе).
>
> Имеется список в фомате хтмл, вида
>
> ссылка  тексттексттексттекст
> ссылка  тексттексттексттекст
> ссылка  тексттексттексттекст
> ссылка  тексттексттексттекст
> ссылка  тексттексттексттекст
>
> необходима программа, которая обработает каждую запись списка
> следующим образом: пройдя по ссылке найдёт на страничке определённый
> текст по шаблону (наверное, регулярное выражение) и вставит этот текст
> в конец строки.
cat | while read fff; do .. .... ...; echo $fff `wget .... | grep ....`; done


-- 
Regards, Nick S. Grechukh
NSG1-UANIC
network administrator at many places :-)

=== ALT Linux fortune: ========================
Чтобы "заткнуть дыру", я "пошел на сделку с совестью" и отключил тесты.
  -- at in devel@

[-- Attachment #2: Type: application/pgp-signature, Size: 189 bytes --]

^ permalink raw reply	[flat|nested] 4+ messages in thread

* [Comm] гм... (was: strage script needed)
  2004-10-20  9:09 ` Aleksander N. Gorohovski
@ 2004-10-24 16:17   ` Michael Shigorin
  0 siblings, 0 replies; 4+ messages in thread
From: Michael Shigorin @ 2004-10-24 16:17 UTC (permalink / raw)
  To: community

On Wed, Oct 20, 2004 at 01:09:51PM +0400, Aleksander N. Gorohovski wrote:
> >Имеется список в фомате хтмл, вида
> >ссылка  тексттексттексттекст
> >ссылка  тексттексттексттекст
> >ссылка  тексттексттексттекст
> >ссылка  тексттексттексттекст
> >ссылка  тексттексттексттекст
> >необходима программа, которая обработает каждую запись списка
> >следующим образом: пройдя по ссылке найдёт на страничке определённый
> >текст по шаблону (наверное, регулярное выражение) и вставит этот текст
> >в конец строки.
> >Чем бы это сделать ?
> Думаю лучше чем Perl, ничто ни справится!

Ну почему.  Ruby, например. :)

По мотивам 
/usr/share/doc/ruby-doc-extra-0.1/ProgrammingRuby-0.3a/html/tut_io.html:

---
#!/usr/bin/ruby
require 'net/http'

while line = gets
	pattern = Regex.new('http://[a-zA-Z0-9_.]+(:\d+)?(/\S+*)\s+(.*)$')
	host, port, path, rest = line.scan(pattern)
	next unless host
	port = 80 unless port
	path = "/" unless path
	begin
		conn = Net::HTTP.new(host, port)
		resp, data = conn.get(path, nil)
		if resp.message == "OK"
			data.scan(/<img src="(.*?)"/) { |x| puts line + x }
		end
	rescue
		next
	end
end
---

Где-то так (не проверял :) -- должно работать фильтром, в данном
случае выводящим исходную строчку с добавлением пути к картинке
для каждой строчки stdin, соответствующей pattern, для которой
удалось вытащить страничку и найти в ней эти пути.

Но это так, просто пример похожий вспомнился -- писать вообще-то
всегда полезней самому, уж коль странного захотелось :-)

Просто такие вещи на shell пишутся (и особенно модифицируются) уж
больно болезненно, эффективнее получается сразу вложить время в
хороший язык.
  
-- 
 ---- WBR, Michael Shigorin <mike@altlinux.ru>
  ------ Linux.Kiev http://www.linux.kiev.ua/


^ permalink raw reply	[flat|nested] 4+ messages in thread

end of thread, other threads:[~2004-10-24 16:17 UTC | newest]

Thread overview: 4+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2004-10-20 10:04 [Comm] <JT> strage script needed Grigory Tuboltsev
2004-10-20  9:09 ` Aleksander N. Gorohovski
2004-10-24 16:17   ` [Comm] гм... (was: strage script needed) Michael Shigorin
2004-10-20 10:06 ` [Comm] <JT> strage script needed Nick S. Grechukh

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git