* [Comm] squid & archive
@ 2006-05-22 17:55 Alex Vader
2006-05-23 6:30 ` Slava Dubrovskiy
0 siblings, 1 reply; 2+ messages in thread
From: Alex Vader @ 2006-05-22 17:55 UTC (permalink / raw)
To: community
Привет всем,
как можно организовать архив текста всех страниц прошедших через squid?
Интересует только html код, без любой графики и стилей. Также важно чтобы
сохранялся запрашиваемый url и дата/время обращения.
В данный момент использую плугин к FF - slogger. Данная тулзень сохраняет в
каталог текст всех страниц с сохранением адреса и времени обращения
открываемых в моем браузере. Данный архив ведется почти год.
Но у slogger два недостатка - работает только в FF и съедает почти секунду
времени на каждую страницу.
Хочется вынести все на сервер, у него голова большая - пусть думает.
С уважением, Alex Vader
PS если я правильно понял, всяческие "редиректоры" оперируют только с адресом.
Конечно можно цеплять ссылку через wget и сохранять куда хочетсья, но это
абсолютно не романтично
^ permalink raw reply [flat|nested] 2+ messages in thread
end of thread, other threads:[~2006-05-23 6:30 UTC | newest]
Thread overview: 2+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2006-05-22 17:55 [Comm] squid & archive Alex Vader
2006-05-23 6:30 ` Slava Dubrovskiy
ALT Linux Community general discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
public-inbox-index community
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.community
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git