Культурный офтопик
 help / color / mirror / Atom feed
From: Eugene Ostapets <eostapets@gmail.com>
To: smoke-room@altlinux.ru
Subject: Re: [room] robots.txt
Date: Sun, 17 Jul 2005 11:46:53 +0300
Message-ID: <e12fd2db0507170146332a843b@mail.gmail.com> (raw)
In-Reply-To: <dbcq10$pgd$1@sea.gmane.org>

17.07.05, Nick S. Grechukh<nick.grechukh bigmir.net> написал(а):
> Eugene Ostapets wrote:
> >> > На сколько я помню - это требование к системам индексирования не
> >> Так вот "требование" или совет?
> > То, что читал я - звучало как требование...
> на самом деле, все равно это не может рассматриваться как средство защиты и
> соответственно его обхода не было (а если агент не поддерживает robot
> exclusion standart? в протоколе http robots.txt не описан :-)
Я думаю что юристы будут не так однозначны в трактовании этого файла... 
> 
> вот когда baida.ru не отдает wget'у 403, и я делаю wget -u Mozilla - это
> "взлом" для dmca. потому что server side ограничение.
Хорошо что напомнили:
man wget:
------- skip ------
Wget can follow links in HTML and XHTML pages and create local versions
of remote web sites, fully recreating the directory structure of the
original site.  This is sometimes referred to as ``recursive download-
ing.''  While doing that, Wget respects the Robot Exclusion Standard
(/robots.txt).  Wget can be instructed to convert the links in down-
loaded HTML files to the local files for offline viewing.
------- skip ------

-- 
С уважением,
Евгений Остапец
uin: 23747217
jid: eugene_ostapets@jabber.ru

  reply	other threads:[~2005-07-17  8:46 UTC|newest]

Thread overview: 13+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2005-07-16 10:35 Nick Grechukh
2005-07-16 12:20 ` Eugene Ostapets
2005-07-16 13:12   ` Andrey Rahmatullin
2005-07-16 14:25     ` Eugene Ostapets
2005-07-17  5:23       ` Nick S. Grechukh
2005-07-17  8:46         ` Eugene Ostapets [this message]
2005-07-17  9:51           ` Nick S. Grechukh
2005-07-17 19:49             ` Aleksey Korotkov
2005-07-18  4:23               ` Eugene Ostapets
2005-07-18 14:25                 ` Andrey Rahmatullin
2005-07-18 14:42                   ` Eugene Ostapets
2005-07-18 15:42                   ` Michael Shigorin
2005-07-18 15:50                     ` Nick S. Grechukh

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=e12fd2db0507170146332a843b@mail.gmail.com \
    --to=eostapets@gmail.com \
    --cc=smoke-room@altlinux.ru \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

Культурный офтопик

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/smoke-room/0 smoke-room/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 smoke-room smoke-room/ http://lore.altlinux.org/smoke-room \
		smoke-room@lists.altlinux.org smoke-room@lists.altlinux.ru smoke-room@lists.altlinux.com smoke-room@altlinux.ru smoke-room@altlinux.org smoke-room@altlinux.com
	public-inbox-index smoke-room

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.smoke-room


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git