ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [Comm] Проблема со wget -p
@ 2003-07-22 19:49 Olga
  2003-07-23  4:05 ` Leonid B. Sysoletin
  2003-07-23  9:13 ` Olga
  0 siblings, 2 replies; 8+ messages in thread
From: Olga @ 2003-07-22 19:49 UTC (permalink / raw)
  To: community

Здравствуйте!

Прошу помощи в борьбе со wget'ом -- не получается заставить его 
подниматься вверх по иерархии каталогов при скчивании HTML-страницы
вместе с её содержимым. (wget-1.8.2-alt2.1)

Имеется url    http://www.сервер.ru/dir1/file1.htm
в нём есть ссылки вида:   <img src="../img/dir2/file2.jpg">

Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
в него таким образом рисунками

wget -p http://www.сервер.ru/dir1/file1.htm

Однако, скачивается только сам file1.htm, ну и robots.txt, но не 
рисунки. Как всё-таки заставить wget выкачивать и их?

Опции -r -l 1, -k (на всякий случай) не помогают -- 
скачиваются всё равно лишь file1.htm и robots.txt.
А ссылки не битые -- убедилась в этом, заходя на ту страницу галеоном.


-- 
 С уважением,                           (>|<)
 OL                                       |


^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] Проблема со wget -p
  2003-07-22 19:49 [Comm] Проблема со wget -p Olga
@ 2003-07-23  4:05 ` Leonid B. Sysoletin
  2003-07-23  9:13 ` Olga
  1 sibling, 0 replies; 8+ messages in thread
From: Leonid B. Sysoletin @ 2003-07-23  4:05 UTC (permalink / raw)
  To: community

В сообщении от 22 Июль 2003 23:49 Olga написал(a):
> Имеется url    http://www.сервер.ru/dir1/file1.htm
> в нём есть ссылки вида:   <img src="../img/dir2/file2.jpg">
> Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
> в него таким образом рисунками
> wget -p http://www.сервер.ru/dir1/file1.htm
> Однако, скачивается только сам file1.htm, ну и robots.txt, но не
> рисунки. Как всё-таки заставить wget выкачивать и их?

	wget -r -l 1
?
("минус эр минус эль один")

-- 
Л. Сысолетин,
webmaster@unicon-ms.ru, webmaster@bdo.ru
[Team Ёжики-рулез!] [Team Котёнки на солярке] [Team Берегите букву "ё"!]
[Team Я люблю свою фортунку] [Team Фортунка в переписку не вступает]

If he should ever change his faith, it'll be because he no longer thinks
he's God.



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] Проблема со wget -p
  2003-07-22 19:49 [Comm] Проблема со wget -p Olga
  2003-07-23  4:05 ` Leonid B. Sysoletin
@ 2003-07-23  9:13 ` Olga
  2003-07-23 10:18   ` Leonid B. Sysoletin
  2003-07-23 10:41   ` Alexey Pristavkin
  1 sibling, 2 replies; 8+ messages in thread
From: Olga @ 2003-07-23  9:13 UTC (permalink / raw)
  To: community

Leonid B. Sysoletin <webmaster@unicon-ms.ru> пишет:

> В сообщении от 22 Июль 2003 23:49 Olga написал(a):
> > Имеется url    http://www.сервер.ru/dir1/file1.htm
> > в нём есть ссылки вида:   <img src="../img/dir2/file2.jpg">
> > Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
> > в него таким образом рисунками
> > wget -p http://www.сервер.ru/dir1/file1.htm
> > Однако, скачивается только сам file1.htm, ну и robots.txt, но не
> > рисунки. Как всё-таки заставить wget выкачивать и их?
>
>	wget -r -l 1
> ?
> ("минус эр минус эль один")

Нет, этот вариант тоже не проходит -- скачиваются, опять же, лишь
file1.htm и robots.txt


-- 
 С уважением,                           (>|<)
 OL                                       |


^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] Проблема со wget -p
  2003-07-23  9:13 ` Olga
@ 2003-07-23 10:18   ` Leonid B. Sysoletin
  2003-07-23 10:41   ` Alexey Pristavkin
  1 sibling, 0 replies; 8+ messages in thread
From: Leonid B. Sysoletin @ 2003-07-23 10:18 UTC (permalink / raw)
  To: community

В сообщении от 23 Июль 2003 13:13 Olga написал(a):
> Нет, этот вариант тоже не проходит -- скачиваются, опять же, лишь
> file1.htm и robots.txt

А можно линк на неберущийся сайт?

-- 
Л. Сысолетин,
webmaster@unicon-ms.ru, webmaster@bdo.ru
[Team Ёжики-рулез!] [Team Котёнки на солярке] [Team Берегите букву "ё"!]
[Team Я люблю свою фортунку] [Team Фортунка в переписку не вступает]

f u cn rd ths, u r prbbly a lsy spllr.



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] Проблема со wget -p
  2003-07-23  9:13 ` Olga
  2003-07-23 10:18   ` Leonid B. Sysoletin
@ 2003-07-23 10:41   ` Alexey Pristavkin
  2003-07-23 11:50     ` Michael Bykov
  2003-07-23 17:31     ` Olga
  1 sibling, 2 replies; 8+ messages in thread
From: Alexey Pristavkin @ 2003-07-23 10:41 UTC (permalink / raw)
  To: community

Olga wrote:

>Leonid B. Sysoletin <webmaster@unicon-ms.ru> пишет:
>
>>В сообщении от 22 Июль 2003 23:49 Olga написал(a):
>>    
>>
>>>Имеется url    http://www.сервер.ru/dir1/file1.htm
>>>в нём есть ссылки вида:   <img src="../img/dir2/file2.jpg">
>>>Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
>>>в него таким образом рисунками
>>>wget -p http://www.сервер.ru/dir1/file1.htm
>>>Однако, скачивается только сам file1.htm, ну и robots.txt, но не
>>>рисунки. Как всё-таки заставить wget выкачивать и их?
>>>      
>>>
>>	wget -r -l 1
>>?
>>("минус эр минус эль один")
>>    
>>
>
>Нет, этот вариант тоже не проходит -- скачиваются, опять же, лишь
>file1.htm и robots.txt
>
wget -e robots=off -r http://www.сервер.ru/dir1/file1.htm
Кажется так.



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] Проблема со wget -p
  2003-07-23 10:41   ` Alexey Pristavkin
@ 2003-07-23 11:50     ` Michael Bykov
  2003-07-23 12:32       ` Alexey Pristavkin
  2003-07-23 17:31     ` Olga
  1 sibling, 1 reply; 8+ messages in thread
From: Michael Bykov @ 2003-07-23 11:50 UTC (permalink / raw)
  To: community

On Wed, 23 Jul 2003 14:41:22 +0400
Alexey Pristavkin <alexey@bill.mts.ru> wrote:

> >Нет, этот вариант тоже не проходит -- скачиваются,
> >опять же, лишь file1.htm и robots.txt
> >
> wget -e robots=off -r
> http://www.сервер.ru/dir1/file1.htm
> Кажется так.


Я всегда запускал wget -m -r http... 

-m значит миррор

--
Regards,

М.


^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] Проблема со wget -p
  2003-07-23 11:50     ` Michael Bykov
@ 2003-07-23 12:32       ` Alexey Pristavkin
  0 siblings, 0 replies; 8+ messages in thread
From: Alexey Pristavkin @ 2003-07-23 12:32 UTC (permalink / raw)
  To: community

Michael Bykov wrote:

>On Wed, 23 Jul 2003 14:41:22 +0400
>Alexey Pristavkin <alexey@bill.mts.ru> wrote:
>  
>
>>>Нет, этот вариант тоже не проходит -- скачиваются,
>>>опять же, лишь file1.htm и robots.txt
>>>
>>>      
>>>
>>wget -e robots=off -r
>>http://www.сервер.ru/dir1/file1.htm
>>Кажется так.
>>    
>>
>
>
>Я всегда запускал wget -m -r http... 
>
>-m значит миррор
>
-m не поможет. Проблема в наличии файла robots.txt в корне сайта, и в 
этом случае абсолютно безразлично как запускать с -m или -r, главное 
отключить обработку этого файла, а это как раз делается с помощью -e 
robots=off. Не говоря о том что по большому счету -r и -m отличаются 
только тем что -m пытается сохранить временные атрибуты файла, и не 
удаляет файл листы при выкачивании фтп, что как правило не сильно 
требуется...

-- 
С уважением,
Приставкин Алексей
---------------------------------
технический специалист
службы управления ресурсами
информационных систем
ОАО "МТС"
<alexey@bill.mts.ru>




^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [Comm] Проблема со wget -p
  2003-07-23 10:41   ` Alexey Pristavkin
  2003-07-23 11:50     ` Michael Bykov
@ 2003-07-23 17:31     ` Olga
  1 sibling, 0 replies; 8+ messages in thread
From: Olga @ 2003-07-23 17:31 UTC (permalink / raw)
  To: community

Alexey Pristavkin <alexey@bill.mts.ru> пишет:

> >>>Имеется url    http://www.сервер.ru/dir1/file1.htm
> >>>в нём есть ссылки вида:   <img src="../img/dir2/file2.jpg">
> >>>Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
> >>>в него таким образом рисунками
> >>>wget -p http://www.сервер.ru/dir1/file1.htm
> >>>Однако, скачивается только сам file1.htm, ну и robots.txt, но не
> >>>рисунки. Как всё-таки заставить wget выкачивать и их?
> >
> wget -e robots=off -r http://www.сервер.ru/dir1/file1.htm

Спасибо! 

Проблема решена, помогло как раз  -e robots=off
(Как оказалось, в robots.txt прописано Disallow 
на многие каталоги сайта)

-- 
 С уважением,                           (>|<)
 OL                                       |


^ permalink raw reply	[flat|nested] 8+ messages in thread

end of thread, other threads:[~2003-07-23 17:31 UTC | newest]

Thread overview: 8+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2003-07-22 19:49 [Comm] Проблема со wget -p Olga
2003-07-23  4:05 ` Leonid B. Sysoletin
2003-07-23  9:13 ` Olga
2003-07-23 10:18   ` Leonid B. Sysoletin
2003-07-23 10:41   ` Alexey Pristavkin
2003-07-23 11:50     ` Michael Bykov
2003-07-23 12:32       ` Alexey Pristavkin
2003-07-23 17:31     ` Olga

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git