* [Comm] Проблема со wget -p
@ 2003-07-22 19:49 Olga
2003-07-23 4:05 ` Leonid B. Sysoletin
2003-07-23 9:13 ` Olga
0 siblings, 2 replies; 8+ messages in thread
From: Olga @ 2003-07-22 19:49 UTC (permalink / raw)
To: community
Здравствуйте!
Прошу помощи в борьбе со wget'ом -- не получается заставить его
подниматься вверх по иерархии каталогов при скчивании HTML-страницы
вместе с её содержимым. (wget-1.8.2-alt2.1)
Имеется url http://www.сервер.ru/dir1/file1.htm
в нём есть ссылки вида: <img src="../img/dir2/file2.jpg">
Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
в него таким образом рисунками
wget -p http://www.сервер.ru/dir1/file1.htm
Однако, скачивается только сам file1.htm, ну и robots.txt, но не
рисунки. Как всё-таки заставить wget выкачивать и их?
Опции -r -l 1, -k (на всякий случай) не помогают --
скачиваются всё равно лишь file1.htm и robots.txt.
А ссылки не битые -- убедилась в этом, заходя на ту страницу галеоном.
--
С уважением, (>|<)
OL |
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [Comm] Проблема со wget -p
2003-07-22 19:49 [Comm] Проблема со wget -p Olga
@ 2003-07-23 4:05 ` Leonid B. Sysoletin
2003-07-23 9:13 ` Olga
1 sibling, 0 replies; 8+ messages in thread
From: Leonid B. Sysoletin @ 2003-07-23 4:05 UTC (permalink / raw)
To: community
В сообщении от 22 Июль 2003 23:49 Olga написал(a):
> Имеется url http://www.сервер.ru/dir1/file1.htm
> в нём есть ссылки вида: <img src="../img/dir2/file2.jpg">
> Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
> в него таким образом рисунками
> wget -p http://www.сервер.ru/dir1/file1.htm
> Однако, скачивается только сам file1.htm, ну и robots.txt, но не
> рисунки. Как всё-таки заставить wget выкачивать и их?
wget -r -l 1
?
("минус эр минус эль один")
--
Л. Сысолетин,
webmaster@unicon-ms.ru, webmaster@bdo.ru
[Team Ёжики-рулез!] [Team Котёнки на солярке] [Team Берегите букву "ё"!]
[Team Я люблю свою фортунку] [Team Фортунка в переписку не вступает]
If he should ever change his faith, it'll be because he no longer thinks
he's God.
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [Comm] Проблема со wget -p
2003-07-22 19:49 [Comm] Проблема со wget -p Olga
2003-07-23 4:05 ` Leonid B. Sysoletin
@ 2003-07-23 9:13 ` Olga
2003-07-23 10:18 ` Leonid B. Sysoletin
2003-07-23 10:41 ` Alexey Pristavkin
1 sibling, 2 replies; 8+ messages in thread
From: Olga @ 2003-07-23 9:13 UTC (permalink / raw)
To: community
Leonid B. Sysoletin <webmaster@unicon-ms.ru> пишет:
> В сообщении от 22 Июль 2003 23:49 Olga написал(a):
> > Имеется url http://www.сервер.ru/dir1/file1.htm
> > в нём есть ссылки вида: <img src="../img/dir2/file2.jpg">
> > Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
> > в него таким образом рисунками
> > wget -p http://www.сервер.ru/dir1/file1.htm
> > Однако, скачивается только сам file1.htm, ну и robots.txt, но не
> > рисунки. Как всё-таки заставить wget выкачивать и их?
>
> wget -r -l 1
> ?
> ("минус эр минус эль один")
Нет, этот вариант тоже не проходит -- скачиваются, опять же, лишь
file1.htm и robots.txt
--
С уважением, (>|<)
OL |
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [Comm] Проблема со wget -p
2003-07-23 9:13 ` Olga
@ 2003-07-23 10:18 ` Leonid B. Sysoletin
2003-07-23 10:41 ` Alexey Pristavkin
1 sibling, 0 replies; 8+ messages in thread
From: Leonid B. Sysoletin @ 2003-07-23 10:18 UTC (permalink / raw)
To: community
В сообщении от 23 Июль 2003 13:13 Olga написал(a):
> Нет, этот вариант тоже не проходит -- скачиваются, опять же, лишь
> file1.htm и robots.txt
А можно линк на неберущийся сайт?
--
Л. Сысолетин,
webmaster@unicon-ms.ru, webmaster@bdo.ru
[Team Ёжики-рулез!] [Team Котёнки на солярке] [Team Берегите букву "ё"!]
[Team Я люблю свою фортунку] [Team Фортунка в переписку не вступает]
f u cn rd ths, u r prbbly a lsy spllr.
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [Comm] Проблема со wget -p
2003-07-23 9:13 ` Olga
2003-07-23 10:18 ` Leonid B. Sysoletin
@ 2003-07-23 10:41 ` Alexey Pristavkin
2003-07-23 11:50 ` Michael Bykov
2003-07-23 17:31 ` Olga
1 sibling, 2 replies; 8+ messages in thread
From: Alexey Pristavkin @ 2003-07-23 10:41 UTC (permalink / raw)
To: community
Olga wrote:
>Leonid B. Sysoletin <webmaster@unicon-ms.ru> пишет:
>
>>В сообщении от 22 Июль 2003 23:49 Olga написал(a):
>>
>>
>>>Имеется url http://www.сервер.ru/dir1/file1.htm
>>>в нём есть ссылки вида: <img src="../img/dir2/file2.jpg">
>>>Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
>>>в него таким образом рисунками
>>>wget -p http://www.сервер.ru/dir1/file1.htm
>>>Однако, скачивается только сам file1.htm, ну и robots.txt, но не
>>>рисунки. Как всё-таки заставить wget выкачивать и их?
>>>
>>>
>> wget -r -l 1
>>?
>>("минус эр минус эль один")
>>
>>
>
>Нет, этот вариант тоже не проходит -- скачиваются, опять же, лишь
>file1.htm и robots.txt
>
wget -e robots=off -r http://www.сервер.ru/dir1/file1.htm
Кажется так.
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [Comm] Проблема со wget -p
2003-07-23 10:41 ` Alexey Pristavkin
@ 2003-07-23 11:50 ` Michael Bykov
2003-07-23 12:32 ` Alexey Pristavkin
2003-07-23 17:31 ` Olga
1 sibling, 1 reply; 8+ messages in thread
From: Michael Bykov @ 2003-07-23 11:50 UTC (permalink / raw)
To: community
On Wed, 23 Jul 2003 14:41:22 +0400
Alexey Pristavkin <alexey@bill.mts.ru> wrote:
> >Нет, этот вариант тоже не проходит -- скачиваются,
> >опять же, лишь file1.htm и robots.txt
> >
> wget -e robots=off -r
> http://www.сервер.ru/dir1/file1.htm
> Кажется так.
Я всегда запускал wget -m -r http...
-m значит миррор
--
Regards,
М.
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [Comm] Проблема со wget -p
2003-07-23 11:50 ` Michael Bykov
@ 2003-07-23 12:32 ` Alexey Pristavkin
0 siblings, 0 replies; 8+ messages in thread
From: Alexey Pristavkin @ 2003-07-23 12:32 UTC (permalink / raw)
To: community
Michael Bykov wrote:
>On Wed, 23 Jul 2003 14:41:22 +0400
>Alexey Pristavkin <alexey@bill.mts.ru> wrote:
>
>
>>>Нет, этот вариант тоже не проходит -- скачиваются,
>>>опять же, лишь file1.htm и robots.txt
>>>
>>>
>>>
>>wget -e robots=off -r
>>http://www.сервер.ru/dir1/file1.htm
>>Кажется так.
>>
>>
>
>
>Я всегда запускал wget -m -r http...
>
>-m значит миррор
>
-m не поможет. Проблема в наличии файла robots.txt в корне сайта, и в
этом случае абсолютно безразлично как запускать с -m или -r, главное
отключить обработку этого файла, а это как раз делается с помощью -e
robots=off. Не говоря о том что по большому счету -r и -m отличаются
только тем что -m пытается сохранить временные атрибуты файла, и не
удаляет файл листы при выкачивании фтп, что как правило не сильно
требуется...
--
С уважением,
Приставкин Алексей
---------------------------------
технический специалист
службы управления ресурсами
информационных систем
ОАО "МТС"
<alexey@bill.mts.ru>
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [Comm] Проблема со wget -p
2003-07-23 10:41 ` Alexey Pristavkin
2003-07-23 11:50 ` Michael Bykov
@ 2003-07-23 17:31 ` Olga
1 sibling, 0 replies; 8+ messages in thread
From: Olga @ 2003-07-23 17:31 UTC (permalink / raw)
To: community
Alexey Pristavkin <alexey@bill.mts.ru> пишет:
> >>>Имеется url http://www.сервер.ru/dir1/file1.htm
> >>>в нём есть ссылки вида: <img src="../img/dir2/file2.jpg">
> >>>Пытаюсь выкачать wget'ом этот самый file1.htm вместе со вставленными
> >>>в него таким образом рисунками
> >>>wget -p http://www.сервер.ru/dir1/file1.htm
> >>>Однако, скачивается только сам file1.htm, ну и robots.txt, но не
> >>>рисунки. Как всё-таки заставить wget выкачивать и их?
> >
> wget -e robots=off -r http://www.сервер.ru/dir1/file1.htm
Спасибо!
Проблема решена, помогло как раз -e robots=off
(Как оказалось, в robots.txt прописано Disallow
на многие каталоги сайта)
--
С уважением, (>|<)
OL |
^ permalink raw reply [flat|nested] 8+ messages in thread
end of thread, other threads:[~2003-07-23 17:31 UTC | newest]
Thread overview: 8+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2003-07-22 19:49 [Comm] Проблема со wget -p Olga
2003-07-23 4:05 ` Leonid B. Sysoletin
2003-07-23 9:13 ` Olga
2003-07-23 10:18 ` Leonid B. Sysoletin
2003-07-23 10:41 ` Alexey Pristavkin
2003-07-23 11:50 ` Michael Bykov
2003-07-23 12:32 ` Alexey Pristavkin
2003-07-23 17:31 ` Olga
ALT Linux Community general discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
public-inbox-index community
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.community
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git