ALT Linux Community general discussions
 help / color / mirror / Atom feed
* [mdk-re] ëÁË ÓÄÅÌÁÔØ ÌÏËÁÌØÎÏÅ ÚÅÒËÁÌÏ ÓÁÊÔÁ?
@ 2001-03-29 14:28 Ivan Kudryashov
  2001-03-29 14:49 ` [mdk-re] Re: [mdk-re] Как сделать локальное зеркало сайта? Maxim Savrilov
  2001-03-30 13:24 ` [mdk-re] Re: [mdk-re] Как сделать локальное зеркало сайта? cornet
  0 siblings, 2 replies; 4+ messages in thread
From: Ivan Kudryashov @ 2001-03-29 14:28 UTC (permalink / raw)
  To: mandrake-russian

Здравствуйте!

Проблема такая:

Мне  нужно  иметь  на локальной машине зеркало некоего сайта (на самом
деле,  не  одного,  а  многих, но это уже лирика). Зеркало должно быть
корректно  локализовано,  т.е.  в  нём  должны быть перекодированы все
внутренние html - ссылки. Вроде бы, всё это делается с помощью:

wget -c -k -L -l <глубина> -N <адрес>

НО!

При  использовании  ключа  -k  изменяется размер закачанных страниц, в
результате чего при последующих обновлениях на них не распространяется
-N (у меня, во всяком случае явное впечатление, основанное на опыте) -
файлы перезакачиваются снова. Сделать -nc нельзя, потому что некоторые
страницы  меняются со временем. Очевидный выход - всосать сайт без -k,
но тогда его невозможно смотреть обычными средствами.

Под  виндами  есть  такой  OfflineExplorer,  падучий,  но решающий эту
проблему   примитивнейшим   образом   -  он  хранит  закачанные  файлы
неизменными  (добавляя  к  имени файла '.primary'), а конверсию ссылок
делает на копии, доступной для просмотра.

Вижу варианты:

1. Найти  способ  закачивать  файлы  с проверкой времени создания, но
   отключенной проверкой совпадения размеров. Кто-нибудь знает, как?

2. Выкачивать  оригиналы,  делать локальную копию и конвертить ссылки
   прямо в ней. Кто-нибудь знает готовую программу для конверсии
   ссылок?

3. (Шаманский). Подсунуть выкачанный сайт прокси-серверу в кэш, так,
   чтобы обращение к сайту автоматом (и без попыток обратиться наружу,
   при отключенном момеде, например) обрабатывалось и я получал ранее
   выкачанные страницы. Но это требует спецобработки этого куска кэша
   (чтобы он не сбрасывался и не делались попытки проверить обновление
   страниц при обращении к нему). Никто не пробовал?

-------------------------------------------
С уважением, 
Ivan Kudryashov <jony@chat.ru> ICQ 1547081





^ permalink raw reply	[flat|nested] 4+ messages in thread

* [mdk-re] Re: [mdk-re] Как сделать локальное зеркало сайта?
  2001-03-29 14:28 [mdk-re] ëÁË ÓÄÅÌÁÔØ ÌÏËÁÌØÎÏÅ ÚÅÒËÁÌÏ ÓÁÊÔÁ? Ivan Kudryashov
@ 2001-03-29 14:49 ` Maxim Savrilov
  2001-03-29 15:06   ` [mdk-re] Re: [mdk-re] ëÁË ÓÄÅÌÁÔØ ÌÏËÁÌØÎÏÅ ÚÅÒËÁÌÏ ÓÁÊÔÁ? Ivan Kudryashov
  2001-03-30 13:24 ` [mdk-re] Re: [mdk-re] Как сделать локальное зеркало сайта? cornet
  1 sibling, 1 reply; 4+ messages in thread
From: Maxim Savrilov @ 2001-03-29 14:49 UTC (permalink / raw)
  To: mandrake-russian

Ivan Kudryashov wrote:

> Здравствуйте!
>
> Проблема такая:
>
> Мне  нужно  иметь  на локальной машине зеркало некоего сайта (на самом
> деле,  не  одного,  а  многих, но это уже лирика). Зеркало должно быть
> корректно  локализовано,  т.е.  в  нём  должны быть перекодированы все
> внутренние html - ссылки. Вроде бы, всё это делается с помощью:
>
> wget -c -k -L -l <глубина> -N <адрес>
>
> НО!
>
> При  использовании  ключа  -k  изменяется размер закачанных страниц, в
> результате чего при последующих обновлениях на них не распространяется
> -N (у меня, во всяком случае явное впечатление, основанное на опыте) -
> файлы перезакачиваются снова. Сделать -nc нельзя, потому что некоторые
> страницы  меняются со временем. Очевидный выход - всосать сайт без -k,
> но тогда его невозможно смотреть обычными средствами.
>
> Под  виндами  есть  такой  OfflineExplorer,  падучий,  но решающий эту
> проблему   примитивнейшим   образом   -  он  хранит  закачанные  файлы
> неизменными  (добавляя  к  имени файла '.primary'), а конверсию ссылок
> делает на копии, доступной для просмотра.
>
> Вижу варианты:
>
> 1. Найти  способ  закачивать  файлы  с проверкой времени создания, но
>    отключенной проверкой совпадения размеров. Кто-нибудь знает, как?
>
> 2. Выкачивать  оригиналы,  делать локальную копию и конвертить ссылки
>    прямо в ней. Кто-нибудь знает готовую программу для конверсии
>    ссылок?

ну если вы готовы делать локальную копию, то ничего не мешает прогнать
wget 2 раза
один раз с оригинального сервера - без конвертации, второй раз - со
своего - с конвертацией

p.s. сам я никогда не миррорил сервера, это так, в порядке дружеского
совета ;)




^ permalink raw reply	[flat|nested] 4+ messages in thread

* Re: [mdk-re] Re: [mdk-re] ëÁË ÓÄÅÌÁÔØ ÌÏËÁÌØÎÏÅ ÚÅÒËÁÌÏ ÓÁÊÔÁ?
  2001-03-29 14:49 ` [mdk-re] Re: [mdk-re] Как сделать локальное зеркало сайта? Maxim Savrilov
@ 2001-03-29 15:06   ` Ivan Kudryashov
  0 siblings, 0 replies; 4+ messages in thread
From: Ivan Kudryashov @ 2001-03-29 15:06 UTC (permalink / raw)
  To: Maxim Savrilov

Hello, Maxim Savrilov!

29.03.2001 14:56:19, you wrote:

>>
>> Вижу варианты:
>>
>> 1. Найти  способ  закачивать  файлы  с проверкой времени создания, но
>>    отключенной проверкой совпадения размеров. Кто-нибудь знает, как?
>>
>> 2. Выкачивать  оригиналы,  делать локальную копию и конвертить ссылки
>>    прямо в ней. Кто-нибудь знает готовую программу для конверсии
>>    ссылок?

MS> ну если вы готовы делать локальную копию, то ничего не мешает прогнать
MS> wget 2 раза
MS> один раз с оригинального сервера - без конвертации, второй раз - со
MS> своего - с конвертацией

Честно  говоря,  как  раз  этого  бы и не хотелось. Просто потому, что
поднимать  сервер  -  лишний  геморрой. И потом - там опять проблема с
адресами.   Исходный   выкачанный   сайт  имеет  адрес,  что-то  вроде
www.chto-to.ru,  значит, мне надо на моём сервере его дублировать, как
это  делать,  я,  честно  говоря, не знаю. Прямым обращением? Подменой
адресов  в  DNS?  Ещё  как-нибудь?  Если  wget начнёт качать с другого
адреса  -  он  просто  примет  ссылки за внешние и ковертировать их не
станет...  Потом,  если уж поднимать свой сервер-имитатор, тогда зачем
делать локализованную копию - просто читать с него, и все дела...

Кстати,  а  SQUID  нельзя  настроить на пре-кеширование? Заставить его
принудительно  закешировать  сайт  и  пусть  в кэше валяется... Только
опять  же  проблемы с запретом произвольного сброса этой части кэша...
Хотя для такого случая можно накатать скрипт, который будет выставлять
на эти файлы 444, на всё время, кроме времени обновления...

-------------------------------------------
С уважением, 
Ivan Kudryashov <jony@chat.ru> ICQ 1547081





^ permalink raw reply	[flat|nested] 4+ messages in thread

* [mdk-re] Re: [mdk-re] Как сделать локальное зеркало сайта?
  2001-03-29 14:28 [mdk-re] ëÁË ÓÄÅÌÁÔØ ÌÏËÁÌØÎÏÅ ÚÅÒËÁÌÏ ÓÁÊÔÁ? Ivan Kudryashov
  2001-03-29 14:49 ` [mdk-re] Re: [mdk-re] Как сделать локальное зеркало сайта? Maxim Savrilov
@ 2001-03-30 13:24 ` cornet
  1 sibling, 0 replies; 4+ messages in thread
From: cornet @ 2001-03-30 13:24 UTC (permalink / raw)
  To: mandrake-russian

Ivan Kudryashov wrote:
> 
> Здравствуйте!
> 
> Проблема такая:
> 
> Мне  нужно  иметь  на локальной машине зеркало некоего сайта (на самом
> деле,  не  одного,  а  многих, но это уже лирика). Зеркало должно быть
> корректно  локализовано,  т.е.  в  нём  должны быть перекодированы все
> внутренние html - ссылки. Вроде бы, всё это делается с помощью:
> 
> wget -c -k -L -l <глубина> -N <адрес>
> 
> НО!
> 
> При  использовании  ключа  -k  изменяется размер закачанных страниц, в
> результате чего при последующих обновлениях на них не распространяется
> -N (у меня, во всяком случае явное впечатление, основанное на опыте) -
> файлы перезакачиваются снова. Сделать -nc нельзя, потому что некоторые
> страницы  меняются со временем. Очевидный выход - всосать сайт без -k,
> но тогда его невозможно смотреть обычными средствами.
> 
> Под  виндами  есть  такой  OfflineExplorer,  падучий,  но решающий эту
> проблему   примитивнейшим   образом   -  он  хранит  закачанные  файлы
> неизменными  (добавляя  к  имени файла '.primary'), а конверсию ссылок
> делает на копии, доступной для просмотра.
> 
> Вижу варианты:
> 
> 1. Найти  способ  закачивать  файлы  с проверкой времени создания, но
>    отключенной проверкой совпадения размеров. Кто-нибудь знает, как?
> 
> 2. Выкачивать  оригиналы,  делать локальную копию и конвертить ссылки
>    прямо в ней. Кто-нибудь знает готовую программу для конверсии
>    ссылок?
> 
> 3. (Шаманский). Подсунуть выкачанный сайт прокси-серверу в кэш, так,
>    чтобы обращение к сайту автоматом (и без попыток обратиться наружу,
>    при отключенном момеде, например) обрабатывалось и я получал ранее
>    выкачанные страницы. Но это требует спецобработки этого куска кэша
>    (чтобы он не сбрасывался и не делались попытки проверить обновление
>    страниц при обращении к нему). Никто не пробовал?
> 
> -------------------------------------------
> С уважением,
> Ivan Kudryashov <jony@chat.ru> ICQ 1547081
> 

я зеркалю так:

wget -b -r -m -N --convert-links --level=30 http://www.XXXXXXXXXXX.ru/

и все нормально зеркалится, кроме cgi и php разумеется, а при
дозеркаливании апдейтиться корректно и повторных закачек не происходит.


-- 
******** FIRE & STEEL ********



^ permalink raw reply	[flat|nested] 4+ messages in thread

end of thread, other threads:[~2001-03-30 13:24 UTC | newest]

Thread overview: 4+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2001-03-29 14:28 [mdk-re] ëÁË ÓÄÅÌÁÔØ ÌÏËÁÌØÎÏÅ ÚÅÒËÁÌÏ ÓÁÊÔÁ? Ivan Kudryashov
2001-03-29 14:49 ` [mdk-re] Re: [mdk-re] Как сделать локальное зеркало сайта? Maxim Savrilov
2001-03-29 15:06   ` [mdk-re] Re: [mdk-re] ëÁË ÓÄÅÌÁÔØ ÌÏËÁÌØÎÏÅ ÚÅÒËÁÌÏ ÓÁÊÔÁ? Ivan Kudryashov
2001-03-30 13:24 ` [mdk-re] Re: [mdk-re] Как сделать локальное зеркало сайта? cornet

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git