ALT Linux Team development discussions
 help / color / mirror / Atom feed
From: Alexey Tourbin <at@altlinux.ru>
To: ALT Linux Team development discussions <devel@lists.altlinux.org>
Subject: Re: [devel] rsync_roll
Date: Mon, 26 May 2008 11:15:53 +0400
Message-ID: <20080526071553.GI7996@solemn.turbinal> (raw)
In-Reply-To: <ffae7d540805251311n208e869nfbf2f70924f7e1b2@mail.gmail.com>

[-- Attachment #1: Type: text/plain, Size: 1848 bytes --]

On Mon, May 26, 2008 at 12:11:46AM +0400, Alexander Myltsev wrote:
> 2008/5/25 Alexey Tourbin <at@altlinux.ru>:
> >> http://ozlabs.org/~rusty/gzip.rsync.patch2, на который ссылаются как
> >> Джефф, так и Эгмонт.
> > Что делает этот патч?  Почему "это работает"?
> >
> > Когда сумма принимает определённое значение (а именно, когда
> > sum % RSYNC_WIN == 0) то в конце окна принимается решение
> > "сборосить блок" и заново инициализировать процедуру сжатия.
> >
> > Это означает, что в этой точке как бы начинается "новый файл",
> > который gzip будет жать отдельно; если в двух разных входных
> > потоках в точке обнуления суммы несжатые данные идут одинаковые,
> > то и сжатые данные пойдут одинаковые.
> 
> Ну да, это и требуется. Благодаря этому точечное изменение в несжатых
> данных влияет только на конечное число блоков.

А откуда это следует, что точечное изменение в несжатых данных влияет
на конечное число блоков?  А неточечное?  А смещение?  Ведь требуется,
чтобы, как только в двух разных потоках пошли одинаковые данные, так
сразу сумма должна синхронно относительно этих данных обнуляться.

  ABCD-ABCD-ABCD-ABCD-DATA-DATA-DATA-DATA-DATA-		data
   ^     ^   ^  ^     ^    ^   ^   ^    ^		sync
      XYZ-XYZ-XYZ-XYZ-DATA-DATA-DATA-DATA-DATA-
        ^     ^   ^     ^  ^   ^   ^    ^

Какие математические свойства суммы гарантируют, что при появлении
совпадающих данных DATA-DATA- оба процесса суммирования, которые до
этого находились в разных состояниях, достаточно быстро "сойдутся"?

> Можно попробовать рассматривать функцию сжатия блока как чёрный ящик.
> Тогда очевидно, что для rsyncability важно правильным (стабильным)
> образом разбивать входные данные на блоки. Предлагаемый патч задаёт
> локально стабильный способ разбиения на блоки.

Прошу подробнее про стабильность или ссылку.

[-- Attachment #2: Type: application/pgp-signature, Size: 197 bytes --]

  reply	other threads:[~2008-05-26  7:15 UTC|newest]

Thread overview: 33+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2008-05-24 14:21 [devel] rpm: LZMA payload compression Alexey Tourbin
2008-05-24 14:20 ` Andrey Rahmatullin
2008-05-24 14:32   ` Alexey Tourbin
2008-05-25  0:01     ` Dmitry V. Levin
2008-05-24 14:51 ` Alexander Bokovoy
2008-05-24 15:35   ` Alexey Tourbin
2008-05-24 15:45     ` Alexey Tourbin
2008-05-24 15:53     ` Alexander Bokovoy
2008-05-24 15:58       ` Andrey Rahmatullin
2008-05-24 16:09         ` Alexander Bokovoy
2008-05-24 16:02       ` Alexander Bokovoy
2008-05-24 16:37       ` Alexey Tourbin
2008-05-24 17:55         ` Alexander Bokovoy
2008-05-24 19:16           ` Alexey Tourbin
2008-05-25  6:55           ` [devel] [JT] " Alexey Tourbin
2008-05-25  7:10             ` Alexander Bokovoy
2008-05-25  7:24               ` Alexey Tourbin
2008-05-25  7:27                 ` Alexander Bokovoy
2008-05-25  0:11         ` [devel] rsync mirrors Dmitry V. Levin
2008-05-25  6:03           ` Alexey Tourbin
2008-05-25  7:54       ` [devel] gzip --rsyncable Alexey Tourbin
2008-05-25  8:08         ` Alexander Bokovoy
2008-05-25  8:18           ` Alexey Tourbin
2008-05-25  8:31             ` Alexander Bokovoy
2008-05-25  8:48               ` Alexander Bokovoy
2008-05-25 11:35               ` Alexey Tourbin
2008-05-25 18:30               ` [devel] rsync_roll Alexey Tourbin
2008-05-25 18:38                 ` Alexander Bokovoy
2008-05-25 20:11                 ` Alexander Myltsev
2008-05-26  7:15                   ` Alexey Tourbin [this message]
2008-05-26  8:38                     ` Alexey Tourbin
2008-05-25  8:09         ` [devel] gzip --rsyncable Led
2008-05-25  8:27         ` Alexey Tourbin

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=20080526071553.GI7996@solemn.turbinal \
    --to=at@altlinux.ru \
    --cc=devel@lists.altlinux.org \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

ALT Linux Team development discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
		devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
	public-inbox-index devel

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.devel


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git