ALT Linux Team development discussions
 help / color / mirror / Atom feed
From: Alexey Tourbin <at@altlinux.ru>
To: ALT Devel discussion list <devel@lists.altlinux.org>
Subject: Re: [devel] comprehensive rsyncability test
Date: Sun, 1 Jun 2008 12:11:50 +0400
Message-ID: <20080601081150.GE7996@solemn.turbinal> (raw)
In-Reply-To: <20080531194452.GA3975@wo.int.altlinux.org>


[-- Attachment #1.1: Type: text/plain, Size: 2927 bytes --]

On Sat, May 31, 2008 at 11:44:52PM +0400, Dmitry V. Levin wrote:
> On Sat, May 31, 2008 at 10:58:47PM +0400, Alexey Tourbin wrote:
> > Предварительное тестирование rsyncable gzdio показало, что эффект
> > от rsyncable deflate есть, и лучше всего он проявляется при
> > незначительном изменении пакетов; кроме того, пакет должен содержать
> > достаточно большие файлы (если пакет целиком состоит из маленьких
> > файлов, то rsyncability резко падает).
> > 
> > Но одиночные тесты не выявляют "реального положения вещей"; требуется
> > более широкое тестирование с привлечением "реальных данных" за некоторый
> > промежуток времени.
> > 
> > Предлагаю протестировать rsyncability двух каталогов:
> > /ALT/archive/Sisyphus/2008/03/01/files/x86_64/RPMS
> > /ALT/archive/Sisyphus/2008/04/01/files/x86_64/RPMS
> > 
> > Методика тестирования следующая:
> > 1) Из каталогов парами выбираются файлы, у которых совпадает
> > имя пакета %{NAME}, но при этом не совпадает имя файла
> > %name-%version-%release.x86_64.rpm.
> > 2) Для каждой пары пакетов извлекается cpio архив и перепаковывается
> > с помощью rsyncable gzdio из нового rpmio.
> > 3) Отсекаются маленькие пакеты: оба перепакованных архива должны быть
> > больше 32K.
> > 4) Запускается rsync, который диагностирует степень "совпадения" двух
> > перепакованных архивов.
> 
> Тогда, наверное, надо сравнить ещё и размер rsyncable deflate, нынешний
> не-rsyncable deflate и lzma для этих двух групп пакетов.

Далее я прицепил таблицу

файл-2   gzdio-размер   lzdio(2)-размер   lzma-5-размер
------   ------------   ---------------   -------------

$ cut -f2 lzma.txt |sum                                     
2433627
$

Общий размер новых файлов, перепакованных с помощью rsyncable deflate,
прежний -- 2.32G.

$ cut -f3 lzma.txt |sum
1960275
$ cut -f4 lzma.txt |sum
1819361
$ 

Если те же самые файлы сжать с помощью 'lzma -2' или 'lzma -5',
то получим 1.87G и 1.73G соответственно.  Напомню, что при
синхронизации rsync скачал 1.57G.  Несколько точнее, разница
между 1.57G и 1.73G в данном случае 172M.


#!/bin/sh -efu
packages "$1" >pkg1
packages "$2" >pkg2
join -t$'\t' -j 1 -o '0 1.3 2.3' pkg1 pkg2 |awk -F'\t' '$2!=$3' >pkg12
while read -r pkg f1 f2; do
        rpm2cpio "$1/$f1" |./gzdio >cpio1.gz
        rpm2cpio "$2/$f2" |./gzdio >cpio2.gz
        s1=$(du -b cpio1.gz |awk '{print int($1/1024+0.5)}')
        s2=$(du -b cpio2.gz |awk '{print int($1/1024+0.5)}')
        [ "$s1" -gt 32 ] && [ "$s2" -gt 32 ] || continue
        rpm2cpio "$2/$f2" |./lzdio >cpio2.lz-2
        rpm2cpio "$2/$f2" |./lzma -5 >cpio2.lz-5
        s3=$(du -b cpio2.lz-2 |awk '{print int($1/1024+0.5)}')
        s4=$(du -b cpio2.lz-5 |awk '{print int($1/1024+0.5)}')
        echo $f2$'\t'$s2$'\t'$s3$'\t'$s4
done <pkg12

Здесь программа lzdio.c такая же, как gzdio.c, только в ней вместо
"w9.gzdio" написано "w2.lzdio".

[-- Attachment #1.2: lzma.txt.gz --]
[-- Type: application/x-gzip, Size: 19681 bytes --]

[-- Attachment #2: Type: application/pgp-signature, Size: 197 bytes --]

  parent reply	other threads:[~2008-06-01  8:11 UTC|newest]

Thread overview: 93+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2008-05-31 18:58 Alexey Tourbin
2008-05-31 19:44 ` Dmitry V. Levin
2008-05-31 21:32   ` Alexey Tourbin
2008-05-31 21:57     ` Dmitry V. Levin
2008-05-31 22:14       ` Alexey Tourbin
2008-05-31 22:26         ` Dmitry V. Levin
2008-05-31 23:10           ` Alexey Tourbin
2008-06-01  8:11   ` Alexey Tourbin [this message]
2008-06-01 17:35     ` Michael Shigorin
2008-06-01 17:43       ` Mikhail Gusarov
2008-06-01 18:04         ` Michael Shigorin
2008-06-01 18:39         ` Alexey I. Froloff
2008-06-01 17:44       ` Alexander Bokovoy
2008-06-01 18:22         ` Alexey Tourbin
2008-06-01 18:32           ` Led
2008-06-01 19:04             ` Alexey Tourbin
2008-06-01 10:18 ` Alexey Tourbin
2008-06-01 12:18   ` Anton Farygin
2008-06-01 13:23     ` Mikhail Gusarov
2008-06-01 12:26       ` Anton Farygin
2008-06-01 13:48         ` Alexander Bokovoy
2008-06-01 21:17           ` [devel] rsync server load Alexey Tourbin
2008-06-01 21:52             ` Konstantin A. Lepikhov
2008-06-02 14:08             ` Dmitry V. Levin
2008-06-02 14:25               ` Konstantin A. Lepikhov
2008-06-02 14:29                 ` Dmitry V. Levin
2008-06-02 18:04                   ` Konstantin A. Lepikhov
2008-06-02 20:21                     ` [devel] [jt] " Dmitry V. Levin
2008-06-02 20:28                       ` Alexey Gladkov
2008-06-02 20:35                         ` Dmitry V. Levin
2008-06-02 20:41                           ` Alexey Gladkov
2008-06-02 20:58                           ` Sergey Y. Afonin
2008-06-03  6:30                         ` Dmitriy M. Maslennikov
2008-06-02 20:53                       ` Sergey Y. Afonin
2008-06-02 21:33                       ` Konstantin A. Lepikhov
2008-06-02 21:42                         ` Dmitry V. Levin
2008-06-02 22:25                           ` Konstantin A. Lepikhov
2008-06-02 22:50                             ` [devel] [jt] clustered fs Dmitry V. Levin
2008-06-02 22:54                               ` Konstantin A. Lepikhov
2008-06-02 23:08                                 ` Dmitry V. Levin
2008-06-03  5:38                                   ` Anton Farygin
2008-06-03  7:19                                   ` Serge Ryabchun
2008-06-03  8:53                                   ` Michael Shigorin
2008-06-03 10:27                                     ` [devel] " Dmitry V. Levin
2008-06-03 15:02                                       ` Michael Shigorin
2008-06-03 15:18                                         ` [devel] lustre Dmitry V. Levin
2008-06-03 20:21                                           ` Michael Shigorin
2008-06-03 21:27                                             ` Dmitry V. Levin
2008-06-04 12:15                                               ` Serge Ryabchun
2008-06-04 12:20                                                 ` Michael Shigorin
2008-06-04 12:47                                                   ` Anton Farygin
2008-06-04 14:17                                                     ` Andrey Brindeyev
2008-06-04 14:17                                                       ` Andrey Brindeyev
2008-06-04 14:46                                                       ` Anton Farygin
2008-06-04 15:12                                                         ` Serge Ryabchun
2008-06-04 15:22                                                         ` Andrey Brindeyev
2008-06-04 18:49                                                           ` Anton Farygin
2008-06-04 15:10                                                       ` Alexander Bokovoy
2008-06-05  9:04                                                         ` Sergey Zhumatiy
2008-06-05  9:08                                                           ` Alexander Bokovoy
2008-06-03 10:50                                     ` [devel] [jt] clustered fs Mykola S. Grechukh
2008-06-03  8:51                           ` [devel] [jt] rsync server load Michael Shigorin
2008-06-01 13:49         ` [devel] comprehensive rsyncability test Alexander Bokovoy
2008-06-01 12:55           ` Anton Farygin
2008-06-01 15:35           ` Alexey Tourbin
2008-06-01 16:38             ` Alexander Bokovoy
2008-06-01 16:42               ` Mikhail Gusarov
2008-06-01 16:55                 ` Alexander Bokovoy
2008-06-01 17:03                   ` Mikhail Gusarov
2008-06-01 17:41   ` Michael Shigorin
2008-06-01 17:47     ` Mikhail Gusarov
2008-06-01 18:07       ` [devel] [JT] насчёт НП-18 Michael Shigorin
2008-06-01 18:11         ` Mikhail Gusarov
2008-06-02  3:48           ` Anton Farygin
2008-06-02  4:50             ` Alexander Bokovoy
2008-06-02  9:45               ` Sergey Bolshakov
2008-06-02  9:52               ` Anton Farygin
2008-06-02  9:57                 ` Aleksey Novodvorsky
2008-06-02 10:18                   ` Mikhail Gusarov
2008-06-02 10:43                   ` Anton Farygin
2008-06-02 20:24   ` [devel] comprehensive rsyncability test Dmitry V. Levin
2008-06-02 20:31     ` Led
2008-06-04 12:33     ` Alexey Tourbin
2008-06-04 12:49       ` Anton Farygin
2008-06-04 13:04         ` Alexey Tourbin
2008-06-04 17:37           ` Michael Shigorin
2008-06-04 18:24             ` Alexey Tourbin
2008-06-04 18:54               ` Michael Shigorin
2008-06-05  7:36             ` Anton V. Boyarshinov
2008-06-04 18:49           ` Dmitry V. Levin
2008-06-02 10:06 ` Alexey Tourbin
2008-06-02 10:38   ` Alexander Bokovoy
2008-06-02 10:46     ` Anton Farygin

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=20080601081150.GE7996@solemn.turbinal \
    --to=at@altlinux.ru \
    --cc=devel@lists.altlinux.org \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

ALT Linux Team development discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
		devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
	public-inbox-index devel

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.devel


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git