From: Alexey Tourbin <at@altlinux.ru> To: ALT Linux Team development discussions <devel@lists.altlinux.org> Subject: Re: [devel] changelogs for apt repo Date: Sun, 18 May 2008 03:03:31 +0400 Message-ID: <20080517230331.GC9319@solemn.turbinal> (raw) In-Reply-To: <482F54F3.1060403@altlinux.ru> [-- Attachment #1: Type: text/plain, Size: 3858 bytes --] On Sun, May 18, 2008 at 01:58:11AM +0400, Alexey Gladkov wrote: > Alexey Tourbin wrote: > >Но там уже есть description (а не только summary). > >Так что для чего > >предназначен pkglist это вопрос > >неоднозначный. > > Эта информация нужна для поиска. Значит, предназначение pkglist двоякое: как текстовая информация для чтения человеком (и поиска), так и информация для установки пакетов и автоматического разрешения зависимостей. > >Какая плата тебя бы устроила? Думаю что > >плату можно будет немного > >уменьшить, если сначала отсортировать > >пакеты по %{SOURCERPM}, а уже > >потом выгонять хедеры. Тогда bzip2 лучше > >сожмёт одинаковые changelog'и > >подряд идущих подпакетов. > > Может пойти по другому пути и разбить > этот файл. Чтобы трафик между сервером и > обновляемым клиентом была меньше. Ведь, > как ты правильно сказал, pkglist это > сваленные в одну кучу хэдеры (плюс они > ещё пожаты). Если переделать алгоритм > чтобы хэдеры передавались по одиночке, а > на стороне клиента объединялись, то > скачиваться будут только новые и > изменённые хэдеры. Если класть хедеры в отдельные файлы, то оверхед в связи с этим будет очень большой (это и inode'ы, и перекачка информации о файлах). На самом деле если pkglist не сжимать, то rsync прокачает его гораздо быстрее (особенно если отсортировать хедеры по %{SOURCERPM}). Средний размер хедера в pkglist 2K, если сделать rsync --block-size=1K то мы возьмём почти чистый diff (с оверхедом того же порядка, что и при передаче хедеров по отдельности). Но почему-то почти все используют ftp, и ради них pkglist бзипют. > Сейчас меня несколько волнует, что при > обновлении к тебе на машину копируются > хэдеры от *всех* пакетов в сизифе вне > зависимости изменились они или нет. Это всё-таки не очень большой объем информации (3-4M) по сравнению с типичным размером dist-upgrade. > >И это будет опция. Если ты генерируешь > >свой репозитарий с жесткими > >ограничениями на размер, то это можно > >бдует отключить. > > Но сизиф-то будет с этой информацией. И > поэтому у всех наших клиентов ты > увеличишь размер pkglist. А также все клиенты смогут читать changelog'и ДО того, как что-то скачать и обновить (хуже того, apt устроен таким образом, что даже в промежуток между скачать и обновить довольно-таки неудобно вклиниться -- можно, конечно, сделать apt-get --download-only и потом искать скоченые *.rpm'ы в /var/*/apt, которые он к тому же манглит...). В общем, взыскательные клиенты могут и оценить фичу. > >Есть такая дилемма. > > Так может написать такую поддержку в apt и > перейти на них. В этих базах есть всё что > может понадобиться. Это тоже хэдеры плюс > индексы. apt всё равно создаёт свой собственный pkgcache.bin, который он mmap'ит в память, и все его алгоритмы завязаны на формат этого кеша (который я плохо понимаю!). И, собственно, rpmdb как альтернатива pkglist ничего не экономит; а rpmdb как дополнение к pkglist порождает вопросы, напр. должна ли эта rpmdb скачиваться при apt-get update или нет. Или у неё статус такой же как у contents_index. Типа кто-то его туда наклал. > >Но ведь мы можем обновляться не с > >предпоследней версии на последнюю, > >а с ещё более ранней. То есть мы можем > >пропустить промежуточное важное > >изменение. Поэтому есть наибольший > >смысл сохранять changelog'и строго > >по известной дате, как я и предлагаю > >сделать. > > И за сколько будем хранить, за год? Через > какой период по вашему люди обновляются > сидя на сизифе (ведь именно этот период > тебе и нужно охватить с таким подходом) ? Ну, сейчас "эпоха" начинается с бранча 4.0. Видимо за три года где-то. Но по идее за эти ближайшие годы инфраструктура интернета разовьётся не меньше, чем мы успеем написать changelog'ов. [-- Attachment #2: Type: application/pgp-signature, Size: 197 bytes --]
next prev parent reply other threads:[~2008-05-17 23:03 UTC|newest] Thread overview: 35+ messages / expand[flat|nested] mbox.gz Atom feed top 2008-05-17 5:34 Alexey Tourbin 2008-05-17 9:50 ` Евгений Терешков 2008-05-17 12:06 ` Alexey Gladkov 2008-05-17 13:23 ` Andrey Rahmatullin 2008-05-17 13:54 ` Alexey Gladkov 2008-05-17 19:00 ` Alexey Tourbin 2008-05-17 20:01 ` Led 2008-05-17 19:55 ` Andrey Rahmatullin 2008-05-17 21:16 ` Led 2008-05-17 21:09 ` Andrey Rahmatullin 2008-05-18 6:34 ` Kirill Maslinsky 2008-05-17 20:50 ` Alexey Tourbin 2008-05-17 21:58 ` Alexey Gladkov 2008-05-17 21:46 ` Andrey Rahmatullin 2008-05-17 22:14 ` Alexey Gladkov 2008-05-17 22:00 ` Andrey Rahmatullin 2008-05-17 22:21 ` Alexey Gladkov 2008-05-17 22:10 ` Andrey Rahmatullin 2008-05-17 22:32 ` Alexey Gladkov 2008-05-17 22:45 ` Sergey Bolshakov 2008-05-17 23:03 ` Alexey Tourbin [this message] 2008-05-19 4:02 ` Ildar Mulyukov 2008-05-19 4:53 ` Alexey Tourbin 2008-05-19 10:26 ` Ildar Mulyukov 2008-05-19 10:35 ` Andrey Rahmatullin 2008-05-19 10:41 ` Pavlov Konstantin 2008-05-19 10:43 ` Andrey Rahmatullin 2008-05-19 10:53 ` Aleksey Avdeev 2008-05-20 12:27 ` Alexander Bokovoy 2008-05-18 2:07 ` Alexey Tourbin 2008-05-18 2:25 ` Alexey Tourbin 2008-05-18 9:26 ` Alexey Gladkov 2008-05-18 21:35 ` Alexey Tourbin 2008-05-18 22:26 ` Alexey Gladkov 2008-05-20 2:34 ` Alexey Morozov
Reply instructions: You may reply publicly to this message via plain-text email using any one of the following methods: * Save the following mbox file, import it into your mail client, and reply-to-all from there: mbox Avoid top-posting and favor interleaved quoting: https://en.wikipedia.org/wiki/Posting_style#Interleaved_style * Reply using the --to, --cc, and --in-reply-to switches of git-send-email(1): git send-email \ --in-reply-to=20080517230331.GC9319@solemn.turbinal \ --to=at@altlinux.ru \ --cc=devel@lists.altlinux.org \ /path/to/YOUR_REPLY https://kernel.org/pub/software/scm/git/docs/git-send-email.html * If your mail client supports setting the In-Reply-To header via mailto: links, try the mailto: link
ALT Linux Team development discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \ devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru public-inbox-index devel Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.devel AGPL code for this site: git clone https://public-inbox.org/public-inbox.git