From: "Хихин Руслан" <hihin@yandex.ru> To: ALT Devel discussion list <devel@lists.altlinux.org> Subject: Re: [devel] статистика Date: Fri, 24 Aug 2007 01:08:26 +0400 Message-ID: <200708240108.32151@ruslandh> (raw) In-Reply-To: <20070823190529.GE6155@solemn.turbinal> [-- Attachment #1: Type: text/plain, Size: 3103 bytes --] Здравствуйте Alexey Tourbin В сообщении от 23 августа 2007 Alexey Tourbin написал(a): > On Thu, Aug 23, 2007 at 04:32:18PM +0400, Alexey Tourbin wrote: > > Очень дорого это сколько, в новых деньгах? :) > > > > > > > > Я и это обсуждал с ldv на конференции. Порешили на том, > > > > что нужно поточнее прикинуть статистику. Какая пропускная > > > > способность сизифа и средняя загрузка сборочных серверов > > > > нам нужна, и сколько, исходя из этого, нужно сборочных серверов? > > > > > > > > Думаю, что в ближайшее время ответ на эти вопросы будет получен. > > > > Тогда можно ставить вопрос ребром. А заранее вопить "очень > > дорого", > > > > впрочем как и "даёшь серверы" с пустыми руками и без понятия, это > > > > по-моему не стоит так делать. > > Я грепнул логи /raid/beehive/old-logs/i586/2007/0812/success/, > > выложил сюда: ftp://ftp.altlinux.org/pub/people/at/buildtime > > > > У меня получилась следующая первичная статистика: > > среднее время сборки 74 секунды, медиана распределения 27 секунд, > > сигма которая СКО она же стандартная девиация 189 секунд, > > максимальное время сборки 3273 секунды (у пакета kdebase). > > > > Гистограмма по смыслу похожа на распределение Максвелла. :) > > ftp://ftp.altlinux.org/pub/people/at/buildtime.png > > > > Теперь, если кто понимает в мат. статистике, я вопрошаю: > > что можно извлечь из этих данных? > > > > Начнем с простого вопроса: что дает среднее время сборки пакета? > > Ведь может попасться "неудачный" пакет, и рассчитывать, что он > соберётся > > за минуту, нельзя (kdebase собирается целый час). Из статистики > > известно "правило трёх сигм" (правда, оно касается распределений, > > близких к нормальному). Это правило сводится к тому, что с > надёжностью > > больше 99% случайная величина (время сборки) принимает значение > > (среднее)плюс-минус(3*сигма), и с надежностью около 95% > > (среднее)плюс-минус(2*сигма). > > > > Значит, чтобы нас не "прокатили" на "оптимистичном" среднем > значении, > > нужно закладывать время сборки пакета 74+2*сигма=74+2*189=452 > секунды. > > > > С другой стороны, "время сборки" одного пакета по отношению к нашей > > задаче вообще имеет мало смысла. Мы ведь будем пересобирать серию > из > > N пакетов подряд. Из статистики также известно (если чорт меня не > > попутал), что с увеличением размеров выборки сигма падает > > пропорционально 1/sqrt(N) -- то есть, на пальцах, "размах" > отклонения > > суммарного времени падает за счет нивелирования выбросов. > > Это даёт следующую формулу: > > > > (ВРЕМЯ СБОРКИ СЛУЧАЙНО ВЫБРАННЫХ N src.rpm ПАКЕТОВ) <= > > N * (среднее + 2*сигма/sqrt(N)) > > где > > среднее = 74 секунды > > сигма = 189 секунда > > неравенство выполняется с вероятностью около 90%. > > > > Прошу подписчиков листа обдумать это соображение. :) т.е. для 1000 пакетов (область статисики) имеем ~ 74011 секунд или 20 часов 33 минуты ? а для 6685 пакетов, находящихся в Сизифе около 5 суток ? Ошибки в расчётах нет ? -- С уважением Хихин Руслан [-- Attachment #2: This is a digitally signed message part. --] [-- Type: application/pgp-signature, Size: 189 bytes --]
next prev parent reply other threads:[~2007-08-23 21:08 UTC|newest] Thread overview: 46+ messages / expand[flat|nested] mbox.gz Atom feed top 2007-08-21 21:43 [devel] RFC: тестирование входящих пакетов полной пересборкой сизифа Alexey Tourbin 2007-08-22 5:25 ` Денис Смирнов 2007-08-22 8:22 ` Хихин Руслан 2007-08-23 10:19 ` Alexey Tourbin 2007-08-23 11:10 ` Michael Shigorin 2007-08-23 11:16 ` Mykola S. Grechukh 2007-08-23 11:18 ` Mykola S. Grechukh 2007-08-23 11:52 ` [devel] [JT] " Michael Shigorin 2007-08-23 12:10 ` Mykola S. Grechukh 2007-08-23 12:11 ` Michael Shigorin 2007-08-23 12:32 ` Alexey Tourbin 2007-08-23 19:05 ` [devel] статистика Alexey Tourbin 2007-08-23 20:25 ` Alexey Tourbin 2007-08-23 20:37 ` Vadim V. Zhytnikov 2007-08-23 19:51 ` Alexey Tourbin 2007-08-23 21:03 ` Alexey Tourbin 2007-08-23 21:08 ` Хихин Руслан [this message] 2007-08-23 21:47 ` Alexey Tourbin 2007-08-23 21:59 ` Alexey Tourbin 2007-08-23 22:19 ` Alexey Tourbin 2007-08-23 12:19 ` [devel] [JT] Re: RFC: тестирование входящих пакетов полной пересборкой сизифа Alexey Tourbin 2007-08-23 13:12 ` Michael Shigorin 2007-08-24 11:15 ` Alexey Tourbin 2007-08-25 9:15 ` Alexey I. Froloff 2007-08-25 9:33 ` Alexey Tourbin 2007-08-25 10:16 ` Alexey I. Froloff 2007-08-25 11:25 ` Igor Vlasenko 2007-08-25 11:36 ` Igor Vlasenko 2007-08-25 11:48 ` Michael Shigorin 2007-08-25 11:53 ` Mykola S. Grechukh 2007-08-25 21:58 ` Igor Vlasenko 2007-08-25 22:43 ` Alexey Tourbin 2007-08-25 23:35 ` Igor Vlasenko 2007-08-26 13:38 ` Alexey I. Froloff 2007-08-25 18:33 ` Alexey Tourbin 2007-08-25 19:32 ` [devel] incominger Michael Shigorin 2007-08-25 20:13 ` [devel] [JT] Re: RFC: тестирование входящих пакетов полной пересборкой сизифа Денис Смирнов 2007-08-23 13:23 ` [devel] " Alexey Tourbin 2007-08-24 12:51 ` Alexey Tourbin 2007-08-24 21:23 ` [devel] статистика [2] Alexey Tourbin 2007-08-25 14:57 ` [devel] Критерий значимости пакета (Was: статистика) Alexey Rusakov 2007-08-25 20:10 ` Денис Смирнов 2007-08-25 20:28 ` Alexey Tourbin 2007-08-25 22:47 ` Денис Смирнов 2007-08-25 23:55 ` Alexey Tourbin 2007-08-29 20:39 ` [devel] статистика [2] Dmitry V. Levin
Reply instructions: You may reply publicly to this message via plain-text email using any one of the following methods: * Save the following mbox file, import it into your mail client, and reply-to-all from there: mbox Avoid top-posting and favor interleaved quoting: https://en.wikipedia.org/wiki/Posting_style#Interleaved_style * Reply using the --to, --cc, and --in-reply-to switches of git-send-email(1): git send-email \ --in-reply-to=200708240108.32151@ruslandh \ --to=hihin@yandex.ru \ --cc=devel@lists.altlinux.org \ /path/to/YOUR_REPLY https://kernel.org/pub/software/scm/git/docs/git-send-email.html * If your mail client supports setting the In-Reply-To header via mailto: links, try the mailto: link
ALT Linux Team development discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \ devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru public-inbox-index devel Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.devel AGPL code for this site: git clone https://public-inbox.org/public-inbox.git