ALT Linux Team development discussions
 help / color / mirror / Atom feed
From: Vladislav Zavjalov <slazav@altlinux.org>
To: ALT Linux Team development discussions <devel@lists.altlinux.org>
Subject: Re: [devel] вопрос про числа
Date: Sun, 8 Nov 2009 07:02:07 +0300
Message-ID: <20091108040207.GA21896@imap.altlinux.org> (raw)
In-Reply-To: <20091107223421.GE10659@altlinux.org>

On Sun, Nov 08, 2009 at 01:34:21AM +0300, Alexey Tourbin wrote:
> On Sun, Nov 08, 2009 at 12:35:51AM +0300, Vladislav Zavjalov wrote:
> > > То есть, задача: есть n m-битных чисел, нужно проверить, что данное число
> > > находится среди них. Хранить хочется меньше, чем n*m бит.
> > > 
> > > Я бы попробовал посмотреть паковку на такую тему:
> > 
> > Эх, только вот эксперимент показывает, что такая паковка эффективна
> > только при достаточно больших n. При n=1000 и m=32 коэффициент паковки у меня
> > получился 1.38... Так что я неправильно подумал...
> 
> Что-то у Вас слишком хороший коэффициент получился.  У меня получается
> энтропия 23.477 бита супротив 32 то максимально возможный коэффициент
> сжатия по идее должен быть 1.36.
> 
> $ perl -le 'sub log2{log($_[0])/log(2)}; sub H{my$p=shift;-$p*log2($p)-(1-$p)*log2(1-$p)}; $n=1000;$m=32; $bits_per_hash=(1<<$m)/$n; print H(1/$bits_per_hash)*$bits_per_hash'
> 23.4769105882751
> $
> 
> Я правда не уверен что это правильная энтропия получается (через
> эквивалентность по битмапу).

Я плохо выразился, при небольших n у меня оказалось все совсем плохо, происходит не сжатие, а расширение :)

Слава


  parent reply	other threads:[~2009-11-08  4:02 UTC|newest]

Thread overview: 15+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2009-11-07 19:34 Alexey Tourbin
2009-11-07 19:54 ` Денис Смирнов
2009-11-07 20:09 ` Dmitry V. Levin
2009-11-07 20:39 ` Vladislav Zavjalov
2009-11-07 21:35   ` Vladislav Zavjalov
2009-11-07 22:34     ` Alexey Tourbin
2009-11-08  0:18       ` Денис Смирнов
2009-11-08  4:02       ` Vladislav Zavjalov [this message]
2009-11-09 12:31         ` Kharitonov A. Dmitry
2009-11-09 13:06           ` Vladislav Zavjalov
2009-11-09 13:48             ` Kharitonov A. Dmitry
2009-11-08 20:45 ` Vladislav Zavjalov
2009-11-09 12:48   ` Kharitonov A. Dmitry
2009-11-09 13:04     ` Vladislav Zavjalov
2009-11-12 18:35 ` Michael Shigorin

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=20091108040207.GA21896@imap.altlinux.org \
    --to=slazav@altlinux.org \
    --cc=devel@lists.altlinux.org \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

ALT Linux Team development discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
		devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
	public-inbox-index devel

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.devel


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git