ALT Linux Sisyphus discussions
 help / color / mirror / Atom feed
From: Ivan Adzhubey <iadzhubey@rics.bwh.harvard.edu>
To: ALT Linux Sisyphus mailing list <sisyphus@lists.altlinux.org>
Subject: Re: [sisyphus] Huge regression in "grep -i" performance
Date: Mon, 15 Aug 2011 21:09:28 -0400
Message-ID: <201108152109.28740.iadzhubey@rics.bwh.harvard.edu> (raw)
In-Reply-To: <20110815205221.GA12186@altlinux.org>

On Monday, August 15, 2011 04:52:21 PM Dmitry V. Levin wrote:
> On Mon, Aug 15, 2011 at 11:25:31PM +0400, Dmitry V. Levin wrote:
> > On Sun, Aug 14, 2011 at 11:36:54PM -0400, Ivan Adzhubey wrote:
> > > Доброго времени суток всем!
> > > 
> > > Похоже, у нас в Сизифе регрессия:
> > > 
> > > https://bugzilla.redhat.com/show_bug.cgi?id=194471
> > > 
> > > Причем, в отличие от описанного в федоровской багзилле, у нас и fgrep
> > > точно так же тормозит под UTF. Так что я не уверен, что это именно
> > > этот баг, просто точнее ничего не нашел.
> > 
> > Это, конечно, какая-то другая регрессия с -i, но она, тем не менее,
> > воспроизводится на текущей версии grep.  Спасибо за информацию.
> 
> Это http://savannah.gnu.org/bugs/?29391 и она еще не исправлена.

Да, эта регрессия похоже у всех присутствует, см ниже. Даже на Mac OS X, 
правда говорят, там ее починили в 10.6, но у меня 10.6 нету чтобы проверить. 
Вообще феерический баг, мне сейчас приходится шерстить сотни скриптов и 
дописывать всюду LANG=C.

Прощу прощения за невольную попытку дискредитации Сизифа ;-)

Kubuntu 11.04:

$ time grep -i ^1ko9 pdb.fragm
1ko9   A      1   312     12   323

real    0m0.734s
user    0m0.730s
sys     0m0.000s

$ time fgrep -i 1ko9 pdb.fragm
1ko9   A      1   312     12   323

real    0m0.766s
user    0m0.740s
sys     0m0.010s

$ LANG=C time grep -i ^1ko9 pdb.fragm
1ko9   A      1   312     12   323
0.07user 0.00system 0:00.07elapsed 95%CPU (0avgtext+0avgdata 3296maxresident)k
0inputs+0outputs (0major+259minor)pagefaults 0swaps

$ echo $LANG
en_US.UTF-8

$ grep --version
GNU grep 2.6.3

Copyright (C) 2009 Free Software Foundation, Inc.

      reply	other threads:[~2011-08-16  1:09 UTC|newest]

Thread overview: 4+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2011-08-15  3:36 Ivan Adzhubey
2011-08-15 19:25 ` Dmitry V. Levin
2011-08-15 20:52   ` Dmitry V. Levin
2011-08-16  1:09     ` Ivan Adzhubey [this message]

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=201108152109.28740.iadzhubey@rics.bwh.harvard.edu \
    --to=iadzhubey@rics.bwh.harvard.edu \
    --cc=sisyphus@lists.altlinux.org \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

ALT Linux Sisyphus discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \
		sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru
	public-inbox-index sisyphus

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.sisyphus


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git