ALT Linux Community general discussions
 help / color / mirror / Atom feed
From: "Nick S. Grechukh" <ngrechukh@ua.fm>
To: community@altlinux.ru
Subject: [Comm] using statistical fingreprints for charset autodetect
Date: Fri, 4 Mar 2005 22:21:03 +0200
Message-ID: <200503042221.09125.ngrechukh@ua.fm> (raw)
In-Reply-To: <200503041318.33018.ngrechukh@ua.fm>

[-- Attachment #1: Type: text/plain, Size: 884 bytes --]

On Friday 04 March 2005 13:18, Nick S. Grechukh wrote:
> > > xcode/enca на cp1251 "Би-2"  говорят koi8 и делают из него "аХ-2". 
>>хотя с другой стороны если детектить не один тэг а всю пачку сразу...
> > А ты поштучно?
> так интереснее. вообще-то реализовал оба варианта, по крайней мере UTF8 в
> >Приколист...
> именно ;-) жастфорфан и все такое, заодно и C научился (блин, обленившись
> до админа, уже и забыл кайф программирования. третью ночь не сплю ;-)). а
> еще попробую статистику пар заюзать, как в xmms.
всех интересующихся автоугадавами прошу потестить:
http://gns-linux.narod.ru/autougadaf-0.2.tar.bz2
типа нейросеть, достаточно слова в две-три-четыре буквы.

два варианта баз: юзать для этого москва-петушки уже немодно, есть на выбор 
статистика по Олегу Дивову (4Мб), или по "избранным изречениям  Дзен" (7кб).
первое по идее надежнее, зато второе концептуальнее ;-).

[-- Attachment #2: Type: application/pgp-signature, Size: 190 bytes --]

  reply	other threads:[~2005-03-04 20:21 UTC|newest]

Thread overview: 80+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2005-02-25 15:56 [Comm] Каталог disk в /mnt Andrei Popov
2005-02-25 16:15 ` Alexey I. Froloff
2005-02-25 21:11   ` [Comm] " Michael Shigorin
2005-02-25 22:35     ` Вячеслав Диконов
2005-02-26  8:06       ` Michael Shigorin
2005-02-26  8:28       ` Drool
2005-02-26  9:47         ` Вячеслав Диконов
2005-02-26 15:58           ` Vitaly Lipatov
2005-02-26 21:09             ` Вячеслав Диконов
2005-02-26 14:28       ` Olvin
2005-02-28 13:50         ` Вячеслав Диконов
2005-03-01 10:18           ` Olvin
2005-03-01 20:06             ` Вячеслав Диконов
2005-02-28 12:10     ` php-coder
2005-02-28 12:51       ` Michael Shigorin
2005-02-28 13:02         ` Eugene Ostapets
2005-02-28 13:10           ` [Comm] Re: Каталог disk в /mnt [JT] Gleb Stiblo
2005-02-28 13:23             ` Eugene Ostapets
2005-02-28 13:41               ` Gleb Stiblo
2005-02-28 14:13                 ` Eugene Ostapets
2005-02-28 13:46           ` [Comm] Re: Каталог disk в /mnt Вячеслав Диконов
2005-02-28 13:51             ` Вячеслав Диконов
2005-02-28 14:05             ` Re[2]: " Andrei Popov
2005-02-28 14:19             ` Eugene Ostapets
2005-02-28 15:30               ` Вячеслав Диконов
2005-03-01  9:16                 ` Eugene Ostapets
2005-02-28 14:01           ` [Comm] [JT] " Michael Shigorin
2005-02-28 13:26         ` [Comm] " Afanasov Dmitry
2005-02-28 14:02           ` [Comm] [JT] " Michael Shigorin
2005-02-28 14:21             ` Eugene Ostapets
2005-02-28 14:04           ` Re[2]: [Comm] " Andrei Popov
2005-02-28 14:23             ` Eugene Ostapets
2005-02-28 13:44       ` Вячеслав Диконов
2005-02-28 14:18         ` Eugene Ostapets
2005-02-28 15:28           ` Вячеслав Диконов
2005-03-01  9:14             ` Eugene Ostapets
2005-03-01 20:02               ` Вячеслав Диконов
2005-03-01 20:55                 ` Denis G. Samsonenko
2005-03-02 15:43                   ` Вячеслав Диконов
2005-03-02 16:00                     ` Alexey Rusakov
2005-03-02 16:12                       ` Вячеслав Диконов
2005-03-02 17:36                         ` [Comm] И снова о Unicode (Was: Каталог disk в /mnt) Alexey Rusakov
2005-03-02 18:03                           ` Вячеслав Диконов
2005-03-02 20:41                             ` Alexey Rusakov
2005-03-03  7:39                               ` Вячеслав Диконов
2005-03-03 10:12                                 ` Alexey Rusakov
2005-03-02 18:05                         ` [Comm] Re: Каталог disk в /mnt Denis G. Samsonenko
2005-03-03 11:10                         ` [Comm] [OT] " Michael Shigorin
2005-03-03 13:30                           ` Вячеслав Диконов
2005-03-03 13:36                             ` Eugene Ostapets
2005-03-03 13:50                               ` Вячеслав Диконов
2005-03-03 13:54                                 ` Andriy Dobrovol's'kii
2005-03-03 14:20                               ` Alexey I. Froloff
2005-03-03 14:17                             ` [Comm] " Michael Shigorin
2005-03-03 14:52                               ` Yuri N. Sedunov
2005-03-03 14:31                             ` [Comm] " Kylik Semen
2005-03-02 17:51                     ` [Comm] " Denis G. Samsonenko
2005-03-02 18:20                       ` Вячеслав Диконов
2005-03-02 19:08                         ` Denis G. Samsonenko
2005-03-03 11:17                         ` [Comm] usability and defaults (was: Каталог disk в /mnt) Michael Shigorin
2005-03-03 19:08                     ` [Comm] Re: Каталог disk в /mnt Nick S. Grechukh
2005-03-03 19:28                       ` Вячеслав Диконов
2005-03-04  9:36                         ` Nick S. Grechukh
2005-03-04 10:04                           ` Michael Shigorin
2005-03-04 11:18                             ` [JT] " Nick S. Grechukh
2005-03-04 20:21                               ` Nick S. Grechukh [this message]
2005-03-05  4:01                                 ` [Comm][JT] using statistical fingreprints for charset autodetect Andrey Rahmatullin
2005-03-05 14:11                                   ` Nick S. Grechukh
2005-03-04 13:54                       ` [Comm] Re: Каталог disk в /mnt Arioch
2005-03-04 14:19                         ` Nick S. Grechukh
2005-03-02  7:16                 ` Alexey Morsov
2005-03-03 11:09                 ` [Comm] [JT] " Michael Shigorin
2005-02-26 14:21   ` [Comm] " Olvin
2005-02-28  8:06   ` Re[2]: " Andrei Popov
2005-02-27 18:13 ` some_x
2005-02-28  4:26   ` Pavel N. Solovyov
2005-02-28  6:05     ` Вячеслав Диконов
2005-02-28 10:53       ` Pavel N. Solovyov
2005-03-01 16:00         ` Andrey Rahmatullin
2005-02-28 13:28       ` Afanasov Dmitry

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=200503042221.09125.ngrechukh@ua.fm \
    --to=ngrechukh@ua.fm \
    --cc=community@altlinux.ru \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

ALT Linux Community general discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/community/0 community/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 community community/ http://lore.altlinux.org/community \
		mandrake-russian@linuxteam.iplabs.ru community@lists.altlinux.org community@lists.altlinux.ru community@lists.altlinux.com
	public-inbox-index community

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.community


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git