ALT Linux Sisyphus discussions
 help / color / mirror / Atom feed
From: Victor Forsyuk <victor@ksi-linux.com>
To: sisyphus@altlinux.ru
Subject: Re: [sisyphus] SpamAssassin
Date: Mon, 27 Oct 2003 18:20:28 +0200
Message-ID: <20031027162028.GF6219@mailhub.gu.net> (raw)
In-Reply-To: <02e601c39c66$c531fa50$7004a8c0@sumtechsys.com>

On Mon, Oct 27, 2003 at 11:46:09AM +0300, Serj wrote:
> Всем привет,
> 
> Поставил SpamAssassin, сразу стал отсеивать % 30 спама, но для получения

Всего 30% ? Что-то мало. Не модифицировали установленный из пакета
/etc/mail/spamassassin/local.cf ? Там - совершенно намеренно! - установлен
достаточно высокий порог срабатывания:

required_hits 7.5

Попробуйте понизить его до 5 (что является прописанным внутри SA
умолчанием).

> большего % на сколько я понял надо обучать bayes фильтр.

Я бы сформулировал иначе. Для получения большего процента отсева спама
необходимо - если мы говорим не только конкретно о SA - строить
комплексную "эшелонированную" :) оборону. Начиная с отсева спама еще
во время SMTP-сеанса по различным критериям и только заканчивая
контекстной фильтрацией инструментами типа spamassassin.

Для SpamAssassin - больше увеличит процент отсева понижение порога
срабатывания, если Вас устраивает сопутствующее увеличение вероятности
false positives.

> Отсюда вопрос, может стоит сделать дополнительный пакет с обученным
> фильтром ?

Это невозможно. По самой сути методов частотного разделения типа bayes
не может быть "обученного вообще" фильтра с соответствующими базами,
_подходящими для всех_.
 
> Может поделится кто, у кого он хорошо обучен ?

И это по сути неправильно. Объясню на простых примерах. Представим себе,
что Вы работаете в фирме, которая занимается семинарами... да или вообще,
допустим, по какой-то себе причине часто упоминаете их в письмах.

В Украине одни из самых наглых и активных спамеров рассылают спам с
рекламой семинаров (это наш аналог вашего ALC). Легко догадаться,
что произойдет, если Вы попытаетесь воспользоваться частотными базами,
обученными вовсе не на Вашем почтовом трафике. Такие базы неминуемо
дадут большие false positives и false negatives.

Включайте в SpamAssassin'е site-wide bayes autolearn и получите еще
немного более "догадливый" в отношении спама фильтр. Причем без
ручного вмешательства. Ну а если учите его ручками на своем профайле,
получите еще более точный инструмент.




  parent reply	other threads:[~2003-10-27 16:20 UTC|newest]

Thread overview: 8+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2003-10-27  8:46 Serj
2003-10-27 15:03 ` [sisyphus] SpamAssassin Michael Shigorin
2003-10-27 16:20 ` Victor Forsyuk [this message]
2003-10-27 17:02   ` Re[2]: [sisyphus] SpamAssassin Sergey Solopov
2003-10-30 10:35     ` vserge
2003-10-30 11:59       ` Salavat Yarmukhametov
2003-10-30 12:09       ` Re[2]: " Victor Forsyuk
2003-10-30 14:31     ` Victor Forsyuk

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=20031027162028.GF6219@mailhub.gu.net \
    --to=victor@ksi-linux.com \
    --cc=sisyphus@altlinux.ru \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

ALT Linux Sisyphus discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \
		sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru
	public-inbox-index sisyphus

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.sisyphus


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git