ALT Linux Sisyphus discussions
 help / color / mirror / Atom feed
From: Victor Forsyuk <victor@ksi-linux.com>
To: Sergey Solopov <serj@arte.ru>, sisyphus@altlinux.ru
Subject: Re: [sisyphus] SpamAssassin
Date: Thu, 30 Oct 2003 16:31:35 +0200
Message-ID: <20031030143135.GB10062@mailhub.gu.net> (raw)
In-Reply-To: <714239426.20031027200244@arte.ru>

On Mon, Oct 27, 2003 at 08:02:44PM +0300, Sergey Solopov wrote:
> 
> >> большего % на сколько я понял надо обучать bayes фильтр.
> 
> VF> Я бы сформулировал иначе. Для получения большего процента отсева спама
> VF> необходимо - если мы говорим не только конкретно о SA - строить
> VF> комплексную "эшелонированную" :) оборону. Начиная с отсева спама еще
> VF> во время SMTP-сеанса по различным критериям и только заканчивая
> VF> контекстной фильтрацией инструментами типа spamassassin.
> Это по поводу различных RBL и blacklist-ов ? Так уже используются.

И о них тоже, но далеко не только лишь о них. К примеру, если к вам из
внешнего Интернета (не от своих клиентов с виндюками) пришло соединение,
в котором параметр EHLO не содержит точки - это спам. Если параметр
EHLO compuserve.com - это спам. Если параметр EHLO является одним из
ваших доменных имен или IP одного из интерфейсов - это спам. И т.д.
 
> >> Отсюда вопрос, может стоит сделать дополнительный пакет с обученным
> >> фильтром ?
> 
> VF> Это невозможно. По самой сути методов частотного разделения типа bayes
> VF> не может быть "обученного вообще" фильтра с соответствующими базами,
> VF> _подходящими для всех_.
> 
> В принципе понятно, по ведь SA ставят, те-же ISP провайдеры, у которых
> под обучение попадает "общая" часть спама, а до учить уже можно на

Ну вот я поставил (ISP "Global Ukraine"). Обучается на живом потоке.
Вот как раз для ISP, где адресаты по определению получают разнопрофильную
почту, с "общей" частью лучше не играться.

> месте. Например, bayes-овский фильтр для 'the bat' имеет в поставке и
> обученную базу, хочешь используй, нет - обучай сам. На такой "общей
> базе" достигается показатель 80-90% и она подошла большенству моих
> знакомых.

Это Ritlabs такое поставляет?? Я конечно могу понять мотивы, но IMNSHO
это не вполне ответственное решение.
 
> А ложные сработатывания можно дооубчать с помошью sa-learn, если я
> правильно понял.
> 
> 
> VF> Включайте в SpamAssassin'е site-wide bayes autolearn и получите еще
> VF> немного более "догадливый" в отношении спама фильтр.
> autolearn стоит

Тогда подождите немного или покормите его своими архивами спама - пока
у SA bayes-база маленькая она слабо влияет на скоринг. Можете также
_немного_ понизить (с дефолтных 12) порог срабатывания spam autolearn,
для более быстрого наполнения.



      parent reply	other threads:[~2003-10-30 14:31 UTC|newest]

Thread overview: 8+ messages / expand[flat|nested]  mbox.gz  Atom feed  top
2003-10-27  8:46 Serj
2003-10-27 15:03 ` [sisyphus] SpamAssassin Michael Shigorin
2003-10-27 16:20 ` [sisyphus] SpamAssassin Victor Forsyuk
2003-10-27 17:02   ` Re[2]: " Sergey Solopov
2003-10-30 10:35     ` vserge
2003-10-30 11:59       ` Salavat Yarmukhametov
2003-10-30 12:09       ` Re[2]: " Victor Forsyuk
2003-10-30 14:31     ` Victor Forsyuk [this message]

Reply instructions:

You may reply publicly to this message via plain-text email
using any one of the following methods:

* Save the following mbox file, import it into your mail client,
  and reply-to-all from there: mbox

  Avoid top-posting and favor interleaved quoting:
  https://en.wikipedia.org/wiki/Posting_style#Interleaved_style

* Reply using the --to, --cc, and --in-reply-to
  switches of git-send-email(1):

  git send-email \
    --in-reply-to=20031030143135.GB10062@mailhub.gu.net \
    --to=victor@ksi-linux.com \
    --cc=serj@arte.ru \
    --cc=sisyphus@altlinux.ru \
    /path/to/YOUR_REPLY

  https://kernel.org/pub/software/scm/git/docs/git-send-email.html

* If your mail client supports setting the In-Reply-To header
  via mailto: links, try the mailto: link

ALT Linux Sisyphus discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \
		sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru
	public-inbox-index sisyphus

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.sisyphus


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git