From: Victor Forsyuk <victor@ksi-linux.com> To: sisyphus@altlinux.ru Subject: Re: [sisyphus] SpamAssassin Date: Mon, 27 Oct 2003 18:20:28 +0200 Message-ID: <20031027162028.GF6219@mailhub.gu.net> (raw) In-Reply-To: <02e601c39c66$c531fa50$7004a8c0@sumtechsys.com> On Mon, Oct 27, 2003 at 11:46:09AM +0300, Serj wrote: > Всем привет, > > Поставил SpamAssassin, сразу стал отсеивать % 30 спама, но для получения Всего 30% ? Что-то мало. Не модифицировали установленный из пакета /etc/mail/spamassassin/local.cf ? Там - совершенно намеренно! - установлен достаточно высокий порог срабатывания: required_hits 7.5 Попробуйте понизить его до 5 (что является прописанным внутри SA умолчанием). > большего % на сколько я понял надо обучать bayes фильтр. Я бы сформулировал иначе. Для получения большего процента отсева спама необходимо - если мы говорим не только конкретно о SA - строить комплексную "эшелонированную" :) оборону. Начиная с отсева спама еще во время SMTP-сеанса по различным критериям и только заканчивая контекстной фильтрацией инструментами типа spamassassin. Для SpamAssassin - больше увеличит процент отсева понижение порога срабатывания, если Вас устраивает сопутствующее увеличение вероятности false positives. > Отсюда вопрос, может стоит сделать дополнительный пакет с обученным > фильтром ? Это невозможно. По самой сути методов частотного разделения типа bayes не может быть "обученного вообще" фильтра с соответствующими базами, _подходящими для всех_. > Может поделится кто, у кого он хорошо обучен ? И это по сути неправильно. Объясню на простых примерах. Представим себе, что Вы работаете в фирме, которая занимается семинарами... да или вообще, допустим, по какой-то себе причине часто упоминаете их в письмах. В Украине одни из самых наглых и активных спамеров рассылают спам с рекламой семинаров (это наш аналог вашего ALC). Легко догадаться, что произойдет, если Вы попытаетесь воспользоваться частотными базами, обученными вовсе не на Вашем почтовом трафике. Такие базы неминуемо дадут большие false positives и false negatives. Включайте в SpamAssassin'е site-wide bayes autolearn и получите еще немного более "догадливый" в отношении спама фильтр. Причем без ручного вмешательства. Ну а если учите его ручками на своем профайле, получите еще более точный инструмент.
next prev parent reply other threads:[~2003-10-27 16:20 UTC|newest] Thread overview: 8+ messages / expand[flat|nested] mbox.gz Atom feed top 2003-10-27 8:46 Serj 2003-10-27 15:03 ` [sisyphus] SpamAssassin Michael Shigorin 2003-10-27 16:20 ` Victor Forsyuk [this message] 2003-10-27 17:02 ` Re[2]: [sisyphus] SpamAssassin Sergey Solopov 2003-10-30 10:35 ` vserge 2003-10-30 11:59 ` Salavat Yarmukhametov 2003-10-30 12:09 ` Re[2]: " Victor Forsyuk 2003-10-30 14:31 ` Victor Forsyuk
Reply instructions: You may reply publicly to this message via plain-text email using any one of the following methods: * Save the following mbox file, import it into your mail client, and reply-to-all from there: mbox Avoid top-posting and favor interleaved quoting: https://en.wikipedia.org/wiki/Posting_style#Interleaved_style * Reply using the --to, --cc, and --in-reply-to switches of git-send-email(1): git send-email \ --in-reply-to=20031027162028.GF6219@mailhub.gu.net \ --to=victor@ksi-linux.com \ --cc=sisyphus@altlinux.ru \ /path/to/YOUR_REPLY https://kernel.org/pub/software/scm/git/docs/git-send-email.html * If your mail client supports setting the In-Reply-To header via mailto: links, try the mailto: link
ALT Linux Sisyphus discussions This inbox may be cloned and mirrored by anyone: git clone --mirror http://lore.altlinux.org/sisyphus/0 sisyphus/git/0.git # If you have public-inbox 1.1+ installed, you may # initialize and index your mirror using the following commands: public-inbox-init -V2 sisyphus sisyphus/ http://lore.altlinux.org/sisyphus \ sisyphus@altlinux.ru sisyphus@altlinux.org sisyphus@lists.altlinux.org sisyphus@lists.altlinux.ru sisyphus@lists.altlinux.com sisyphus@linuxteam.iplabs.ru sisyphus@list.linux-os.ru public-inbox-index sisyphus Example config snippet for mirrors. Newsgroup available over NNTP: nntp://lore.altlinux.org/org.altlinux.lists.sisyphus AGPL code for this site: git clone https://public-inbox.org/public-inbox.git