From mboxrd@z Thu Jan  1 00:00:00 1970
Return-Path: <byyjrtnybq@ural.ru>
Date: Sun, 28 Mar 2004 06:33:38 +0600
From: Alexander Leschinsky <byyjrtnybq@ural.ru>
X-Mailer: The Bat! (v2.05 Beta/12)
Organization: FreeLancer
X-Priority: 3 (Normal)
Message-ID: <1194953947.20040328063338@post.ural.ru>
To: =?koi8-r?B?9NXUz9cg8s/Nwc4g98nL1M/Sz9fJ3g==?= <community@altlinux.ru>
Subject: Re[5]: [Comm] spamassassin
Comments: =?koi8-r?B?dG8g9NXUz9cg8s/Nwc4g98nL1M/Sz9fJ3iA8dHV0b3Yucm9tYW5Acm9zdG92?=
	=?koi8-r?B?LmFzdG9uLnJ1Pg==?=
In-Reply-To: <1699337531.20040326142536@rostov.aston.ru>
References: <2083939812.20040326100858@rostov.aston.ru>
	<1458077001.20040326101843@sodom.ru>
	<951254040.20040326133937@post.ural.ru>
	<1959520151.20040326131401@sodom.ru>
	<1699337531.20040326142536@rostov.aston.ru>
MIME-Version: 1.0
Content-Type: text/plain; charset=koi8-r
Content-Transfer-Encoding: 8bit
X-Spam-Processed: mayorat.e-city.net.ru, Sun, 28 Mar 2004 06:38:40 +0600
	(not processed: message from valid local sender)
X-MDRemoteIP: 213.242.234.41
X-Return-Path: byyjrtnybq@ural.ru
X-MDaemon-Deliver-To: community@altlinux.ru
X-BeenThere: community@altlinux.ru
X-Mailman-Version: 2.1.4
Precedence: list
Reply-To: community@altlinux.ru
List-Id: Mailing list for ALT Linux users <community.altlinux.ru>
List-Unsubscribe: <http://lists.altlinux.ru/mailman/listinfo/community>,
	<mailto:community-request@altlinux.ru?subject=unsubscribe>
List-Archive: <http://lists.altlinux.ru/pipermail/community>
List-Post: <mailto:community@altlinux.ru>
List-Help: <mailto:community-request@altlinux.ru?subject=help>
List-Subscribe: <http://lists.altlinux.ru/mailman/listinfo/community>,
	<mailto:community-request@altlinux.ru?subject=subscribe>
X-List-Received-Date: Sun, 28 Mar 2004 00:37:42 -0000
Archived-At: <http://lore.altlinux.org/community/1194953947.20040328063338@post.ural.ru/>
List-Archive: <http://lore.altlinux.org/community/>
List-Post: <mailto:mandrake-russian@linuxteam.iplabs.ru>

Hello Тутов,

   On Fri, 26 Mar 2004 14:25:36 +0300 (26.03.2004 17:25 my local time),
   received Friday, March 26, 2004 at 22:23:59,
   you wrote about "[Comm] spamassassin"
   at least in part:

>  Не хочу прерывать только завязавшуюся драку :) ,
Драки - не будет... Нашкодившего ребенка я (максимум) выпорю... как
только руки дойдут

> но хочется услышать мнение на сколько spamassassin эффективен
Сначала - немного более или менее теоретических рассуждений, потом
пойдут и чистые цифры.

Спамассассин от более ранних попыток (процмыльных un mass) отлчитается
тем, что вместо проверки одного (или их небольшого набора) условия и
принятия в соответствии с результатами проверки решения, он использует
систему правил для контекстного анализа всего письма, и в зависмости от
суммы сработавших правил (и собственных настроек) делает финальное
предположение о том, какой категории соответствует каждое сообщение.
Одной из сильных его сторон, несоменно, является и то, что кроме
локальных тестов (regexp-based) он также выполняет (может) сетевые
запросы, для получения более полной информации, насколько это возможно
(встроенные DNSBL-тесты, возможность интегрировать в себя результаты
запросов Razor, Pyzor, DCC) и реагировать более адекватно даже без
модификации правил и их re-scoring'a - как пример прогон через Razor...
это может быть очередной мутант, который не идентифицируется текущим
набором рулей, но если много народа сказали, что это - спам, то так оно
скорее всего и есть, и Ассассин добавляет заметную толику в начисленным
хитам

Еще год-полтора назад он действительно обеспечивал 90%+ процентов
фильтрации, но "на войне как на войне", и поскольку его базовый набор
открыт, были найдены методы для их обхода и обмана (более или менее
удачные), и результативность SA (даже с недавно добавленным байесом) не
настолько велика, чтобы можно было считать единственной панацеей, но и не
настролько мала, чтобы совсем выкидывать

Мне _лениво_ (честно признаю, лениво, и ничего более) доставать данные
по закрытым месяцам, хотя они у меня с ноября 2002 года где-то...
поэтому дам цифры только по нынешнему марту
(рули SA творчески переработаны и дополнены своими рулями и чужими
контрибами)

Пропущено -  5'660
                  из них более поздний DNSBL-check выдернул 243
                  вручную отмечены как спам                 105
Поймано SA - 1'736
                  из них _только_ при помощи                    ~BAYES_99 - 34
                  изменение score BAYES_90 за предел выше спам отсечки
                  принципиально картину не изменит              ~BAYES_9  - 55

Относить оцененные ниже 90% к спаму - это получить гарантированный
значительный процент FP

Вот такие цифры. Даже 80% процентов эффективности стоят того, чтобы работать и
использовать, думаю...
-- 
Best regards,
 Alexander Leschinsky