From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: To: community@altlinux.ru Subject: Re: [Comm] =?iso-8859-5?b?3dDf2OHQ2w==?= bogofilter-howto References: <200311111751.46224.combr@vesna.ru> From: Dmitry Derjavin Date: Wed, 12 Nov 2003 13:41:52 +1000 In-Reply-To: <200311111751.46224.combr@vesna.ru> (Mike Lykov's message of "Tue, 11 Nov 2003 17:51:46 +0400") Message-ID: User-Agent: Gnus/5.090024 (Oort Gnus v0.24) Emacs/21.2 (gnu/linux) MIME-Version: 1.0 Content-Type: text/plain; charset=koi8-r Content-Transfer-Encoding: 8bit X-BeenThere: community@altlinux.ru X-Mailman-Version: 2.1.3 Precedence: list Reply-To: community@altlinux.ru List-Id: List-Unsubscribe: , List-Archive: List-Post: List-Help: List-Subscribe: , X-List-Received-Date: Wed, 12 Nov 2003 03:41:54 -0000 Archived-At: List-Archive: List-Post: Mike Lykov writes: > Вот, решил написать нечто вроде bogofilter-howto (или bogofilter-faq). Спасибо! Очень полезная вещь. > Естественно, что это только первая версия, которая может содержать опечатки и > ошибки - как грамматические, так и фактические. > Поэтому буду рад увидеть комментарии и предложения по улучшению ;) После беглого прочтения: > Для обучения необходимо иметь два файла в виде mbox с коллекцией писем, > например spam.mbx & non-spam.mbx (некоторые называют это ham ;) 1. На самом ведь деле -- не необходимо. Можно же использовать и отдельные файлы с сообщениями. Maildir, например. Возможно, стоит добавить что-то вроде: $ for i in `ls -1`; do cat $i | bogofilter -n; done > Если вы использ версию 0.15.7 и создаете базы впервые, полезно указать ключи 2. Опечатка -- "используете". 3. Возможно, стоит ещё в начале немного процитировать "Plan for spam" по поводу методов борьбы со спамом вообще. То есть, сказать о том, что критерием эффективности должно быть не количество спама, просочившегося через фильтр, а именно количество ложных срабатываний фильтра. Так как иначе борьба со спамом превращается в довольно сомнительную затею.. 4. Видимо, стоит чётко определиться с переводом терминов, чтобы не было путаницы.. "Хорошие письма, ошибочно принятые за спам" -- почти что "яблони в цвету". Класс! ;) Навевает сентиментальные настроения. Возможно, действительно, "не-спам"? 5. Ещё раз спасибо. -- ~dd