From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: Date: Sat, 26 Oct 2002 14:40:22 +0400 (MSD) From: Vitaly Lugovsky To: Subject: Re: [devel] I: new package (SpamOracle) In-Reply-To: Message-ID: MIME-Version: 1.0 Content-Type: TEXT/PLAIN; charset=koi8-r Content-Transfer-Encoding: 8BIT Sender: devel-admin@altlinux.ru Errors-To: devel-admin@altlinux.ru X-BeenThere: devel@altlinux.ru X-Mailman-Version: 2.0.9 Precedence: bulk Reply-To: devel@altlinux.ru List-Unsubscribe: , List-Id: List-Post: List-Help: List-Subscribe: , List-Archive: Archived-At: List-Archive: List-Post: On Sat, 26 Oct 2002, Alex Ott wrote: > VL> Если кто заинтересован - прошу тестировать. Русский язык прикручен > VL> абы как, но по крайней мере для меня всё работает неплохо. Базу делал > VL> на >20000 "хороших" писем (ну конечно же, списки рассылки ALT Linux!) > VL> и >1000 "плохих" (это что за два дня мне пришло). С момента начала > VL> тестирования уже две сотни спамовых писем ушло на помойку и ни одного > VL> "хорошего" не потерялось. > > Могу поделиться своей базой спама, на которой я отлаживал спам-детектор > (работающий по тому же алгоритму, что и spamoracle), написанный на > mzscheme. База большая, где-то около 80 мегабайт -- сколько уж писем и не > вспомню. Сейчас программа дает сбой где-то на одном письме из 10. Обычно > это спам, похожий на деловые письма, и корейский спам. Это не страшно - главное, чтоб нормальные письма за спам не считались. Ну а корейцев я по кодировке режу.