From mboxrd@z Thu Jan 1 00:00:00 1970 Return-Path: To: devel@altlinux.ru Subject: Re: [devel] I: new package (SpamOracle) References: From: Alex Ott Date: Sat, 26 Oct 2002 17:55:49 +0400 In-Reply-To: (Vitaly Lugovsky's message of "Sat, 26 Oct 2002 14:40:22 +0400 (MSD)") Message-ID: User-Agent: Gnus/5.090007 (Oort Gnus v0.07) Emacs/21.2 (i586-alt-linux-gnu) MIME-Version: 1.0 Content-Type: text/plain; charset=koi8-r Content-Transfer-Encoding: 8bit Sender: devel-admin@altlinux.ru Errors-To: devel-admin@altlinux.ru X-BeenThere: devel@altlinux.ru X-Mailman-Version: 2.0.9 Precedence: bulk Reply-To: devel@altlinux.ru List-Unsubscribe: , List-Id: List-Post: List-Help: List-Subscribe: , List-Archive: Archived-At: List-Archive: List-Post: >>>>> "VL" == Vitaly Lugovsky writes: VL> On Sat, 26 Oct 2002, Alex Ott wrote: Если кто заинтересован - прошу VL> тестировать. Русский язык прикручен абы как, но по крайней мере для VL> меня всё работает неплохо. Базу делал на >20000 "хороших" писем (ну VL> конечно же, списки рассылки ALT Linux!) и >1000 "плохих" (это что за VL> два дня мне пришло). С момента начала тестирования уже две сотни VL> спамовых писем ушло на помойку и ни одного "хорошего" не потерялось. >> Могу поделиться своей базой спама, на которой я отлаживал >> спам-детектор (работающий по тому же алгоритму, что и spamoracle), >> написанный на mzscheme. База большая, где-то около 80 мегабайт -- >> сколько уж писем и не вспомню. Сейчас программа дает сбой где-то на >> одном письме из 10. Обычно это спам, похожий на деловые письма, и >> корейский спам. VL> Это не страшно - главное, чтоб нормальные письма за спам не VL> считались. Ну а корейцев я по кодировке режу. Я выложу где-нибудь у себя эту базу. Нормальные письма не режутся. (по крайней мере на наших тестах), но я пока в продакшион не ставил систему. -- With best wishes, Alex Ott ------------------------------- Jet Infosystems, Moscow, Russia mailto: ottalex@narod.ru http://xtalk.msk.su/~ott/ ICQ #22005116