* [devel] I: new package (SpamOracle)
@ 2002-10-25 16:23 Vitaly Lugovsky
2002-10-25 19:53 ` Aleksandr Blokhin
` (2 more replies)
0 siblings, 3 replies; 8+ messages in thread
From: Vitaly Lugovsky @ 2002-10-25 16:23 UTC (permalink / raw)
To: devel; +Cc: sisyphus
В инкоминг приехало:
SpamOracle-1.2-alt1.src.rpm
Если кто заинтересован - прошу тестировать. Русский
язык прикручен абы как, но по крайней мере для меня всё
работает неплохо. Базу делал на >20000 "хороших" писем
(ну конечно же, списки рассылки ALT Linux!) и >1000 "плохих"
(это что за два дня мне пришло). С момента начала тестирования
уже две сотни спамовых писем ушло на помойку и ни одного "хорошего"
не потерялось.
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] I: new package (SpamOracle)
2002-10-25 16:23 [devel] I: new package (SpamOracle) Vitaly Lugovsky
@ 2002-10-25 19:53 ` Aleksandr Blokhin
2002-10-25 20:16 ` [sisyphus] " Aleksandr Blokhin
2002-10-25 20:06 ` Alex Ott
2002-11-01 3:17 ` at
2 siblings, 1 reply; 8+ messages in thread
From: Aleksandr Blokhin @ 2002-10-25 19:53 UTC (permalink / raw)
To: devel; +Cc: sisyphus
On Fri, 25 Oct 2002 20:23:21 +0400 (MSD)
Vitaly Lugovsky <vsl@ontil.ihep.su> wrote:
VL> В инкоминг приехало:
Нельзя ли уточнить в какой incoming?
А то я смотрю-смотрю, да и не вижу.
VL> SpamOracle-1.2-alt1.src.rpm
VL> Если кто заинтересован - прошу тестировать. Русский
VL> язык прикручен абы как, но по крайней мере для меня всё
VL> работает неплохо. Базу делал на >20000 "хороших" писем
VL> (ну конечно же, списки рассылки ALT Linux!) и >1000 "плохих"
VL> (это что за два дня мне пришло). С момента начала тестирования
VL> уже две сотни спамовых писем ушло на помойку и ни одного "хорошего"
VL> не потерялось.
VL> _______________________________________________
VL> Devel mailing list
VL> Devel@altlinux.ru
VL> http://altlinux.ru/mailman/listinfo/devel
--
Best regards
AB
--
... In nomine Altli, et Ctrli, et Spititus Deli, Reset!
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] I: new package (SpamOracle)
2002-10-25 16:23 [devel] I: new package (SpamOracle) Vitaly Lugovsky
2002-10-25 19:53 ` Aleksandr Blokhin
@ 2002-10-25 20:06 ` Alex Ott
2002-10-26 10:40 ` Vitaly Lugovsky
2002-11-01 3:17 ` at
2 siblings, 1 reply; 8+ messages in thread
From: Alex Ott @ 2002-10-25 20:06 UTC (permalink / raw)
To: devel
>>>>> "VL" == Vitaly Lugovsky writes:
VL> В инкоминг приехало:
VL> SpamOracle-1.2-alt1.src.rpm
VL> Если кто заинтересован - прошу тестировать. Русский язык прикручен
VL> абы как, но по крайней мере для меня всё работает неплохо. Базу делал
VL> на >20000 "хороших" писем (ну конечно же, списки рассылки ALT Linux!)
VL> и >1000 "плохих" (это что за два дня мне пришло). С момента начала
VL> тестирования уже две сотни спамовых писем ушло на помойку и ни одного
VL> "хорошего" не потерялось.
Могу поделиться своей базой спама, на которой я отлаживал спам-детектор
(работающий по тому же алгоритму, что и spamoracle), написанный на
mzscheme. База большая, где-то около 80 мегабайт -- сколько уж писем и не
вспомню. Сейчас программа дает сбой где-то на одном письме из 10. Обычно
это спам, похожий на деловые письма, и корейский спам.
--
With best wishes, Alex Ott
-------------------------------
Jet Infosystems, Moscow, Russia mailto: ottalex@narod.ru
http://xtalk.msk.su/~ott/ ICQ #22005116
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [sisyphus] Re: [devel] I: new package (SpamOracle)
2002-10-25 19:53 ` Aleksandr Blokhin
@ 2002-10-25 20:16 ` Aleksandr Blokhin
0 siblings, 0 replies; 8+ messages in thread
From: Aleksandr Blokhin @ 2002-10-25 20:16 UTC (permalink / raw)
To: devel
On Fri, 25 Oct 2002 21:53:57 +0200
Aleksandr Blokhin <sass@uustoll.ee> wrote:
AB> On Fri, 25 Oct 2002 20:23:21 +0400 (MSD)
AB> Vitaly Lugovsky <vsl@ontil.ihep.su> wrote:
VL>> В инкоминг приехало:
AB> Нельзя ли уточнить в какой incoming?
AB> А то я смотрю-смотрю, да и не вижу.
VL>> SpamOracle-1.2-alt1.src.rpm
Уже нашёл. Заявлено было alt1, оказалось alt2, а так как я искал по полному имени, поэтому и не нашёл поначалу.
--
Best regards
AB
--
... In nomine Altli, et Ctrli, et Spititus Deli, Reset!
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] I: new package (SpamOracle)
2002-10-25 20:06 ` Alex Ott
@ 2002-10-26 10:40 ` Vitaly Lugovsky
2002-10-26 13:55 ` Alex Ott
0 siblings, 1 reply; 8+ messages in thread
From: Vitaly Lugovsky @ 2002-10-26 10:40 UTC (permalink / raw)
To: devel
On Sat, 26 Oct 2002, Alex Ott wrote:
> VL> Если кто заинтересован - прошу тестировать. Русский язык прикручен
> VL> абы как, но по крайней мере для меня всё работает неплохо. Базу делал
> VL> на >20000 "хороших" писем (ну конечно же, списки рассылки ALT Linux!)
> VL> и >1000 "плохих" (это что за два дня мне пришло). С момента начала
> VL> тестирования уже две сотни спамовых писем ушло на помойку и ни одного
> VL> "хорошего" не потерялось.
>
> Могу поделиться своей базой спама, на которой я отлаживал спам-детектор
> (работающий по тому же алгоритму, что и spamoracle), написанный на
> mzscheme. База большая, где-то около 80 мегабайт -- сколько уж писем и не
> вспомню. Сейчас программа дает сбой где-то на одном письме из 10. Обычно
> это спам, похожий на деловые письма, и корейский спам.
Это не страшно - главное, чтоб нормальные письма за спам не считались.
Ну а корейцев я по кодировке режу.
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] I: new package (SpamOracle)
2002-10-26 10:40 ` Vitaly Lugovsky
@ 2002-10-26 13:55 ` Alex Ott
0 siblings, 0 replies; 8+ messages in thread
From: Alex Ott @ 2002-10-26 13:55 UTC (permalink / raw)
To: devel
>>>>> "VL" == Vitaly Lugovsky writes:
VL> On Sat, 26 Oct 2002, Alex Ott wrote: Если кто заинтересован - прошу
VL> тестировать. Русский язык прикручен абы как, но по крайней мере для
VL> меня всё работает неплохо. Базу делал на >20000 "хороших" писем (ну
VL> конечно же, списки рассылки ALT Linux!) и >1000 "плохих" (это что за
VL> два дня мне пришло). С момента начала тестирования уже две сотни
VL> спамовых писем ушло на помойку и ни одного "хорошего" не потерялось.
>> Могу поделиться своей базой спама, на которой я отлаживал
>> спам-детектор (работающий по тому же алгоритму, что и spamoracle),
>> написанный на mzscheme. База большая, где-то около 80 мегабайт --
>> сколько уж писем и не вспомню. Сейчас программа дает сбой где-то на
>> одном письме из 10. Обычно это спам, похожий на деловые письма, и
>> корейский спам.
VL> Это не страшно - главное, чтоб нормальные письма за спам не
VL> считались. Ну а корейцев я по кодировке режу.
Я выложу где-нибудь у себя эту базу. Нормальные письма не режутся. (по
крайней мере на наших тестах), но я пока в продакшион не ставил систему.
--
With best wishes, Alex Ott
-------------------------------
Jet Infosystems, Moscow, Russia mailto: ottalex@narod.ru
http://xtalk.msk.su/~ott/ ICQ #22005116
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] I: new package (SpamOracle)
2002-10-25 16:23 [devel] I: new package (SpamOracle) Vitaly Lugovsky
2002-10-25 19:53 ` Aleksandr Blokhin
2002-10-25 20:06 ` Alex Ott
@ 2002-11-01 3:17 ` at
2002-11-03 0:47 ` Vitaly Lugovsky
2 siblings, 1 reply; 8+ messages in thread
From: at @ 2002-11-01 3:17 UTC (permalink / raw)
To: devel
On Fri, Oct 25, 2002 at 08:23:21PM +0400, Vitaly Lugovsky wrote:
> В инкоминг приехало:
>
> SpamOracle-1.2-alt1.src.rpm
>
> Если кто заинтересован - прошу тестировать. Русский
Я заинтересован. Работает хорошо, хотя алгоритм Байеса -- далеко не
самый эффективный для таких задач. Просто спам однотипный.
Виталий, скажите честно, у вас есть скрипт, который регулярно
перестраивает базу по крону? Бог велел делиться. :)
> язык прикручен абы как, но по крайней мере для меня всё
> работает неплохо. Базу делал на >20000 "хороших" писем
> (ну конечно же, списки рассылки ALT Linux!) и >1000 "плохих"
> (это что за два дня мне пришло). С момента начала тестирования
> уже две сотни спамовых писем ушло на помойку и ни одного "хорошего"
> не потерялось.
>
>
> _______________________________________________
> Devel mailing list
> Devel@altlinux.ru
> http://altlinux.ru/mailman/listinfo/devel
^ permalink raw reply [flat|nested] 8+ messages in thread
* Re: [devel] I: new package (SpamOracle)
2002-11-01 3:17 ` at
@ 2002-11-03 0:47 ` Vitaly Lugovsky
0 siblings, 0 replies; 8+ messages in thread
From: Vitaly Lugovsky @ 2002-11-03 0:47 UTC (permalink / raw)
To: devel; +Cc: sisyphus
On Fri, 1 Nov 2002 at@turbinal.org wrote:
> > В инкоминг приехало:
> >
> > SpamOracle-1.2-alt1.src.rpm
> >
> > Если кто заинтересован - прошу тестировать. Русский
>
> Я заинтересован. Работает хорошо, хотя алгоритм Байеса -- далеко не
> самый эффективный для таких задач. Просто спам однотипный.
>
> Виталий, скажите честно, у вас есть скрипт, который регулярно
> перестраивает базу по крону? Бог велел делиться. :)
Прошу прощения, сразу эту мессагу не заметил...
Тут никаких особых действий совершать не надо. Базу не обязательно
перестраивать, там есть функция add. Т.е. скрипт может выглядеть так:
if [ -f $HOME/mail/spam ] ; then
/usr/bin/spamoracle add -spam $HOME/mail/spam
rm -f $HOME/mail/spam
fi
(в ~/mail/spam летят руками отфильтрованные спамовые письма).
Убивать базу и создавать заново - вовсе не обязательно.
^ permalink raw reply [flat|nested] 8+ messages in thread
end of thread, other threads:[~2002-11-03 0:47 UTC | newest]
Thread overview: 8+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2002-10-25 16:23 [devel] I: new package (SpamOracle) Vitaly Lugovsky
2002-10-25 19:53 ` Aleksandr Blokhin
2002-10-25 20:16 ` [sisyphus] " Aleksandr Blokhin
2002-10-25 20:06 ` Alex Ott
2002-10-26 10:40 ` Vitaly Lugovsky
2002-10-26 13:55 ` Alex Ott
2002-11-01 3:17 ` at
2002-11-03 0:47 ` Vitaly Lugovsky
ALT Linux Team development discussions
This inbox may be cloned and mirrored by anyone:
git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git
# If you have public-inbox 1.1+ installed, you may
# initialize and index your mirror using the following commands:
public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
public-inbox-index devel
Example config snippet for mirrors.
Newsgroup available over NNTP:
nntp://lore.altlinux.org/org.altlinux.lists.devel
AGPL code for this site: git clone https://public-inbox.org/public-inbox.git