ALT Linux Team development discussions
 help / color / mirror / Atom feed
* [devel] I: new package (SpamOracle)
@ 2002-10-25 16:23 Vitaly Lugovsky
  2002-10-25 19:53 ` Aleksandr Blokhin
                   ` (2 more replies)
  0 siblings, 3 replies; 8+ messages in thread
From: Vitaly Lugovsky @ 2002-10-25 16:23 UTC (permalink / raw)
  To: devel; +Cc: sisyphus


 В инкоминг приехало:

SpamOracle-1.2-alt1.src.rpm

 Если кто заинтересован - прошу тестировать. Русский
язык прикручен абы как, но по крайней мере для меня всё
работает неплохо. Базу делал на >20000 "хороших" писем
(ну конечно же, списки рассылки ALT Linux!) и >1000 "плохих"
(это что за два дня мне пришло). С момента начала тестирования
уже две сотни спамовых писем ушло на помойку и ни одного "хорошего"
не потерялось.




^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [devel] I: new package (SpamOracle)
  2002-10-25 16:23 [devel] I: new package (SpamOracle) Vitaly Lugovsky
@ 2002-10-25 19:53 ` Aleksandr Blokhin
  2002-10-25 20:16   ` [sisyphus] " Aleksandr Blokhin
  2002-10-25 20:06 ` Alex Ott
  2002-11-01  3:17 ` at
  2 siblings, 1 reply; 8+ messages in thread
From: Aleksandr Blokhin @ 2002-10-25 19:53 UTC (permalink / raw)
  To: devel; +Cc: sisyphus

On Fri, 25 Oct 2002 20:23:21 +0400 (MSD)
Vitaly Lugovsky <vsl@ontil.ihep.su> wrote:



VL> В инкоминг приехало:

Нельзя ли уточнить в какой incoming?
А то я смотрю-смотрю, да и не вижу.

VL> SpamOracle-1.2-alt1.src.rpm

VL> Если кто заинтересован - прошу тестировать. Русский
VL> язык прикручен абы как, но по крайней мере для меня всё
VL> работает неплохо. Базу делал на >20000 "хороших" писем
VL> (ну конечно же, списки рассылки ALT Linux!) и >1000 "плохих"
VL> (это что за два дня мне пришло). С момента начала тестирования
VL> уже две сотни спамовых писем ушло на помойку и ни одного "хорошего"
VL> не потерялось.


VL> _______________________________________________
VL> Devel mailing list
VL> Devel@altlinux.ru
VL> http://altlinux.ru/mailman/listinfo/devel

--
Best regards
AB
--
				... In nomine Altli, et Ctrli, et Spititus Deli, Reset!



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [devel] I: new package (SpamOracle)
  2002-10-25 16:23 [devel] I: new package (SpamOracle) Vitaly Lugovsky
  2002-10-25 19:53 ` Aleksandr Blokhin
@ 2002-10-25 20:06 ` Alex Ott
  2002-10-26 10:40   ` Vitaly Lugovsky
  2002-11-01  3:17 ` at
  2 siblings, 1 reply; 8+ messages in thread
From: Alex Ott @ 2002-10-25 20:06 UTC (permalink / raw)
  To: devel

>>>>> "VL" == Vitaly Lugovsky writes:
 VL>  В инкоминг приехало:

 VL> SpamOracle-1.2-alt1.src.rpm

 VL>  Если кто заинтересован - прошу тестировать. Русский язык прикручен
 VL> абы как, но по крайней мере для меня всё работает неплохо. Базу делал
 VL> на >20000 "хороших" писем (ну конечно же, списки рассылки ALT Linux!)
 VL> и >1000 "плохих" (это что за два дня мне пришло). С момента начала
 VL> тестирования уже две сотни спамовых писем ушло на помойку и ни одного
 VL> "хорошего" не потерялось.

Могу поделиться своей базой спама, на которой я отлаживал спам-детектор
(работающий по тому же алгоритму, что и spamoracle), написанный на
mzscheme. База большая, где-то около 80 мегабайт -- сколько уж писем и не
вспомню. Сейчас программа дает сбой где-то на одном письме из 10. Обычно
это спам, похожий на деловые письма, и корейский спам.

-- 
With best wishes, Alex Ott
-------------------------------
Jet Infosystems, Moscow, Russia    mailto: ottalex@narod.ru
http://xtalk.msk.su/~ott/          ICQ #22005116



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [sisyphus] Re: [devel] I: new package (SpamOracle)
  2002-10-25 19:53 ` Aleksandr Blokhin
@ 2002-10-25 20:16   ` Aleksandr Blokhin
  0 siblings, 0 replies; 8+ messages in thread
From: Aleksandr Blokhin @ 2002-10-25 20:16 UTC (permalink / raw)
  To: devel

On Fri, 25 Oct 2002 21:53:57 +0200
Aleksandr Blokhin <sass@uustoll.ee> wrote:

AB> On Fri, 25 Oct 2002 20:23:21 +0400 (MSD)
AB> Vitaly Lugovsky <vsl@ontil.ihep.su> wrote:

VL>> В инкоминг приехало:

AB> Нельзя ли уточнить в какой incoming?
AB> А то я смотрю-смотрю, да и не вижу.

VL>> SpamOracle-1.2-alt1.src.rpm

Уже нашёл. Заявлено было alt1, оказалось alt2, а так как я искал по полному имени, поэтому и не нашёл поначалу.



--
Best regards
AB
--
				... In nomine Altli, et Ctrli, et Spititus Deli, Reset!



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [devel] I: new package (SpamOracle)
  2002-10-25 20:06 ` Alex Ott
@ 2002-10-26 10:40   ` Vitaly Lugovsky
  2002-10-26 13:55     ` Alex Ott
  0 siblings, 1 reply; 8+ messages in thread
From: Vitaly Lugovsky @ 2002-10-26 10:40 UTC (permalink / raw)
  To: devel

On Sat, 26 Oct 2002, Alex Ott wrote:

>  VL>  Если кто заинтересован - прошу тестировать. Русский язык прикручен
>  VL> абы как, но по крайней мере для меня всё работает неплохо. Базу делал
>  VL> на >20000 "хороших" писем (ну конечно же, списки рассылки ALT Linux!)
>  VL> и >1000 "плохих" (это что за два дня мне пришло). С момента начала
>  VL> тестирования уже две сотни спамовых писем ушло на помойку и ни одного
>  VL> "хорошего" не потерялось.
> 
> Могу поделиться своей базой спама, на которой я отлаживал спам-детектор
> (работающий по тому же алгоритму, что и spamoracle), написанный на
> mzscheme. База большая, где-то около 80 мегабайт -- сколько уж писем и не
> вспомню. Сейчас программа дает сбой где-то на одном письме из 10. Обычно
> это спам, похожий на деловые письма, и корейский спам.

 Это не страшно - главное, чтоб нормальные письма за спам не считались.
Ну а корейцев я по кодировке режу.




^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [devel] I: new package (SpamOracle)
  2002-10-26 10:40   ` Vitaly Lugovsky
@ 2002-10-26 13:55     ` Alex Ott
  0 siblings, 0 replies; 8+ messages in thread
From: Alex Ott @ 2002-10-26 13:55 UTC (permalink / raw)
  To: devel

>>>>> "VL" == Vitaly Lugovsky writes:
 VL> On Sat, 26 Oct 2002, Alex Ott wrote: Если кто заинтересован - прошу
 VL> тестировать. Русский язык прикручен абы как, но по крайней мере для
 VL> меня всё работает неплохо. Базу делал на >20000 "хороших" писем (ну
 VL> конечно же, списки рассылки ALT Linux!)  и >1000 "плохих" (это что за
 VL> два дня мне пришло). С момента начала тестирования уже две сотни
 VL> спамовых писем ушло на помойку и ни одного "хорошего" не потерялось.
 >>  Могу поделиться своей базой спама, на которой я отлаживал
 >> спам-детектор (работающий по тому же алгоритму, что и spamoracle),
 >> написанный на mzscheme. База большая, где-то около 80 мегабайт --
 >> сколько уж писем и не вспомню. Сейчас программа дает сбой где-то на
 >> одном письме из 10. Обычно это спам, похожий на деловые письма, и
 >> корейский спам.

 VL>  Это не страшно - главное, чтоб нормальные письма за спам не
 VL> считались.  Ну а корейцев я по кодировке режу.

Я выложу где-нибудь у себя эту базу. Нормальные письма не режутся. (по
крайней мере на наших тестах), но я пока в продакшион не ставил систему. 

-- 
With best wishes, Alex Ott
-------------------------------
Jet Infosystems, Moscow, Russia    mailto: ottalex@narod.ru
http://xtalk.msk.su/~ott/          ICQ #22005116



^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [devel] I: new package (SpamOracle)
  2002-10-25 16:23 [devel] I: new package (SpamOracle) Vitaly Lugovsky
  2002-10-25 19:53 ` Aleksandr Blokhin
  2002-10-25 20:06 ` Alex Ott
@ 2002-11-01  3:17 ` at
  2002-11-03  0:47   ` Vitaly Lugovsky
  2 siblings, 1 reply; 8+ messages in thread
From: at @ 2002-11-01  3:17 UTC (permalink / raw)
  To: devel

On Fri, Oct 25, 2002 at 08:23:21PM +0400, Vitaly Lugovsky wrote:
>  В инкоминг приехало:
> 
> SpamOracle-1.2-alt1.src.rpm
> 
>  Если кто заинтересован - прошу тестировать. Русский

Я заинтересован. Работает хорошо, хотя алгоритм Байеса -- далеко не
самый эффективный для таких задач. Просто спам однотипный.

Виталий, скажите честно, у вас есть скрипт, который регулярно
перестраивает базу по крону? Бог велел делиться. :)


> язык прикручен абы как, но по крайней мере для меня всё
> работает неплохо. Базу делал на >20000 "хороших" писем
> (ну конечно же, списки рассылки ALT Linux!) и >1000 "плохих"
> (это что за два дня мне пришло). С момента начала тестирования
> уже две сотни спамовых писем ушло на помойку и ни одного "хорошего"
> не потерялось.
> 
> 
> _______________________________________________
> Devel mailing list
> Devel@altlinux.ru
> http://altlinux.ru/mailman/listinfo/devel


^ permalink raw reply	[flat|nested] 8+ messages in thread

* Re: [devel] I: new package (SpamOracle)
  2002-11-01  3:17 ` at
@ 2002-11-03  0:47   ` Vitaly Lugovsky
  0 siblings, 0 replies; 8+ messages in thread
From: Vitaly Lugovsky @ 2002-11-03  0:47 UTC (permalink / raw)
  To: devel; +Cc: sisyphus

On Fri, 1 Nov 2002 at@turbinal.org wrote:

> >  В инкоминг приехало:
> > 
> > SpamOracle-1.2-alt1.src.rpm
> > 
> >  Если кто заинтересован - прошу тестировать. Русский
> 
> Я заинтересован. Работает хорошо, хотя алгоритм Байеса -- далеко не
> самый эффективный для таких задач. Просто спам однотипный.
> 
> Виталий, скажите честно, у вас есть скрипт, который регулярно
> перестраивает базу по крону? Бог велел делиться. :)

 Прошу прощения, сразу эту мессагу не заметил...

 Тут никаких особых действий совершать не надо. Базу не обязательно 
перестраивать, там есть функция add. Т.е. скрипт может выглядеть так:

if [ -f $HOME/mail/spam ] ; then
  /usr/bin/spamoracle add -spam $HOME/mail/spam
  rm -f $HOME/mail/spam
fi

(в ~/mail/spam летят руками отфильтрованные спамовые письма).

Убивать базу и создавать заново - вовсе не обязательно. 



^ permalink raw reply	[flat|nested] 8+ messages in thread

end of thread, other threads:[~2002-11-03  0:47 UTC | newest]

Thread overview: 8+ messages (download: mbox.gz / follow: Atom feed)
-- links below jump to the message on this page --
2002-10-25 16:23 [devel] I: new package (SpamOracle) Vitaly Lugovsky
2002-10-25 19:53 ` Aleksandr Blokhin
2002-10-25 20:16   ` [sisyphus] " Aleksandr Blokhin
2002-10-25 20:06 ` Alex Ott
2002-10-26 10:40   ` Vitaly Lugovsky
2002-10-26 13:55     ` Alex Ott
2002-11-01  3:17 ` at
2002-11-03  0:47   ` Vitaly Lugovsky

ALT Linux Team development discussions

This inbox may be cloned and mirrored by anyone:

	git clone --mirror http://lore.altlinux.org/devel/0 devel/git/0.git

	# If you have public-inbox 1.1+ installed, you may
	# initialize and index your mirror using the following commands:
	public-inbox-init -V2 devel devel/ http://lore.altlinux.org/devel \
		devel@altlinux.org devel@altlinux.ru devel@lists.altlinux.org devel@lists.altlinux.ru devel@linux.iplabs.ru mandrake-russian@linuxteam.iplabs.ru sisyphus@linuxteam.iplabs.ru
	public-inbox-index devel

Example config snippet for mirrors.
Newsgroup available over NNTP:
	nntp://lore.altlinux.org/org.altlinux.lists.devel


AGPL code for this site: git clone https://public-inbox.org/public-inbox.git