1。贝叶斯分类在Spamassassin中的基本思想。
如果你使用sa-learn来处理100封含有阴茎增大手术这个关键词的垃圾邮件,那么当Spamassassin在处理包含有阴茎增大手术的关键词的第101封邮件时,贝叶斯分类器就会认为这是一封垃圾邮件,就会增加这封邮件的spam的分值。
2。要知道的一些事
Byaesian Classifier至少需要1000个垃圾邮件样本才能有效判别是否为垃圾邮件。而在未到达200个垃圾样本之前,Byaesian Classifier是不会有任何作用的。
TO BE CONTINUE!
Resource:
[url]http://wiki.apache.org/spamassassin/BayesInSpamAssassin[/url]
如果你使用sa-learn来处理100封含有阴茎增大手术这个关键词的垃圾邮件,那么当Spamassassin在处理包含有阴茎增大手术的关键词的第101封邮件时,贝叶斯分类器就会认为这是一封垃圾邮件,就会增加这封邮件的spam的分值。
2。要知道的一些事
Byaesian Classifier至少需要1000个垃圾邮件样本才能有效判别是否为垃圾邮件。而在未到达200个垃圾样本之前,Byaesian Classifier是不会有任何作用的。
TO BE CONTINUE!
Resource:
[url]http://wiki.apache.org/spamassassin/BayesInSpamAssassin[/url]
本文介绍了贝叶斯分类器在Spamassassin中的应用原理及实践效果。通过训练至少1000个样本,可以有效提高垃圾邮件识别率。文章指出,在收集到200个样本之前,分类器不会发挥作用。
1万+

被折叠的 条评论
为什么被折叠?



