期刊文献+

基于规则的垃圾邮件过滤算法比较研究 被引量:4

原文传递
导出
摘要 基于规则的垃圾邮件过滤技术是目前常用的垃圾邮件过滤方法之一。基于规则的垃圾邮件过滤方法是通过训练样本,归纳总结出其中规律性的内容来得到显式规则,从而实现垃圾邮件分类的目的。为了对基于规则算法的邮件过滤方法进行比较,本文简要分析了Ripper、C4.5决策树和Adaboost这三种基于规则的常用算法,并利用开源的数据挖掘平台WEKA对三种算法的垃圾邮件过滤方法进行实验比较。实验结果表明:Ripper、C4.5决策树和Adaboost这三种算法都获得了80%以上的查准率和查全率,但相比较而言,Adaboost算法的查准率和查全率结果较好,获得了90%以上的查准率和查全率结果。
作者 汤金波 孙力
出处 《网络安全技术与应用》 2016年第6期57-58,共2页 Network Security Technology & Application
  • 相关文献

参考文献6

  • 1王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量:129
  • 2李方圆..基于决策树的邮件分类技术研究[D].湖南师范大学,2007:
  • 3H.Drucker, D Wu, and V.N.Vapnik,Support Vector Machines for Spam Categorization[J].IEEE Transactions on Neural Networks,Vol. 10,No.5,Sep. 1999. 被引量:1
  • 4X Carreras and L.Marquez.Boosting Trees for AntiSpam Email FilteringiAl In Proceedings of: RANLP-01, 4th International Conference on Recent Advances in Natural Lap.guage processing, Sep,2001. 被引量:1
  • 5柴宝仁,谷文成,牛占云,周宏君,王克生.基于Boosting算法的垃圾邮件过滤方法研究[J].北京理工大学学报,2013,33(1):79-83. 被引量:7
  • 6郑梅..基于规则的垃圾邮件过滤系统设计与实现[D].电子科技大学,2008:

二级参考文献42

  • 1李渝勤,孙丽华.基于规则的自动分类在文本分类中的应用[J].中文信息学报,2004,18(4):9-14. 被引量:20
  • 2M. DeSouza, J. Fitzgerald, C. Kempand G. Truong, A Decision Tree based Spam Filtering Agent[EB] . from http:∥www. cs. mu. oz. au/481/2001- projects/gntr/index. html, 2001. 被引量:1
  • 3N. Littlestone, Learning quickly when irrelevant attributes abound: A new linear-threshold algorithm[J]. Machine Learning, 2(4) :285- 318, 1988[J]. 被引量:1
  • 4R. Krishnamurthy and C. Orasan, A corpus-based investigation of junk emails[A]. In: Proceedings of Language Resources and Evaluation Conference (LREC 2002)[C]. Las Palmas de Gran Canaria, Spain, pp. 1773- 1780,May 2002. 被引量:1
  • 5M. Sahami, S. Dumais, D. Heckerman and E. Horvitz, A Bayesian approach to filtering junk e-mail[A]. In:Proc. of AAAI Workshop on Learning for Text Categorization[C]. pp. 55-62, 1998. 被引量:1
  • 6W. Cohen, Fast effective rule induction[A]. In: Machine Learning Proceedings of the Twelfth International Conference[C]. Lake Taho, California, Mongan Kanfmann, pp. 115-123, 1995. 被引量:1
  • 7W. Cohen, Learning rules that classify email[A]. In: Proceedings of the AAAI spring symposium of Machine Learning in Information Access, Palo Alto[C]. California, pp. 18 - 25. 1996. 被引量:1
  • 8X. Carreras and L. Marquez, Boosting Trees for Anti-Spam Email Filtering[A]. In: Proceedings of Euro Conference Recent Advances in NLP (RANLP-2001)[C]. pp. 58-64, Sep. 2001. 被引量:1
  • 9T. Nicholas, Using AdaBoost and Decision Stumps to Identify Spam E-mail[ EB]. Stanford University Course Project (Spring 2002/2003) Report, from http: ∥nlp. stanford. edu/courses/cs224n/2003/fp/. 被引量:1
  • 10Y. Diao, H. LuandD. Wu, A Comparative Study of Classification Based PersonalE-mail Filtering[A]. In: Proceedings of PAKDD-2000[C], pp.408-419, Apr. 2000. 被引量:1

共引文献134

同被引文献26

引证文献4

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部