期刊文献+

基于朴素贝叶斯的垃圾邮件分类系统的设计 被引量:2

The Design of Junk Mail Classification System Based on Naive Bayes
下载PDF
导出
摘要 结合垃圾邮件分类系统的具体要求,在传统规则分类方法的基础上引入机器学习的知识,给出了系统体系结构和特征提取算法,试验了一种对新邮件计算所属类别后验概率的方法,并详细讨论了一个基于朴素贝叶斯方法的个性化垃圾邮件分类系统的设计。提出的分TFIDF特征子集提取算法和朴素贝叶斯方法对邮件进行分类具有较好的分类精度,应用朴素贝叶斯方法在新邮件到达的同时对其进行分类,具有较好的分类速度。 The research of anti junk mail is the hotspot in computer science research area at all times. This paper combines the specific demand to junk mail classifier, introduces the knowledge of machine learning on the base of the traditional regular classification, presents the architecture of the junk mail system and the feature extraction algorithm, and tests a new method to compute the posteriori probability which sort a new email fall into, and discusses in detail the design of an individual junk mail classifier which is based on Na? ve - Bayes. When the system uses the dispart words algorithm, TFIDF feature subset abstraction algorithm and Naive - Bayes method, it classifies emails more precisely and more quickly.
作者 徐治国
机构地区 盐城民航站
出处 《盐城工学院学报(自然科学版)》 CAS 2008年第2期47-50,共4页 Journal of Yancheng Institute of Technology:Natural Science Edition
关键词 电子邮件 文本分类 朴素贝叶斯 机器学习 email text classification Naive-Bayes machine learning
  • 相关文献

参考文献2

二级参考文献17

  • 1周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量:43
  • 2吴立德,大规模中文文本处理,1997年 被引量:1
  • 3揭春雨,中文信息学报,1989年,3卷,1期,1页 被引量:1
  • 4Salton G,Communications ACM,1975年,18卷,613页 被引量:1
  • 5梁南元.书面汉语自动分词系统—CDWS[J].中文信息学报,1987,(2):44-52. 被引量:45
  • 6Soumen Chakrabarti,Kunal Punera,Mallela Subramanyam. Accelerated Focused Crawling through Online Relevance Feedback,WWW2002,Honolulu, Hawaii, USA, 2002-05 被引量:1
  • 7M F Porter. An algorithm for suffix stripping[J].Program, 1980; 14(3):130~137 被引量:1
  • 8G Salton,M J McGill.An Introduction to Modern Information Retrieval. McGraw-Hill Book Co,New York,1983-04 被引量:1
  • 9Kjersti Aas,Line Eikvil.Text Categorisation:A Survey[R].Technical report,Norwegian Computing Center, 1999-06 被引量:1
  • 10Eric J Glover. Using Web Structure for Classifying and Describing Web Pages. WWW-2000 被引量:1

共引文献45

同被引文献19

引证文献2

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部