期刊文献+

基于Winnow算法的反垃圾邮件引擎的设计与实现 被引量:2

Design and Implementation of One Prototype of Anti-Spam Engine Based on Winnow Algorithm
下载PDF
导出
摘要 电子邮件(e-mail)是人们日常生活中不可缺少的通信手段之一,但是垃圾邮件却给人们带来了很大的危害。文中主要是针对中文垃圾邮件,给出了一种基于Winnow算法的基于邮件内容的反垃圾邮件引擎原型的设计,对于未知邮件可以达到较好的区分效果。首先对邮件的内容进行解码、分词,采用信息增益选取特征项;然后采用Winnow算法构造分类器;最后采用部分邮件样本进行测试,测试结果可以进行反馈学习。最后的测试数据分析表明系统达到了比较好的效果。 Email is one of indispensable communication ways in daily life, but spam has done serious harm to people. In this paper present the design of an anti - spare engine based on Winnow algorithm and focus on Chinese sparn,and the result of distinguishing from unknown mail is good. Firstly it decodes content of the mail, segments, and chooses terms with information gain. Then it constructs the classification. Finally it tests the result with partly maila, and the wrong will result in feedback study. The test data analysis shows that the system outcome is good.
作者 张丽 黄东
出处 《计算机技术与发展》 2006年第4期170-172,175,共4页 Computer Technology and Development
关键词 垃圾邮件 文本分类 特征选择 特征提取 WINNOW算法 反馈 spare text categorization feature selection feature extraction Winnow algorithm feedback
  • 相关文献

参考文献5

  • 1吴立德等..大规模中文文本处理[M],1997.
  • 2姚松源..文本自动分类系统的研究与实现[D].北京工业大学,2003:
  • 3潘文峰.[D].北京.中国科学院计算技术研究所,2004.7. 被引量:22
  • 4鲁松,李晓黎,白硕,王实.文档中词语权重计算方法的改进[J].中文信息学报,2000,14(6):8-13. 被引量:120
  • 5Littlestone N.Learning quickly when irrelevant attributes alound:A new linear-threshold algorithm[J].Machine Learning,1988,2(4):285-318. 被引量:1

二级参考文献1

  • 1Yang Yiming,ProceedingsoftheSeventeenthInternationalACMSIGIRConferenceonResearchandDevelopme,1994年,12页 被引量:1

共引文献140

同被引文献15

引证文献2

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部