基于覆盖算法的垃圾邮件过滤被引量：3

Spam Filtering Based on Covering Algorithm

下载PDF

导出

摘要电子邮件系统分类的正确性与风险性是评价邮件系统好坏的关键因素,邮件过滤是文本分类问题的一种特殊应用。将神经网络中的覆盖算法引入到邮件过滤中,结合多种特征降维方法进行邮件分类实验,并与SVM方法进行了比较。给出一个结合覆盖算法、合适的特征选择与降维方法的分类器,可以实现较好的效果。另外,根据垃圾邮件过滤在实际使用中的最小风险性的要求,从风险角度分析了覆盖算法对测试样本进行分类时的过程。根据分析结果提出对其拒识样本的处理过程进行改进,通过改变非垃圾邮件所属覆盖的影响范围降低了垃圾邮件过滤时的风险。 The correction rate and the risk rate of classification are important factors for evaluating an E-Mail system＇s performance,and spare filtering is a particular application of text categorization. This paper introduced covering algorithm （CA） of NN into spam filtering, and used several feature reduction methods to classify E-Mail. Comparing with SVM, the results of experiments indicated that it is an effective method to realize a spam filter using the combination of covering algorithm,appropriated feature selection and reduction methods. For the need of minimum risk of sparn filtering,we proposed an improvement of one process in the handling of rejection samples by employing cross cover algorithm according to the result of analysis. The results show that this method can reduce the risk by changing the area which is affected by normal mail.

作者段震王倩倩张燕平张铃

机构地区安徽大学计算智能与信号处理重点实验室

出处《计算机科学》 CSCD 北大核心 2009年第8期217-219,253,共4页 Computer Science

基金国家自然科学基金(60675031) 973计划(2004CB318108 2007BC311003)资助

关键词垃圾邮件过滤覆盖算法特征选择特征降维 Spare filtering, Covering algorithm, Feature selection, Feature reduction

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1曹麒麟,张千里编著..垃圾邮件与反垃圾邮件技术[M].北京:人民邮电出版社,2003:162.
2陈凯..反垃圾邮件技术的研究与实践[D].北京邮电大学,2006:
3张铃,张钹.神经网络中BP算法的分析[J].模式识别与人工智能,1994,7(3):191-195. 被引量：58
4张铃,张钹著..人工神经网络理论及应用[M].杭州:浙江科学技术出版社,1997:374.
5张铃,张钹,殷海风.多层前向网络的交叉覆盖设计算法[J].软件学报,1999,10(7):737-742. 被引量：158
6吴涛,张燕平,张铃.前向神经网络交叉覆盖算法的一种改进[J].微机发展,2003,13(3):50-52. 被引量：8
7王倩倩,段震.基于神经网络的垃圾邮件过滤[J].合肥学院学报（自然科学版）,2006,16(1):55-57. 被引量：1
8Salton G, Wong A. On the specification of term value in automatic indexing [J]. Journal of Documentation, 1973,29 (4): 351- 372. 被引量：1
9Yang Y,Pedersen J O. A comparative study on feature selection in text categorization[A]//Proceedings of the 14th International Conference on Machine Learning (ICML'97)[C]. San Francisco: Morgan Kaufmann Publishers, 1997 : 412-420. 被引量：1
10Li Wenbin, Liu Chunnian, Chen Yiying. Design and Implement Cost2Sensitive Email Filtering Algorithms [A]//Proceedings of the Artificial Intelligence Applications and Innovations[C]. Beijing(CN), 2005 : 325-334. 被引量：1

二级参考文献28

1叶振宇,刘晶.基于模糊模式识别的中文邮件过滤探讨[J].计算机时代,2004(11):38-40. 被引量：1
2张铃,张钹,吴福朝.神经网络的规划学习算法[J].计算机学报,1994,17(9):669-675. 被引量：13
3张铃.A Geometrical Representation of McCulloch-Pitts Neural Model andIts Applications[J].IEEE Trans，on Neural Networks,1999,10(4):925-929. 被引量：1
4边肇祺张学工.模式识别[M].北京:清华大学出版社,2001.. 被引量：29
5张铃张钹.人工神经网络理论及应用[M].杭州:浙江科学技术出版社,1996.. 被引量：5
6Y. Yang , J. P. Pedersen. A comparative study on feature selection in text categorization. In: Proc. of the 14th ICML' 971997,412 ～ 420 被引量：1
7Fabrizio Sebastian. Machine learning in automated text categorization. Journal of the ACM(JACM) ,2002,34(1) :1 ～ 47 被引量：1
8边肇祺,张学工.模式识别(第二版).北京:清华大学出版社,2000 被引量：1
9.[EB/OL].TREC官方网站http://trec.nist.gov,. 被引量：1
10.北大中文网页自动分类竞赛规则.[S].李小明,2003.. 被引量：1

共引文献231

1赵小明.BP神经网络模型中平台现象的抑制[J].台州学院学报,2002,24(3):7-9. 被引量：2
2冯玉强,潘启澍.The tool for building an NN based on improved BP algorithm[J].Journal of Harbin Institute of Technology(New Series),2001,8(3):312-316.
3段震,姚芳兵,张铃.基于构造性学习方法的车牌定位[J].微机发展,2004,14(8):41-43. 被引量：2
4张燕平,张铃,吴涛,徐锋,张,王伦文.基于覆盖的构造性学习算法SLA及在股票预测中的应用[J].计算机研究与发展,2004,41(6):979-984. 被引量：18
5张燕平,张铃,夏莹.商空间理论与粗糙集的比较[J].微机发展,2004,14(10):21-24. 被引量：6
6段震,鲁杰,张铃.基于交叉覆盖神经网络的车牌识别研究[J].安徽大学学报（自然科学版）,2004,28(5):11-14. 被引量：7
7董吉文,史奎凡,杨波.基于欧氏距离提高人工神经网的识别精度的方法[J].小型微型计算机系统,2004,25(10):1785-1787. 被引量：1
8赵姝,张燕平,张媛,陈传明.基于交叉覆盖算法的改进算法——核平移覆盖算法[J].微机发展,2004,14(11):1-3. 被引量：6
9张旻,吴涛,王容川,程家兴.基于粗糙集理论和构造型神经网络的分类算法研究[J].模式识别与人工智能,2004,17(3):362-367.
10黄国宏,邵惠鹤.一种新的基于神经网络覆盖分类算法[J].中国图象图形学报（A辑）,2004,9(10):1165-1168. 被引量：6

同被引文献26

1张燕平,张铃,吴涛,徐锋,张,王伦文.基于覆盖的构造性学习算法SLA及在股票预测中的应用[J].计算机研究与发展,2004,41(6):979-984. 被引量：18
2黄国宏,邵惠鹤.一种新的基于神经网络覆盖分类算法[J].中国图象图形学报（A辑）,2004,9(10):1165-1168. 被引量：6
3张旻,张铃,程家兴.一种加权的构造型神经网络覆盖算法设计与实现[J].计算机工程,2005,31(2):36-38. 被引量：3
4詹川,卢显良,周旭,侯孟书.一种基于学习向量量化网络的垃圾邮件过滤方法[J].计算机科学,2005,32(3):66-68. 被引量：1
5吴涛,张铃,张燕平.机器学习中的核覆盖算法[J].计算机学报,2005,28(8):1295-1301. 被引量：33
6王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量：129
7何江平,文俊浩,邓恬洁,王道乾.基于支持向量机的图像识别[J].重庆大学学报（自然科学版）,2006,29(1):57-60. 被引量：9
8徐袭,姚琼荟,石敏.基于粗糙集与支持向量机的故障智能分类方法[J].计算技术与自动化,2006,25(1):32-34. 被引量：8
9王德文,赵文清,朱永利.一个基于粗糙集理论的邮件分类模型[J].计算机工程与应用,2006,42(18):167-170. 被引量：5
10张旻,张铃.构造性覆盖算法的知识发现方法研究[J].电子与信息学报,2006,28(7):1322-1326. 被引量：5

引证文献3

1陈婷,陈卫.基于覆盖算法的SVM雷达辐射源识别[J].计算机工程,2011,37(10):179-181. 被引量：2
2吴叶科,邬颖捷,宋如顺,陈波.粗LVQ神经网络的垃圾邮件过滤[J].计算机工程与应用,2011,47(26):107-109.
3李家兵,何富贵.基于LVQ神经网络的改进覆盖算法[J].计算机工程与应用,2012,48(17):165-169. 被引量：1

二级引证文献3

1王洪迅,解国良,徐忠伟,王星.雷达信号快速分选算法的流水实现[J].火力与指挥控制,2013,38(3):141-143. 被引量：1
2王晓燕,刘辉,苏纯,白艳萍.基于神经网络的激光超声探伤表面波的分类[J].信阳师范学院学报（自然科学版）,2016,29(1):120-123.
3金秋,王宏艳,马方方.雷达辐射源分类识别方法综述[J].电讯技术,2019,59(3):360-368. 被引量：18

1P2P平台投之家A轮融资8000万元创东方投资领投[J].信息技术与信息化,2016(8):4-4. 被引量：1
2李凤梅.信息系统项目风险管理浅析[J].电子技术与软件工程,2013(18):249-250. 被引量：5
3曹建荣,蔡安妮.基于支持向量机的视频关键帧语义提取[J].北京邮电大学学报,2006,29(2):123-126. 被引量：6
4陈亮.从风雨中走来的金融网站[J].互联网天地,2005(9):52-53.
5杨涛.基于OCTAVE的商业银行信息资产风险评估[J].中国金融电脑,2010(5):70-74.
6业内动态[J].计算机安全,2010(7):108-109.
7王进.系统集成项目的风险管理应用[J].中国科技信息,2010(3):90-91. 被引量：4
8许传朝.“标准”接力——3款HP低端黑白激光打印机新品评测[J].微电脑世界,2003(8):58-59.
9刘彬.风电场中央监控及远程监测系统的研究与设计[J].广西电力,2013,36(1):87-90. 被引量：3
10李新波,刘禾,吴超云.一种基于任务过程的液体火箭发动机可靠性建模方法[J].质量与可靠性,2016(6):10-14. 被引量：1

计算机科学

2009年第8期

浏览历史

内容加载中请稍等...

基于覆盖算法的垃圾邮件过滤被引量：3

参考文献13

二级参考文献28

共引文献231

同被引文献26

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于覆盖算法的垃圾邮件过滤 被引量：3

参考文献13

二级参考文献28

共引文献231

同被引文献26

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于覆盖算法的垃圾邮件过滤被引量：3