基于粗糙集的带决策规则边界的邮件过滤算法被引量：2

E-mail filtering algorithm with boundary decision rules based on rough set

下载PDF

导出

摘要针对垃圾邮件过滤的准确率和稳定性不高,以及为了解决邮件过滤算法在语料分类上存在漏报和误报等问题,提出基于粗糙集的带决策规则边界的邮件过滤算法(RARM)。该算法运用粗糙集理论对语料库进行直接分析,并采用启发式方法提出了粗糙集理论的三种不同决策规则的执行计划,确保当邮件内容的词汇语义较为模糊时,仍能保证一定的分类准确度。在实验仿真中,通过与基于支持向量机(SVM)、Ada Boost和贝叶斯分类的邮件过滤算法相比较,该算法在垃圾邮件过滤上的准确率优于对比算法。 For accuracy and stability of the spam filter is not high , and in order to solve the problem such as e-mail filtering algorithm has false negatives and false positives on the corpus classification. This paper proposed e-mail filtering algorithm with boundary decision rules based on rough set. First, it used rough set theory for direct analysis of corpus and used heuristic methods to propose three different decision rules of the rough set theory in the execution plan, making sure that when the mes- sage content was more blurred at lexical semantics, could still guarantee a certain classification accuracy. In spare classifica- tion experiments, this algorithm is compared with SVM, AdaBoost and Bayesian mail filtering algorithm, which better than the comparison algorithm on the accuracy of spare filtering.

作者杨艳燕郭红转路新华

机构地区南阳理工学院计算机与信息工程学院郑州大学信息工程学院

出处《计算机应用研究》 CSCD 北大核心 2015年第1期258-261,共4页 Application Research of Computers

基金河南省科技攻关项目(122102210563 132102210215)

关键词邮件过滤粗糙集启发式方法决策规则边界 spam filtering rough set heuristic methods decision rules boundary

分类号 TP393.098 [自动化与计算机技术—计算机应用技术] TP301.6 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献9

1刘伍颖,王挺.结构化集成学习垃圾邮件过滤[J].计算机研究与发展,2012,49(3):628-635. 被引量：12
2邓维斌,王国胤,洪智勇.基于粗糙集的加权朴素贝叶斯邮件过滤方法[J].计算机科学,2011,38(2):218-221. 被引量：21
3YEVSEYEVA I, BASTO-FERNANDES V, RUANO-ORDJI.S D. Op- timising anti-spam filters with evolutionary algorithms [ J]. Expert Systems with Applications,2013,40(10) :4010-4021. 被引量：1
4PEREZ-DIAZ N, RUANO-ORDAS D,FDEZ-RIVEROLA F, et al. SDAI : an integral evaluation methodology for content-based spam fihe- ring models [ J ]. Expert Systems with Applications, 2012, 39 ( 16 ) : 12487-12500. 被引量：1
5LI Cheng-hua, HUANG J X. Spam filtering using semantic eimilarity approach and adaptive BPNN [ J]. Neurocomputing, 2012,92 : 88- 97. 被引量：1
6LAI G H, CHEN C M, LAIH C S, et al. A collaborative anti-spam system [ J ]. Expert System with Applications, 2009,36 ( 3 ) : 6645- 6653. 被引量：1
7CHIU Y F, CHEN C M, JENG B, et al. An alliance-based anti- spam approach [ C ]//Proc of the 3rd International Conference on Na- tural Computation. 2007 : 203- 207. 被引量：1
8KIM J, CHUNG K, CHOI K. Spam filtering with dynamically upda- ted URL statistics[J]. IEEE Security and Privacy,2007,5(4) :33- 39. 被引量：1
9CARRERAS X, MERQUEZ L. Boosting trees for anti-spam e-mail filtering[ C ]//Proc of the 4th International Conference on Recent Ad- vances in Natural Language. 2001:58-64. 被引量：1

二级参考文献20

1陈孝礼,刘培玉,张立伟.一种基于加权支持向量机的垃圾邮件过滤方法[J].山东师范大学学报（自然科学版）,2009,24(4). 被引量：1
2姜远,周志华.基于词频分类器集成的文本分类方法[J].计算机研究与发展,2006,43(10):1681-1687. 被引量：22
3邓维斌,王国胤,王燕.基于Rough Set的加权朴素贝叶斯分类算法[J].计算机科学,2007,34(2):204-206. 被引量：43
4Dietterich T G. Ensemble methods in machine learning [C] // Proc of the Multiple Classifier Systems. London: Springer, 2000:1-15. 被引量：1
5Liu Wuying, Wang Ting. Multi-field learning for email spam filtering [C] //Proc of the 33rd Annual Int ACM SIGIR Conf on Research and Development in Information Retrieval. New York: ACM, 2010: 745-746. 被引量：1
6Fabrizio S. Machine learning in automated text categorization [J]. ACM Computing Surveys, 2002, 34(1): 1-47. 被引量：1
7Drucker H, Wu D, Vapnik V N. Support vector machines for spam categorization [J]. IEEE Trans on Neural Networks, 1999, 10(5): 1048-1054. 被引量：1
8Zobel J, Moffat A. Inverted files for text search engines [J]. ACM Computing Surveys, 2006, 38(2):.Article 6. 被引量：1
9Joachims T. Training linear SVMs in linear time [C] //Proc of the 12th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2006:217-226. 被引量：1
10Paul G. Better Bayesian filtering [C/OL] //Proc of the 2003 Spam Conf. 2003. [2010-01-01]. http://www, paulgraham. com/better, html. 被引量：1

共引文献31

1翟军昌,车伟伟,刘艳丽,康建军.基于改进信息增益的垃圾邮件过滤研究[J].电子设计工程,2012,20(13):9-11. 被引量：2
2申铉京,何月,张博,龙建武.基于空间信息及隶属度约束的FCM图像分割算法[J].北京工业大学学报,2012,38(7):1073-1078. 被引量：6
3王丽娟,杨习贝,杨静宇,吴陈.基于覆盖的粗糙集模型比较[J].计算机科学,2012,39(7):229-231. 被引量：6
4邓职洁,王勇,陶晓玲.基于FPGA的二次加权NB网络流量分类方法[J].计算机工程与设计,2012,33(11):4392-4397.
5翟军昌,秦玉平,车伟伟.应用特征词分类贡献的垃圾邮件过滤研究[J].计算机工程与应用,2012,48(34):116-119. 被引量：2
6赵春生,冯林,蒋劢,李聪.一种基于DTRS模型与α-正域的邮件过滤方法[J].重庆邮电大学学报（自然科学版）,2013,25(1):126-131.
7曾青华,袁家斌,张云洲.基于Hadoop的贝叶斯过滤MapReduce模型[J].计算机工程,2013,39(11):57-60. 被引量：3
8翟军昌,车伟伟.一种基于条件熵的垃圾邮件过滤算法[J].计算机与现代化,2014(2):129-132. 被引量：3
9王超.基于Parzen窗概率密度估计的小样本选煤数据分类算法研究[J].煤炭技术,2014,33(1):142-144.
10周全强,张付志.基于仿生模式识别的用户概貌攻击集成检测方法[J].计算机研究与发展,2014,51(4):789-801. 被引量：5

同被引文献21

1王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量：129
2齐浩亮,程晓龙,杨沐昀,何晓宁,李生,雷国华.高性能中文垃圾邮件过滤器[J].中文信息学报,2010,24(2):76-83. 被引量：7
3樊全会.基于CORBA的电子邮件安全研究与设计[J].软件导刊,2012,11(1):71-73. 被引量：1
4卢永强,方勇,方昉,蒲伟.浏览器隐私信息存储与保护技术研究[J].信息安全与通信保密,2013,11(4):84-85. 被引量：2
5孙彧,胡凯.接入控制器中基于Netfilter的防范DDOS攻击策略研究[J].光通信研究,2013(5):63-66. 被引量：1
6魏庆.“电子邮件”泄密与防范[J].中国信息安全,2014(4):116-117. 被引量：1
7李全刚,时金桥,秦志光,柳厅文.面向邮件网络事件检测的用户行为模式挖掘[J].计算机学报,2014,37(5):1135-1146. 被引量：9
8沈元辅,沈跃伍.基于多层grams的在线支持向量机的中文垃圾邮件过滤[J].中文信息学报,2015,29(1):126-132. 被引量：4
9成凯丽,叶玮琼,许林.基于SMTP-POP3协议的嵌入式远程控制设计与实现[J].湖南工业大学学报,2015,29(1):88-92. 被引量：3
10孙雪,韩蕾,李昆仑.基于类别特征选择与反馈学习随机森林算法的邮件过滤系统研究[J].计算机应用与软件,2015,32(4):67-71. 被引量：1

引证文献2

1申纯洁,朱明,孙梦尧,李跃新.路由器端电子邮件的拦截与放行设计与实现[J].计算机测量与控制,2018,26(1):268-271.
2彭成,展万里,周晓红.基于随机森林的异常邮件检测方法研究与实现[J].湖南工业大学学报,2020,34(1):70-76. 被引量：3

二级引证文献3

1刘倩,李正飞,丁新磊,陈焕新,王誉舟,徐畅.多联机系统故障类型识别及故障细化诊断模型研究[J].制冷学报,2021,42(2):118-126. 被引量：6
2尹毅峰,杨显哲,甘勇,毛保磊.基于LightGBM算法的漏洞利用预测研究[J].郑州大学学报（工学版）,2022,43(5):24-30. 被引量：1
3马建梅,旷开金.基于机器学习方法的学籍异动预测研究——以某地方本科院校为例[J].河南工程学院学报（自然科学版）,2024,36(2):67-72.

1STM32F072:ARM Cortex-M0 32位MCU解决方案[J].世界电子元器件,2014(3):11-13.
2钱志宏.一种改进的灰名单邮件过滤技术[J].电脑知识与技术,2015,0(12):53-54.
3孙英娟,蒲东兵,孙英慧,李春宜,周春光.邮件过滤Agent的设计[J].吉林大学学报（信息科学版）,2008,26(6):576-579. 被引量：1
4秦志光,罗琴,张凤荔.一种混合的垃圾邮件过滤算法研究[J].电子科技大学学报,2007,36(3):485-488. 被引量：7
5刘慧,马军,雷景生,宋玲.基于词频的权值计算在邮件过滤算法中的应用[J].计算机工程,2006,32(17):60-62.
6谢小民.基于贝叶斯的垃圾邮件过滤算法设计研究[J].电子技术与软件工程,2014(15):42-42. 被引量：3
7朱俚治,朱梧檟,侯爱莲.一种新的邮件过滤技术研究[J].计算技术与自动化,2016,35(4):137-141.
8徐健锋,刘承启,黄传华,李建民.反垃圾邮件及粗糙朴素贝叶斯邮件分类器[J].南昌大学学报（理科版）,2008,32(6):605-608. 被引量：3
9刘延华,林嘉雯.基于贝叶斯算法的中文邮件过滤系统设计[J].福建电脑,2009,25(11):7-8.
10赵治国,谭敏生,李志敏.基于改进贝叶斯的垃圾邮件过滤算法综述[J].南华大学学报（自然科学版）,2006,20(1):33-38. 被引量：4

计算机应用研究

2015年第1期

浏览历史

内容加载中请稍等...

基于粗糙集的带决策规则边界的邮件过滤算法被引量：2

参考文献9

二级参考文献20

共引文献31

同被引文献21

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的带决策规则边界的邮件过滤算法 被引量：2

参考文献9

二级参考文献20

共引文献31

同被引文献21

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的带决策规则边界的邮件过滤算法被引量：2