基于贝叶斯分类的邮件过滤方法及模型研究被引量：6

Research in a Method and Model of Spam Filtering based on Bayesian Classifier

下载PDF

导出

摘要垃圾邮件日益泛滥,给用户带来了极大的不便和危害．并对网络安全构成威胁．传统邮件过滤方法单一,过滤精度不高,已不能很好地满足需求．结合规则过滤技术,分析了基于文本内容的贝叶斯分类器实现的关键技术与方法,并给出核心过滤算法在邮件分类中的实现具体方法及过程,进而完成垃圾邮件的判别．为减少邮件的误判对用户造成的损害及垃圾邮件漏判造成的影响,提出相应的改进措施,使用最小风险贝叶斯决策减小误判率,对分类系统经训练部分进行自适应调整,最后给出基于规则与内容的双重防范机制的邮件过滤模型及基于该框架的邮件判别流程． The increasing junk mail brings great inconvenience and danger to people,threatens the safety of the network. The filtering way is single used by traditional filters, can＇ t well satisfy the demand of filtering. This paper has analysed the key techniques and methods about Bayesian classifier of content-based, provided the effective way and process of kernelly arithmetic in filtering and completed the judgment of spam. In order to reducing the damages because of mistaking e-mail, we provide the improved methods of using the risk minimization Bayesian decision and selfimprovement of categorization system. The paper finally has described a spam filtering model and process by double defending based on rule and content.

作者肖旻刘晓璐屠立忠

机构地区东南大学计算机科学与工程系南京工程学院计算机工程系

出处《南京师范大学学报（工程技术版）》 CAS 2006年第2期86-89,共4页 Journal of Nanjing Normal University(Engineering and Technology Edition)

基金南京工程学院科研基金项目资助(科研令号04-37)

关键词邮件过滤贝叶斯原理文本分类向量空间模型 spam filter, Bayesian theory, text categorization, vector space model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1[1]YANG Yiming.A example-based mapping method for text categorization and retrieval[J].ACM Transactions on Information Systems,1994,12 (3):252-277. 被引量：1
2[2]CARRERAS X,MARQUE L.Boosting trees for anti-spam email filtering[C]//Proceedings of Euro Confrence Recent Advances in NLP(RANLP-2001).[S.l.]:[s.n.],2001:58-64. 被引量：1
3[3]MEHRAN S,SUSAN D,DAVID H,et al.A bayesian approach to filtering junk E-mail[C]//Proc of AAAI Workshop on Learning for Text Categorization.Madison,Wisconsin,1998:55-62. 被引量：1
4[4]DRUCKER H,VAPNIK V.Support vector machines for spam categorization[J].IEEE Transactions On Neural Networks,1999,20 (5):1048-1054. 被引量：1
5[5]LIN Yaping,CHEN Zhiping,YANG Xiaolin,et al.Mail filtering based on the risk minimization Bayesian algorithm[J].Proceedings Industrial System and Engineering,2002,17 (3):282-285. 被引量：1

同被引文献20

1肖明,殷锋,张楠.垃圾邮件过滤技术及发展[J].西南民族大学学报（自然科学版）,2007,33(1):207-212. 被引量：8
2王从陆,尹长林.基于博弈论的安全决策信息融合[J].中国安全科学学报,2005,15(4):74-76. 被引量：6
3詹川,卢显良,周旭,侯孟书.An Improved Bayesian with Application to Anti-Spam Email[J].Journal of Electronic Science and Technology of China,2005,3(1):30-33. 被引量：2
4王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量：129
5吕新杰,柴乔林,马莉.分布式垃圾邮件检测系统的研究与实现[J].计算机工程,2005,31(18):124-126. 被引量：3
6刘震,周明天.基于有监督Bayesian网络的垃圾邮件过滤[J].计算机应用,2006,26(3):558-561. 被引量：8
7胡永杰,卜红霞.垃圾邮件过滤技术研究[J].河北师范大学学报（自然科学版）,2006,30(2):158-160. 被引量：3
8李晓毅,徐兆棣.增量式贝叶斯分类的原理和算法[J].沈阳工业大学学报,2006,28(4):422-425. 被引量：7
9张羿,周建国,晏蒲柳.垃圾邮件过滤系统的研究与实现[J].计算机工程,2006,32(18):106-108. 被引量：9
10陈东锋,雷英杰,田野.基于直觉模糊等价关系的聚类算法[J].空军工程大学学报（自然科学版）,2007,8(1):63-65. 被引量：12

引证文献6

1刘洋,曹津宁,刘昊,秦玉平.基于贝叶斯方法的垃圾邮件处理模型研究[J].长春工程学院学报（自然科学版）,2007,8(3):75-76.
2黄诠.垃圾邮件过滤技术研究与发展[J].电脑知识与技术,2008,3(6):1218-1220. 被引量：2
3余承依.基于贝叶斯增量分类的邮件过滤研究[J].科学技术与工程,2009,9(9):2356-2361. 被引量：1
4余承依.基于贝叶斯最小风险的垃圾邮件过滤技术[J].计算机时代,2009(5):53-55.
5孙晶涛,张秋余,袁占亭,董建设.博弈论在邮件特征选择中的应用[J].电子科技大学学报,2011,40(1):95-99. 被引量：1
6张展.机器学习在徐工技校招生系统中的应用研究[J].新课程（下）,2011,0(10):139-140.

二级引证文献4

1郭剑平.垃圾邮件的检测分析技术[J].福建电脑,2009,25(12):59-60.
2王丽美,胡竞,彭富强.基于重复-动态博弈模型的可变剪接预测[J].昭通学院学报,2014,36(5):17-22.
3杨婷,滕少华.改进的贝叶斯分类方法在电信客户流失中的研究与应用[J].广东工业大学学报,2015,32(3):67-72. 被引量：6
4景云.垃圾邮件的检测分析技术[J].经营管理者,2010(8X):300-300.

1范洁彦,铁玲.前置式邮件过滤模型[J].通信技术,2003,36(8):91-93. 被引量：1
2吴雪平,贾瑞清.过滤器过滤精度的选择[J].液压与气动,1995,19(4):9-11.
3黄杰,史啸.一种基于人体裸露皮肤形状的不良图像过滤系统[J].东南大学学报（自然科学版）,2014,44(6):1111-1115. 被引量：2
4王涛,裘国永,何聚厚.新的基于最小风险的贝叶斯邮件过滤模型[J].计算机应用研究,2008,25(4):1147-1148. 被引量：6
5李永亮,刘海燕,陈军.基于多个机器学习算法的投票式邮件过滤模型[J].计算机工程,2006,32(19):214-216. 被引量：1
6迟学芝,朱晓丽,赵志刚.基于BP人工神经网络的信息过滤技术研究[J].电脑开发与应用,2007,20(6):58-60. 被引量：1
7张博.基于NSCT变换的车牌定位算法研究[J].微型电脑应用,2015,31(1):32-35. 被引量：1
8别玉玉,刘飞,张书伟,毕方明.贝叶斯垃圾邮件过滤算法的改进与实现[J].微计算机信息,2011,27(3):167-168. 被引量：3
9陈葡,谢晓尧,徐洋.基于词序列核的垃圾邮件过滤[J].武汉大学学报（理学版）,2011,57(5):419-423. 被引量：1
10何静,刘海燕,宫云战.在TIS的WWW代理服务中实现基于网络安全的内容过滤[J].计算机工程与应用,2003,39(20):25-26. 被引量：3

南京师范大学学报（工程技术版）

2006年第2期

浏览历史

内容加载中请稍等...

基于贝叶斯分类的邮件过滤方法及模型研究被引量：6

参考文献5

同被引文献20

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于贝叶斯分类的邮件过滤方法及模型研究 被引量：6

参考文献5

同被引文献20

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于贝叶斯分类的邮件过滤方法及模型研究被引量：6