期刊文献+

基于自然语言处理的多级网页过滤器研究 被引量:2

Natural Language Processing Technologies for Spam WebFilter
下载PDF
导出
摘要 针对现有网页过滤系统的不足和实时网络信息过滤的新挑战,提出新一代多级网页智能过滤解决方案:主要采用Mimefilte r技术,结合多级过滤方法对网页进行过滤。利用分类算法对已知的训练样本进行学习,提取特征向量,构造二值分类器。然后运用此分类器,对新的网页进行过滤,将过滤的结果提交给用户,用户可对过滤结果进行评价反馈,系统再根据反馈对过滤器进行调整。基于上述方法和理论,在Java EE 6+MySQL5.1平台上设计并开发了一个多级网页过滤系统。它能在提高信息安全度和不降低信息共享度之间找到一个平衡点。实验证明了多级过滤相结合的网页过滤器是可行的、高效的。 Aiming at the new challenge and shortage of web filter,a new multilevel filtering technique is put forward.It adopts Mine filter technology and combines multilevel filtering technique.It can automatically learn by trained samples,extract eigenvector,and construct two-value classifier.Then using the classifier,it filters the new web and return the results to user.User can evaluates and feeds back.The system can be readjusted by the feedback.Finally,a web filter system is put into effect on Java EE 6 + MySQL5.1 based on the above theory and technique.Experiment proves that it considerably enhances the filtering degree of web.
出处 《信息安全与技术》 2011年第10期66-69,共4页
基金 北京市教委科技计划面上项目(KM201210772014) 国家自然基金面上项目(60873013) 北京市高校学术创新团队建设计划项目(PHR201106133)
关键词 网页过滤 Mimefilter技术 黑白/名单 自然语言处理 web filtering mime filter technology black/white list natural language processing
  • 相关文献

参考文献7

二级参考文献41

共引文献104

同被引文献16

引证文献2

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部