期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于权重均值的不良网页过滤算法研究 被引量:3
1
作者 唐坚刚 魏然 《计算机工程与设计》 CSCD 北大核心 2008年第5期1088-1089,1107,共3页
传统的网页权重过滤算法中的权重大都根据词频统计方法来确定,该方法不能很好地表达关键词对主题的表征程度,且易被某些网站利用反关键字过滤策略逃避检测。在传统方法的基础上,设置加权的关键字矩阵词典,从关联规则出发,应用汉语语料... 传统的网页权重过滤算法中的权重大都根据词频统计方法来确定,该方法不能很好地表达关键词对主题的表征程度,且易被某些网站利用反关键字过滤策略逃避检测。在传统方法的基础上,设置加权的关键字矩阵词典,从关联规则出发,应用汉语语料库里的同类词定义,提出基于同类词权重均值的关联过滤算法。试验结果表明,该算法过滤更为高效,并且能够很好地应对色情网站的反关键字过滤策略,尤其在色情与医学网页的分离上有明显的效果。 展开更多
关键词 网页过滤 关键字 矩阵词典 关联规则 权重均值
下载PDF
基于语义的关键词过滤权重算法 被引量:2
2
作者 唐坚刚 熊国萍 《微计算机信息》 北大核心 2007年第27期261-262,109,共3页
在关键词权重统计算法的基础上,从语义角度出发,通过关键词对主题的表征强度并考虑关键词在文档中的位置等其他因素来计算关键词权重,为此创造性地提出了基于语义的矩阵词典和权重策略,使过滤更高效且权重取值更合理。实验表明,其对不... 在关键词权重统计算法的基础上,从语义角度出发,通过关键词对主题的表征强度并考虑关键词在文档中的位置等其他因素来计算关键词权重,为此创造性地提出了基于语义的矩阵词典和权重策略,使过滤更高效且权重取值更合理。实验表明,其对不良网页的过滤准确率也更高。 展开更多
关键词 向量空间模型 网页过滤 权重策略 矩阵词典
下载PDF
基于网络安全的网页过滤模型及其关键算法 被引量:1
3
作者 季秀兰 熊拥军 《中南林业科技大学学报》 CAS CSCD 北大核心 2011年第12期197-201,共5页
识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出... 识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出了基于同类词权重均值的关联过滤算法。最后,从两个角度进行算法评估,该过滤算法更为高效,并且能够很好的应对不良网站的反关键字过滤策略。 展开更多
关键词 网页过滤 矩阵词典 权重均值
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部