期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于权重均值的不良网页过滤算法研究
被引量:
3
1
作者
唐坚刚
魏然
《计算机工程与设计》
CSCD
北大核心
2008年第5期1088-1089,1107,共3页
传统的网页权重过滤算法中的权重大都根据词频统计方法来确定,该方法不能很好地表达关键词对主题的表征程度,且易被某些网站利用反关键字过滤策略逃避检测。在传统方法的基础上,设置加权的关键字矩阵词典,从关联规则出发,应用汉语语料...
传统的网页权重过滤算法中的权重大都根据词频统计方法来确定,该方法不能很好地表达关键词对主题的表征程度,且易被某些网站利用反关键字过滤策略逃避检测。在传统方法的基础上,设置加权的关键字矩阵词典,从关联规则出发,应用汉语语料库里的同类词定义,提出基于同类词权重均值的关联过滤算法。试验结果表明,该算法过滤更为高效,并且能够很好地应对色情网站的反关键字过滤策略,尤其在色情与医学网页的分离上有明显的效果。
展开更多
关键词
网页过滤
关键字
矩阵
词典
关联规则
权重均值
下载PDF
职称材料
基于语义的关键词过滤权重算法
被引量:
2
2
作者
唐坚刚
熊国萍
《微计算机信息》
北大核心
2007年第27期261-262,109,共3页
在关键词权重统计算法的基础上,从语义角度出发,通过关键词对主题的表征强度并考虑关键词在文档中的位置等其他因素来计算关键词权重,为此创造性地提出了基于语义的矩阵词典和权重策略,使过滤更高效且权重取值更合理。实验表明,其对不...
在关键词权重统计算法的基础上,从语义角度出发,通过关键词对主题的表征强度并考虑关键词在文档中的位置等其他因素来计算关键词权重,为此创造性地提出了基于语义的矩阵词典和权重策略,使过滤更高效且权重取值更合理。实验表明,其对不良网页的过滤准确率也更高。
展开更多
关键词
向量空间模型
网页过滤
权重策略
矩阵
词典
下载PDF
职称材料
基于网络安全的网页过滤模型及其关键算法
被引量:
1
3
作者
季秀兰
熊拥军
《中南林业科技大学学报》
CAS
CSCD
北大核心
2011年第12期197-201,共5页
识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出...
识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出了基于同类词权重均值的关联过滤算法。最后,从两个角度进行算法评估,该过滤算法更为高效,并且能够很好的应对不良网站的反关键字过滤策略。
展开更多
关键词
网页过滤
矩阵
词典
权重均值
下载PDF
职称材料
题名
基于权重均值的不良网页过滤算法研究
被引量:
3
1
作者
唐坚刚
魏然
机构
上海理工大学计算机工程学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第5期1088-1089,1107,共3页
基金
上海市高等学校青年科学基金项目(03SQ05)
文摘
传统的网页权重过滤算法中的权重大都根据词频统计方法来确定,该方法不能很好地表达关键词对主题的表征程度,且易被某些网站利用反关键字过滤策略逃避检测。在传统方法的基础上,设置加权的关键字矩阵词典,从关联规则出发,应用汉语语料库里的同类词定义,提出基于同类词权重均值的关联过滤算法。试验结果表明,该算法过滤更为高效,并且能够很好地应对色情网站的反关键字过滤策略,尤其在色情与医学网页的分离上有明显的效果。
关键词
网页过滤
关键字
矩阵
词典
关联规则
权重均值
Keywords
webpage filtering
keywords
matrix dictionary
connection rule
weight equal value
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于语义的关键词过滤权重算法
被引量:
2
2
作者
唐坚刚
熊国萍
机构
上海理工大学计算机工程学院
出处
《微计算机信息》
北大核心
2007年第27期261-262,109,共3页
基金
上海市高等学校青年科学基金项目基于数据挖掘的网络安全管理技术研究(03SQ05)
文摘
在关键词权重统计算法的基础上,从语义角度出发,通过关键词对主题的表征强度并考虑关键词在文档中的位置等其他因素来计算关键词权重,为此创造性地提出了基于语义的矩阵词典和权重策略,使过滤更高效且权重取值更合理。实验表明,其对不良网页的过滤准确率也更高。
关键词
向量空间模型
网页过滤
权重策略
矩阵
词典
Keywords
Vector space model, Webpage filtering, Weight Algorithm, Matrix dictionary
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于网络安全的网页过滤模型及其关键算法
被引量:
1
3
作者
季秀兰
熊拥军
机构
江苏食品职业技术学院计算机应用技术系
中南大学信息科学与工程学院
出处
《中南林业科技大学学报》
CAS
CSCD
北大核心
2011年第12期197-201,共5页
文摘
识别存在于大量的WEB网页中的不良信息的非法文本,并将其有效屏蔽,是未来信息过滤研究的新领域。在传统方法的基础上,在对抓取到的网页进行预处理后,设置加权的关键字词典;应用汉语语料库里同类词的概念,从词汇关联的角度出发,最终提出了基于同类词权重均值的关联过滤算法。最后,从两个角度进行算法评估,该过滤算法更为高效,并且能够很好的应对不良网站的反关键字过滤策略。
关键词
网页过滤
矩阵
词典
权重均值
Keywords
webpage filtering
matrix dictionary
weight equal value
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于权重均值的不良网页过滤算法研究
唐坚刚
魏然
《计算机工程与设计》
CSCD
北大核心
2008
3
下载PDF
职称材料
2
基于语义的关键词过滤权重算法
唐坚刚
熊国萍
《微计算机信息》
北大核心
2007
2
下载PDF
职称材料
3
基于网络安全的网页过滤模型及其关键算法
季秀兰
熊拥军
《中南林业科技大学学报》
CAS
CSCD
北大核心
2011
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部