-
题名基于特征倾向性的网页特征提取方法研究
被引量:3
- 1
-
-
作者
沈凤仙
朱巧明
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第16期3894-3896,共3页
-
基金
国家自然科学基金项目(60673041)
国家863高技术研究发展计划基金项目(2006AA01Z147)
-
文摘
网页包含的信息很丰富,传统的TFIDF公式很难满足内容过滤系统的要求。针对网页过滤技术中的特征选择方法存在的问题,加入语义信息,改进TFIDF公式,提出了一种比较适合网页过滤的特征选择方法。该方法综合考虑特征的长度、在网页中的位置信息,并且将情感色彩这种语义信息附加到特征上。实验结果表明,该方法在网页过滤系统中取得了较好的效果,尤其是实时内容过滤系统中,具有一定的实用价值。
-
关键词
网页过滤
特征提取
语义倾向
情感分析
中文信息处理
-
Keywords
web page filtering
feature extraction
semantic orientation
emotional analysis
Chinese information processing
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的Web文本自适应过滤策略
被引量:1
- 2
-
-
作者
沈凤仙
朱巧明
刘粉香
-
机构
三江学院计算机基础教学部
江苏省计算机信息处理技术重点实验室
-
出处
《计算机与现代化》
2010年第9期48-52,共5页
-
文摘
面对实时网络信息过滤的新挑战,自适应信息过滤基本上能够解决问题。针对现有自适应系统的不足,本文提出提高模板准确性的学习和过滤阈值优化的新方法。改进的过滤策略过滤初期采用SVM算法,中后期采用改进的自适应模板过滤法。模板的更新采用改进的模板系数调整策略,并引入特征衰减因子来提高过滤的准确率。该系统运行于一个校园网关上,取得了较好的结果。
-
关键词
网页过滤
自适应信息过滤
语义倾向
-
Keywords
web page filtering
adaptive information filtering
semantic orientation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名非法网页过滤的研究与实现
被引量:8
- 3
-
-
作者
周威成
马素霞
-
机构
华北电力大学计算机科学与技术系
-
出处
《计算机应用》
CSCD
北大核心
2003年第10期108-110,共3页
-
文摘
文中介绍了文本分类中常用的KNN(KNearestNeighbor)算法,将KNN算法应用到了非法网页过滤中,提出了一种非法网页过滤解决方案。基于Linux操作系统实现了此方案,并采用国际通用的相关评估方法对本方案的应用进行了测定和评估。评估结果显示,文中提出的方案在非法网页过滤中可以取得很好的过滤效果。
-
关键词
KNN算法
信息过滤
非法网页过滤
-
Keywords
KNN algorithm
information filtering
illegal web page filtering
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-