1
|
Web页面信息块的自动分割 |
瞿有利
于浩
徐国伟
西野文人
|
《中文信息学报》
CSCD
北大核心
|
2004 |
10
|
|
2
|
基于FFT的网页正文提取算法研究与实现 |
李蕾
王劲林
白鹤
胡晶晶
|
《计算机工程与应用》
CSCD
北大核心
|
2007 |
15
|
|
3
|
一种基于块分析的网页去噪音方法 |
刘晨曦
吴扬扬
|
《广西师范大学学报(自然科学版)》
CAS
北大核心
|
2007 |
8
|
|
4
|
基于文档对象模型与行块分布算法的网页信息抽取 |
高庆宁
吴鹏
张晶晶
|
《情报理论与实践》
CSSCI
北大核心
|
2016 |
9
|
|
5
|
网络舆情中的信息预处理与自动摘要算法 |
廉捷
刘云
|
《北京交通大学学报》
CAS
CSCD
北大核心
|
2010 |
8
|
|
6
|
互联网商品信息抽取技术 |
于鲁波
陈超
|
《计算机工程》
CAS
CSCD
北大核心
|
2008 |
5
|
|
7
|
基于分块的网页主题文本抽取 |
任玉
樊勇
郑家恒
|
《广西师范大学学报(自然科学版)》
CAS
北大核心
|
2009 |
5
|
|
8
|
基于网页结构特征的网页主要文本信息抽取策略 |
火善栋
|
《现代计算机》
|
2008 |
4
|
|
9
|
基于语义的中文网页检索 |
余一骄
刘芹
|
《计算机科学》
CSCD
北大核心
|
2012 |
4
|
|
10
|
Web站点结构及网页特征信息的抽取 |
王二平
|
《吕梁高等专科学校学报》
|
2004 |
0 |
|
11
|
一种基于后缀树的包装器自动生成方法研究 |
李永丽
张玉良
|
《计算机工程与应用》
CSCD
北大核心
|
2007 |
2
|
|
12
|
基于超链接和DOM结构树的网页标题实时抽取方法 |
张兵
汤进
罗斌
|
《计算机与现代化》
|
2015 |
2
|
|
13
|
基于网页分割的Web信息提取算法 |
侯明燕
杨天奇
|
《微型机与应用》
|
2011 |
2
|
|
14
|
基于海量冗余网页过滤的Web挖掘技术研究 |
赵玺
|
《科技通报》
北大核心
|
2013 |
2
|
|
15
|
动态网页信息提取技术在求职搜索中的应用 |
方宏
吕太之
|
《计算机工程》
CAS
CSCD
北大核心
|
2009 |
2
|
|
16
|
基于模式匹配的网页净化方法 |
曾蒸
马燕
|
《重庆师范大学学报(自然科学版)》
CAS
CSCD
北大核心
|
2015 |
0 |
|
17
|
基于SRI的动态网页信息抽取方法 |
朱跃林
戴昌林
高志强
|
《重庆工学院学报(自然科学版)》
|
2009 |
1
|
|
18
|
基于新型主题信息量化方法的Web主题信息提取研究 |
吕聚旺
都云程
王弘蔚
施水才
|
《现代图书情报技术》
CSSCI
北大核心
|
2008 |
1
|
|
19
|
基于网页规划布局的页面主题内容抽取 |
聂卉
张津华
|
《情报理论与实践》
CSSCI
北大核心
|
2011 |
1
|
|
20
|
基于标签路径聚类的文本信息抽取算法 |
刘云峰
|
《计算机工程》
CAS
CSCD
北大核心
|
2010 |
1
|
|