期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
支持DOM模板可视化配置的网页抽取方法
被引量:
4
1
作者
李健
马延周
《现代计算机》
2018年第7期56-60,共5页
为提高网页采集的效率和精准度,提出一种支持可视化模板配置的抽取方法。此方法通过在目标网页中点选元素的方式,自动生成基于DOM路径的抽取模板。将详细介绍基于DOM路径的抽取原理;研究可视化模板配置的关键技术;并将此方法应用于新闻...
为提高网页采集的效率和精准度,提出一种支持可视化模板配置的抽取方法。此方法通过在目标网页中点选元素的方式,自动生成基于DOM路径的抽取模板。将详细介绍基于DOM路径的抽取原理;研究可视化模板配置的关键技术;并将此方法应用于新闻采集系统,以测试其实用效果。
展开更多
关键词
网络爬虫
网页抽取
dom
模板
可视化配置
下载PDF
职称材料
题名
支持DOM模板可视化配置的网页抽取方法
被引量:
4
1
作者
李健
马延周
机构
解放军信息工程大学洛阳校区基础部
出处
《现代计算机》
2018年第7期56-60,共5页
基金
国家自然科学基金重大项目(No.11590771)
文摘
为提高网页采集的效率和精准度,提出一种支持可视化模板配置的抽取方法。此方法通过在目标网页中点选元素的方式,自动生成基于DOM路径的抽取模板。将详细介绍基于DOM路径的抽取原理;研究可视化模板配置的关键技术;并将此方法应用于新闻采集系统,以测试其实用效果。
关键词
网络爬虫
网页抽取
dom
模板
可视化配置
Keywords
Web Crawler
Webpage Extraction
dom
Template
Visual Configuration
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
TP393.092 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
支持DOM模板可视化配置的网页抽取方法
李健
马延周
《现代计算机》
2018
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部