期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
支持DOM模板可视化配置的网页抽取方法 被引量:4
1
作者 李健 马延周 《现代计算机》 2018年第7期56-60,共5页
为提高网页采集的效率和精准度,提出一种支持可视化模板配置的抽取方法。此方法通过在目标网页中点选元素的方式,自动生成基于DOM路径的抽取模板。将详细介绍基于DOM路径的抽取原理;研究可视化模板配置的关键技术;并将此方法应用于新闻... 为提高网页采集的效率和精准度,提出一种支持可视化模板配置的抽取方法。此方法通过在目标网页中点选元素的方式,自动生成基于DOM路径的抽取模板。将详细介绍基于DOM路径的抽取原理;研究可视化模板配置的关键技术;并将此方法应用于新闻采集系统,以测试其实用效果。 展开更多
关键词 网络爬虫 网页抽取 dom模板 可视化配置
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部