期刊文献+

基于Web页面结构的网页数据提取技术探究 被引量:1

下载PDF
导出
摘要 随着网络技术的迅速发展,各种各样的数据信息呈现出爆炸性的增长,而网络上的数据主要来自于Web数据。然而受到多种因素的影响,人们往往不能在众多的数据当中提取到需要的或者感兴趣的内容,所以如何在众多的数据当中提取到有用的内容并且存储起来十分的重要。现阶段,对此方面的研究大多是以HTML标签解析为依据基于网页DOM树结构,再利用包装器的设计方式进行相应的提取技术。本文以DOM树结构为基础,主要对Web页面抽取和相关技术进行概述,研究了Web页面数据的区域定位算法,从而进行网页数据记录抽取工作。
作者 郭晓宇 彭浩
出处 《产业与科技论坛》 2020年第18期66-67,共2页 Industrial & Science Tribune
基金 湖南省自然科学基金资助项目(编号:2017JJ2135) 湖南省教育厅科学研究项目(编号:18A481,19C1070)研究成果
  • 相关文献

参考文献4

二级参考文献9

共引文献15

同被引文献7

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部