期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于Web页面结构的网页数据提取技术探究被引量：1

下载PDF

导出

摘要随着网络技术的迅速发展,各种各样的数据信息呈现出爆炸性的增长,而网络上的数据主要来自于Web数据。然而受到多种因素的影响,人们往往不能在众多的数据当中提取到需要的或者感兴趣的内容,所以如何在众多的数据当中提取到有用的内容并且存储起来十分的重要。现阶段,对此方面的研究大多是以HTML标签解析为依据基于网页DOM树结构,再利用包装器的设计方式进行相应的提取技术。本文以DOM树结构为基础,主要对Web页面抽取和相关技术进行概述,研究了Web页面数据的区域定位算法,从而进行网页数据记录抽取工作。

作者郭晓宇彭浩

机构地区湖南涉外经济学院

出处《产业与科技论坛》 2020年第18期66-67,共2页 Industrial & Science Tribune

基金湖南省自然科学基金资助项目(编号:2017JJ2135) 湖南省教育厅科学研究项目(编号:18A481,19C1070)研究成果

关键词 Web页面结构网页数据提取技术

分类号 TP393.092 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1胡瑞..基于Web页面结构的网页数据提取研究[D].安徽大学,2016:
2朱锦洪,彭书广,徐艺琛,高晓峰.弧焊逆变电源的网络化CAD系统[J].焊接学报,2019,40(4):36-40. 被引量：1
3王卫红,梁朝凯,闵勇.基于可视块的多记录型复杂网页信息提取算法[J].计算机科学,2019,46(10):63-70. 被引量：13
4赵建视,梁俊卿,吕笑琳,黄学波,冷悦,张在军.基于DOM树统计关键词路径的WEB信息提取研究[J].计算机科学与应用,2019,9(2):181-187. 被引量：4

二级参考文献9

1张立斌,姚玉环.弧焊变压器CAD系统研究[J].电焊机,1994,24(4):18-21. 被引量：5
2石红信,朱锦洪,于华,路凯通.逆变弧焊电源高频变压器的设计[J].热加工工艺,2006,35(23):76-77. 被引量：3
3刘萍,杨宏,赵春蕾.基于网络环境的CAD系统的设计与实现[J].天津理工大学学报,2008,24(2):80-82. 被引量：5
4张立斌,姚玉环,高晶.SCR式弧焊整流电源CAD系统研究[J].电焊机,1998,28(2):15-17. 被引量：1
5陈玉喜,朱锦洪,石红信,丁高剑.弧焊逆变器设计中的性能指标及主要参数[J].焊接技术,2010,39(2):35-39. 被引量：2
6刘艳霞,郑羽.利用ActiveX DLL技术实现ASP源代码的保护[J].计算机时代,2010(12):7-8. 被引量：2
7代乐宜,朱锦洪,石红信,王义乐.计算机和网络技术在焊接电源设计中的应用[J].电焊机,2011,41(6):78-82. 被引量：3
8张立斌,姚玉环,廖平.弧焊电源CAD系统[J].焊接学报,2001,22(2):83-84. 被引量：4
9李建洋,任芳,杨兆建,任雄.基于Web的矿井提升机CAD/CAE集成系统设计与研究[J].煤炭技术,2015,34(8):210-213. 被引量：7

共引文献15

1郭亚东.动态网页前端开发技术及优化[J].产业与科技论坛,2020,19(22):49-50. 被引量：2
2李健.基于Gecko浏览器内核的谷歌翻译爬虫[J].现代计算机,2021,27(18):32-37.
3郭炜杰,包晓安.知识数据库中非结构化文本关键信息抽取模型[J].计算机仿真,2021,38(9):357-360. 被引量：3
4邓子云.一种通过筛选和位置感知精准提取资讯类网页标题的方法[J].信息化研究,2021,47(4):8-15.
5伍尚君.基于H5网页前端开发的项目启发式教学探究[J].科技视界,2021(33):124-125.
6陈壮,葛斌.一种改进混合文本密度的网页信息提取方法[J].佳木斯大学学报（自然科学版）,2022,40(1):41-44. 被引量：1
7陈壮,葛斌.基于视觉特征去噪和DOM树的网页信息提取方法[J].山西师范大学学报（自然科学版）,2021,35(4):116-121.
8王群,张江波.基于OPM3模型的智慧医院建设全过程工程咨询模式研究[J].粉煤灰综合利用,2022,36(1):133-139. 被引量：3
9王立志.网页信息抽取方法综述[J].网络安全技术与应用,2022(3):12-13. 被引量：2
10翁彬月,秦永彬,黄瑞章,任丽娜,田悦霖.NEMTF:基于多维度文本特征的新闻网页信息提取方法[J].计算机应用研究,2022,39(4):1043-1048.

同被引文献7

1李昊林.计算机网络安全的主要隐患及管理措施分析[J].计算机产品与流通,2020,0(3):38-38. 被引量：7
2周艳平,李金鹏,宋群豹.一种基于SVM及文本密度特征的网页信息提取方法[J].计算机应用与软件,2019,36(10):251-255. 被引量：13
3李小孟.基于Docker容器技术的云实训平台建设[J].电脑编程技巧与维护,2020(7):105-106. 被引量：7
4王成满.集成网络异构模态数据特征提取数学建模仿真[J].计算机仿真,2020,37(9):424-427. 被引量：1
5张学青.计算机网络漏洞扫描技术的应用分析[J].中小企业管理与科技,2020(31):160-161. 被引量：1
6王伟忠,张欣,王大江,陈珂.大数据和云计算环境下网络安全分析与解决方案研究[J].信息安全与通信保密,2020(11):102-110. 被引量：24
7郑辉,孙轲.大规模分段攻击下网络安全态势预测方法研究[J].太原学院学报（自然科学版）,2020,38(4):64-68. 被引量：2

引证文献1

1韩霄.网络安全大数据下的靶标系统的构建[J].微型电脑应用,2023,39(3):153-155. 被引量：1

二级引证文献1

1甘子昊.网络安全大数据背景下靶标系统的研究与构建[J].现代工业经济和信息化,2024,14(3):74-76.

1王卫红,梁朝凯,闵勇.基于可视块的多记录型复杂网页信息提取算法[J].计算机科学,2019,46(10):63-70. 被引量：13
2郝佳音,陈槾露,何润泉.基于专家库技术的远动数据治理工具设计与应用[J].机电信息,2020(36):36-37.
3李文德.大数据时代企业管理面临的挑战与解决对策[J].商业2.0（经济管理）,2020(8):0130-0131.
4李宗剑.OBE理念下的Web前端设计课程教学改革[J].电子世界,2020(19):16-17. 被引量：2
5王为.浅析会计信息化对会计实务工作的影响[J].知识经济,2020(24):61-62.
6杨荣荣.计算机软件数据整合虚拟数据库体系研究分析[J].电子测试,2020,31(22):76-77. 被引量：2
7盛琦鑫.基于WebSocket和MSE的视频监控Web页播放的实现方法[J].广播电视网络,2020,27(12):62-66. 被引量：1

产业与科技论坛

2020年第18期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部