网页新闻内容自动采集

Web New Content Auto Extraction

下载PDF

导出

摘要研究了网站网页新闻内容自动采集的实现方法,给出了编程实现的算法。 The paper studies the methods of auto collecting web New content in websites, giving the programming algo-rithms.

作者吴文辉

机构地区国防信息学院

出处《电脑编程技巧与维护》 2014年第14期82-82,84,共2页 Computer Programming Skills & Maintenance

基金第52期中国国博士后科学基金面上资助(2012M521838)

关键词网页自动采集 Web page auto extract

分类号 TP393.092 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1李锋.基于网站拓扑的网页内容精化算法[J].计算机工程,2007,33(21):50-51. 被引量：1

二级参考文献5

1傅骞,温晓辉.开放式Web信息抽取系统研究与实现[J].北京师范大学学报（自然科学版）,2005,41(6):594-598. 被引量：3
2Cutler M,Shih Y,Meng W.Using the Structure of HTML Documents to Improve Retreival[C]//Proc.of USENIX Symposium on Internet Technologies and Systems.1997:241-251. 被引量：1
3Brin S,Page L.The Anatomy of a Large Scale Hyper-textual Web Search Engine[J].Computer Networks and ISDN Systems.1998,30(1/7):107-117. 被引量：1
4Davulcu H,Vadrevu S,Nagarajan S.OntoMiner:Bootstrapping and Populating Ontologies from Domain Specific Web Sites[J].Intelligent Systems,2003,18(5):24-33. 被引量：1
5Buttler D,Liu L,Pu C.A Fully Automated Object Extraction System for the World Wide Web[C]//Proceedings of the 2001 International Conference on Distributed Computing Systems.2001:361-370. 被引量：1

1袁野.浅析超级链接在网页制作中的应用——以Dreamweaver CS6为例[J].电脑与电信,2016(4):97-99.
2痛并快乐着.神奇的代码[J].计算机应用文摘,2009(10):46-46.
3贾倩,毕经元,王立伟,杨玉,褚厚斌.面向大型科研机构的知识管理系统设计[J].现代情报,2012,32(12):143-148. 被引量：4
4钟浩铭.基于虚拟仪器技术的传感器自动检测系统[J].电子制作,2013,21(5X):60-60. 被引量：1
5马众,周丽萍,崔华扬,严冰.基于RFID和GPRS的远程物流数据自动采集及实时监控系统[J].科技视界,2012(29):99-99. 被引量：2
6寒飞飞.让QQ迷你首页不再显示[J].电脑爱好者（普及版）,2008,0(5):68-68.
7王亚辉.Web标准的电子商务网站网页设计研究[J].电子商务,2015,16(5):49-49. 被引量：1
8Stone.会认还要会听，听“新闻”练英语[J].电脑乐园,2010,2(9):23-23.
9钟时俊,陈明能,余丽波,周小燕.多象限光电探测器测试系统信息化集成的设计与实现[J].西南民族大学学报（自然科学版）,2005,31(1):64-68.
10丁永贤.浅析计算机Web网站信息采集的设计及实现[J].计算机光盘软件与应用,2014,17(22):127-127.

电脑编程技巧与维护

2014年第14期

浏览历史

内容加载中请稍等...

网页新闻内容自动采集

参考文献1

二级参考文献5

相关作者

相关机构

相关主题

浏览历史