期刊文献+

网页新闻内容自动采集

Web New Content Auto Extraction
下载PDF
导出
摘要 研究了网站网页新闻内容自动采集的实现方法,给出了编程实现的算法。 The paper studies the methods of auto collecting web New content in websites, giving the programming algo-rithms.
作者 吴文辉
机构地区 国防信息学院
出处 《电脑编程技巧与维护》 2014年第14期82-82,84,共2页 Computer Programming Skills & Maintenance
基金 第52期中国国博士后科学基金面上资助(2012M521838)
关键词 网页 自动采集 Web page auto extract
  • 相关文献

参考文献1

二级参考文献5

  • 1傅骞,温晓辉.开放式Web信息抽取系统研究与实现[J].北京师范大学学报(自然科学版),2005,41(6):594-598. 被引量:3
  • 2Cutler M,Shih Y,Meng W.Using the Structure of HTML Documents to Improve Retreival[C]//Proc.of USENIX Symposium on Internet Technologies and Systems.1997:241-251. 被引量:1
  • 3Brin S,Page L.The Anatomy of a Large Scale Hyper-textual Web Search Engine[J].Computer Networks and ISDN Systems.1998,30(1/7):107-117. 被引量:1
  • 4Davulcu H,Vadrevu S,Nagarajan S.OntoMiner:Bootstrapping and Populating Ontologies from Domain Specific Web Sites[J].Intelligent Systems,2003,18(5):24-33. 被引量:1
  • 5Buttler D,Liu L,Pu C.A Fully Automated Object Extraction System for the World Wide Web[C]//Proceedings of the 2001 International Conference on Distributed Computing Systems.2001:361-370. 被引量:1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部