期刊文献+

正则表达式在油价事件网页提取中的应用 被引量:1

The Application of Regular Expressions in Online Oil Price Event Extraction
下载PDF
导出
摘要 利用正则表达式在字符串操作上的优势,实现从不规则含噪页面中对油价事件信息的抓取,指出实现中的难点要点,并验证正则表达式在字符串处理中强大的结构描述能力。 With the advantages of regular expression in string manipulation, this paper realizes extraction of oil price information from noisy and irregular Webpages. Points of importance and difficulty in realization are pointed out, and the structural description ability of regular expression in string manipulation is testified.
出处 《现代图书情报技术》 CSSCI 北大核心 2009年第2期83-88,共6页 New Technology of Library and Information Service
基金 "十一五"国家科技支撑计划项目"国外矿产资源开发利用风险评价技术研究"(项目编号:2006BAB08B01)的研究成果之一
关键词 正则表达式 网页数据抓取 数据清洗 字符串处理 Regular Expression Webpage Data Extraction Data Cleaning String Processiong
  • 相关文献

参考文献11

二级参考文献33

共引文献29

同被引文献2

  • 1叶勇勤.基于URL规则的聚焦爬虫及其应用[D].杭州:浙江大学,2007. 被引量:4
  • 2Jan Goyvaerts.正则表达式经典实例[M].北京:人民邮电出版社,2010. 被引量:3

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部