期刊文献+

一种基于XML的Web信息抽取方法 被引量:7

Study of Semi-Structured Information Extraction Process Based-on XML
下载PDF
导出
摘要 目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。
出处 《情报杂志》 CSSCI 北大核心 2006年第8期49-51,共3页 Journal of Intelligence
基金 湖南省教育厅重点项目(编号:04A037) 2006年湖南省教育厅资助科研项目。
  • 相关文献

参考文献7

二级参考文献20

  • 1杨文柱 徐林昊 郝亚南.个性化的Web查询助手的设计与实现[Z]..19届全国数据库会议[C].郑州,2002.. 被引量:1
  • 2徐林吴 杨文柱 陈少飞.基于XPath的Web信息抽取[Z]..19届全国数据库会议[C].郑州,2002.. 被引量:1
  • 3[2]Sahuguet A,Azavant F. Building intelligent web applications using lightweight wrappers. Data and Knowledge Engineering, 2001,36(3):283~316. 被引量:1
  • 4[3]Muslea I, Minton S, Knoblock C. A hierarchical approach to wrapper induction . Proceedings of the Third International Conference on Autonomous Agents,1999,22 1~227. 被引量:1
  • 5Grishman R, Sundheim B. Message Understanding Conference - 6: A Brief History. In:Proceedings of the 16h International Conference on Computational Linguistics COLIN - 96,1996. 被引量:1
  • 6Chinchor N. Overview of MUC - 7/MET - 2. In: Proceedings of the Seventh Message Understanding Conference, 1998. 被引量:1
  • 7Chinchor N. Marsh E. MUC- 7 Information Extraction Task Definition(version 5.1). In:Proceedings of the Seventh Message Understanding Conference, 1998. 被引量:1
  • 8Yu S H, Bai S H, Wu P. Description of the Kent Ridge Digital Labs System Used for MUC- 7. In: Proceedings of the Seventh Message Understanding Conference, 1998. 被引量:1
  • 9NLP group of University of Sheffield, In fo mation Extraction. http://nip. shef ac uk/research/ie hrml(Accessed Feb. 8,2004). 被引量:1
  • 10Douglas E Appelt and Davie J. Israel, Introduction to information Extraction Technology, http://www. ai sri com/appelt/ie - tutoriak/(Accessed Feb. 8,2004). 被引量:1

共引文献34

同被引文献34

引证文献7

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部