期刊文献+

基于本体论的Web信息抽取 被引量:34

Ontology-Based Information Extraction from Web Sources
下载PDF
导出
摘要 以本体论为基础 ,以所要提取的信息的层次结构作为信息提取的路径 ,定义了Web页面的信息项本体 ,并自动解析生成Web页面的结构本体 通过对这两个本体进行对比 ,构造了一种归纳学习算法来半自动地生成信息提取规则 。 Based on the ontology, this paper regards the hiberarchy of information to be extracted as the path of information extraction, defines an information item ontology of Web page and automatic creates a construction ontology by parsing the Web page. Using these two ontologies, a novel approach to semi-automatically generate information extraction rules is presented for efficiently collecting information from Web.
出处 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第4期535-541,共7页 Journal of Computer-Aided Design & Computer Graphics
基金 国家自然科学基金 ( 69773 0 19)资助
  • 相关文献

参考文献6

  • 1Hammer J, Garcia-Molina H, Nestorov S, et al. Template-based wrapper in the TSIMMIS system (system demonstration)[A]. In: Proceedings of ACM SIGMOD Conference on Management of Data, Tucson, Arizona, 1997. 532~535 被引量:1
  • 2Hammer J, Garcia-Molina H, Cho J, et al. Extracting semi-structured information from the Web[A]. In: Proceedings of Workshop on Management of Semi-Structured Data, Tucson, Arizona, 1997. 18~25 被引量:1
  • 3李朝光,张铭,邓志鸿,杨冬青,唐世渭.论文元数据信息的自动抽取[J].计算机工程与应用,2002,38(21):189-191. 被引量:38
  • 4Kushmerick N, Weld D, et al. Induction for information extraction[A]. In: Proceedings of the 15th International Joint Conference on Artificial Intelligent, Nagoya, 1997, 2: 729~737 被引量:1
  • 5Ashish N, Knoblock C. Wrapper generation for semi-structured internet sources[A]. In: Proceedings of Workshop on Management of Semi-Structured Data, Tucson, Arizona, 1997. 10~17 被引量:1
  • 6陈羡.[D].杭州: 浙江大学,2001,18~20. 被引量:1

二级参考文献1

共引文献37

同被引文献369

引证文献34

二级引证文献82

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部