期刊文献+

基于Web挖掘的信息抽取系统的研究

下载PDF
导出
摘要 文章讨论了Web挖掘的一些基本概念,针对Web数据的特点提出了一个基于Web挖掘的信息抽取系统的结构模型。模型通过对XML文档的解析生成DOM树,在此基础上,通过对样本页的DOM树的先序遍历生成抽取规则,再以此规则对Web页进行数据抽取,所抽取的数据保存在数据库中,以便利用数据库技术进一步利用这些数据。
出处 《铜陵学院学报》 2010年第4期66-68,共3页 Journal of Tongling University
  • 相关文献

参考文献5

  • 1郭璐青,任锦.关联规则挖掘算法的研究[J]科技信息(学术研究),2008(36). 被引量:1
  • 2付国瑜.Web文本分类挖掘[J].科学咨询,2008(5):56-56. 被引量:1
  • 3韩家炜,孟小峰,王静,李盛恩.Web挖掘研究[J].计算机研究与发展,2001,38(4):405-414. 被引量:356
  • 4卢睿..基于XML的Web信息抽取研究[D].大连海事大学,2005:
  • 5XML中国论坛编著..XML实用进阶教程[M].北京:清华大学出版社,2001:386.

二级参考文献6

共引文献355

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部