期刊文献+

基于HTML或MXL描述的Web页信息抽取技术研究 被引量:2

Study on Information Extraction Technology Based on Web Pages Descrbed with HTML or XML
下载PDF
导出
摘要 从同类企业挖掘有价值的信息是企业信息化的重要任务,目前Web企业信息描述大多数是用HTML表示的,但基于XML描述的企业信息Web页面逐渐增加,Web数据抽取是Web企业信息挖掘的关键,本文提出了一种面向HTML和XML描述的Web页面的Web数据抽取模型并阐述了实现过程。 Worthy information mining from kindred enterprise is important task of enterprise information system, currently Web enterprise information depiction almost uses HTML, but Web page based XML is increasing. Web data extraction is a key procedure of Web enterprise information Mining, This article proposes a Web data described with HTML or XML extraction model and discusses achieving procedure.
出处 《情报科学》 CSSCI 北大核心 2005年第9期1398-1402,共5页 Information Science
基金 国家社会科学基金项目(02BTQ013)
关键词 WEB 企业信息挖掘 HTML XML 数据抽取 web enterprise information Mining HTML XML data extraction
  • 相关文献

参考文献5

二级参考文献11

  • 1[1]Fayyad U, Piateskey Shapiro G, Smyth P. The KDD Process for Extracting Useful Knowledge form Volumes of Data[J]. Comm- unications of the ACM,2000,39(11) 被引量:1
  • 2[2]Zaiane O R. Resource and Knowledge Discovery from the Internet and Multimedia Repositories[D]. Vancouver: Simon Fraser University, 2000 被引量:1
  • 3[3]Dunja M. Text Learning and Intelligence Agents[R]. Slovenia Jozef: Stefan Institue, 2001 被引量:1
  • 4[4]Balabanovic M, Fab S Y. Content-based, Collaborative Recommen- dation[J]. Communication of the ACM, 2000, 40(3) 被引量:1
  • 5[5]Park J, Chen M,Yu P. An Effective Hash-based Algorithm for Mining Association Rules[J]. IEEE Trans. on Knowledge and Data Engineer- ing, 2001,9(5):813-825 被引量:1
  • 6许龄艺 徐小丽.南京市制造业企业信息化调查报告[R].南京:南京大学国家信息资源管理南京研究基地,2003.. 被引量:2
  • 7.[EB/OL].http://www.amteam.org.,. 被引量:1
  • 8.[EB/OL].http://www.erper.com.,. 被引量:1
  • 9.[EB/OL].http://lwww.sunlike.corn.,. 被引量:1
  • 10.[EB/OL].http://www.netup.tom.cn.,. 被引量:1

共引文献52

同被引文献27

引证文献2

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部