摘要
从同类企业挖掘有价值的信息是企业信息化的重要任务,目前Web企业信息描述大多数是用HTML表示的,但基于XML描述的企业信息Web页面逐渐增加,Web数据抽取是Web企业信息挖掘的关键,本文提出了一种面向HTML和XML描述的Web页面的Web数据抽取模型并阐述了实现过程。
Worthy information mining from kindred enterprise is important task of enterprise information system, currently Web enterprise information depiction almost uses HTML, but Web page based XML is increasing. Web data extraction is a key procedure of Web enterprise information Mining, This article proposes a Web data described with HTML or XML extraction model and discusses achieving procedure.
出处
《情报科学》
CSSCI
北大核心
2005年第9期1398-1402,共5页
Information Science
基金
国家社会科学基金项目(02BTQ013)