摘要
探讨围绕知识发现领域中较为宏观、较为重大的问题。首先 ,根据复杂类型数据 (包括Web数据、多媒体数据、空间数据、时间序列数据等 )所具有的非线性动力学性质和特征 ,采用模式 (定义为Hilbert空间中的矢量 )来定量地表征复杂类型数据的多变性及具有的不确定状态和行为 ,并用模式的变化来刻画其整体知识发现过程的发展和演变规律 ;其次 ,以知识发现系统内在机理的研究为基础 ,构造了复杂类型数据知识发现系统的总体结构模型———发现特征子空间模型DFSSM ;最后 ,用基于Web的文本挖掘系统和基于图像信息 (气象云图 )的知识发现系统作为实例进行了验证 ,结果表明DFSSM方法对于非结构化的文本数据及图像数据类型的知识发现过程具有指导性作用。因此 ,该结构模型具有较好的实用性与普适性 。
This paper discusses the macroscopic and important problem in the field of KDD. First, it is very difficult to describe the complex type data by general knowledge representation method. So the authors use pattern, which is defined as the vector in Hilbert Space, to represent the characteristic of complex type data. It also can be used to describe the rule of knowledge discovery. Second, the general structure model is constructed based on complex type data—DFSSM (discovery feature sub space model ) following by the research on inner mechanism of knowledge discovery system. At last, the authors prove the practicability and validity of this general structure model i.e. DFSSM which can guide the knowledge discovery of textual data and image data (meteorological echogram data). It will beapplied in other complex type data in future. [
出处
《中国工程科学》
2003年第1期56-61,68,共7页
Strategic Study of CAE
基金
国家自然科学基金重点资助项目 (6983 5 0 0 1)
国家教育部科技重点资助项目 (教技司 [2 0 0 0 ] 175 )