摘要
传统的数据开采算法总是假定数据源为单个数据集,然而,事实上大多数开采任务面对的都是多数据库的集合,该文提出一种检测数据库与开采任务是否关联的方法,并给出了多数据库环境下检测数据库与开采任务相关性的算法DRD。
The conventional data mining algorithms always assumes that a single data set is its' data sources. However,most real world applications have to face the problem of multidatabases.In this paper,we propose a way that identify those databases relevant to a data mining task from a set of related databases,furthermore,. We address the specific algorithm DRD for this problem.
出处
《计算机工程与应用》
CSCD
北大核心
2000年第4期30-31,35,共3页
Computer Engineering and Applications
基金
国防预研基金!(94J3.4.2.J9W05)
关键词
数据开采
数据选择
数据库
相关性
识别
data mining, multidatabase, relevance measure, data selection