-
题名数据簸箕
- 1
-
-
作者
钱宇华
成红红
张晓琴
梁吉业
-
机构
山西大学计算机与信息技术学院
山西大学数学科学学院
-
出处
《计算机科学与探索》
CSCD
2013年第11期1009-1017,共9页
-
基金
国家自然科学基金
国家重点基础研究发展计划(973计划)
山西省自然科学基金~~
-
文摘
大数据时代的到来给数据挖掘和知识发现带来了很大的挑战。簸箕是一种大家熟知的农用工具,能快速将不同的物体分开。基于簸箕的工作机制,提出了一个新颖的学习原理:随机并行序化原理(random parallel ranking principle,RPRP),称为数据簸箕,可高效地对数据进行排序和分类。为了验证这种学习原理的有效性与高效性,设计了一种新的聚类方法,即聚类簸箕。实验结果表明,聚类簸箕能够快速且有效地对数据进行聚类。此外,该学习原理也能够用于设计高效的分类器。该数据簸箕有望推动大数据背景下机器学习与知识发现理论与方法的发展。
-
关键词
大数据集
数据簸箕
随机并行序化原理(RPRP)
聚类簸箕
-
Keywords
very-large-scale data set
data dustpan
random parallel ranking principle (RPRP)
clustering dustpan
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-