期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于数据垂直划分的分布式密度聚类算法 被引量:8
1
作者 倪巍伟 陈耿 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2007年第9期1612-1617,共6页
聚类分析是数据挖掘领域的一项重要研究课题,对大数据集的聚类更以其数据量大、噪声数据多等而成为一个难点.针对数据垂直划分的情况,提出连通点集及局部噪声点集等概念.在分析局部噪声点集与全局噪声点集以及局部连通点集与全局连通点... 聚类分析是数据挖掘领域的一项重要研究课题,对大数据集的聚类更以其数据量大、噪声数据多等而成为一个难点.针对数据垂直划分的情况,提出连通点集及局部噪声点集等概念.在分析局部噪声点集与全局噪声点集以及局部连通点集与全局连通点集关系的基础上,对全局噪声点进行有效过滤,进一步设计闭三角链表结构存储各个结点的聚类中间结果,提出了基于密度的分布式聚类算法DDB-SCAN.理论分析和实验结果表明,算法可以有效解决垂直划分的大数据集聚类问题,算法是有效可行的. 展开更多
关键词 分布式数据挖掘 数据垂直划分 连通点集 局部噪声点集 三角链表
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部