-
题名一种基于数据垂直划分的分布式密度聚类算法
被引量:8
- 1
-
-
作者
倪巍伟
陈耿
孙志挥
-
机构
东南大学计算机科学与工程学院
南京审计学院审计信息工程实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第9期1612-1617,共6页
-
基金
江苏省自然科学基金项目(BK2006095)
教育部高等学校博士学科点专项科研基金项目(20040286009)
-
文摘
聚类分析是数据挖掘领域的一项重要研究课题,对大数据集的聚类更以其数据量大、噪声数据多等而成为一个难点.针对数据垂直划分的情况,提出连通点集及局部噪声点集等概念.在分析局部噪声点集与全局噪声点集以及局部连通点集与全局连通点集关系的基础上,对全局噪声点进行有效过滤,进一步设计闭三角链表结构存储各个结点的聚类中间结果,提出了基于密度的分布式聚类算法DDB-SCAN.理论分析和实验结果表明,算法可以有效解决垂直划分的大数据集聚类问题,算法是有效可行的.
-
关键词
分布式数据挖掘
数据垂直划分
连通点集
局部噪声点集
闭三角链表
-
Keywords
distributed data mining
vertically partitioned data
connected set
local noise set
closed triangle list
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于数据垂直划分的高效并行Skyline查询
被引量:1
- 2
-
-
作者
邓瑞鹏
王意洁
李小勇
王媛
-
机构
国防科学技术大学计算机学院并行与分布处理国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
2012年第14期56-58,61,共4页
-
基金
国家"973"计划基金资助项目(2011CB302601)
国家"863"计划基金资助项目(2011AA01A202)
+2 种基金
国家自然科学基金资助项目(60873215)
湖南省自然科学杰出青年基金资助项目(S2010J5050)
高等学校博士学科点专项科研基金资助项目(200899980003)
-
文摘
基于数据垂直划分的分布并行Skyline查询算法大多并行性较低,无法适应海量分布式数据的快速响应要求。为此,在BDS算法的基础上提出一种更高效的分布并行Skyline查询算法PDS-VP。其中,节点被分为协调者与参与者,原本由协调者节点完成的随机访问和本地Skyline计算分发给各参与者节点进行处理,以提高算法的执行效率。实验结果证明,该算法提高了原算法的并行性和运行效率。
-
关键词
SKYLINE查询
分布式环境
并行Skyline
数据垂直划分
多目标优化
数据挖掘
-
Keywords
Skyline query
distributed environment
parallel Skyline
data vertical partition
multi-object optimization
data mining
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-