期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
融合密度峰值和空间邻域信息的FCM聚类算法 被引量:11
1
作者 周世波 徐维祥 徐良坤 《仪器仪表学报》 EI CAS CSCD 北大核心 2019年第4期137-144,共8页
针对模糊C均值(FCM)算法聚类结果对初始中心点敏感以及聚类过程中没有考虑到不同密度样本点在聚类过程中影响力不同的缺陷,提出了一种密度峰值和样本点空间邻域信息优化的FCM算法。改进后的算法选择数据集中具有局部密度峰值的样本点或... 针对模糊C均值(FCM)算法聚类结果对初始中心点敏感以及聚类过程中没有考虑到不同密度样本点在聚类过程中影响力不同的缺陷,提出了一种密度峰值和样本点空间邻域信息优化的FCM算法。改进后的算法选择数据集中具有局部密度峰值的样本点或者局部密度较大的样本点作为初始聚类中心,充分考虑样本点邻域之间的关系,增加局部密度值大的样本点在聚类中心迭代计算过程中的影响力,从而达到优化FCM算法聚类效果的目的。理论分析和在人造数据集、加州大学欧文分校(UCI)机器学习数据库中真实数据上的实验结果表明,改进后算法的抗噪性、聚类效果和全局收敛能力均优于传统FCM算法。 展开更多
关键词 密度峰值 模糊C均值 局部密度 聚类
下载PDF
自然反向最近邻优化的密度峰值聚类算法 被引量:11
2
作者 刘娟 万静 《计算机科学与探索》 CSCD 北大核心 2021年第10期1888-1899,共12页
密度峰值聚类算法是一种基于密度的聚类算法。针对密度峰值聚类算法存在的参数敏感和对复杂流形数据得到的聚类结果较差的缺陷,提出一种新的密度峰值聚类算法,该算法基于自然反向最近邻结构。首先,该算法引入反向最近邻计算数据对象的... 密度峰值聚类算法是一种基于密度的聚类算法。针对密度峰值聚类算法存在的参数敏感和对复杂流形数据得到的聚类结果较差的缺陷,提出一种新的密度峰值聚类算法,该算法基于自然反向最近邻结构。首先,该算法引入反向最近邻计算数据对象的局部密度;其次,通过代表点和密度相结合的方式选取初始聚类中心;然后,应用密度自适应距离计算初始聚类中心之间的距离,利用基于反向最近邻计算出的局部密度和密度自适应距离在初始聚类中心上构建决策图,并通过决策图选择最终的聚类中心;最后,将剩余的数据对象分配到距离其最近的初始聚类中心所在的簇中。实验结果表明,该算法在合成数据集和UCI真实数据集上与实验对比算法相比较,具有较好的聚类效果和准确性,并且在处理复杂流形数据上的优越性较强。 展开更多
关键词 自然邻居 反向最近邻 代表点 局部密度 聚类
下载PDF
自适应聚合策略优化的密度峰值聚类算法 被引量:10
3
作者 钱雪忠 金辉 《计算机科学与探索》 CSCD 北大核心 2020年第4期712-720,共9页
针对密度峰值聚类算法受人为干预影响较大和参数敏感的问题,即不正确的截断距离dc会导致错误的初始聚类中心,而且在某些情况下,即使设置了适当的dc值,仍然难以从决策图中人为选择初始聚类中心。为克服这些缺陷,提出一种新的基于密度峰... 针对密度峰值聚类算法受人为干预影响较大和参数敏感的问题,即不正确的截断距离dc会导致错误的初始聚类中心,而且在某些情况下,即使设置了适当的dc值,仍然难以从决策图中人为选择初始聚类中心。为克服这些缺陷,提出一种新的基于密度峰值的聚类算法。该算法首先根据K近邻的思想来确定数据点的局部密度,然后提出一种新的自适应聚合策略,即首先通过算法给出阈值判断初始类簇中心,然后依据离初始类簇中心最近分配剩余点,最后通过类簇间密度可达来合并相似类簇。在实验中,该算法在合成和实际数据集中的表现比DPC、DBSCAN、KNNDPC和K-means算法要好,能有效提高聚类准确率和质量。 展开更多
关键词 密度峰 K近邻(KNN) 局部密度 合并策略 类簇间密度可达
下载PDF
局部标准差优化的密度峰值聚类算法
4
作者 谢娟英 张文杰 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期47-62,共16页
密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密... 密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。 展开更多
关键词 密度峰值聚类 标准差 局部密度 分配策略 聚类
下载PDF
基于局部密度聚类的雷达目标散射中心区域分割
5
作者 胡承鑫 曾曙光 +5 位作者 管灵 董纯柱 曾祥云 郑胜 黄瑶 罗骁域 《科学技术与工程》 北大核心 2024年第1期260-266,共7页
散射中心是描述雷达目标高频散射机理的重要特征,准确提取雷达目标散射中心参数对解析雷达目标有着极其重要的研究意义。为了提高散射中心参数计算速度,通常将整幅合成孔径雷达(synthetic aperture radar,SAR)图像分解为多个包含散射中... 散射中心是描述雷达目标高频散射机理的重要特征,准确提取雷达目标散射中心参数对解析雷达目标有着极其重要的研究意义。为了提高散射中心参数计算速度,通常将整幅合成孔径雷达(synthetic aperture radar,SAR)图像分解为多个包含散射中心的小区域,对每个小区域分别进行特征提取和参数计算。根据雷达目标散射中心的特点,提出了一种基于局部密度聚类的雷达目标散射中心区域分割技术。首先,对雷达图像进行Frost滤波、基于水平集方法(level set method,LSM)的图像分割和面积滤波的一系列图像预处理获得目标感兴趣(region of interest,ROI)区域,然后对预处理后的图像利用局部密度聚类算法检测散射中心并进行区域分割。实验中,采用模拟数据和真实数据对所提方法和传统图像分割算法展开数值实验,实验结果验证了所提方法在雷达目标散射中心区域分割的有效性和优越性。 展开更多
关键词 雷达目标 散射中心 局部密度聚类 区域分割
下载PDF
基于局部密度峰和标签传播的最小生成树聚类
6
作者 林钰莹 侯新民 《计算机系统应用》 2024年第8期18-29,共12页
基于最小生成树(minimum spanning tree,MST)的聚类算法能够识别具有任意形状的簇,该算法在如何有效构建最小生成树和识别无效边方面存在不足,而且易受到噪声点影响.本文利用密度峰值聚类算法思想的优点来寻找局部密度峰,局部密度峰在... 基于最小生成树(minimum spanning tree,MST)的聚类算法能够识别具有任意形状的簇,该算法在如何有效构建最小生成树和识别无效边方面存在不足,而且易受到噪声点影响.本文利用密度峰值聚类算法思想的优点来寻找局部密度峰,局部密度峰在保留原始数据集分布结构的同时,排除了噪声点,因此,将局部密度峰与最小生成树聚类算法相结合,采用标签传播,提出了基于局部密度峰和标签传播的最小生成树聚类算法(DPMST).该算法采用了局部密度峰之间基于共享邻的距离,利用局部密度峰之间的邻域信息,有效构造最小生成树和识别无效边,使算法能够发现具有复杂结构的簇.标签传播增强强标签,削弱弱标签,以细化错误的标签,特别是对于边界点以及揭示复杂流形,能够提高聚类结果的质量.人工和真实数据集上的实验结果表明,与经典聚类算法DPC、MST、K-means、DBSCAN、AP、SC和BIRCH比较,DPMST算法表现优异. 展开更多
关键词 局部密度峰 最小生成树 标签传播 聚类
下载PDF
基于局部密度聚类的WSN多Sink节点部署研究
7
作者 李翠然 吕安琪 +1 位作者 谢健骊 孙振刚 《传感技术学报》 CAS CSCD 北大核心 2024年第2期326-331,共6页
针对无线传感器网络中传感器节点能量受限,网络生命周期短的问题,在考虑网络成本的情况下,提出一种基于节点局部密度聚类的多Sink节点优化部署算法。首先,基于多属性因子构建聚类决策函数确定Sink节点部署位置,完成传感器节点聚类;然后... 针对无线传感器网络中传感器节点能量受限,网络生命周期短的问题,在考虑网络成本的情况下,提出一种基于节点局部密度聚类的多Sink节点优化部署算法。首先,基于多属性因子构建聚类决策函数确定Sink节点部署位置,完成传感器节点聚类;然后,根据下一跳节点与Sink节点间距离最短准则搜索并形成数据传输路径;最后,以网络生命周期成本比最大化为依据确定最优的Sink节点数目,实现多Sink节点优化部署。仿真结果表明:与已有算法相比,所提算法能够有效延长网络生命周期,具有较高的网络生命周期能效比。 展开更多
关键词 无线传感器网络 Sink节点部署 局部密度聚类 网络生命周期
下载PDF
基于加权共享近邻与累加序列的密度峰值算法 被引量:3
8
作者 王芙银 张德生 肖燕婷 《计算机工程》 CAS CSCD 北大核心 2022年第4期61-69,共9页
密度峰值聚类(DPC)算法在对密度分布差异较大的数据进行聚类时效果不佳,聚类结果受局部密度及其相对距离影响,且需要手动选取聚类中心,从而降低了算法的准确性与稳定性。为此,提出一种基于加权共享近邻与累加序列的密度峰值算法DPC-WSN... 密度峰值聚类(DPC)算法在对密度分布差异较大的数据进行聚类时效果不佳,聚类结果受局部密度及其相对距离影响,且需要手动选取聚类中心,从而降低了算法的准确性与稳定性。为此,提出一种基于加权共享近邻与累加序列的密度峰值算法DPC-WSNN。基于加权共享近邻重新定义局部密度的计算方式,以避免截断距离选取不当对聚类效果的影响,同时有效处理不同类簇数据集分布不均的问题。在原有DPC算法决策值的基础上,生成一组累加序列,将累加序列的均值作为聚类中心和非聚类中心的临界点从而实现聚类中心的自动选取。利用人工合成数据集与UCI上的真实数据集测试与评估DPC-WSNN算法,并将其与FKNN-DPC、DPC、DBSCAN等算法进行比较,结果表明,DPC-WSNN算法具有更好的聚类表现,聚类准确率较高,鲁棒性较强。 展开更多
关键词 密度峰值聚类算法 局部密度 加权共享近邻 累加序列 聚类中心
下载PDF
面向故障短文本的改进图节点嵌入与聚类方法
9
作者 邱竞雄 孙林夫 韩敏 《计算机集成制造系统》 EI CSCD 北大核心 2023年第12期4256-4266,共11页
为有效挖掘故障短文本中跨文本的词汇间关联,构建故障实体节点的全局特征表示,从而获取故障实体节点聚类标签,提出一种面向故障短文本的改进图节点嵌入与聚类方法。该方法首先在图结构构建过程中创新边权重计算方法,用以区分同一窗口下... 为有效挖掘故障短文本中跨文本的词汇间关联,构建故障实体节点的全局特征表示,从而获取故障实体节点聚类标签,提出一种面向故障短文本的改进图节点嵌入与聚类方法。该方法首先在图结构构建过程中创新边权重计算方法,用以区分同一窗口下不同距离的词汇间关联;其次改进图节点结构特征获取方法,从而体现节点度值差异对嵌入的影响;通过融合节点的结构特征与关系特征,增强具有相似邻居节点的同类节点之间的相似性表现;在聚类阶段设计备选节点数参数以缓解截断距离的敏感性。该方法在公开数据集和真实业务数据上进行了参数分析和性能评估,结果表明该方法可获取精准有效的故障实体节点聚类结果。 展开更多
关键词 故障短文本 图节点嵌入 局部密度 图节点聚类
下载PDF
基于WT和LDC综合算法的电能质量扰动源辨识方法 被引量:2
10
作者 罗伟明 吴杰康 +5 位作者 方梓康 谢明钊 陈盛语 王瑞东 蔡志宏 刘国新 《供用电》 2022年第10期58-65,83,共9页
提出一种基于小波变换(wavelet transform,WT)与局部密度聚类(local density clustering,LDC)算法的电能质量扰动源辨识方法。通过小波变换提取电能质量扰动特征量,采用多级局部密度聚类搭建分类模型进行电能质量扰动源分类辨识。首先... 提出一种基于小波变换(wavelet transform,WT)与局部密度聚类(local density clustering,LDC)算法的电能质量扰动源辨识方法。通过小波变换提取电能质量扰动特征量,采用多级局部密度聚类搭建分类模型进行电能质量扰动源分类辨识。首先对电能质量扰动的时序信号进行小波分解,将其分解为低频与高频信号;接着结合各个信号在小波能量谱上的差异度来提取电能质量扰动特征量;然后将其作为样本进行LDC聚类分析,搭建电能质量扰动分类模型;最后采用搭建的分类模型进行电能质量扰动源分类辨识。在算例实验中,选用8种常见的电能质量扰动以及对应2种复合扰动源进行分类检验,该方法对上述电能质量问题能进行有效分类,且多级LDC具有较低的运算复杂度和较高的辨识度。 展开更多
关键词 小波变换 电能质量特征量 电能质量扰动分类 局部密度聚类 分类模型
下载PDF
局部网格动态聚类算法 被引量:2
11
作者 王玮琪 万仁霞 周方祥 《现代电子技术》 北大核心 2020年第1期102-106,共5页
针对传统网格聚类算法聚类精度较低,处理流数据效率较低等问题进行改进。提出局部网格动态聚类算法,算法引入维度半径概念进行增量动态网格划分,通过采用新的簇边界判定方法对簇边界进行判定,依据稀疏网格与其邻接密集网格的质心距离,... 针对传统网格聚类算法聚类精度较低,处理流数据效率较低等问题进行改进。提出局部网格动态聚类算法,算法引入维度半径概念进行增量动态网格划分,通过采用新的簇边界判定方法对簇边界进行判定,依据稀疏网格与其邻接密集网格的质心距离,将稀疏网格归并到相应网格簇中,对于不能归并的稀疏网格则采用局部网格划分方法对稀疏网格再次进行划分聚类,避免簇边界的误删,在一定程度上提高了聚类精确度。通过对比实验结果表明提出的算法具有更好的聚类时效性和聚类精度。 展开更多
关键词 网格 局部密度 聚类算法 密集网格 稀疏网格 簇边界
下载PDF
一种基于局部密度的网格排序聚类算法 被引量:2
12
作者 刘建军 周廷英 《计算机应用研究》 CSCD 北大核心 2016年第11期3279-3283,3288,共6页
针对复杂及带噪声的数据集的聚类问题,提出了一种基于局部密度的网格排序策略(GSS-LD),并以其作为网格聚类的组织模式。GSS-LD利用聚类的局部性质进行网格单元排序,将基于网格的聚类问题转换为网格的排序问题,运用相对局部密度变化率的... 针对复杂及带噪声的数据集的聚类问题,提出了一种基于局部密度的网格排序策略(GSS-LD),并以其作为网格聚类的组织模式。GSS-LD利用聚类的局部性质进行网格单元排序,将基于网格的聚类问题转换为网格的排序问题,运用相对局部密度变化率的概念,克服了传统网格聚类算法中全局性参数的局限性,使其可以适应多密度数据集的聚类。通过三组具有不同拓扑结构的数据集测试GSS-LD的聚类性能并与其他两种方法进行比较,结果表明GSS-LD可以对复杂数据集进行有效聚类,其时间复杂度分别与数据规模及网格结构具有线性关系,同时具有较强的噪声处理能力。 展开更多
关键词 网格排序 局部密度 锚定网格 聚类 抗噪
下载PDF
一种基于k近邻的密度峰值聚类算法 被引量:1
13
作者 罗军锋 锁志海 郭倩 《软件》 2020年第7期185-188,共4页
密度峰值聚类算法(DPC算法)虽然具有简单高效的优点,但存在着需要人为确定截断距离的不足,从而造成聚类结果出现不准确。为解决这一问题,本文提出了一种基于K近邻的改进算法。该算法引入信息熵,采用属性加权的距离公式进行聚类,这样就... 密度峰值聚类算法(DPC算法)虽然具有简单高效的优点,但存在着需要人为确定截断距离的不足,从而造成聚类结果出现不准确。为解决这一问题,本文提出了一种基于K近邻的改进算法。该算法引入信息熵,采用属性加权的距离公式进行聚类,这样就解决了不同属性的权重影响问题;在聚类过程中通过计算数据点的近邻密度,再利用KNN近邻算法实现自动求解截断距离,据此得到聚类中心再进行聚类,通过实验证明,该算法在准确性、运行效率上均有不同程度的提升。 展开更多
关键词 聚类 密度峰值 局部密度 聚类中心 信息熵 K近邻 截断距离 相对距离
下载PDF
基于影响空间的稳健密度峰值聚类算法 被引量:1
14
作者 陈春涛 陈优广 《计算机科学》 CSCD 北大核心 2019年第11期216-221,共6页
DP(Clustering by Fast Search and Find of Density Peaks)是一种新提出的基于局部密度和距离的聚类算法,具有能够发现任意形状的类簇、易于理解并且可以高效划分数据的优点。但是该算法无法处理单个类簇中同时存在多个密度峰值的情况... DP(Clustering by Fast Search and Find of Density Peaks)是一种新提出的基于局部密度和距离的聚类算法,具有能够发现任意形状的类簇、易于理解并且可以高效划分数据的优点。但是该算法无法处理单个类簇中同时存在多个密度峰值的情况,并且数据划分不稳定,容易导致连锁错误划分;当类簇间的密度差异较大时,其无法准确识别稀疏的类簇。为弥补以上不足,提出一种基于影响空间的稳健密度峰值聚类算法。该改进算法通过邻近数据计算局部密度,增强对小规模类簇的识别能力。为了提高数据划分的稳定性,引入了影响空间,并定义了一种新的对称关系,提出了一种新的分配策略。其通过计算目标数据与邻近数据的局部密度比值,并对影响空间进行加权,使算法能够处理具有多密度分布特征的数据。基于人工合成数据集和UCI数据集的模拟对比实验表明,提出的改进策略增强了算法对稀疏类簇的识别能力,提高了数据划分的稳定性,在NMI和Acc评价指标方面取得了较优的结果。 展开更多
关键词 局部密度 聚类算法 影响空间 分配策略 稳定性
下载PDF
一种基于局部密度的k-means算法 被引量:1
15
作者 黎凡 王新 +2 位作者 和晓萍 马晓敏 黎吾鑫 《云南民族大学学报(自然科学版)》 CAS 2014年第6期439-442,459,共5页
针对k-means算法必须事先指定初始聚类数k,并且对初始聚类中心点比较敏感,聚类准则函数对求解的最优聚类数评价不理想,提出一种基于局部密度的启发式生成初始聚类中心方法,在此基础上设计一种准则函数自动生成聚类数目,改进了传统k-mean... 针对k-means算法必须事先指定初始聚类数k,并且对初始聚类中心点比较敏感,聚类准则函数对求解的最优聚类数评价不理想,提出一种基于局部密度的启发式生成初始聚类中心方法,在此基础上设计一种准则函数自动生成聚类数目,改进了传统k-means算法.实验表明改进的算法比传统k-means算法提高了聚类效率. 展开更多
关键词 K-MEANS算法 局部密度 初始中心点 聚类准则函数
下载PDF
基于改进力导向模型和局部密度的聚类算法 被引量:1
16
作者 刘风剑 刘向阳 《信息技术》 2019年第10期51-54,58,共5页
在没有先验知识的前提下,聚类是分析样本集中不同类簇的有效方式。文中提出了一种基于改进力导向模型的聚类算法。为实现样本数据预处理的类内聚集和类间分离效果,设计了基于样本点局部密度和样本间距离的吸引力计算方法、基于样本点近... 在没有先验知识的前提下,聚类是分析样本集中不同类簇的有效方式。文中提出了一种基于改进力导向模型的聚类算法。为实现样本数据预处理的类内聚集和类间分离效果,设计了基于样本点局部密度和样本间距离的吸引力计算方法、基于样本点近邻连通图中边的介数的排斥力计算方法。实验结果表明,文中算法能够使得类内样本点更加聚集、类间样本点更加分离,可以有效地提高聚类的正确率。 展开更多
关键词 力导向模型 局部密度 聚类 边介数
下载PDF
基于局部密度和测地距离的谱聚类
17
作者 张涛 葛洪伟 +1 位作者 苏辉 张欢庆 《计算机工程与应用》 CSCD 北大核心 2017年第7期141-146,262,共7页
传统根据K-近邻图计算测地距离的方法,虽然能够发现流形分布数据间的相似关系,但是当不同类的点存在粘连关系时,依此计算相似度时不能体现样本间的真实关系,从而无法有效聚类。针对传统测地距离计算相似度的方法不能有效处理粘连数据集... 传统根据K-近邻图计算测地距离的方法,虽然能够发现流形分布数据间的相似关系,但是当不同类的点存在粘连关系时,依此计算相似度时不能体现样本间的真实关系,从而无法有效聚类。针对传统测地距离计算相似度的方法不能有效处理粘连数据集的问题,提出了基于局部密度和测地距离的谱聚类方法。计算样本的局部密度,寻找每个样本点的最近高密度点,并选择边缘点和非边缘点;在边缘点和其最近高密度点之间构造边、非边缘点之间的K个近邻点构造边,依此计算测地距离和相似度并进行聚类。在人工数据集和UCI数据集上的实验表明,该算法在处理粘连数据集时有效提高了聚类准确率。 展开更多
关键词 K-近邻图 测地距离 局部密度 相似度 谱聚类
下载PDF
基于局部密度的高效聚类算法研究
18
作者 周杰 刘立波 卜旭松 《湖北工程学院学报》 2015年第6期21-25,共5页
针对基于密度聚类算法对参数值过于敏感、参数值难以设置的不足,提出一种基于局部密度的高效聚类算法,以有效解决基于密度聚类算法对密度层级不同数据集聚类准确率低的问题。该算法将局部密度概念和k-means算法相结合,在算法迭代过程中... 针对基于密度聚类算法对参数值过于敏感、参数值难以设置的不足,提出一种基于局部密度的高效聚类算法,以有效解决基于密度聚类算法对密度层级不同数据集聚类准确率低的问题。该算法将局部密度概念和k-means算法相结合,在算法迭代过程中动态计算局部密度参数和簇核心距。对于分布在簇核心距之内的数据,采用基于划分的方法直接聚类;对于分布在簇核心距之外的数据采用基于局部密度方法进行聚类。实验结果表明,提出的算法在聚类精度和计算效率两方面均具有较好的性能。 展开更多
关键词 K-MEANS 局部密度 簇核心距 聚类
下载PDF
基于量子计算加速的DDC算法
19
作者 刘雪娟 袁家斌 +1 位作者 许娟 段博佳 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第7期1677-1682,共6页
考虑到量子计算具有超强的并行计算能力,拟引入量子计算以降低局部密度和delta距离度量的聚类算法(DDC)计算复杂度。DDC算法的局部密度求解过程是计数算法,提出利用量子计数算法加速局部密度的求解;delta距离是最小值查找的过程,提出利... 考虑到量子计算具有超强的并行计算能力,拟引入量子计算以降低局部密度和delta距离度量的聚类算法(DDC)计算复杂度。DDC算法的局部密度求解过程是计数算法,提出利用量子计数算法加速局部密度的求解;delta距离是最小值查找的过程,提出利用最小值查找量子算法加速delta距离的求解。研究结果表明:利用量子计算对DDC聚类算法进行加速,能够使算法的执行效率获得显著提升。 展开更多
关键词 局部密度 delta距离 聚类算法 量子计算 加速
下载PDF
一种基于局部密度的分布式聚类挖掘算法 被引量:19
20
作者 倪巍伟 陈耿 +1 位作者 吴英杰 孙志挥 《软件学报》 EI CSCD 北大核心 2008年第9期2339-2348,共10页
分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的... 分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的分布式聚类算法——LDBDC(local density based distributed clustering).算法适用于含噪声数据和数据分布异常情况,对高雏数据有着良好的适应性.理论分析和实验结果表明,LDBDC算法在聚类质量和算法效率方面优于已有的DBDC算法和SDBDC(scalable dellsity-based distributed clustering)算法.算法是有效、可行的. 展开更多
关键词 分布式聚类 局部密度聚类局部聚类模型 密度吸引子 高维数据
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部