密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密...密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。展开更多
散射中心是描述雷达目标高频散射机理的重要特征,准确提取雷达目标散射中心参数对解析雷达目标有着极其重要的研究意义。为了提高散射中心参数计算速度,通常将整幅合成孔径雷达(synthetic aperture radar,SAR)图像分解为多个包含散射中...散射中心是描述雷达目标高频散射机理的重要特征,准确提取雷达目标散射中心参数对解析雷达目标有着极其重要的研究意义。为了提高散射中心参数计算速度,通常将整幅合成孔径雷达(synthetic aperture radar,SAR)图像分解为多个包含散射中心的小区域,对每个小区域分别进行特征提取和参数计算。根据雷达目标散射中心的特点,提出了一种基于局部密度聚类的雷达目标散射中心区域分割技术。首先,对雷达图像进行Frost滤波、基于水平集方法(level set method,LSM)的图像分割和面积滤波的一系列图像预处理获得目标感兴趣(region of interest,ROI)区域,然后对预处理后的图像利用局部密度聚类算法检测散射中心并进行区域分割。实验中,采用模拟数据和真实数据对所提方法和传统图像分割算法展开数值实验,实验结果验证了所提方法在雷达目标散射中心区域分割的有效性和优越性。展开更多
提出一种基于小波变换(wavelet transform,WT)与局部密度聚类(local density clustering,LDC)算法的电能质量扰动源辨识方法。通过小波变换提取电能质量扰动特征量,采用多级局部密度聚类搭建分类模型进行电能质量扰动源分类辨识。首先...提出一种基于小波变换(wavelet transform,WT)与局部密度聚类(local density clustering,LDC)算法的电能质量扰动源辨识方法。通过小波变换提取电能质量扰动特征量,采用多级局部密度聚类搭建分类模型进行电能质量扰动源分类辨识。首先对电能质量扰动的时序信号进行小波分解,将其分解为低频与高频信号;接着结合各个信号在小波能量谱上的差异度来提取电能质量扰动特征量;然后将其作为样本进行LDC聚类分析,搭建电能质量扰动分类模型;最后采用搭建的分类模型进行电能质量扰动源分类辨识。在算例实验中,选用8种常见的电能质量扰动以及对应2种复合扰动源进行分类检验,该方法对上述电能质量问题能进行有效分类,且多级LDC具有较低的运算复杂度和较高的辨识度。展开更多
DP(Clustering by Fast Search and Find of Density Peaks)是一种新提出的基于局部密度和距离的聚类算法,具有能够发现任意形状的类簇、易于理解并且可以高效划分数据的优点。但是该算法无法处理单个类簇中同时存在多个密度峰值的情况...DP(Clustering by Fast Search and Find of Density Peaks)是一种新提出的基于局部密度和距离的聚类算法,具有能够发现任意形状的类簇、易于理解并且可以高效划分数据的优点。但是该算法无法处理单个类簇中同时存在多个密度峰值的情况,并且数据划分不稳定,容易导致连锁错误划分;当类簇间的密度差异较大时,其无法准确识别稀疏的类簇。为弥补以上不足,提出一种基于影响空间的稳健密度峰值聚类算法。该改进算法通过邻近数据计算局部密度,增强对小规模类簇的识别能力。为了提高数据划分的稳定性,引入了影响空间,并定义了一种新的对称关系,提出了一种新的分配策略。其通过计算目标数据与邻近数据的局部密度比值,并对影响空间进行加权,使算法能够处理具有多密度分布特征的数据。基于人工合成数据集和UCI数据集的模拟对比实验表明,提出的改进策略增强了算法对稀疏类簇的识别能力,提高了数据划分的稳定性,在NMI和Acc评价指标方面取得了较优的结果。展开更多
分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的...分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的分布式聚类算法——LDBDC(local density based distributed clustering).算法适用于含噪声数据和数据分布异常情况,对高雏数据有着良好的适应性.理论分析和实验结果表明,LDBDC算法在聚类质量和算法效率方面优于已有的DBDC算法和SDBDC(scalable dellsity-based distributed clustering)算法.算法是有效、可行的.展开更多
文摘密度峰值聚类(clustering by fast search and find of density peaks,DPC)算法是一种基于密度的聚类算法,它可以发现任意形状和维度的类簇,是具有里程碑意义的聚类算法。然而,DPC算法的样本局部密度定义不适用于同时发现数据集的稠密簇和稀疏簇;此外,DPC算法的一步分配策略使得一旦有一个样本分配错误,将导致更多样本的错误分配,产生“多米诺骨牌效应”。针对这些问题,提出一种新的样本局部密度定义,采用局部标准差指数定义样本局部密度,克服DPC的密度定义缺陷;采用两步分配策略代替DPC的一步分配策略,克服DPC的“多米诺骨牌效应”,得到ESDTS-DPC算法。与DPC及其改进算法KNN-DPC、FKNN-DPC、DPC-CE和经典密度聚类算法DBSCAN的实验比较显示,提出的ESDTS-DPC算法具有更好的聚类准确性。
文摘散射中心是描述雷达目标高频散射机理的重要特征,准确提取雷达目标散射中心参数对解析雷达目标有着极其重要的研究意义。为了提高散射中心参数计算速度,通常将整幅合成孔径雷达(synthetic aperture radar,SAR)图像分解为多个包含散射中心的小区域,对每个小区域分别进行特征提取和参数计算。根据雷达目标散射中心的特点,提出了一种基于局部密度聚类的雷达目标散射中心区域分割技术。首先,对雷达图像进行Frost滤波、基于水平集方法(level set method,LSM)的图像分割和面积滤波的一系列图像预处理获得目标感兴趣(region of interest,ROI)区域,然后对预处理后的图像利用局部密度聚类算法检测散射中心并进行区域分割。实验中,采用模拟数据和真实数据对所提方法和传统图像分割算法展开数值实验,实验结果验证了所提方法在雷达目标散射中心区域分割的有效性和优越性。
文摘提出一种基于小波变换(wavelet transform,WT)与局部密度聚类(local density clustering,LDC)算法的电能质量扰动源辨识方法。通过小波变换提取电能质量扰动特征量,采用多级局部密度聚类搭建分类模型进行电能质量扰动源分类辨识。首先对电能质量扰动的时序信号进行小波分解,将其分解为低频与高频信号;接着结合各个信号在小波能量谱上的差异度来提取电能质量扰动特征量;然后将其作为样本进行LDC聚类分析,搭建电能质量扰动分类模型;最后采用搭建的分类模型进行电能质量扰动源分类辨识。在算例实验中,选用8种常见的电能质量扰动以及对应2种复合扰动源进行分类检验,该方法对上述电能质量问题能进行有效分类,且多级LDC具有较低的运算复杂度和较高的辨识度。
文摘DP(Clustering by Fast Search and Find of Density Peaks)是一种新提出的基于局部密度和距离的聚类算法,具有能够发现任意形状的类簇、易于理解并且可以高效划分数据的优点。但是该算法无法处理单个类簇中同时存在多个密度峰值的情况,并且数据划分不稳定,容易导致连锁错误划分;当类簇间的密度差异较大时,其无法准确识别稀疏的类簇。为弥补以上不足,提出一种基于影响空间的稳健密度峰值聚类算法。该改进算法通过邻近数据计算局部密度,增强对小规模类簇的识别能力。为了提高数据划分的稳定性,引入了影响空间,并定义了一种新的对称关系,提出了一种新的分配策略。其通过计算目标数据与邻近数据的局部密度比值,并对影响空间进行加权,使算法能够处理具有多密度分布特征的数据。基于人工合成数据集和UCI数据集的模拟对比实验表明,提出的改进策略增强了算法对稀疏类簇的识别能力,提高了数据划分的稳定性,在NMI和Acc评价指标方面取得了较优的结果。
文摘分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的分布式聚类算法——LDBDC(local density based distributed clustering).算法适用于含噪声数据和数据分布异常情况,对高雏数据有着良好的适应性.理论分析和实验结果表明,LDBDC算法在聚类质量和算法效率方面优于已有的DBDC算法和SDBDC(scalable dellsity-based distributed clustering)算法.算法是有效、可行的.