期刊文献+
共找到493篇文章
< 1 2 25 >
每页显示 20 50 100
密度峰值聚类算法综述 被引量:47
1
作者 陈叶旺 申莲莲 +3 位作者 钟才明 王田 陈谊 杜吉祥 《计算机研究与发展》 EI CSCD 北大核心 2020年第2期378-394,共17页
密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度... 密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度峰值点,可以用来作为聚类中心.根据建构好的层次关系,该算法提供了2种不同的方式完成最后聚类:一种是与用户交互的决策图,另一种是自动化方式.跟踪了DPeak近年来的发展与应用动态,对该算法的各种改进或变种从以下3方面进行了总结和梳理:首先,介绍了DPeak算法原理,对其在聚类算法分类体系中的位置进行了讨论.将其与5个主要的聚类算法做了比较之后,发现DPeak与均值漂移聚类算法(mean shift)有诸多相似之处,因而认为其可能为mean shift的一个特殊变种.其次,讨论了DPeak的几个不足之处,如复杂度较高、自适应性不足、精度低和高维数据适用性差等,将针对这些缺点进行改进的相关算法做了分类讨论.此外,梳理了DPeak算法在不同领域中的应用,如自然语言处理、生物医学应用、光学应用等.最后,探讨了密度峰值聚类算法所存在的问题及挑战,同时对进一步的工作进行展望. 展开更多
关键词 聚类算法 密度峰值 大数据 数据挖掘 密度聚类
下载PDF
一种基于簇中心点自动选择策略的密度峰值聚类算法 被引量:47
2
作者 马春来 单洪 马涛 《计算机科学》 CSCD 北大核心 2016年第7期255-258,280,共5页
针对基于密度峰值的聚类算法(CFSFDP)无法自行选择簇中心点的问题,提出了CFSFDP改进算法。该算法采用簇中心点自动选择策略,根据簇中心权值的变化趋势搜索"拐点",并以"拐点"之前的一组点作为各簇中心,这一策略有效... 针对基于密度峰值的聚类算法(CFSFDP)无法自行选择簇中心点的问题,提出了CFSFDP改进算法。该算法采用簇中心点自动选择策略,根据簇中心权值的变化趋势搜索"拐点",并以"拐点"之前的一组点作为各簇中心,这一策略有效避免了通过决策图判决簇中心的方法所带来的误差。仿真实验采用5类数据集,并与DBSCAN及CFSFDP算法进行了对比,结果表明,CFSFDP改进算法具有较高的准确度及较强的鲁棒性,适用于较低维度的数据的聚类分析。 展开更多
关键词 聚类 DBSCAN 密度峰值 簇中心点
下载PDF
自动确定聚类中心的密度峰值算法 被引量:36
3
作者 王洋 张桂珠 《计算机工程与应用》 CSCD 北大核心 2018年第8期137-142,共6页
密度峰值聚类算法(Density Peaks Clustering,DPC),是一种基于密度的聚类算法,该算法具有不需要指定聚类参数,能够发现非球状簇等优点。针对密度峰值算法凭借经验计算截断距离d_c无法有效应对各个场景并且密度峰值算法人工选取聚类中心... 密度峰值聚类算法(Density Peaks Clustering,DPC),是一种基于密度的聚类算法,该算法具有不需要指定聚类参数,能够发现非球状簇等优点。针对密度峰值算法凭借经验计算截断距离d_c无法有效应对各个场景并且密度峰值算法人工选取聚类中心的方式难以准确获取实际聚类中心的缺陷,提出了一种基于基尼指数的自适应截断距离和自动获取聚类中心的方法,可以有效解决传统的DPC算法无法处理复杂数据集的缺点。该算法首先通过基尼指数自适应截断距离d_c,然后计算各点的簇中心权值,再用斜率的变化找出临界点,这一策略有效避免了通过决策图人工选取聚类中心所带来的误差。实验表明,新算法不仅能够自动确定聚类中心,而且比原算法准确率更高。 展开更多
关键词 密度峰值 聚类 簇中心点 基尼指数
下载PDF
三种岩石高温后纵波波速特性的试验研究 被引量:28
4
作者 闫治国 朱合华 +3 位作者 邓涛 曾令军 姚坚 强健 《岩土工程学报》 EI CAS CSCD 北大核心 2006年第11期2010-2014,共5页
对经受不同高温后熔结凝灰岩、花岗岩及流纹状凝灰角砾岩的波动特性进行了研究,分析比较了三种岩石纵波波速、密度、弹性模量及峰值应力随经历温度的变化规律,并研究了纵波波速与密度,纵波波速与弹性模量,纵波波速与峰值应力的关系。结... 对经受不同高温后熔结凝灰岩、花岗岩及流纹状凝灰角砾岩的波动特性进行了研究,分析比较了三种岩石纵波波速、密度、弹性模量及峰值应力随经历温度的变化规律,并研究了纵波波速与密度,纵波波速与弹性模量,纵波波速与峰值应力的关系。结果表明,经历高温后三种岩石的纵波波速、密度、弹性模量及峰值应力均有不同程度的降低,且随着经历温度的升高,降低的幅度增大。此外,纵波波速降低的幅度均大于密度降低的幅度;而纵波波速与弹性模量、峰值应力的关系则依赖于不同的岩石而表现出不同的规律。 展开更多
关键词 岩石 高温 纵波波速 密度 弹性模量 峰值应力
下载PDF
密度峰值优化初始中心的K-medoids聚类算法 被引量:27
5
作者 谢娟英 屈亚楠 《计算机科学与探索》 CSCD 北大核心 2016年第2期230-247,共18页
针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算... 针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算法。算法采用样本x i的t最近邻距离之和倒数度量其局部密度ρi,并定义样本x i的新距离δi,构造样本距离相对于样本密度的决策图。局部密度较高且相距较远的样本位于决策图的右上角区域,且远离数据集的大部分样本。选择这些样本作为初始聚类中心,使得初始聚类中心位于不同类簇,并自动得到数据集类簇数。为进一步优化聚类结果,提出采用类内距离与类间距离之比作为聚类准则函数。在UCI数据集和人工模拟数据集上进行了实验测试,并对初始聚类中心、迭代次数、聚类时间、Rand指数、Jaccard系数、Adjusted Rand index和聚类准确率等经典聚类有效性评价指标进行了比较,结果表明提出的K-medoids算法能有效识别数据集的真实类簇数和合理初始类簇中心,减少聚类迭代次数,缩短聚类时间,提高聚类准确率,并对噪音数据具有很好的鲁棒性。 展开更多
关键词 聚类 K-medoids算法 初始聚类中心 密度峰值 准则函数
下载PDF
聚类算法研究综述 被引量:27
6
作者 陈新泉 周灵晶 刘耀中 《集成技术》 2017年第3期41-49,共9页
聚类是数据挖掘研究领域的一种重要数据预处理方法,其目的是从无标签数据集中获得有价值数据集的内在分布结构,进而简化数据集的描述。历经几十年的研究,针对不同应用和数据特性已出现了千余种不同的聚类算法,但不同的聚类算法都有其特... 聚类是数据挖掘研究领域的一种重要数据预处理方法,其目的是从无标签数据集中获得有价值数据集的内在分布结构,进而简化数据集的描述。历经几十年的研究,针对不同应用和数据特性已出现了千余种不同的聚类算法,但不同的聚类算法都有其特定的适用范围和不足。传统的聚类算法大致可分为划分聚类方法、层次聚类方法、密度聚类方法、网格聚类方法、模型聚类方法等。通过对传统聚类方法的回顾和总结,文章重点介绍了近年来出现的同步聚类算法、信念传播聚类算法和密度峰值聚类算法,并针对以上聚类算法的应用及发展方向进行了论述。 展开更多
关键词 数据挖掘 聚类 信念传播 同步聚类 密度峰值
下载PDF
自然最近邻优化的密度峰值聚类算法 被引量:22
7
作者 金辉 钱雪忠 《计算机科学与探索》 CSCD 北大核心 2019年第4期711-720,共10页
针对现有的基于密度的聚类算法存在参数敏感,处理非球面数据和复杂流形数据聚类效果差的问题,提出一种新的基于密度峰值的聚类算法。该算法首先根据自然最近邻居的概念确定数据点的局部密度,然后根据密度峰局部密度最高并且被稀疏区域... 针对现有的基于密度的聚类算法存在参数敏感,处理非球面数据和复杂流形数据聚类效果差的问题,提出一种新的基于密度峰值的聚类算法。该算法首先根据自然最近邻居的概念确定数据点的局部密度,然后根据密度峰局部密度最高并且被稀疏区域分割来确定聚类中心,最后提出一种新的类簇间相似度概念来解决复杂流形问题。在实验中,该算法在合成和实际数据集中的表现比DPC(clustering by fast search and find of density peaks)、DBSCAN(density-based spatial clustering of applications with noise)和K-means算法要好,并且在非球面数据和复杂流形数据上的优越性特别大。 展开更多
关键词 密度峰 自然最近邻居 局部密度 稀疏区域 类簇间相似度
下载PDF
一种基于网格的密度峰值聚类算法 被引量:22
8
作者 王飞 王国胤 +1 位作者 李智星 彭思源 《小型微型计算机系统》 CSCD 北大核心 2017年第5期1034-1038,共5页
针对密度峰值聚类算法由于时空复杂度高而不能对大数据集进行有效聚类的问题,提出一种基于网格的密度峰值聚类算法.首先通过自适应多分辨率的网格划分的思想把数据划分到多个网格空间中,然后在每个网格空间中进行密度峰值聚类,利用网格... 针对密度峰值聚类算法由于时空复杂度高而不能对大数据集进行有效聚类的问题,提出一种基于网格的密度峰值聚类算法.首先通过自适应多分辨率的网格划分的思想把数据划分到多个网格空间中,然后在每个网格空间中进行密度峰值聚类,利用网格边界合并网格空间中的聚类结果,从而得到原始数据集的聚类结果.本算法集成了网格聚类和密度峰值聚类算法的优点,网格的方法可以减少算法空间复杂度和算法计算量,进而降低了密度峰值聚类算法的时空复杂度.仿真实验结果表明,本算法能够有效处理数据聚类问题,并提高了传统算法的效率. 展开更多
关键词 网格划分 密度峰值 聚类 时空复杂度
下载PDF
自适应局部半径的DBSCAN聚类算法 被引量:19
9
作者 秦佳睿 徐蔚鸿 +1 位作者 马红华 曾水玲 《小型微型计算机系统》 CSCD 北大核心 2018年第10期2186-2190,共5页
经典的基于密度的聚类方法 DBSCAN算法需要指定邻域半径和最小数据点阈值两个基本参数.这两个参数的确定对聚类结果的影响非常大.目前缺少有效的参数选择确定方法,同时DBSCAN算法在聚类过程中,使用统一的邻域半径参数,使得密度不均匀集... 经典的基于密度的聚类方法 DBSCAN算法需要指定邻域半径和最小数据点阈值两个基本参数.这两个参数的确定对聚类结果的影响非常大.目前缺少有效的参数选择确定方法,同时DBSCAN算法在聚类过程中,使用统一的邻域半径参数,使得密度不均匀集上的聚类质量不高.本文提出一种自适应选择局部半径的密度聚类算法(SALE-DBSCAN),通过确定密度峰值点,自适应选择聚类的局部邻域半径,简化了参数选择的过程;通过使用自适应选择的局部邻域半径扩张密度峰值点的邻域进行聚类,提高了聚类结果质量.实验结果表明,本SALE-DBSCAN算法相较其他密度聚类算法的聚类结果更加准确. 展开更多
关键词 密度聚类 DBSCAN 密度峰值 自适应局部半径
下载PDF
瓦斯浓度对爆炸传播影响的实验研究 被引量:18
10
作者 王磊 司荣军 +2 位作者 张延松 李润之 韩丽丽 《中国矿业》 北大核心 2009年第5期107-109,共3页
在DN700mm试验管道中,进行了不同浓度瓦斯爆炸火焰、压力波传播试验。从中可以看出,爆源点的最大压力值,并不是整个过程的最大值;爆炸压力峰值与传播距离呈三次函数关系,瓦斯浓度对爆炸压力峰值影响较大;火焰速度随着传播距离的加长而... 在DN700mm试验管道中,进行了不同浓度瓦斯爆炸火焰、压力波传播试验。从中可以看出,爆源点的最大压力值,并不是整个过程的最大值;爆炸压力峰值与传播距离呈三次函数关系,瓦斯浓度对爆炸压力峰值影响较大;火焰速度随着传播距离的加长而依次增大,瓦斯浓度对火焰传播速度也有比较大的影响。研究结果为煤矿井下隔抑爆装置和瓦斯输送管道隔抑爆装置的研制及安装技术规范,制定奠定理论基础,同时,也为煤矿瓦斯爆炸事故调查分析提供理论依据。 展开更多
关键词 瓦斯浓度 瓦斯爆炸 压力峰值 火焰速度
下载PDF
单压下节理密度及倾角对类岩石试件强度及变形的影响 被引量:19
11
作者 王佩新 曹平 +3 位作者 蒲成志 范祥 陈瑜 王聪聪 《工程科学学报》 EI CSCD 北大核心 2017年第4期494-501,共8页
通过预制张开节理类岩石试件,在单轴压缩条件下,研究节理密度及倾角的组合作用对试件强度和变形特征的影响.试验结果表明:(1)随着节理倾角的增大,应力-应变曲线由多峰值转变为单峰值,试件脆性增强,延性减弱;(2)节理密度对当量峰值强度... 通过预制张开节理类岩石试件,在单轴压缩条件下,研究节理密度及倾角的组合作用对试件强度和变形特征的影响.试验结果表明:(1)随着节理倾角的增大,应力-应变曲线由多峰值转变为单峰值,试件脆性增强,延性减弱;(2)节理密度对当量峰值强度的影响与节理倾角大小有关,对当量弹模的影响呈"V"形变化,即当量弹模随着节理密度的增大呈现先减小后增大的变化规律;(3)当量弹模随节理倾角的增大而增大,在节理倾角为90°的时候达到最大值,为完整试件弹性模量的70%~80%;(4)节理倾角对多节理类岩石试件当量峰值强度和当量弹性模量的影响大于节理密度的影响.对试验结果进一步分析发现:节理密度及节理倾角与应力-应变曲线、当量峰值强度及当量弹性模量之间的关系,其变化规律与试件的破坏过程息息相关,其破坏模式可分为张拉破坏、剪切破坏和复合破坏. 展开更多
关键词 类岩石试件 岩石节理 倾角 密度 单轴压缩 峰值强度 弹性模量 破坏模式
原文传递
基于密度峰值优化的模糊C均值聚类算法 被引量:15
12
作者 刘沧生 许青林 《计算机工程与应用》 CSCD 北大核心 2018年第14期153-157,共5页
针对传统模糊C均值聚类算法和基于K-means++优化聚类中心的模糊C均值算法存在初始聚类中心敏感、聚类速度收敛慢、聚类算法需要人为给定聚类数目等缺陷,受密度峰值聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP... 针对传统模糊C均值聚类算法和基于K-means++优化聚类中心的模糊C均值算法存在初始聚类中心敏感、聚类速度收敛慢、聚类算法需要人为给定聚类数目等缺陷,受密度峰值聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)的启发,提出了基于密度峰值算法优化的模糊C均值聚类算法,自适应产生初始聚类中心,确定聚类数目,并优化算法收敛过程。实验结果表明,改进后的算法与传统模糊聚类C均值算法相比能够准确地得到簇的数目,性能有明显的提高,并加快算法的收敛速度,达到相对更好的聚类效果。 展开更多
关键词 模糊C均值聚类 密度峰值 密度聚类 自适应
下载PDF
自动确定聚类中心的快速搜索和发现密度峰值的聚类算法 被引量:15
13
作者 王万良 吴菲 吕闯 《模式识别与人工智能》 EI CSCD 北大核心 2019年第11期1032-1041,共10页
快速搜索和发现密度峰值的聚类算法(CFSFDP)具有不能自动确定聚类中心的缺点,文中提出自动确定聚类中心的CFSFDP.首先针对变量分布不均匀的问题,将密度和距离进行归一化处理.再通过切比雪夫不等式确定归一化后的密度阈值上限,利用标准... 快速搜索和发现密度峰值的聚类算法(CFSFDP)具有不能自动确定聚类中心的缺点,文中提出自动确定聚类中心的CFSFDP.首先针对变量分布不均匀的问题,将密度和距离进行归一化处理.再通过切比雪夫不等式确定归一化后的密度阈值上限,利用标准差确定归一化后的距离阈值上限.最后根据决策函数确定决策阈值上限,统筹考虑两种决定因素,避免中心点选取遗漏,自动确定聚类中心.实验表明,文中算法可以有效地自适应选择聚类中心,具有较好的鲁棒性和有效性. 展开更多
关键词 密度峰值 聚类算法 聚类中心 切比雪夫不等式
下载PDF
基于核密度估计的K-CFSFDP聚类算法 被引量:13
14
作者 董晓君 程春玲 《计算机科学》 CSCD 北大核心 2018年第11期244-248,共5页
快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)是一种新的基于密度的聚类算法,它通过发现密度峰值来有效地识别类簇中心,具有聚类速度快、实现简单等优点。针对CFSFDP算法的准确性依... 快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)是一种新的基于密度的聚类算法,它通过发现密度峰值来有效地识别类簇中心,具有聚类速度快、实现简单等优点。针对CFSFDP算法的准确性依赖于数据集的密度估计和截断距离(dc)的人为选择问题,提出一种基于核密度估计的KCFSFDP算法。该算法利用无参的核密度估计分析数据点的分布特征并自适应地选取dc,从而搜索和发现数据点的密度峰值,并以峰值点数据作为初始聚类中心。基于4个典型数据集的仿真结果表明,K-CFSFDP算法比CFSFDP,K-means和DBSCAN算法具有更高的准确度和更强的鲁棒性。 展开更多
关键词 聚类 核密度估计 密度峰值 聚类中心
下载PDF
经腹超声造影鉴别诊断子宫内膜病变价值及与微血管密度关系探讨 被引量:12
15
作者 周璇 刘海静 白洁 《陕西医学杂志》 CAS 2020年第8期960-963,共4页
目的:探讨经腹超声造影鉴别诊断子宫内膜病变价值及与微血管密度的关系。方法:回顾性分析86例子宫内膜病变患者的临床资料,所有患者均接受经腹超声造影检查,根据病理学结果分为恶性组(n=32)和良性组(n=54)。比较两组经腹超声造影相关参... 目的:探讨经腹超声造影鉴别诊断子宫内膜病变价值及与微血管密度的关系。方法:回顾性分析86例子宫内膜病变患者的临床资料,所有患者均接受经腹超声造影检查,根据病理学结果分为恶性组(n=32)和良性组(n=54)。比较两组经腹超声造影相关参数,以病理学结果为金标准,绘制受试者工作曲线(ROC)分析经腹超声造影相关参数鉴别良恶性子宫内膜病变的诊断效能。病理标本行免疫组织化学染色检测微血管密度(MVD),分析经腹超声造影相关参数与MVD的相关性。结果:恶性组峰值强度高于良性组,达峰时间、上升时间均短于良性组(P<0.05);由ROC曲线可知,经腹超声造影相关参数以峰值强度鉴别良恶性子宫内膜病变的价值最大,其AUC为0.841,达峰时间、上升时间鉴别良恶性子宫内膜病变的价值相对较低,其AUC分别为0.837、0.802;恶性组MVD显著高于良性组(P<0.05);Pearson线性相关分析结果显示,峰值强度与MVD呈正相关(r=0.455,P=0.000),达峰时间与MVD呈负相关(r=-0.415,P=0.000),上升时间与MVD呈负相关(r=-0.340,P=0.001)。结论:经腹超声造影在鉴别诊断子宫内膜病变中具有较高的价值,峰值强度、达峰时间、上升时间与微血管密度有相关性,可以为临床评价微血管密度提供依据。 展开更多
关键词 子宫内膜病变 诊断 超声造影 内膜厚度 微血管密度 峰值强度
下载PDF
基于密度峰值的网格聚类算法 被引量:12
16
作者 杨洁 王国胤 王飞 《计算机应用》 CSCD 北大核心 2017年第11期3080-3084,共5页
2014年提出的密度峰值聚类算法,思想简洁新颖,所需参数少,不需要进行迭代求解,而且具有可扩展性。基于密度峰值聚类算法提出了一种网格聚类算法,能够高效地对大规模数据进行处理。首先,将N维空间粒化为不相交的长方形网格单元;然后,统... 2014年提出的密度峰值聚类算法,思想简洁新颖,所需参数少,不需要进行迭代求解,而且具有可扩展性。基于密度峰值聚类算法提出了一种网格聚类算法,能够高效地对大规模数据进行处理。首先,将N维空间粒化为不相交的长方形网格单元;然后,统计单元空间的信息,利用密度峰值聚类寻找中心点的思想确定中心单元,即中心网格单元被一些低局部密度的数据单元包围,而且与比自身局部密度高的网格单元的距离相对较大;最后,合并与中心网格单元相近网格单元,从而得出聚类结果。在UCI人工数据集上的仿真实验结果表明,所提算法能够较快得出聚类中心,有效处理大规模数据的聚类问题,具有较高的效率,与原始的密度峰值聚类算法相比,在不同数据集上时间损耗降低至原来的1/100~1/10,而精度损失维持在5%~8%。 展开更多
关键词 密度峰值 网格粒化 大规模数据 聚类
下载PDF
自适应聚合策略优化的密度峰值聚类算法 被引量:10
17
作者 钱雪忠 金辉 《计算机科学与探索》 CSCD 北大核心 2020年第4期712-720,共9页
针对密度峰值聚类算法受人为干预影响较大和参数敏感的问题,即不正确的截断距离dc会导致错误的初始聚类中心,而且在某些情况下,即使设置了适当的dc值,仍然难以从决策图中人为选择初始聚类中心。为克服这些缺陷,提出一种新的基于密度峰... 针对密度峰值聚类算法受人为干预影响较大和参数敏感的问题,即不正确的截断距离dc会导致错误的初始聚类中心,而且在某些情况下,即使设置了适当的dc值,仍然难以从决策图中人为选择初始聚类中心。为克服这些缺陷,提出一种新的基于密度峰值的聚类算法。该算法首先根据K近邻的思想来确定数据点的局部密度,然后提出一种新的自适应聚合策略,即首先通过算法给出阈值判断初始类簇中心,然后依据离初始类簇中心最近分配剩余点,最后通过类簇间密度可达来合并相似类簇。在实验中,该算法在合成和实际数据集中的表现比DPC、DBSCAN、KNNDPC和K-means算法要好,能有效提高聚类准确率和质量。 展开更多
关键词 密度峰 K近邻(KNN) 局部密度 合并策略 类簇间密度可达
下载PDF
基于K近邻和多类合并的密度峰值聚类算法 被引量:10
18
作者 薛小娜 高淑萍 +1 位作者 彭弘铭 吴会会 《吉林大学学报(理学版)》 CAS 北大核心 2019年第1期111-120,共10页
针对密度峰值聚类(DPC)算法在处理结构复杂、维数较高以及同类中存在多个密度峰值的数据集时聚类性能不佳的问题,提出一种基于K近邻和多类合并的密度峰值聚类(KM-DPC)算法.首先利用定义的密度计算方法描述样本分布,采用新的评价指标获... 针对密度峰值聚类(DPC)算法在处理结构复杂、维数较高以及同类中存在多个密度峰值的数据集时聚类性能不佳的问题,提出一种基于K近邻和多类合并的密度峰值聚类(KM-DPC)算法.首先利用定义的密度计算方法描述样本分布,采用新的评价指标获取聚类中心;然后结合K近邻思想设计迭代分配策略,将剩余点准确归类;最后给出一种局部类合并方法,以防将包含多个密度峰值点的类分裂.仿真实验结果表明,该算法在22个不同数据集上的性能明显优于DPC算法. 展开更多
关键词 聚类 局部密度 密度峰值 K近邻 多类合并
下载PDF
结合主动学习和密度峰值聚类的协同训练算法 被引量:10
19
作者 龚彦鹭 吕佳 《计算机应用》 CSCD 北大核心 2019年第8期2297-2301,共5页
针对协同训练算法对模糊度高的样本容易标记错误导致分类器精度降低和协同训练在迭代时选择加入的无标记样本隐含有用信息不够的问题,提出了一种结合主动学习和密度峰值聚类的协同训练算法。在每次迭代之前,先选择模糊度高的无标记样本... 针对协同训练算法对模糊度高的样本容易标记错误导致分类器精度降低和协同训练在迭代时选择加入的无标记样本隐含有用信息不够的问题,提出了一种结合主动学习和密度峰值聚类的协同训练算法。在每次迭代之前,先选择模糊度高的无标记样本主动标记后加入有标记样本集,然后利用密度峰值聚类对无标记样本聚类得到每个无标记样本的密度和相对距离。迭代时选择具有较高密度和相对距离较远的无标记样本交由朴素贝叶斯(NB)分类,反复上述过程直到满足终止条件。利用主动学习标记模糊度高的样本能够改善分类器误标记识别问题,利用密度峰值聚类能够选择出较好表现数据空间结构的样本。在UCI的8个数据集和Kaggle的pima数据集上的实验表明,与SSLNBCA算法相比,所提算法的准确率最高提升6.7个百分点,平均提升1.46个百分点。 展开更多
关键词 协同训练 主动学习 密度峰值 朴素贝叶斯 视图
下载PDF
基于加权直觉模糊兰氏距离的密度峰值聚类算法 被引量:5
20
作者 徐鑫 曹原 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第1期101-110,共10页
利用传统的聚类算法对直觉模糊集进行聚类分析时,存在对异常值敏感、复杂度较高的问题,不适用于大规模直觉模糊数据的聚类。针对上述问题,提出了一种基于密度峰值思想和加权兰氏距离的直觉模糊聚类算法(WIFDPL),用来提高算法对直觉模糊... 利用传统的聚类算法对直觉模糊集进行聚类分析时,存在对异常值敏感、复杂度较高的问题,不适用于大规模直觉模糊数据的聚类。针对上述问题,提出了一种基于密度峰值思想和加权兰氏距离的直觉模糊聚类算法(WIFDPL),用来提高算法对直觉模糊数据的检测精度,降低算法的复杂度。由于现有直觉模糊距离算子不满足距离度量的定义,提出了一种新的直觉模糊兰氏距离算子,减少了数据的偏移程度,降低了对异常值的敏感程度;由于凝聚型层次聚类算法复杂度较高,采用密度峰值聚类算法对直觉模糊集进行聚类,显著提高了算法的运行效率。实验结果表明,利用改进的直觉模糊兰氏距离提高了聚类精度,且新算法复杂度较低,更适用于大规模直觉模糊集的聚类。 展开更多
关键词 聚类分析 直觉模糊集 兰氏距离 密度峰值
下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部