期刊文献+
共找到231篇文章
< 1 2 12 >
每页显示 20 50 100
面向含多种用户类型的负荷曲线聚类研究 被引量:41
1
作者 王帅 杜欣慧 +1 位作者 姚宏民 王凤萍 《电网技术》 EI CSCD 北大核心 2018年第10期3401-3412,共12页
传统聚类算法在进行负荷曲线聚类时,存在不易选取初始聚类中心、需人为确定最佳聚类数、收敛速度慢等问题,并且当负荷数据中含有较多的用户类型时,其聚类效果往往较差,针对以上问题,以密度峰值聚类为基础,提出一种面向多种用户类型的负... 传统聚类算法在进行负荷曲线聚类时,存在不易选取初始聚类中心、需人为确定最佳聚类数、收敛速度慢等问题,并且当负荷数据中含有较多的用户类型时,其聚类效果往往较差,针对以上问题,以密度峰值聚类为基础,提出一种面向多种用户类型的负荷曲线聚类优化算法。该算法通过类间优化与类内优化的方式,实现了数据集的全局扩散与局部收敛,增强了数据的可分性,且具备一定的自愈优化能力。实验选用轮廓系数(silhouette coefficient,SC)作为聚类有效性评价指标,在国内外不同负荷数据集中进行算法的性能测试与参数摄动下的稳定性测试。结果表明该算法在面向含有多种用户类型的负荷数据集时,能够显著提高聚类有效性与鲁棒性,可为电力咨询、精准购电、负荷管理等辅助服务提供决策性信息。 展开更多
关键词 多用户类型 密度峰值聚类 距离优化 轮廓系数 鲁棒性
下载PDF
基于峰值密度聚类的公交出行目的分类模型 被引量:5
2
作者 梁野 吕卫锋 杜博文 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第3期541-546,共6页
针对如何利用公交卡刷卡数据自动对公交出行目的进行分类问题,基于峰值密度聚类的理论,建立了一个能够在指定区域下对公交乘客出行目的进行准确分类的方法模型。本文根据出行目的不同提取相应特征,将特征相似的乘客进行聚类。得到结果... 针对如何利用公交卡刷卡数据自动对公交出行目的进行分类问题,基于峰值密度聚类的理论,建立了一个能够在指定区域下对公交乘客出行目的进行准确分类的方法模型。本文根据出行目的不同提取相应特征,将特征相似的乘客进行聚类。得到结果后将每个类簇的特征均值作为该类簇群体的出行特征,根据出行特征可以得出每位乘客的出行目的和群体出行目的的统计结果。利用北京市西单地区乘客的公交卡刷卡数据,通过将实际数据与调查问卷结果进行比对验证,证明了该模型方法与传统调查问卷方法相比节省了大量的人力物力,具有良好的效果和实用价值。 展开更多
关键词 交通大数据 峰值密度聚类 出行目的分类 出行特征提取 公交卡数据挖掘 智慧交通
下载PDF
一种基于密度峰值聚类的经典轨迹计算方法 被引量:3
3
作者 李旭东 成烽 《中国电子科学研究院学报》 北大核心 2019年第9期967-972,共6页
轨迹数据是一类重要的时空大数据,蕴含丰富的语义信息与行为模式。经典轨迹是群体轨迹移动时呈现出的相同或相似路径,在刻画海量轨迹时空特征、分析群体行为模式和预测移动对象路径等方面具有重要意义。本文提出了一种基于密度峰值聚类... 轨迹数据是一类重要的时空大数据,蕴含丰富的语义信息与行为模式。经典轨迹是群体轨迹移动时呈现出的相同或相似路径,在刻画海量轨迹时空特征、分析群体行为模式和预测移动对象路径等方面具有重要意义。本文提出了一种基于密度峰值聚类算法的经典轨迹计算框架,首先在相似性度量方面,采用并改进了顾及轨迹几何与方向的SSPD方法,然后在轨迹数据聚类方面,引入了密度峰值聚类方法,并使用其K近邻版本,以消除参数选择的不利影响,最后考虑到峰值点表征了具有最大局部密度的轨迹,直接将聚类中心作为经典轨迹输出。基于船舶轨迹的实验表明,本文方法可以有效从大规模轨迹中分析出经典轨迹,且同TRACLUS算法相比,输出的经典轨迹更为真实自然。 展开更多
关键词 轨迹数据 经典轨迹 相似度矩阵 密度峰值聚类 轨迹蔟
下载PDF
密度峰值聚类算法综述 被引量:52
4
作者 陈叶旺 申莲莲 +3 位作者 钟才明 王田 陈谊 杜吉祥 《计算机研究与发展》 EI CSCD 北大核心 2020年第2期378-394,共17页
密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度... 密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度峰值点,可以用来作为聚类中心.根据建构好的层次关系,该算法提供了2种不同的方式完成最后聚类:一种是与用户交互的决策图,另一种是自动化方式.跟踪了DPeak近年来的发展与应用动态,对该算法的各种改进或变种从以下3方面进行了总结和梳理:首先,介绍了DPeak算法原理,对其在聚类算法分类体系中的位置进行了讨论.将其与5个主要的聚类算法做了比较之后,发现DPeak与均值漂移聚类算法(mean shift)有诸多相似之处,因而认为其可能为mean shift的一个特殊变种.其次,讨论了DPeak的几个不足之处,如复杂度较高、自适应性不足、精度低和高维数据适用性差等,将针对这些缺点进行改进的相关算法做了分类讨论.此外,梳理了DPeak算法在不同领域中的应用,如自然语言处理、生物医学应用、光学应用等.最后,探讨了密度峰值聚类算法所存在的问题及挑战,同时对进一步的工作进行展望. 展开更多
关键词 聚类算法 密度峰值 大数据 数据挖掘 密度聚类
下载PDF
自动确定聚类中心的密度峰值算法 被引量:37
5
作者 王洋 张桂珠 《计算机工程与应用》 CSCD 北大核心 2018年第8期137-142,共6页
密度峰值聚类算法(Density Peaks Clustering,DPC),是一种基于密度的聚类算法,该算法具有不需要指定聚类参数,能够发现非球状簇等优点。针对密度峰值算法凭借经验计算截断距离d_c无法有效应对各个场景并且密度峰值算法人工选取聚类中心... 密度峰值聚类算法(Density Peaks Clustering,DPC),是一种基于密度的聚类算法,该算法具有不需要指定聚类参数,能够发现非球状簇等优点。针对密度峰值算法凭借经验计算截断距离d_c无法有效应对各个场景并且密度峰值算法人工选取聚类中心的方式难以准确获取实际聚类中心的缺陷,提出了一种基于基尼指数的自适应截断距离和自动获取聚类中心的方法,可以有效解决传统的DPC算法无法处理复杂数据集的缺点。该算法首先通过基尼指数自适应截断距离d_c,然后计算各点的簇中心权值,再用斜率的变化找出临界点,这一策略有效避免了通过决策图人工选取聚类中心所带来的误差。实验表明,新算法不仅能够自动确定聚类中心,而且比原算法准确率更高。 展开更多
关键词 密度峰值 聚类 簇中心点 基尼指数
下载PDF
基于网格的密度峰值聚类算法的RFID定位 被引量:25
6
作者 兰庆庆 肖本贤 《电子测量与仪器学报》 CSCD 北大核心 2018年第10期73-78,共6页
针对单一的一种聚类算法在处理实际定位问题时难以满足其精度需求的问题,提出一种基于网格的密度峰值聚类算法并将其应用于处理RFID定位系统中的空间数据信息,以实现对目标标签的定位。该算法结合了网格聚类算法和密度峰值聚类算法各自... 针对单一的一种聚类算法在处理实际定位问题时难以满足其精度需求的问题,提出一种基于网格的密度峰值聚类算法并将其应用于处理RFID定位系统中的空间数据信息,以实现对目标标签的定位。该算法结合了网格聚类算法和密度峰值聚类算法各自的特点,在保留了网格聚类算法处理大规模空间数据集的能力的同时,通过密度峰值聚类算法对网格聚类算法处理复杂聚类信息的能力进行提升,使得在处理基于RFID的室内定位问题时获得的定位效果满足实际需求。通过对3种算法的实验结果进行对比分析,可以看出算法能够提高基于RFID室内定位系统的定位精度,使得定位误差在0.128 m上下波动,具有很好的稳定性。 展开更多
关键词 RFID定位 信号强度值RSSI 网格聚类算法 密度峰值聚类算法
下载PDF
基于K近邻和优化分配策略的密度峰值聚类算法 被引量:22
7
作者 孙林 秦小营 +1 位作者 徐久成 薛占熬 《软件学报》 EI CSCD 北大核心 2022年第4期1390-1411,共22页
密度峰值聚类(density peak clustering,DPC)是一种简单有效的聚类分析方法.但在实际应用中,对于簇间密度差别大或者簇中存在多密度峰的数据集,DPC很难选择正确的簇中心;同时,DPC中点的分配方法存在多米诺骨牌效应.针对这些问题,提出一... 密度峰值聚类(density peak clustering,DPC)是一种简单有效的聚类分析方法.但在实际应用中,对于簇间密度差别大或者簇中存在多密度峰的数据集,DPC很难选择正确的簇中心;同时,DPC中点的分配方法存在多米诺骨牌效应.针对这些问题,提出一种基于K近邻(K-nearest neighbors,KNN)和优化分配策略的密度峰值聚类算法.首先,基于KNN、点的局部密度和边界点确定候选簇中心;定义路径距离以反映候选簇中心之间的相似度,基于路径距离提出密度因子和距离因子来量化候选簇中心作为簇中心的可能性,确定簇中心.然后,为了提升点的分配的准确性,依据共享近邻、高密度最近邻、密度差值和KNN之间距离构建相似度,并给出邻域、相似集和相似域等概念,以协助点的分配;根据相似域和边界点确定初始聚类结果,并基于簇中心获得中间聚类结果.最后,依据中间聚类结果和相似集,从簇中心到簇边界将簇划分为多层,分别设计点的分配策略;对于具体层次中的点,基于相似域和积极域提出积极值以确定点的分配顺序,将点分配给其积极域中占主导地位的簇,获得最终聚类结果.在11个合成数据集和27个真实数据集上进行仿真实验,与最新的基于密度峰值的聚类算法作对比,结果表明:所提算法在纯度、F度量、准确度、兰德系数、调整兰德系数和标准互信息上均表现出良好的聚类性能. 展开更多
关键词 密度峰值聚类 K近邻 簇中心 积极值 分配策略
下载PDF
一种基于网格的密度峰值聚类算法 被引量:22
8
作者 王飞 王国胤 +1 位作者 李智星 彭思源 《小型微型计算机系统》 CSCD 北大核心 2017年第5期1034-1038,共5页
针对密度峰值聚类算法由于时空复杂度高而不能对大数据集进行有效聚类的问题,提出一种基于网格的密度峰值聚类算法.首先通过自适应多分辨率的网格划分的思想把数据划分到多个网格空间中,然后在每个网格空间中进行密度峰值聚类,利用网格... 针对密度峰值聚类算法由于时空复杂度高而不能对大数据集进行有效聚类的问题,提出一种基于网格的密度峰值聚类算法.首先通过自适应多分辨率的网格划分的思想把数据划分到多个网格空间中,然后在每个网格空间中进行密度峰值聚类,利用网格边界合并网格空间中的聚类结果,从而得到原始数据集的聚类结果.本算法集成了网格聚类和密度峰值聚类算法的优点,网格的方法可以减少算法空间复杂度和算法计算量,进而降低了密度峰值聚类算法的时空复杂度.仿真实验结果表明,本算法能够有效处理数据聚类问题,并提高了传统算法的效率. 展开更多
关键词 网格划分 密度峰值 聚类 时空复杂度
下载PDF
结合鲸鱼优化算法的自适应密度峰值聚类算法 被引量:20
9
作者 王芙银 张德生 张晓 《计算机工程与应用》 CSCD 北大核心 2021年第3期94-102,共9页
针对密度峰值聚类算法(DPC)的聚类结果对截断距离dc的取值较为敏感、手动选取聚类中心存在着一定主观性的问题,提出了一种结合鲸鱼优化算法的自适应密度峰值聚类算法(WOA-DPC)。利用加权的局部密度和相对距离乘积的斜率变化趋势实现聚... 针对密度峰值聚类算法(DPC)的聚类结果对截断距离dc的取值较为敏感、手动选取聚类中心存在着一定主观性的问题,提出了一种结合鲸鱼优化算法的自适应密度峰值聚类算法(WOA-DPC)。利用加权的局部密度和相对距离乘积的斜率变化趋势实现聚类中心的自动选择,避免了手动选取导致的聚类中心少选或多选的情况;考虑到合理的截断距离dc是提高DPC算法聚类效果的重要因素,建立以ACC指标为目标函数的优化问题,利用鲸鱼优化算法(WOA)有效地寻优能力对目标函数进行优化,寻找最佳的截断距离dc;利用人工合成数据集与UCI上的真实数据集对WOA-DPC算法进行测试。实验结果表明,该算法在FMI、ARI和AMI指标上均优于DPC算法、DBSCAN算法以及K-Means算法,具有更好的聚类表现。 展开更多
关键词 密度峰值聚类算法 鲸鱼优化算法 聚类中心自适应 截断距离
下载PDF
基于皮尔逊相关系数融合密度峰值和熵权法典型场景研究 被引量:18
10
作者 赵源上 林伟芳 《中国电力》 CSCD 北大核心 2023年第5期193-202,共10页
新能源出力的波动性、随机性使得新型电力系统在规划以及运行分析时,如何获得典型出力场景是亟须解决的关键问题之一。提出了基于皮尔逊相关系数融合密度峰值和熵权法的典型场景聚类中心确定方法。首先,采用密度峰值方法选取初始聚类中... 新能源出力的波动性、随机性使得新型电力系统在规划以及运行分析时,如何获得典型出力场景是亟须解决的关键问题之一。提出了基于皮尔逊相关系数融合密度峰值和熵权法的典型场景聚类中心确定方法。首先,采用密度峰值方法选取初始聚类中心;然后,基于熵权法选取后续聚类中心;接着,采用后向场景缩减方法获得最终典型场景,以该方法为核心,构建了确定新能源典型出力场景的整体方案;最后,以2021年华北某地风电与光伏的日出力场景进行算例分析及对比验证,验证所提方法的准确性和有效性。研究成果将为电力系统规划与运行提供更为准确的数据支撑。 展开更多
关键词 典型出力场景 密度峰值 熵权法 场景聚类 场景缩减
下载PDF
分层递进的改进聚类蚁群算法解决TSP问题 被引量:18
11
作者 冯志雨 游晓明 刘升 《计算机科学与探索》 CSCD 北大核心 2019年第8期1280-1294,共15页
随着旅行商问题(TSP)规模的增大,传统蚁群算法的运行时间会增大,算法的解精度也会降低,并且算法很容易陷入局部最优的情况。提出的分层递进算法的思想源于分工合作的产品线组装流程,首先利用改进的密度峰聚类算法确定拐点,从而选举出聚... 随着旅行商问题(TSP)规模的增大,传统蚁群算法的运行时间会增大,算法的解精度也会降低,并且算法很容易陷入局部最优的情况。提出的分层递进算法的思想源于分工合作的产品线组装流程,首先利用改进的密度峰聚类算法确定拐点,从而选举出聚类中心,根据聚类中心确定包含的数据点;其次将初始的TSP问题分割成较小的簇,这些簇称为二类TSP问题;再经自适应信息素更新策略的蚁群算法运算,找出每个簇的最优解,进一步将簇与簇之间相近的节点构成的边断开;然后两簇之间断开的节点重组成全局最优解;最终通过局部优化策略对重组的优化解进一步优化,从而在保证算法解质量的前提下有效地缩短了运行时间。从TSPLIB中选取小规模、大规模基准案例,通过Matlab仿真验证了改进算法具有更好的鲁棒性,特别是在大规模基准案例中显著地减少了算法运行时间。 展开更多
关键词 分层递进 密度峰聚类 蚁群算法 局部优化 旅行商问题(TSP)
下载PDF
基于改进ABC和IDPC-MKELM的短期电力负荷预测 被引量:17
12
作者 狄曙光 刘峰 +3 位作者 孙建宇 冀超 董铎亮 蔄靖宇 《智慧电力》 北大核心 2022年第9期74-81,共8页
为提高受外部因素影响敏感的短期电力负荷预测精度,提出了一种基于改进ABC优化密度峰值聚类和多核极限学习机的短期电力负荷预测方法。构建融合特征提取、人工蜂群算法(ABC)、密度峰值聚类(DPC)和核极限学习机(KELM)的短期电力负荷预测... 为提高受外部因素影响敏感的短期电力负荷预测精度,提出了一种基于改进ABC优化密度峰值聚类和多核极限学习机的短期电力负荷预测方法。构建融合特征提取、人工蜂群算法(ABC)、密度峰值聚类(DPC)和核极限学习机(KELM)的短期电力负荷预测模型。针对ABC收敛效率不高的缺陷,设计新型蜜源搜索和蜜蜂进化方式,以提升改进ABC全局寻优能力;针对DPC截断距离与聚类中心人为设定的不足,定义邦费罗尼指数函数和聚类中心截断指标,并将改进的ABC应用于DPC参数优化过程,以实现DPC最佳聚类分析;针对KELM回归能力不强、参数选取难以确定的问题,设计多核加权KELM,并采用改进的ABC进行参数优化,以提高极限学习机预测精度。仿真结果表明,所提短期电力负荷预测方法更具有效性,平均误差低了约8.8%~39.8%。 展开更多
关键词 短期电力负荷预测 人工蜂群算法 密度峰值聚类 核极限学习机 特征提取 预测精度
下载PDF
基于线性判别分析和密度峰值聚类的异常用电模式检测 被引量:17
13
作者 王建元 张少锋 《电力系统自动化》 EI CSCD 北大核心 2022年第5期87-95,共9页
现有的异常用电检测方法存在未考虑电力用户的位置信息、模型参数选取困难的问题。据此,提出了一种基于线性判别分析(LDA)和密度峰值(DPeaks)聚类的双判据无监督异常用电检测模型。该模型遵循“特征构造—维度规约—聚类—异常检测”的... 现有的异常用电检测方法存在未考虑电力用户的位置信息、模型参数选取困难的问题。据此,提出了一种基于线性判别分析(LDA)和密度峰值(DPeaks)聚类的双判据无监督异常用电检测模型。该模型遵循“特征构造—维度规约—聚类—异常检测”的流程,借助聚类算法将用电模式类别不同的用户进行分类后再检测。在维度规约模块,使用线性判别分析将用户的台区号输入检测模型,提升了模型的检出率和精确率;在异常检测模块,设置双判据检测标准,减小了模型对参数摄动的敏感程度。采用该模型检测爱尔兰智能电表数据,结果表明用户位置信息的引入可以提高异常检测模型的准确度。 展开更多
关键词 非技术性损失 异常用电检测 无监督学习 线性判别分析 密度峰值聚类
下载PDF
基于密度峰值优化的模糊C均值聚类算法 被引量:15
14
作者 刘沧生 许青林 《计算机工程与应用》 CSCD 北大核心 2018年第14期153-157,共5页
针对传统模糊C均值聚类算法和基于K-means++优化聚类中心的模糊C均值算法存在初始聚类中心敏感、聚类速度收敛慢、聚类算法需要人为给定聚类数目等缺陷,受密度峰值聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP... 针对传统模糊C均值聚类算法和基于K-means++优化聚类中心的模糊C均值算法存在初始聚类中心敏感、聚类速度收敛慢、聚类算法需要人为给定聚类数目等缺陷,受密度峰值聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)的启发,提出了基于密度峰值算法优化的模糊C均值聚类算法,自适应产生初始聚类中心,确定聚类数目,并优化算法收敛过程。实验结果表明,改进后的算法与传统模糊聚类C均值算法相比能够准确地得到簇的数目,性能有明显的提高,并加快算法的收敛速度,达到相对更好的聚类效果。 展开更多
关键词 模糊C均值聚类 密度峰值 密度聚类 自适应
下载PDF
自动确定聚类中心的快速搜索和发现密度峰值的聚类算法 被引量:15
15
作者 王万良 吴菲 吕闯 《模式识别与人工智能》 EI CSCD 北大核心 2019年第11期1032-1041,共10页
快速搜索和发现密度峰值的聚类算法(CFSFDP)具有不能自动确定聚类中心的缺点,文中提出自动确定聚类中心的CFSFDP.首先针对变量分布不均匀的问题,将密度和距离进行归一化处理.再通过切比雪夫不等式确定归一化后的密度阈值上限,利用标准... 快速搜索和发现密度峰值的聚类算法(CFSFDP)具有不能自动确定聚类中心的缺点,文中提出自动确定聚类中心的CFSFDP.首先针对变量分布不均匀的问题,将密度和距离进行归一化处理.再通过切比雪夫不等式确定归一化后的密度阈值上限,利用标准差确定归一化后的距离阈值上限.最后根据决策函数确定决策阈值上限,统筹考虑两种决定因素,避免中心点选取遗漏,自动确定聚类中心.实验表明,文中算法可以有效地自适应选择聚类中心,具有较好的鲁棒性和有效性. 展开更多
关键词 密度峰值 聚类算法 聚类中心 切比雪夫不等式
下载PDF
一种密度峰值聚类的彩色图像分割方法 被引量:15
16
作者 邹旭华 叶晓东 谭治英 《小型微型计算机系统》 CSCD 北大核心 2017年第4期868-871,共4页
提出一种基于密度峰值聚类的彩色图像分割方法.首先,采用超像素分割算法对图像进行预处理,获得图像的超像素表示;然后,使用密度峰值聚类算法对得到的超像素颜色特征进行聚类,可以获得图像的聚类分割结果;最后,根据区域的空间信息和颜色... 提出一种基于密度峰值聚类的彩色图像分割方法.首先,采用超像素分割算法对图像进行预处理,获得图像的超像素表示;然后,使用密度峰值聚类算法对得到的超像素颜色特征进行聚类,可以获得图像的聚类分割结果;最后,根据区域的空间信息和颜色信息度量区域之间的距离,对聚类分割结果进行分级区域合并,获得最终的分割结果.实验结果表明,与当前的一些分割算法相比如:MS算法、FH算法、CTM算法,本文算法具有更好的分割结果. 展开更多
关键词 彩色图像分割 超像素 密度峰值聚类 分级区域合并
下载PDF
基于变分模态分解和密度峰值快速搜索的电力负荷曲线可控聚类模型 被引量:14
17
作者 谷紫文 李鹏 +3 位作者 郎恂 喻怡轩 沈鑫 曹敏 《电力系统保护与控制》 CSCD 北大核心 2021年第8期118-127,共10页
电力负荷曲线作为一种非平稳信号,可以看作由宽平稳的低频分量和非平稳的高频分量构成。针对负荷数据的时间多粒度构成特点,提出了一种基于变分模态分解和密度峰值快速搜索的负荷可控聚类模型。原始负荷曲线通过变分模态分解算法被分解... 电力负荷曲线作为一种非平稳信号,可以看作由宽平稳的低频分量和非平稳的高频分量构成。针对负荷数据的时间多粒度构成特点,提出了一种基于变分模态分解和密度峰值快速搜索的负荷可控聚类模型。原始负荷曲线通过变分模态分解算法被分解为低频,中频和高频三个模态分量。首先,利用负荷曲线的低频模态分量实现簇间的时间粗粒度聚类。然后,在子类中添加中频分量实现簇内的时间细粒度聚类。使用OpenEI数据集对所提模型进行了有效性验证,并与不同聚类算法对原始负荷数据直接聚类进行对比。实验结果表明该模型可以实现不同时间颗粒度的合理聚类。 展开更多
关键词 负荷曲线聚类 变分模态分解 密度峰值聚类 智能电网 数据驱动
下载PDF
物理学优化的密度峰值聚类算法 被引量:14
18
作者 贾露 张德生 吕端端 《计算机工程与应用》 CSCD 北大核心 2020年第13期47-53,共7页
针对密度峰值聚类算法(DPC)在计算样本的局部密度时随机选取截断距离、分配剩余样本点错误率高等问题,提出了一种物理学改进的密度峰值聚类算法W-DPC。通过万有引力定律定义样本的局部密度;基于第一宇宙速度建立了两步策略对剩余样本点... 针对密度峰值聚类算法(DPC)在计算样本的局部密度时随机选取截断距离、分配剩余样本点错误率高等问题,提出了一种物理学改进的密度峰值聚类算法W-DPC。通过万有引力定律定义样本的局部密度;基于第一宇宙速度建立了两步策略对剩余样本点进行分配,即必须属于点的分配和可能属于点的分配,使剩余样本点的分配更加精确。利用人工合成数据集与UCI上的真实数据集对W-DPC算法进行测试,并与KNN-DPC算法、DPC算法、DBSCAN算法、AP算法以及K-Means算法进行比较,数值实验表明:W-DPC算法的聚类效果明显优于其他算法。 展开更多
关键词 密度峰值聚类算法 聚类分析 引力定律 局部密度 第一宇宙速度
下载PDF
密度峰值优化的球簇划分欠采样不平衡数据分类算法 被引量:13
19
作者 刘学文 王继奎 +4 位作者 杨正国 李强 易纪海 李冰 聂飞平 《计算机应用》 CSCD 北大核心 2022年第5期1455-1463,共9页
在集成算法中嵌入代价敏感和重采样方法是一种有效的不平衡数据分类混合策略。针对现有混合方法中误分代价计算和欠采样过程较少考虑样本的类内与类间分布的问题,提出了一种密度峰值优化的球簇划分欠采样不平衡数据分类算法DPBCPUSBoos... 在集成算法中嵌入代价敏感和重采样方法是一种有效的不平衡数据分类混合策略。针对现有混合方法中误分代价计算和欠采样过程较少考虑样本的类内与类间分布的问题,提出了一种密度峰值优化的球簇划分欠采样不平衡数据分类算法DPBCPUSBoost。首先,利用密度峰值信息定义多数类样本的抽样权重,将存在“近邻簇”的多数类球簇划分为“易误分区域”和“难误分区域”,并提高“易误分区域”内样本的抽样权重;其次,在初次迭代过程中按照抽样权重对多数类样本进行欠采样,之后每轮迭代中按样本分布权重对多数类样本进行欠采样,并把欠采样后的多数类样本与少数类样本组成临时训练集并训练弱分类器;最后,结合样本的密度峰值信息与类别分布为所有样本定义不同的误分代价,并通过代价调整函数增加高误分代价样本的权重。在10个KEEL数据集上的实验结果表明,与现有自适应增强(AdaBoost)、代价敏感自适应增强(AdaCost)、随机欠采样增强(RUSBoost)和代价敏感欠采样自适应增强(USCBoost)等不平衡数据分类算法相比,DPBCPUSBoost在准确率(Accuracy)、F1分数(F1-Score)、几何均值(G-mean)和受试者工作特征(ROC)曲线下的面积(AUC)指标上获得最高性能的数据集数量均多于对比算法。实验结果验证了DPBCPUSBoost中样本误分代价和抽样权重定义的有效性。 展开更多
关键词 不平衡数据分类 密度峰值 球聚类 代价敏感 欠采样
下载PDF
基于低频出租车轨迹的城市路网交叉口提取研究 被引量:13
20
作者 李思宇 向隆刚 +1 位作者 张彩丽 龚健雅 《地球信息科学学报》 CSCD 北大核心 2019年第12期1845-1854,共10页
出租车GPS轨迹数据获取成本低、周期短,且覆盖面广,具有实时性及大规模性,同时其包含大量的行车记录信息,对提取数字道路信息具有巨大贡献,适用于大范围城市交通路网信息的获取和快速更新。基于GPS轨迹数据进行交叉口提取是目前的研究热... 出租车GPS轨迹数据获取成本低、周期短,且覆盖面广,具有实时性及大规模性,同时其包含大量的行车记录信息,对提取数字道路信息具有巨大贡献,适用于大范围城市交通路网信息的获取和快速更新。基于GPS轨迹数据进行交叉口提取是目前的研究热点,但现有研究方法大多适用于高频GPS数据,不能很好地提取稀疏区域的交叉口,难以适应出租车轨迹点采样频率低、定位精度低、噪声点多、数据分布不均匀的特性。因此,本文聚焦于城市路网的交叉口识别,为尽可能准确、全面地提取道路交叉口信息,兼顾密集与稀疏区域,提出了一种集成识别策略,分别在矢量空间和栅格空间,采用密度峰值聚类和数学形态学处理方法提取交叉口,并设计了一种融合机制探测交叉口,最后结合主成分分析法判断交叉口的真伪性,识别真实交叉口,并去除伪交叉口,从而得到基于低频出租车轨迹的城市道路交叉口。与已有的研究方法相比,本方法提取了更多的交叉口,并与遥感图像显示一致。本文提取结果准确率为92.23%、召回率为77.26%、F值为84.08%,很好地保证了交叉口的完整性和准确性,在智能交通系统中具有一定的应用价值。 展开更多
关键词 轨迹数据 道路交叉口 密度峰值聚类 低频率 数据融合 数学形态学
原文传递
上一页 1 2 12 下一页 到第
使用帮助 返回顶部