-
题名基于KL变换和KL散度的电网数据特征提取与分类
被引量:17
- 1
-
-
作者
李晖照
王雪
郭莹
-
机构
国网湖北省电力公司
国网湖北省电力公司客户服务中心
-
出处
《电测与仪表》
北大核心
2019年第6期87-92,共6页
-
文摘
智能电网用户行为特征的分析在电力营销策略中扮演者重要的角色。文中结合KL变换和KL散度的方法,提取与分类用电数据信息的特征,实现不同类型的用电数据划分。同时通过综合分析所有用户的日负荷曲线,提取不同类型用户的典型日负荷曲线。研究结果表明:基于KL变换的方法,通过对原始数据的压缩和主要特征的保留,大大降低了智能电网数据提取与分类的计算量,提高了时间效率;基于KL散度的方法,通过对k-means算法中的k值和初始聚类中心的选择进行优化,提高了聚类效果的准确率;实例中电网用户正常数据为38组,可分为3类典型用户,迎峰用电型、错峰用电型、部分迎峰用电型。该研究结果可以更加有效地对电网用户用电行为进行分类,从而为售电公司进行业务拓展提供技术基础。
-
关键词
KL变换
KL散度
电网数据
特征提取
初始聚类
负荷曲线
-
Keywords
KL transform
KL-divergence
grid data
feature extraction
initial clustering
load curve
-
分类号
TM76
[电气工程—电力系统及自动化]
-
-
题名基于势博弈的聚类算法
- 2
-
-
作者
王田雨
徐勇
-
机构
河北工业大学理学院
-
出处
《应用数学进展》
2021年第2期461-470,共10页
-
文摘
针对聚类过程中初始聚类选取方法的不同会影响其最终聚类结果,且传统的聚类算法很难得到稳定的聚类的问题,提出一种新颖的以模糊c均值作为初始聚类的基于势博弈的聚类算法(简称FS-IBRC)。该算法结合模糊c均值算法,以欧氏距离作为相似性度量,不断迭代更新隶属度矩阵和聚类中心,直至目标函数收敛从而得到较优的初始聚类结果。在此基础上,将数据聚类问题转化为寻找势博弈模型的纯纳什均衡问题,这对应于稳定的聚类。进而给出了解决这种基于势博弈模型聚类的算法,即迭代的最佳响应算法。最后,将FS-IBRC算法和一般初始化算法(S-IBRC)分别在两个不同的人工数据集上测试并实现。
-
关键词
模糊C均值
初始聚类
势博弈
纯纳什均衡
迭代最佳响应
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名K-means聚类算法研究综述
被引量:303
- 3
-
-
作者
王千
王成
冯振元
叶金凤
-
机构
[
西安交通大学航天航空学院
中国建设银行苏州常熟支行
-
出处
《电子设计工程》
2012年第7期21-24,共4页
-
基金
国家自然科学基金资助项目(10776026)
-
文摘
总结评述了K-means聚类算法的研究现状,指出K-means聚类算法是一个NP难优化问题,无法获得全局最优。介绍了K-means聚类算法的目标函数、算法流程,并列举了一个实例,指出了数据子集的数目K、初始聚类中心选取、相似性度量和距离矩阵为K-means聚类算法的3个基本参数。总结了K-means聚类算法存在的问题及其改进算法,指出了K-means聚类的进一步研究方向。
-
关键词
K-MEANS聚类算法
NP难优化问题
数据子集的数目K
初始聚类中心选取
相似性度量和距离矩阵
-
Keywords
K-means clustering algorithm
NP hard optimal problem
number of clusters K
cluster initialization
distance metric
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名K-means算法研究综述
被引量:162
- 4
-
-
作者
吴夙慧
成颖
郑彦宁
潘云涛
-
机构
南京大学信息管理系
中国科学技术信息研究所
-
出处
《现代图书情报技术》
CSSCI
北大核心
2011年第5期28-35,共8页
-
基金
国家社会科学基金项目"中文学术信息检索系统相关性集成研究"(项目编号:10CTQ027)
教育部人文社会科学研究规划基金项目"面向用户的相关性标准及其应用研究"(项目编号:07JA870006)
中国科学技术信息研究所合作研究项目的研究成果之一
-
文摘
对聚类分析中的基本算法K-means算法中的K值确定、初始聚类中心选择以及分类属性数据处理等主要问题进行综述,理清K-means算法的整个发展脉络及算法研究中的热点和难点,提出改进K-means聚类算法的思路。
-
关键词
K—means算法
聚类算法
K值
初始聚类中心
-
Keywords
K - means algorithm Clustering algorithm Number of clusters Initial clustering centers
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
G350
[自动化与计算机技术—计算机科学与技术]
-
-
题名K-Means聚类算法的研究
被引量:134
- 5
-
-
作者
周爱武
于亚飞
-
机构
安徽大学计算机科学与技术学院
-
出处
《计算机技术与发展》
2011年第2期62-65,共4页
-
基金
安徽省教育科研重点项目(KJ2009A57)
-
文摘
K-Means算法是一种经典的聚类算法,有很多优点,也存在许多不足。比如初始聚类数K要事先指定,初始聚类中心选择存在随机性,算法容易生成局部最优解,受孤立点的影响很大等。文中主要针对K-Means算法初始聚类中心的选择以及孤立点问题加以改进,首先计算所有数据对象之间的距离,根据距离和的思想排除孤立点的影响,然后提出了一种新的初始聚类中心选择方法,并通过实验比较了改进算法与原算法的优劣。实验表明,改进算法受孤立点的影响明显降低,而且聚类结果更接近实际数据分布。
-
关键词
K-MEANS算法
初始聚类中心
孤立点
-
Keywords
K-Means
initial clustering centre
isolated point
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名新的K-均值算法最佳聚类数确定方法
被引量:90
- 6
-
-
作者
周世兵
徐振源
唐旭清
-
机构
江南大学信息工程学院
江南大学理学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第16期27-31,共5页
-
基金
国家高技术研究发展计划(863)(No.2007AA1Z158)
国家自然科学基金(No.60703106)~~
-
文摘
K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。
-
关键词
K-均值聚类
聚类数
聚类有效性指标
初始聚类中心
-
Keywords
K-means clustering
number of clusters
clustering validity index
initial clustering centers
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种有效的K-means聚类中心初始化方法
被引量:86
- 7
-
-
作者
熊忠阳
陈若田
张玉芳
-
机构
重庆大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第11期4188-4190,共3页
-
基金
重庆市科委基金资助项目(2008BB2191)
-
文摘
传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。
-
关键词
K-均值算法
基于密度
初始聚类中心
最大最小距离
最大距离积
-
Keywords
K-means algorithm
density-based clustering
initial clustering centers
max-min distance
maximum distances product
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名最小方差优化初始聚类中心的K-means算法
被引量:84
- 8
-
-
作者
谢娟英
王艳娥
-
机构
陕西师范大学计算机科学学院
-
出处
《计算机工程》
CAS
CSCD
2014年第8期205-211,223,共8页
-
基金
国家自然科学基金资助项目(31372250)
陕西省科技攻关计划基金资助项目(2013K12-03-24)
中央高校基本科研业务费专项基金资助项目(GK201102007)
-
文摘
传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该算法运用样本空间分布信息,通过计算样本空间分布的方差得到样本紧密度信息,选择方差最小(即紧密度最高)且相距一定距离的样本作为初始聚类中心,实现优化的K-means聚类。在UCI机器学习数据库数据集和含有噪音的人工模拟数据集上的实验结果表明,该算法不仅能得到较好的聚类结果,且聚类结果稳定,对噪音具有较强的免疫性能。
-
关键词
聚类
K-MEANS算法
方差
紧密度
初始聚类中心
-
Keywords
clustering
K-means algorithm
deviation
intensive degree
initialized clustering centers
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于密度的改进K均值算法及实现
被引量:76
- 9
-
-
作者
傅德胜
周辰
-
机构
南京信息工程大学计算机与软件学院
-
出处
《计算机应用》
CSCD
北大核心
2011年第2期432-434,共3页
-
文摘
传统的K均值算法的初始聚类中心从数据集中随机产生,聚类结果很不稳定。提出一种基于密度算法优化初始聚类中心的改进K-means算法,该算法选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验证明,改进的K-means算法能够消除对初始聚类中心的依赖,聚类结果有了较大的改进。
-
关键词
聚类
K-均值算法
初始聚类中心
高密度区域
-
Keywords
clustering
K-means algorithm
initial clustering center
high-density area
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名初始中心优化的K-Means聚类算法
被引量:47
- 10
-
-
作者
李飞
薛彬
黄亚楼
-
机构
南开大学计算机科学与技术系
-
出处
《计算机科学》
CSCD
北大核心
2002年第7期94-96,共3页
-
基金
天津市自然科学基金(003600311)
-
文摘
1.引言
聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
-
关键词
遗传算法
随机全局优化搜索算法
K—Means聚类算法
初始聚类中心
优化
-
Keywords
K-Means algorithm, Genetic algorithm, Gene difference
-
分类号
O242.23
[理学—计算数学]
-
-
题名基于初始聚类中心选取的改进FCM聚类算法
被引量:67
- 11
-
-
作者
张慧哲
王坚
-
机构
同济大学CIMS研究中心
-
出处
《计算机科学》
CSCD
北大核心
2009年第6期206-209,共4页
-
基金
国家"863"计划基金资助项目(2003AA414120)
国家科技支撑计划项目(2006BAF01A46)
+4 种基金
国家"863"计划基金资助项目(2003AA414120)
上海市社会发展重大专项项目(06DZ12001)
上海市基础研究重点项目(06JC14066)
上海市科技发展基金重点项目(061612058)
上海市登山行动计划项目(061111006)资助
-
文摘
针对模糊C-均值(Fuzzy C-Means,FCM)算法聚类效果往往受到初始聚类中心影响,收敛结果易陷入局部极小的问题,提出了一种改进的模糊C均值聚类算法。算法给出了一种简洁快速的初始聚类中心的选取规则,并根据聚类中心的分离特性改进了目标函数,从而使获得的聚类结果为全局最优。仿真结果证明新算法与传统FCM方法相比,迭代次数少,准确率高,同时也更加适用于样本数据分类不均衡的聚类问题。
-
关键词
聚类
FCM聚类
目标函数
初始聚类中心
分离度
-
Keywords
Clustering, Fuzzy C mean clustering, Objective function, Initial cluster centers, Separative degree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于最优划分的K-Means初始聚类中心选取算法
被引量:61
- 12
-
-
作者
张健沛
杨悦
杨静
张泽宝
-
机构
哈尔滨工程大学计算机科学与技术学院
-
出处
《系统仿真学报》
CAS
CSCD
北大核心
2009年第9期2586-2590,共5页
-
基金
国家自然科学基金项目(60873037)
-
文摘
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。
-
关键词
K—Means算法
初始聚类中心
直方图
最优划分方法
-
Keywords
K-Means algorithm
initial clustering centers
histogram
optimized-division method
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名优化初始聚类中心的改进k-means算法
被引量:56
- 13
-
-
作者
张靖
段富
-
机构
太原理工大学计算机科学与技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2013年第5期1691-1694,1699,共5页
-
基金
山西省科技攻关基金项目(20080322008)
山西省自然科学基金项目(2008011039)
-
文摘
传统k-means算法随机选取初始聚类中心使聚类结果不稳定,诸多优化算法的时间复杂度较高,为了提高聚类稳定性并降低时间复杂度,提出了基于个体轮廓系数自适应地选取优秀样本以确定初始聚类中心的改进k-means算法。该算法多次调用传统k-means算法聚类,根据k个类中心的个体轮廓系数以及各样本与类中心的距离,自适应地选取优秀样本,求其均值作为初始聚类中心。在多个UCI数据集上的实验表明,该算法聚类时间短,具有较高的轮廓系数和准确率。
-
关键词
聚类
K均值算法
初始聚类中心
个体轮廓系数
自适应
-
Keywords
clustering
k-means algorithm
initial cluster centers
individual silhouette coefficient
adaptation
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名K-means算法初始聚类中心选择的优化
被引量:49
- 14
-
-
作者
冯波
郝文宁
陈刚
占栋辉
-
机构
解放军理工大学工程兵工程学院
-
出处
《计算机工程与应用》
CSCD
2013年第14期182-185,192,共5页
-
文摘
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。
-
关键词
K—means算法
聚类
初始聚类中心
TDKM算法
-
Keywords
K-means algorithm
clustering
initial clustering centers
TDKM algorithm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名K-means聚类算法的研究
被引量:45
- 15
-
-
作者
韩晓红
胡彧
-
机构
太原理工大学计算机与软件学院
-
出处
《太原理工大学学报》
CAS
北大核心
2009年第3期236-239,共4页
-
文摘
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。
-
关键词
数据挖掘
K—means算法
初始聚类中心
聚类分析
-
Keywords
Clustering algorithm
K-Means algorithm
sell industry
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于双层聚类分析的负荷形态组合识别方法
被引量:42
- 16
-
-
作者
王星华
陈卓优
彭显刚
-
机构
广东工业大学自动化学院
-
出处
《电网技术》
EI
CSCD
北大核心
2016年第5期1495-1501,共7页
-
基金
南方电网公司科技项目(K-GD2014-0609)~~
-
文摘
区别于传统用户用电行为分析方法,提出一种以聚类算法为基础的双层聚类分析方法。该方法结合给出的内、外层变随机设置为有目的选取初始聚类中心的选取规则,解决了聚类算法受初始聚类中心随机选取的影响,其收敛容易陷入局部最小化的问题。利用余弦相似度形态相似作为外层聚类的判据、欧式距离相近作为内层聚类的判据,对不需要经过归一化处理的用户用电轨迹向量进行分类。最后对某地区电力用户日负荷曲线进行算例分析,结果表明:双层聚类组合方法能把不同负荷形态及其大、小用户准确识别出来,实现了地区负荷形态的自动分类识别功能,证明了上述方法的有效性和优越性。
-
关键词
聚类分析
余弦相似度
欧式距离
负荷形态
初始聚类中心
-
Keywords
clustering analysis
cosine similarity
Euclidean distance
load profile
initial cluster centers
-
分类号
TM711
[电气工程—电力系统及自动化]
-
-
题名优化初始聚类中心的K-means聚类算法
被引量:41
- 17
-
-
作者
郭永坤
章新友
刘莉萍
丁亮
牛晓录
-
机构
江西中医药大学计算机学院
江西中医药大学药学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第15期172-178,共7页
-
基金
国家自然科学基金(No.81660727)。
-
文摘
针对传统K-means算法对初始中心十分敏感,聚类结果不稳定问题,提出了一种改进K-means聚类算法。该算法首先计算样本间的距离,根据样本距离找出距离最近的两点形成集合,根据点与集合的计算公式找出其他所有离集合最近的点,直到集合内数据数目大于或等于α(α为样本集数据点数目与聚类的簇类数目的比值),再把该集合从样本集中删除,重复以上步骤得到K(K为簇类数目)个集合,计算每个集合的均值作为初始中心,并根据K-means算法得到最终的聚类结果。在Wine、Hayes-Roth、Iris、Tae、Heart-stalog、Ionosphere、Haberman数据集中,改进算法比传统K-means、K-means++算法的聚类结果更稳定;在Wine、Iris、Tae数据集中,比最小方差优化初始聚类中心的K-means算法聚类准确率更高,且在7组数据集中改进算法得到的轮廓系数和F1值最大。对于密度差异较大数据集,聚类结果比传统K-means、K-means++算法更稳定,更准确,且比最小方差优化初始聚类中心的K-means算法更高效。
-
关键词
K-MEANS聚类算法
算法优化
初始聚类中心
-
Keywords
K-means clustering algorithm
algorithm optimization
initial clustering center
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于信息熵的精确属性赋权K-means聚类算法
被引量:37
- 18
-
-
作者
原福永
张晓彩
罗思标
-
机构
燕山大学信息科学与工程学院
-
出处
《计算机应用》
CSCD
北大核心
2011年第6期1675-1677,共3页
-
文摘
为了进一步提高聚类的精确度,针对传统K-means算法的初始聚类中心产生方式和数据相似性判断依据,提出一种基于信息熵的精确属性赋权K-means聚类算法。首先利用熵值法对数据对象的属性赋权来修正对象间的欧氏距离,然后通过比较初聚类的赋权类别目标价值函数,选择高质量的初始聚类中心来进行更高精度和更加稳定的聚类,最后通过Matlab编程实现。实验证明该算法的聚类精确度和稳定性要明显高于传统K-means算法。
-
关键词
K-MEANS
精确度
信息熵
属性赋权
初始聚类中心
-
Keywords
K-means
accuracy
information entropy
property weight
initial clustering center
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP301
[自动化与计算机技术—控制科学与工程]
-
-
题名一种选取初始聚类中心的方法
被引量:19
- 19
-
-
作者
刘立平
孟志青
-
机构
东莞理工学院计算机系
浙江工业大学经贸管理学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第8期179-180,共2页
-
基金
湖南省教育厅科研项目
-
文摘
对k平均值聚类法中初始聚类中心的选取问题进行了深入研究,给出了一个较好的聚类中心选取算法。该算法也可以用于需要确定初始中心的其它聚类算法。实验结果表明该算法的效果较好。
-
关键词
聚类
k平均值方法
初始聚类中心
-
Keywords
Clustering,K-means,Initial centrepoints
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于距离和权重改进的K-means算法
被引量:35
- 20
-
-
作者
王子龙
李进
宋亚飞
-
机构
空军工程大学研究生院
空军工程大学防空反导学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第23期87-94,共8页
-
基金
国家自然科学基金(No.61703426,No.61503407,No.61876189)
中国博士后科学基金(No.2018M633680)
陕西省高校科协青年人才托举计划(No.20190108)。
-
文摘
K-means聚类算法简单高效,应用广泛。针对传统K-means算法初始聚类中心点的选择随机性导致算法易陷入局部最优以及K值需要人工确定的问题,为了得到最合适的初始聚类中心,提出一种基于距离和样本权重改进的K-means算法。该聚类算法采用维度加权的欧氏距离来度量样本点之间的远近,计算出所有样本的密度和权重后,令密度最大的点作为第一个初始聚类中心,并剔除该簇内所有样本,然后依次根据上一个聚类中心和数据集中剩下样本点的权重并通过引入的参数τi找出下一个初始聚类中心,不断重复此过程直至数据集为空,最后自动得到k个初始聚类中心。在UCI数据集上进行测试,对比经典K-means算法、WK-means算法、ZK-means算法和DCKmeans算法,基于距离和权重改进的K-means算法的聚类效果更好。
-
关键词
数据挖掘
K-MEANS算法
初始聚类中心
加权欧式距离
权重
-
Keywords
data mining
K-means algorithm
initial cluster center
weighted Euclidean distance
weight product
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-