数据预处理方法对模糊C均值聚类的影响被引量：8

Data Pretreatment Method of Fuzzy C-Means Clustering Effects

下载PDF

导出

摘要研究了数据预处理方法对模糊C均值聚类结果的影响。通过对国际标准数据集IRIS和某电力公司所管辖的不同行业电力用户实际负荷数据,利用不同的方法进行预处理,运用模糊C均值聚类算法(FCM)进行聚类,并对实验结果进行了验证和比较。结果显示对于FCM聚类算法,通过总和标准化和极大值标准化方法对数据进行预处理后,FCM的平均准确度最高;Max-Min、平均数方差法两种方法处理后FCM聚类效果较差;用标准差标准化后聚类效果最差。进一步地,对标准差标准化做了相应的改进,改进后FCM聚类效果明显提高。 This paper studies the influence of using different data preprocessing methods on fuzzy c-means clustering results. By preprocessing the international standard data set IRIS and electricity consumers data of different industries in a power company with different preprocessing methods, we use fuzzy c-means clustering algorithm for clustering, and compare and analyze the results of clustering. The results show that when using FCM clustering algorithm for clustering, among the preproeessing methods, used in this paper, the total standardization and maxima standardization are the best in the average accuracy; the＇ Max-Min and average variance are the second; the standard deviation standardization is the worst. Moreover, after we change the way of using the standard deviation standardization, the efficiency of FCM is obviously improved.

作者刘丽轻丁巧林张铁峰陈健

机构地区华北电力大学电气与电子工程学院

出处《电力科学与工程》 2011年第8期24-27,46,共5页 Electric Power Science and Engineering

关键词数据预处理聚类负荷特性聚类准确率 data preprocessing cluster load characteristic effect of clustering

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1方红鹰.数据挖掘中数据预处理的方法研究[D].重庆:西南大学,2009. 被引量：1
2Jiawei,Han,Micheline,Kamber..数据挖掘概念与技术英文[M].北京:高等教育出版社,2001:550.
3冯晓蒲,张铁峰.基于实际负荷曲线的电力用户分类技术研究[J].电力科学与工程,2010,26(9):18-22. 被引量：31
4刘莉,徐玉生,马志新.数据挖掘中数据预处理技术综述[J].甘肃科学学报,2003,15(1):117-119. 被引量：41
5段铷,张彩庆,刘爱芳.模糊聚类在电力用户分类中的应用[J].电力需求侧管理,2005,7(5):18-20. 被引量：12
6Fisher R A. Iris Plants Database [Z] //http: //www. ics. uci. edu/- mlearn/MLRepository. Html. Authorized license. 被引量：1
7冯晓蒲,张铁峰.四种聚类方法之比较[J].微型机与应用,2010,29(16):1-3. 被引量：36

二级参考文献29

1汪海波,张海臣,段雪丽.基于MATLAB的自组织竞争神经网络聚类研究[J].邢台职业技术学院学报,2005,22(1):45-47. 被引量：5
2杨文佳,康重庆,夏清,刘润生,唐涛南,王鹏,张丽.基于预测误差分布特性统计分析的概率性短期负荷预测[J].电力系统自动化,2006,30(19):47-52. 被引量：42
3贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10-13. 被引量：225
4戈国华,肖海波,张敏.基于FCM的数据聚类分析及Matlab实现[J].福建电脑,2007,23(4):89-89. 被引量：8
5FISHER R A. Iris Plants Database//http ://www.ics.uci. edu/-mlearn /MLRepository.Html.Authorized license. 被引量：1
6XU Rui, Donald Wunsch 1 1. survey of clustering algorithm[J].IEEE.Transactions on Neural Networks, 2005,16 (3) : 645-67 8. 被引量：1
7YI Hong, SAM K. Learning assignment order of instances for the constrained k-means clustering algorithm[J].IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics,2009,39 (2) : 568-574. 被引量：1
8孔英会,苑津莎,张铁峰,等.基于数据流管理技术的配变负荷分类方法研究.中国国际供电会议,CICED2006. 被引量：1
9马晓艳唐雁.层次聚类算法研究.计算机科学,2008,34(7):34-36. 被引量：5
10Valero, S, M Ortiz, et al. (2007). Methods for customer and demand response policies selection in new electricity markets [ J ]. Generation, Transmission & Distribution, IET 1(1) : 104-110. 被引量：1

共引文献113

1刘飞,贲树俊.基于聚类分析的居民典型负荷特性分析[J].江苏电机工程,2007(z2):34-37. 被引量：6
2冯雪梅,卢来洁,马爱军,刘洪英.数据挖掘分类方法在冲击谱试验中的应用[J].航天器环境工程,2008,25(1):41-43.
3冯雪梅,卢来洁,马爱军,刘洪英.应用数据挖掘关联技术研究温湿度对冲击谱试验的影响[J].航天器环境工程,2007,24(2):109-112.
4曾维,李清光.改进的FCM方法及其在四色地形图分割中的应用[J].微型机与应用,2013,32(24):37-39.
5庄绪强.基于云计算技术的用户用电智能分析技术研究[J].自动化与仪器仪表,2016(2):187-189. 被引量：8
6任爽,王宇.供应链管理中的数据预处理技术[J].科技情报开发与经济,2004,14(11):186-188. 被引量：1
7吴蓉晖,荣宏.数据预处理在电力远程智能监测系统的应用[J].高电压技术,2005,31(7):58-60. 被引量：11
8谢永红,阿兹古丽.吾拉木,杨炳儒.一个通用型知识发现系统中数据预处理的实现[J].计算机应用研究,2005,22(11):55-57. 被引量：4
9罗小江,韩建保.车辆传动系运行状态监测信号的预处理[J].车辆与动力技术,2006(2):43-46. 被引量：1
10刘绍清,黄章树,黄剑辉.数据挖掘商业应用平台的数据预处理管理[J].重庆工商大学学报（自然科学版）,2006,23(5):453-456. 被引量：7

同被引文献124

1李天云,李想,刘辉军,王洪涛.基于谱聚类的电力负荷分类[J].吉林电力,2008,36(5):4-6. 被引量：2
2王薇薇,王清心,桑海.基于tsPSO的聚类案例检索策略[J].微型电脑应用,2011(9):63-64. 被引量：1
3叶志伟,尹宇洁,王明威,赵伟.一种基于杜鹃搜索算法的聚类分析方法[J].微电子学与计算机,2015,32(5):104-110. 被引量：6
4冯丽,邱家驹.基于电力负荷模式分类的短期电力负荷预测[J].电网技术,2005,29(4):23-26. 被引量：33
5周新华,黄道.一种基于蚁群算法的模糊C均值聚类[J].控制工程,2005,12(2):132-134. 被引量：24
6耿焕同,肖明军,邹翔,蔡庆生.聚类算法在范例库维护中的应用研究[J].计算机工程,2005,31(12):166-168. 被引量：10
7王志勇,曹一家.电力客户负荷模式分析[J].电力系统及其自动化学报,2007,19(3):62-65. 被引量：15
8Shahabi C, Zazkesh A, Adibi J, et al.Knowledge discovery from users Web-page navigation[C]//Workshop on Re- search Issues in Data Engineering, 1997:20-29. 被引量：1
9Fu, Sandhu K.A generalization-based approach to clus- tering of Web usage sessions[C]//International Workshop on Web Usage Analysis and User Profiling,1999:21-38. 被引量：1
10Banerjee A, Merugu S, Dhillon I.A generalized maximum entropy approach to bregman co-clustering and matrix approximation[J].The Journal of Machine Learning Re- search, 2007,8 : 455-474. 被引量：1

引证文献8

1凌海峰,王浩.细菌觅食算法与K-means结合的Web用户会话聚类[J].计算机工程与应用,2012,48(36):121-124. 被引量：2
2胡爱策,任明仑,王浩.粒子群与细菌觅食相结合的案例聚类算法[J].计算机技术与发展,2013,23(10):44-47. 被引量：2
3张铁峰,顾明迪.电力用户负荷模式提取技术及应用综述[J].电网技术,2016,40(3):804-811. 被引量：55
4闫婷,谢红薇.混合细菌觅食和粒子群的k-means聚类算法[J].微电子学与计算机,2016,33(6):59-62. 被引量：4
5张中秋,韦金洪.基于耦合协调度的土地整治项目评价研究[J].钦州学院学报,2017,32(1):34-39. 被引量：1
6周贤泉,宋威.基于狼群算法的DBN网络结构确定方法研究[J].微电子学与计算机,2018,35(7):28-34. 被引量：3
7周贤泉,宋威,张士昱,王晨妮.一种改进的蝙蝠算法[J].传感器与微系统,2019,38(11):139-143. 被引量：5
8郭丁,李姗姗,陈宗信,王力.高分卫星自然资源调查需求满足度评估[J].遥感学报,2022,26(3):579-587. 被引量：4

二级引证文献76

1李宁,郭泽林,袁铁江,王永超,白银平,潘成龙,晏强.基于电力量测信息的低压台区电力拓扑生成方法[J].分布式能源,2020(5):48-55. 被引量：2
2张俊峰,张天添,丁福光,王元慧.基于遗传蝙蝠算法的任务约束船推力分配优化[J].船舶工程,2022,44(2):105-111. 被引量：3
3凌海峰,王西山.求解柔性作业车间调度问题的两阶段参数自适应蚁群算法[J].中国机械工程,2013,24(24):3380-3385. 被引量：9
4王潇笛,刘俊勇,刘友波,许立雄,马铁丰,胥威汀.采用自适应分段聚合近似的典型负荷曲线形态聚类算法[J].电力系统自动化,2019,43(1):110-118. 被引量：56
5李童,毛力,吴滨,杨弘,肖炜.一种基于竞选领导策略的改进粒子群算法[J].计算机工程与应用,2014,50(20):36-40.
6张铁峰,梁思博,顾建炜.配用电大数据应用综述[J].电测与仪表,2017,54(2):92-99. 被引量：20
7刘晓青,李芳,程全,李晋,杨静.基于PSO和CBR优化粒度的磨矿过程设定控制[J].控制工程,2017,24(3):594-599. 被引量：4
8梁樱馨,田浩杉.基于细菌觅食与粒子群的改进混合算法[J].电子科技,2017,30(4):79-82. 被引量：5
9李志华,许新,黎作鹏,任丹萍.PSO-MEA混合优化算法及其收敛性分析[J].微电子学与计算机,2017,34(6):118-122. 被引量：2
10许刚,谈元鹏,戴腾辉.稀疏随机森林下的用电侧异常行为模式检测[J].电网技术,2017,41(6):1964-1971. 被引量：48

1王国伟,闫丽,姚玉霞.基于熵权法加权的模糊C均值聚类算法研究[J].农业网络信息,2010(8):148-150. 被引量：11
2张沛露,王建军.Web日志挖掘数据预处理方法研究[J].吉林建筑工程学院学报,2010,27(6):66-68. 被引量：1
3引领商用个性潮流——惠普带来针对电力行业的商用台式电脑新品[J].电力信息化,2006,4(11):15-15.
4雷筱珍,赖万钦.一种基于信息素的FCM蚁群聚类算法[J].安阳工学院学报,2009,8(2):55-58. 被引量：1
5张思学.电脑软件和操作系统[J].云南农业,2005(2):30-30.
6微博精选[J].微型计算机,2013(16):142-142.
7揭开攻击者的面纱[J].网管员世界,2004(1):64-64.
8陈厦,方方,胡战利.模糊聚类算法综述[J].生命科学仪器,2013,11(6):33-37. 被引量：6
9柳燕.直方图的描述性统计特性[J].科技信息,2011(18).
10崔群海.纺织传感器数据预处理方法研究[J].电子质量,2016(3):7-10.

电力科学与工程

2011年第8期

浏览历史

内容加载中请稍等...

数据预处理方法对模糊C均值聚类的影响被引量：8

参考文献7

二级参考文献29

共引文献113

同被引文献124

引证文献8

二级引证文献76

相关作者

相关机构

相关主题

浏览历史

数据预处理方法对模糊C均值聚类的影响 被引量：8

参考文献7

二级参考文献29

共引文献113

同被引文献124

引证文献8

二级引证文献76

相关作者

相关机构

相关主题

浏览历史

数据预处理方法对模糊C均值聚类的影响被引量：8