WEKA环境下基于模糊理论的聚类算法被引量：15

Clustering algorithm based on fuzzy theory in WEKA

下载PDF

导出

摘要因特网上的数据规模大、动态性强,通常发现的知识或规则很可能是不精确和不完备的。为了克服以上不足,引入模糊理论,通过寻找模糊相似上近似集进行合理聚类,在确定聚类数目的过程中,利用平均信息熵进行最佳聚类。同时将模糊聚类算法嵌入WEKA平台,利用WEKA中的类和可视化功能,扩充了WEKA中的聚类算法。实验表明,算法对含有噪声的、分布不规则的大数据集具有很高的精度和收敛速度。 The data in Internet has a large scale and dynamic peculiarity and the discovered knowledge or rules are likely to be imprecise or incomplete generally. Fuzzy theory and information entropy were introduced into the clustering analysis to overcome the difficulties and achieve the best results of clustering by looking for Fuzzy similarity upper approximation. The process of embedding the Fuzzy approximation algorithm into the WEKA platform in which the classes and visualization functions of open source WEKA was fully utilized. The Fuzzy approximation algorithms extended the clustering algorithm in WEKA. The experiment proves that it has a higher accuracy and convergence for the large-scale data sets that are anomalous and noise.

作者郑世明苗壮宋自林高志年

机构地区解放军理工大学指挥自动化学院南京陆军指挥学院

出处《解放军理工大学学报（自然科学版）》 EI 北大核心 2012年第1期22-26,共5页 Journal of PLA University of Science and Technology(Natural Science Edition)

基金国家863计划资助项目(2007AA01Z126)

关键词模糊集数据挖掘模糊聚类相似上近似 WEKA 聚类算法 fuzzy sets data mining fuzzy clustering similarity upper approximation WEKA clustering algorithm

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
2武小红,周建江.可能性模糊C-均值聚类新算法[J].电子学报,2008,36(10):1996-2000. 被引量：34
3陈慧萍,林莉莉,王建东,苗新蕊.WEKA数据挖掘平台及其二次开发[J].计算机工程与应用,2008,44(19):76-79. 被引量：35
4付艳秋..数据挖掘中模糊聚类与聚类集成研究[D].西南交通大学,2008:
5王元珍,王健,李晨阳.一种改进的模糊聚类算法[J].华中科技大学学报（自然科学版）,2005,33(2):92-94. 被引量：18
6马帅,王腾蛟,唐世渭,杨冬青,高军.一种基于参考点和密度的快速聚类算法[J].软件学报,2003,14(6):1089-1095. 被引量：108
7张勇.基于ReliefF算法的模糊聚类新算法[J].华南金融电脑,2009(1):43-46. 被引量：3
8陈宁,陈安,周龙骧.数值型和分类型混合数据的模糊K-Prototypes聚类算法(英文)[J].软件学报,2001,12(8):1107-1119. 被引量：46

二级参考文献42

1姚再勇,郑启龙,许胤龙,姚震,张红涛,胡晨光.基于Eclipse的并行开发环境EMPI[J].计算机应用与软件,2005,22(10):5-7. 被引量：3
2李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
3林金晓,陈伟男,周学功,彭澄廉,吴荣泉.基于Eclipse平台的边界扫描测试软件的开发[J].计算机工程,2007,33(12):280-282. 被引量：5
4J C Bezdek. Pattern Recognition with Fuzzy Objective Function Algorithms [ M].New York:Plenum Press, 1981. 被引量：1
5J C Bezdek, J Keller, R Krisnapuram, N R Pal. Fuzzy Models and Algorithms for Pattern Recognition and Image Processing [ M]. Kluwer Academic, 1999. 被引量：1
6R Krishnapuram, J Keller. A possibilistic approach to clustering [J].IEEE Trans Fuzzy Systems, 1993,1 ( 2 ) : 98 - 110. 被引量：1
7M Bami, V Cappellini, A Mecocci. Comments on "A possibilistic approach to clustering" [ J ]. IEEE Trans Fuzzy Systems, 1996,4(3):393 - 396. 被引量：1
8N R Pal, K Pal, J C Bezdek. A possibilistic fuzzy c-means clustering algorithm [J].IEEE Trans Fuzzy Systems,2005,13(4) :517 - 530. 被引量：1
9Pal N R,Pal K, Bezdek J C.A new hybrid C-means clustering model [A ]. In Proceedings of the IEEE International Conference On Fuzzy Systems [C]. Piscataway: IEEE Press, 2004. 179 - 184. 被引量：1
10Krishnapuram R, Keller J. The possibilisfic c-means algorithm: Insights and Recommendations [J].IEEE Transaction Fuzzy Systems, 1996,4(3) :385 - 393. 被引量：1

共引文献349

1张勇.基于ReliefF算法的模糊聚类新算法[J].华南金融电脑,2009(1):43-46. 被引量：3
2云健,刘勇奎,何丽君,陈华,王双成.蚁群聚类在民族突发事件应急决策中的应用[J].计算机应用研究,2009,26(2):509-512. 被引量：1
3刘云吉,施晓秋.基于lucene的搜索引擎在Ajax中的应用[J].硅谷,2009,2(19).
4李玉鑑.自适应K-均值聚类算法[J].计算机研究与发展,2007,44(z2):100-104. 被引量：5
5江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
6赵小强,李雄伟.基于改进马氏距离的模糊C聚类研究[J].中南大学学报（自然科学版）,2013,44(S2):195-198. 被引量：5
7薛永生,翁伟,文娟,王劲波,张宇.LSNCCP——一种基于最大不相含核心点集的聚类算法[J].计算机研究与发展,2004,41(11):1930-1935. 被引量：2
8汪加才,朱艺华.模糊K-Prototypes算法中的加权指数研究[J].计算机应用,2005,25(2):348-351. 被引量：4
9陈燕,耿国华,郑建国.一种改进的基于密度的聚类算法[J].微机发展,2005,15(3):17-19. 被引量：13
10王恬宇.基于空间聚类的图像检索方法[J].情报杂志,2005,24(4):108-109.

同被引文献138

1李莉,木拉提.哈米提.医学影像数据分类方法研究综述[J].中国医学物理学杂志,2011,28(6):3007-3011. 被引量：9
2司永胜,刘刚,高瑞.基于K-均值聚类的绿色苹果识别技术[J].农业机械学报,2009,40(S1):100-104. 被引量：50
3朱存,倪远平.EFC-RBF神经网络算法研究与故障模式识别[J].云南大学学报（自然科学版）,2009,31(S2):182-186. 被引量：3
4陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013,25(S1):142-146. 被引量：342
5陆声链,林士敏.基于距离的孤立点检测及其应用[J].计算机与数字工程,2004,32(5):94-97. 被引量：23
6毛文华 ,王一鸣 ,张小超 ,王月青 .基于机器视觉的苗期杂草实时分割算法[J].农业机械学报,2005,36(1):83-86. 被引量：44
7王业琴,王克奇,白雪冰,石岭.计算机视觉木材表面色差检测的研究[J].林业科技,2005,30(2):36-38. 被引量：13
8刘一星,李坚,徐子才,崔永志.我国110个树种木材表面视觉物理量的综合统计分析[J].林业科学,1995,31(4):353-359. 被引量：21
9王晓峰,黄德双,杜吉祥,张国军.叶片图像特征提取与识别技术的研究[J].计算机工程与应用,2006,42(3):190-193. 被引量：114
10汪源源,沈嘉琳,王涌,王怡.基于形态特征判别超声图像中乳腺肿瘤的良恶性[J].光学精密工程,2006,14(2):333-340. 被引量：15

引证文献15

1赵川源,何东健,乔永亮.基于多光谱图像和数据挖掘的多特征杂草识别方法[J].农业工程学报,2013,29(2):192-198. 被引量：32
2张昭,罗文亮,乔永亮,何东健.基于数据挖掘算法的竹块颜色分级研究[J].中国农机化学报,2013,34(2):217-220. 被引量：3
3郑文娟,王会青,陈俊杰.基于Weka平台的FCM算法的研究与实现[J].计算机应用与软件,2013,30(10):41-44. 被引量：4
4张树森,张龙波,陈亚丽,安建瑞,李彩虹.改进的基于熵的中心聚类算法[J].计算机与现代化,2014(3):53-56. 被引量：2
5严红,黄颖.面向服务的数据集成技术研究[J].舰船电子工程,2014,34(4):125-128.
6涂新莉,刘波,林伟伟.大数据研究综述[J].计算机应用研究,2014,31(6):1612-1616. 被引量：164
7方昕.大数据时代下计算机专业教学的探索[J].微型电脑应用,2014,30(11):32-34. 被引量：28
8王晶,于威威.改进的FCM聚类算法在Weka平台的应用[J].计算机系统应用,2015,24(11):219-224.
9方昕.大数据下的智能交通数据共享与处理模型[J].信息技术,2015,39(12):94-97. 被引量：11
10康同曦,刘波,刘强.基于Weka平台下的改进FCM算法的二次开发[J].无线互联科技,2016,13(14):121-123.

二级引证文献256

1张鹏.基于体育与健康理念的中职院校体育教学评价体系探索[J].体育视野,2022(2):69-71. 被引量：3
2关诗倩.大数据时代中美在互联网领域竞争与博弈分析以及应对策略研究[J].产业科技创新,2021(1):16-18.
3金玉玕,尚庆华,曹长群.二叠纪地层研究述评[J].地层学杂志,2000,24(2):99-108. 被引量：58
4阎庆,梁栋,张东彦.基于监督局部线性嵌入算法的玉米田间杂草识别[J].农业工程学报,2013,29(14):171-177. 被引量：9
5李颖,陈怀亮.田间作物杂草识别的最优遥感测量尺度[J].农业工程学报,2013,29(16):159-165. 被引量：1
6白敬,徐友,魏新华,张进敏,沈宝国.基于光谱特性分析的冬油菜苗期田间杂草识别[J].农业工程学报,2013,29(20):128-134. 被引量：28
7詹文田,何东健,史世莲.基于Adaboost算法的田间猕猴桃识别方法[J].农业工程学报,2013,29(23):140-146. 被引量：20
8王宇灿,李一飞,袁勤俭.国际大数据研究热点及前沿演化可视化分析[J].工程研究（跨学科视野中的工程）,2014,6(3):282-293. 被引量：11
9余秀丽,徐超,王丹丹,张卫园,屈卫锋,宋怀波.基于SVM的小麦叶部病害识别方法研究[J].农机化研究,2014,36(11):151-155. 被引量：20
10霍迎秋,秦仁波,邢彩燕,陈曦,方勇.基于CUDA的并行K-means聚类图像分割算法优化[J].农业机械学报,2014,45(11):47-53. 被引量：29

1魏浩,丁要军.一种基于属性相关的C4.5决策树改进算法[J].中北大学学报（自然科学版）,2014,35(4):402-406. 被引量：13
2孟晓明,陈慧萍,张涛.基于WEKA平台的Web事务聚类算法的研究[J].计算机工程与设计,2009,30(6):1332-1334. 被引量：5
3刘茗.一种基于数据挖掘的入侵检测方法研究与实现[J].淮海工学院学报（自然科学版）,2010,19(3):16-20.
4关心,王新.基于数据挖掘的入侵检测系统研究[J].信息技术,2007,31(10):100-103. 被引量：2
5关心,王新.基于k-means改进算法的入侵检测系统的研究[J].计算机系统应用,2007,16(9):82-84. 被引量：2
6邱波.基于粗糙集的Web事务聚类算法[J].微型电脑应用,2014(2):56-58.
7申情,韩燮,蒋云良.基于粗糙近似的Web事务聚类方法研究[J].计算机工程与设计,2007,28(18):4469-4471.
8耿新青,王正欧.一种挖掘模糊相似关联规则的新方法[J].计算机应用,2005,25(5):985-988. 被引量：5
9谭小彬,王卫平,奚宏生,殷保群.基于隐马尔可夫模型的异常检测[J].小型微型计算机系统,2004,25(8):1546-1549. 被引量：9
10李飏.基于差别函数的决策表属性约简算法研究[J].电脑知识与技术,2014(8):5348-5349.

解放军理工大学学报（自然科学版）

2012年第1期

浏览历史

内容加载中请稍等...

WEKA环境下基于模糊理论的聚类算法被引量：15

参考文献8

二级参考文献42

共引文献349

同被引文献138

引证文献15

二级引证文献256

相关作者

相关机构

相关主题

浏览历史

WEKA环境下基于模糊理论的聚类算法 被引量：15

参考文献8

二级参考文献42

共引文献349

同被引文献138

引证文献15

二级引证文献256

相关作者

相关机构

相关主题

浏览历史

WEKA环境下基于模糊理论的聚类算法被引量：15