适用于区间数据的基于相互距离的相似性传播聚类被引量：8

Affinity propagation clustering for symbolic interval data based on mutual distances

下载PDF

导出

摘要符号聚类是对传统聚类的重要扩展,而区间数据是一类常见的符号数据。传统聚类中使用的对称性度量不一定适用于度量区间数据,且算法初始化也一直是干扰聚类的严重问题。因此,提出了一种适用于区间数据的度量——相互距离,并在此度量的基础上采用了一种全新的聚类方法——相似性传播聚类,解决了初始化干扰问题,从而得出了适用于区间数据的基于相互距离的相似性传播聚类。通过理论阐述和实验比较,说明了该算法比基于欧氏聚类的K-均值算法要好。 Clustering for symbolic data is an important extension of conventional clustering, and interval representation for symbolic data is often used. The symmetrical measures in conventional clustering algorithms are sometimes not fit to interval data and the initialization is another severe problem that can affect the clustering algorithms. One metric called mutual distances for interval data was proposed; based on the metric, a new clustering method named affinity propagation clustering that could solve the problem initialization was used. Then, affinity propagation clustering for symbolic interval data based on mutual distance was given. Theoretical explanation and experiments indicate that the proposed algorithm outperforms K-means based on Euclidean distances for the interval symbolic data.

作者谢信喜王士同

机构地区江南大学信息工程学院

出处《计算机应用》 CSCD 北大核心 2008年第6期1441-1443,1493,共4页 journal of Computer Applications

基金国家863计划项目(2007AA1Z1582006AA10Z313) 国家自然科学基金资助项目(60773206/F02010660704047/F030304) 2004年教育部跨世纪优秀人才支持计划基金项目(NCET-04-0496) 2005年教育部科学研究重点基金项目(105087) 中国科学院自动化所模式识别国家重点实验室开放课题

关键词符号聚类区间数据相互距离相似性传播 K-均值 clustering of symbol interval data mutual distance affinity propagation K-means

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献11

1RUI XU, WUNSCH D II. Survey of clustering algorithms [J]. IEEE Transactions on Neural Networks, 2005, 16(3) : 645 - 678. 被引量：1
2de CARVALHO F A T. A fuzzy clustering algorithm for symbolic interval data based on a single adaptive Euclidean distance [ C]// ICONIP 2006, Part Ⅲ, LNCS 4234. Berlin: Springer-Verlag, 2006:1012 - 1021. 被引量：1
3GOWDA K C, DIDAY E. Symbolic clustering using a new dissimilarity measure [ J]. Pattern Recognition, 1991, 24(6) : 567 - 578. 被引量：1
4GOWDA K C, DIDAY E. Symbolic clustering using a new similarity measure [ J]. IEEE Transactions on Systems, Man and Cybernetics, 1992, 22(2): 368-378. 被引量：1
5ICHINO M , YAGUCHI H . Generalized Minkowski metrics for mixed feature type data analysis [ J]. IEEE Transactions on Systems, Man and Cybernetics, 1994, 24(4): 698-708. 被引量：1
6de CARVALHO F A T, de SOUZA R M C R, CHAVENT M, et al. Adaptive Hausdofff distances and dynamic clustering of symbolic interval data [J]. Pattern Recognition Letters, 2006, 27(3): 167 - 179. 被引量：1
7FREY B J, DUECK D. Clustering by passing messages between data points [J]. Science, 2007, 315(5814): 972 -976. 被引量：1
8洪志令 ,姜青山 ,董槐林 ,Wang Sheng-Rui .模糊聚类中判别聚类有效性的新指标[J].计算机科学,2004,31(10):121-125. 被引量：15
9HUBERT L, ARABIE P. Comparing partitions [J]. Classification, 1985, 2(1): 193-218. 被引量：1
10EL-SONBARY Y, ISMAIL M A. Fuzzy clustering for symbolic data [J]. IEEE Transactions on Fuzzy System, 1998, 6(2) : 195 -204. 被引量：1

二级参考文献11

1Gonzalez T. Clustering to Minimize and Maximum Intercluster Distance. Theoretical Computer Science, 1985,38: 293 - 306 被引量：1
2Pal N R,Bezdek J C. On Cluster Validity for the Fuzzy C-Mean Model. IEEE Transactions on Fuzzy Systems [J], 1995. 370-390 被引量：1
3Xie X, Beni G. A Validity Measure for Fuzzy Clustering. IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI) ,1991, 13(8) :841-847 被引量：1
4Bensaid A M. Validity-Guided (Re) Clustering with Applications to Image Segmentation. IEEE Transactions on Fuzzy Systems,1996,4(2) 被引量：1
5Kwon S H. Cluster validity index for fuzzy clustering. ELECTRONICS LETTERS, 1998,34(22) :2176-2177 被引量：1
6Zahid N,Limouri M,Essaid A. A New cluster-validity for fuzzy clustering. Pattern Recognition Letters, 1999,32:1089- 1097 被引量：1
7Sun H,Wang S,Jiang Q. A New Validation Index for Determining the Number of Clusters in a Data Set. IJCNN'01, Washington DC, July 2001.14-19 被引量：1
8Sun H, Wang S,Jiang Q. FCM-Based Model Selection Algorithms for Determining the Number of Cluster. By Pattern Recognition,2003 被引量：1
9Bezdek J C. Chapter F6: Pattern Recognition in Handbook of Fuzzy computation. IOP Publishing Ltd, 1998 被引量：1
10Anderson E. The Iris of the Gaspé Peninsula. Bulletin of American Iris Society, 1935,59:2-5 被引量：1

共引文献14

1瞿俊,姜青山,Wang Shengrui,董槐林.基于高斯混合模型的层次聚类算法[J].计算机研究与发展,2006,43(z3):321-327. 被引量：3
2白素琴,吴小俊.基于模糊聚类算法的有效性指标[J].江南大学学报（自然科学版）,2007,6(6):878-882. 被引量：3
3陈黎飞,姜青山,王声瑞.基于层次划分的最佳聚类数确定方法[J].软件学报,2008,19(1):62-72. 被引量：82
4张姣玲.利用FCM求解最佳聚类数的算法[J].计算机工程与应用,2008,44(22):65-67. 被引量：7
5余元辉,邓莹.一种新的高维数据聚类自适应算法的研究[J].沈阳化工大学学报,2010,24(2):165-169. 被引量：1
6陆斯文,方守恩,王俊骅.基于追尾危险感知模糊推理的交通流运行安全评价[J].同济大学学报（自然科学版）,2011,39(1):69-73. 被引量：4
7朱文婕,吴楠,胡学钢.一个改进的模糊聚类有效性指标[J].计算机工程与应用,2011,47(5):206-209. 被引量：15
8周红芳,李红岩,刘颖,王晓东.多维数据集中聚类数确定算法研究[J].计算机工程,2012,38(9):8-11. 被引量：2
9韩凌波.K-均值算法中聚类个数优化问题研究[J].四川理工学院学报（自然科学版）,2012,25(2):77-80. 被引量：17
10靳燕,任炳兰.全国主要城市气候适宜度分析[J].杨凌职业技术学院学报,2013,12(2):10-14. 被引量：1

同被引文献85

1杨楠,弓丹志,李忺,孟小峰.Web社区发现技术综述[J].计算机研究与发展,2005,42(3):439-447. 被引量：35
2林健,彭敏晶.基于神经网络集成的GDP预测模型[J].管理学报,2005,2(4):434-436. 被引量：17
3樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131. 被引量：70
4柴玉梅,王宇.基于TFIDF的文本特征选择方法[J].微计算机信息,2006,22(08X):24-26. 被引量：32
5刘务华,罗铁坚,王文杰.文本聚类技术的有效性验证[J].计算机工程,2007,33(1):209-211. 被引量：5
6黄果,周竹荣.基于领域本体的概念语义相似度计算研究[J].计算机工程与设计,2007,28(10):2460-2463. 被引量：67
7Liu Bing. Web data mining[M]. Chicago: Springer Press, 2006: 117--149. 被引量：1
8Frey B J, Dueck D. Clustering by passing messages between data points [J]. Science, 2007,315 (5814) :972 -- 976. 被引量：1
9Kanungo T, Mount D M, Netanyahu N, et al. A local search approximation algorithm for k-means clustering [J]. Computational Geometry,2004,28(2/3) :89--112. 被引量：1
10XU R,WUNSCH D.Survey of clustering algorithms[J].IEEE Transactions on Neural Networks,2005,16(3):645-678. 被引量：1

引证文献8

1吴海华,李绍滋,林达真,柯逍,曹冬林.基于新型聚类算法IncreaseK-Means的Blog相似度分析[J].厦门大学学报（自然科学版）,2009,48(2):194-197. 被引量：2
2张仁彦,赵洪亮,卢晓,曹茂永.基于相似性传播聚类的灰度图像分割[J].海军工程大学学报,2009,21(3):33-37. 被引量：4
3刘晓勇,付辉.一种快速AP聚类算法[J].山东大学学报（工学版）,2011,41(4):20-23. 被引量：20
4赵小谦,郑彦,储海庆.概念树在短文本语义相似度上的应用[J].计算机技术与发展,2012,22(6):159-162. 被引量：4
5李辉,丁世飞.基于AP二次聚类的神经网络集成算法研究[J].计算机科学,2015,42(2):224-227. 被引量：3
6郭崇慧,刘永超.区间型符号数据的特征选择方法[J].运筹与管理,2015,24(1):67-74. 被引量：2
7臧斌斌,高辉,刘建,陈良亮.基于改进GRU模型的直流充电桩故障预测[J].计算机系统应用,2023,32(2):356-363. 被引量：2
8荆涛,李俊.基于相异度分析的网络通信异常行为识别方法[J].微电子学与计算机,2014,31(6):12-15. 被引量：5

二级引证文献42

1李存洋,钱良辉.AP聚类算法对多车型定制公交站点的运用[J].区域治理,2019,0(7):209-209.
2刘晓勇,付辉.一种快速AP聚类算法[J].山东大学学报（工学版）,2011,41(4):20-23. 被引量：20
3覃斌,阎春平,汪科,刘飞.支持多任务集中下料的零件分组优化方法[J].计算机集成制造系统,2012,18(5):943-949. 被引量：3
4储岳中,徐波.基于流形分析与AP算法RBF神经网络分类器[J].华中科技大学学报（自然科学版）,2012,40(8):93-97. 被引量：5
5杨传慧,吉根林,章志刚.AP算法在图像聚类中的应用研究[J].计算机与数字工程,2012,40(10):119-121. 被引量：6
6杨传慧,吉根林,章志刚.基于分块加权颜色直方图的图像聚类算法研究[J].南京师范大学学报（工程技术版）,2013,13(1):40-44. 被引量：5
7王磊.基于近邻传播和区域融合的彩色图像分割算法[J].商洛学院学报,2013,27(2):22-26.
8杨方颖,蒋正翔,张姗姗.基于本体结构的语义相似度计算[J].计算机技术与发展,2013,23(7):52-56. 被引量：8
9郭秀娟,陈莹.AP聚类算法的分析与应用[J].吉林建筑工程学院学报,2013,30(4):58-61. 被引量：12
10阳广元,曹霞,甯佐斌,潘煦.国内社区发现研究进展[J].情报资料工作,2014,35(2):29-33. 被引量：3

1李雷,鲁延玲,周蒙蒙,柏永成.基于核方法的一种新的模糊支持向量机[J].计算机技术与发展,2010,20(2):9-11. 被引量：6
2郭娣,赵海燕,侯景德,陈庆奎,曹健.基于相似性传播和流行度降维的混合推荐方法[J].小型微型计算机系统,2015,36(4):707-712. 被引量：1
3周慧芳.自适应的k-means聚类算法SA-K-means[J].科技创新导报,2009,6(34):4-5. 被引量：3
4王柯,朱启兵,崔宝同.决策表连续属性离散化的一种方法[J].计算机工程与应用,2008,44(30):148-149. 被引量：3
5张仁彦,赵洪亮,卢晓,曹茂永.基于相似性传播聚类的灰度图像分割[J].海军工程大学学报,2009,21(3):33-37. 被引量：4
6李丽敏,王仲生,姜洪开.基于相似性传播聚类的航空发动机突发故障诊断[J].振动与冲击,2014,33(1):51-55. 被引量：7
7田腾浩.优化初始聚类中心的K-Means算法[J].网络安全技术与应用,2014(9):42-43. 被引量：3
8李靖波.基于区间数据分析的期刊发展现状分析[J].经济数学,2012,29(1):85-89. 被引量：1
9陆建江,徐宝文.区间数据的并行模糊聚类算法[J].东南大学学报（自然科学版）,2003,33(4):406-409. 被引量：9
10胥少卿,罗强一,梁帅.区间型时间序列数据的点预测方法研究[J].系统仿真学报,2010,22(3):704-707. 被引量：3

计算机应用

2008年第6期

浏览历史

内容加载中请稍等...

适用于区间数据的基于相互距离的相似性传播聚类被引量：8

参考文献11

二级参考文献11

共引文献14

同被引文献85

引证文献8

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

适用于区间数据的基于相互距离的相似性传播聚类 被引量：8

参考文献11

二级参考文献11

共引文献14

同被引文献85

引证文献8

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

适用于区间数据的基于相互距离的相似性传播聚类被引量：8