基于动态邻域的三支聚类分析被引量：11

Three-way Clustering Analysis Based on Dynamic Neighborhood

下载PDF

导出

摘要目前,大多数聚类方法是二支聚类,即对象要么属于一个类,要么不属于一个类,聚类的结果必须具有清晰的边界。然而,将某些不确定的对象强制分配到某个类中将降低聚类结果的结构和精度。三支聚类是一种重叠聚类,它采用核心域和边界域来表示每个类别,较好地处理了具有不确定性对象的聚类问题。提出了一种使用样本邻域将二支聚类转化为三支聚类的方法。该方法利用二支聚类的结果和每个类中元素的邻域是否完全包含在该类中来对集合进行收缩,同时利用不在该类中的元素的邻域是否与该类有交集来进行扩张。收缩的区域称为核心域,扩张域和核心域的差集称为边界域。在UCI数据集上的实验结果显示,该方法在提高聚类结果的结构和F1值方面有较好的效果。 Most of the existing clustering methods are two-way clustering,which are based on the assumption that a cluster must be represented by a set with crisp boundary.However,assigning uncertain points into a cluster will reduce the accuracy of the method.Three-way clustering is an overlapping clustering which describes each cluster by core region and fringe region.This paper presented a strategy for converting a two-way cluster to three-way cluster using the neighborhood of the samples.In the proposed method,a two-way cluster is shrunk according to whether the neighborhood of sample are contained in this cluster and it is stretched according to whether the neighborhood of sample intersects with this cluster.The shrunk result is called core region and the difference between the shrunk result and stretched result is regarded as the fringe region.Experiment using the proposed method on UCI data sets shows that this strategy is effective in improving the structure and F1 values of clustering results.

作者王平心刘强杨习贝米据生

机构地区江苏科技大学理学院河北师范大学数学与信息科学学院江苏科技大学计算机科学学院

出处《计算机科学》 CSCD 北大核心 2018年第1期62-66,89,共6页 Computer Science

基金国家自然科学基金资助项目(61503160 61572242) 江苏省高校自然科学基金(15KJB110004)资助

关键词三支聚类邻域 K-MEANS聚类谱聚类 Three-way clustering Neighborhood K-means clustering Spectral clustering

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1079

二级参考文献1

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114

共引文献1078

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85. 被引量：1
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：4
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献63

1田大新,刘衍珩,魏达.ARTNIDS:基于自适应谐振理论的网络入侵检测系统[J].计算机学报,2005,28(11):1882-1889. 被引量：8
2陆林花,王波.一种改进的遗传聚类算法[J].计算机工程与应用,2007,43(21):170-172. 被引量：26
3孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1079
4胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简[J].软件学报,2008,19(3):640-649. 被引量：292
5蔡晓妍,戴冠中,杨黎斌.谱聚类算法综述[J].计算机科学,2008,35(7):14-18. 被引量：189
6胡清华,赵辉,于达仁.基于邻域粗糙集的符号与数值属性快速约简算法[J].模式识别与人工智能,2008,21(6):732-738. 被引量：82
7张德丰.聚类与动态RBF网络的模式识别应用研究[J].计算机工程与应用,2009,45(16):204-207. 被引量：2
8陶新民,徐晶,杨立标,刘玉.一种改进的粒子群和K均值混合聚类算法[J].电子与信息学报,2010,32(1):92-97. 被引量：79
9杜强,孙敏.基于改进聚类分析算法的入侵检测系统研究[J].计算机工程与应用,2011,47(11):106-108. 被引量：27
10傅涛,孙亚民.基于PSO的k-means算法及其在网络入侵检测中的应用[J].计算机科学,2011,38(5):54-55. 被引量：34

引证文献11

1施虹,刘强,王平心,杨习贝.基于三支决策的谱聚类算法研究[J].南京师大学报（自然科学版）,2018,41(3):6-13. 被引量：1
2解滨,董新玉,梁皓伟.基于三支动态阈值K-means聚类的入侵检测算法[J].郑州大学学报（理学版）,2020,52(2):64-70. 被引量：21
3李洪梅,姜冬勤,王平心.基于邻域样本稳定性的三支聚类方法[J].山西大学学报（自然科学版）,2020,43(4):874-879. 被引量：2
4高艳龙,万仁霞,陈瑞典.基于粒子群的三支聚类算法[J].福州大学学报（自然科学版）,2022,50(3):301-307. 被引量：1
5花遇春,赵燕,马建敏.基于共现概率的三支聚类模型[J].西北大学学报（自然科学版）,2022,52(5):797-804. 被引量：2
6花遇春,马建敏.基于邻域关系的三支聚类方法[J].山西大学学报（自然科学版）,2023,46(2):326-333. 被引量：1
7付立东,刘佳会,王秋红.改进局部扩展的复杂网络重叠社区检测算法[J].西安科技大学学报,2023,43(3):603-612. 被引量：1
8陈沛琦,黄春梅.结合灰狼优化算法和动态邻域的三支密度峰值聚类算法[J].长江信息通信,2024,37(1):70-73.
9朱金,徐天杰,王平心.基于蚁群算法的三支k-means聚类算法[J].江苏科技大学学报（自然科学版）,2024,38(3):63-69.
10聂斌,靳海科,张玉超,郑学鹏,陈星鑫,苗震,李欢.聚类不确定性的三支决策方法综述[J].现代信息科技,2024,8(18):25-32.

二级引证文献28

1朱恒东,马盈仓,张要,张宁.基于L21范数和回归正则项的半监督聚类算法[J].郑州大学学报（理学版）,2020,52(4):67-74. 被引量：5
2刘吉超,王锋.基于Relief-F的半监督特征选择算法[J].郑州大学学报（理学版）,2021,53(1):42-46. 被引量：6
3吕政权,李朝阳,王海峰,陈怡君,彭道刚.基于GRU-CNN的综合能源网络安全攻击检测方法[J].华电技术,2021,43(2):9-14. 被引量：8
4严南.基于K-means算法的网络入侵信息分层检索系统设计[J].信息与电脑,2021,33(15):38-40. 被引量：3
5季赛花,黄树成.基于改进的K-means入侵检测算法[J].计算机与数字工程,2021,49(11):2184-2188. 被引量：4
6杜浩良,孔飘红,金学奇,黄银强.基于深度学习的电力信息网络流量异常检测[J].浙江电力,2021,40(12):117-123. 被引量：14
7吕广旭,卢加奇,魏先燕,王小英.基于随机森林-聚类混合方法的多分类入侵检测研究[J].现代信息科技,2022,6(16):165-167. 被引量：1
8花遇春,赵燕,马建敏.基于共现概率的三支聚类模型[J].西北大学学报（自然科学版）,2022,52(5):797-804. 被引量：2
9董新玉,解滨,赵旭升,高新宝.多视角层次聚类下的无线网络入侵检测算法[J].计算机科学与探索,2022,16(12):2752-2764. 被引量：3
10李刘万,朱金,王平心.基于样本相似度的三支聚类算法[J].扬州大学学报（自然科学版）,2022,25(6):40-44. 被引量：2

1万月,陈秀宏,何佳佳.利用稀疏自编码的局部谱聚类映射算法[J].传感器与微系统,2018,37(1):145-148. 被引量：2
2马子逸,马传香,刘瑞奇,余啸.面向软件缺陷个数预测的混合式特征选择方法[J].计算机应用研究,2018,35(2):487-492. 被引量：2
3张文喜.基于模拟退火算法优化谱聚类的有杆泵抽油井故障诊断[J].化工管理,2018(3):208-208.
4傅文进,吴小俊.基于l_2范数的加权低秩子空间聚类[J].软件学报,2017,28(12):3347-3357. 被引量：7
5冯宏伟,姚博,高原,王惠亚,冯筠.基于边界混合采样的非均衡数据处理算法[J].控制与决策,2017,32(10):1831-1836. 被引量：19
6叶枫,丁锋.不平衡数据分类研究及其应用[J].计算机应用与软件,2018,35(1):132-136. 被引量：15
7周星,刁兴春,曹建军.基于邻域粗糙集的实体分辨记录对划分[J].计算机工程与应用,2017,53(21):72-76.
8谷新军,郭秀萍.随机混流U型拆卸线平衡排序问题多目标进化算法优化[J].运筹与管理,2017,26(9):52-61. 被引量：4
9姜洪权,王岗,高建民,高智勇,高瑞琪,郭旗.一种适用于高维非线性特征数据的聚类算法及应用[J].西安交通大学学报,2017,51(12):49-55. 被引量：12
10徐风,姚晟,纪霞,赵鹏,汪杰.基于模糊邻域粗糙集的信息系统不确定性度量方法[J].南京大学学报（自然科学版）,2017,53(5):926-936. 被引量：10

计算机科学

2018年第1期

浏览历史

内容加载中请稍等...

基于动态邻域的三支聚类分析被引量：11

参考文献1

二级参考文献1

共引文献1078

同被引文献63

引证文献11

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于动态邻域的三支聚类分析 被引量：11

参考文献1

二级参考文献1

共引文献1078

同被引文献63

引证文献11

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于动态邻域的三支聚类分析被引量：11