期刊文献+
共找到131篇文章
< 1 2 7 >
每页显示 20 50 100
聚类集成中的差异性度量研究 被引量:36
1
作者 罗会兰 孔繁胜 李一啸 《计算机学报》 EI CSCD 北大核心 2007年第8期1315-1324,共10页
集体的差异性被认为是影响集成学习的一个关键因素.在分类器集成中有许多的差异性度量被提出,但是在聚类集成中如何测量聚类集体的差异性,目前研究得很少.作者研究了7种聚类集体差异性度量方法,并通过实验研究了这7种度量在不同的平均... 集体的差异性被认为是影响集成学习的一个关键因素.在分类器集成中有许多的差异性度量被提出,但是在聚类集成中如何测量聚类集体的差异性,目前研究得很少.作者研究了7种聚类集体差异性度量方法,并通过实验研究了这7种度量在不同的平均成员聚类准确度、不同的集体大小和不同的数据分布情况下与各种聚类集成算法性能之间的关系.实验表明:这些差异性度量与聚类集成性能间并没有单调关系,但是在平均成员准确度较高、聚类集体大小适中和数据中有均匀簇分布的情况下,它们与集成性能间的相关度还是比较高的.最后给出了一些差异性度量用于指导聚类集体生成的可行性建议. 展开更多
关键词 集成学习 聚类集成 差异性 度量
下载PDF
聚类融合方法综述 被引量:28
2
作者 阳琳贇 王文渊 《计算机应用研究》 CSCD 北大核心 2005年第12期8-10,14,共4页
在分类算法和回归模型中,正广泛而且成功地使用着融合方法,该方法能克服分类、回归中的不稳定性,并给出较好的结果。在非监督机器学习领域,由于缺乏数据集的先验知识,所以分类和回归中的融合方法就不能直接用于聚类算法,这导致了该领域... 在分类算法和回归模型中,正广泛而且成功地使用着融合方法,该方法能克服分类、回归中的不稳定性,并给出较好的结果。在非监督机器学习领域,由于缺乏数据集的先验知识,所以分类和回归中的融合方法就不能直接用于聚类算法,这导致了该领域中对融合方法研究的起步较晚;近几年的研究和实验表明,聚类融合方法能很好地提高聚类算法的鲁棒性和稳定性。对近年来聚类融合的方法进行了综述,阐述了近年来对聚类融合方法进行研究的主要内容与特点,并讨论了聚类融合方法的研究方向。 展开更多
关键词 聚类融合 数据重抽样 共识函数 差异度
下载PDF
基于聚类融合的不平衡数据分类方法 被引量:28
3
作者 陈思 郭躬德 陈黎飞 《模式识别与人工智能》 EI CSCD 北大核心 2010年第6期772-780,共9页
不平衡数据分类问题目前已成为数据挖掘和机器学习的研究热点.文中提出一类基于聚类融合的不平衡数据分类方法,旨在解决传统分类方法对少数类的识别率较低的问题.该方法通过引入"聚类一致性系数"找出处于少数类边界区域和处... 不平衡数据分类问题目前已成为数据挖掘和机器学习的研究热点.文中提出一类基于聚类融合的不平衡数据分类方法,旨在解决传统分类方法对少数类的识别率较低的问题.该方法通过引入"聚类一致性系数"找出处于少数类边界区域和处于多数类中心区域的样本,并分别使用改进的SMOTE过抽样方法和改进的随机欠抽样方法对训练集的少数类和多数类进行不同的处理,以改善不同类数据的平衡度,为分类算法提供更好的训练平台.通过实验对比8种方法在一些公共数据集上的分类性能,结果表明该方法对少数类和多数类均具有较高的识别率. 展开更多
关键词 不平衡数据 聚类融合 过抽样 欠抽样
原文传递
一种不完备混合数据集成聚类算法 被引量:20
4
作者 史倩玉 梁吉业 赵兴旺 《计算机研究与发展》 EI CSCD 北大核心 2016年第9期1979-1989,共11页
集成聚类技术由于具有较好的泛化能力,目前引起了研究者的高度关注.已有研究主要关注数值型完备数据的集成聚类问题.然而,实际应用中面临的数据往往是兼具数值属性和分类属性共同描述的混合型数据,而且通常带有缺失值.为此,针对不完备... 集成聚类技术由于具有较好的泛化能力,目前引起了研究者的高度关注.已有研究主要关注数值型完备数据的集成聚类问题.然而,实际应用中面临的数据往往是兼具数值属性和分类属性共同描述的混合型数据,而且通常带有缺失值.为此,针对不完备混合数据提出了一种集成聚类算法,首先利用3种缺失值填充方法对不完备混合数据进行完备化处理;其次在3种填充后的不同完备数据集上分别多次执行K-Prototypes算法产生基聚类结果;最后对基聚类结果进行集成.在UCI真实数据集上与传统聚类算法通过实验进行了比较分析,实验结果表明提出的算法是有效的. 展开更多
关键词 集成聚类 不完备数据 混合数据 缺失值填充 K原型聚类算法
下载PDF
基于大型数据集的聚类算法研究 被引量:17
5
作者 杜淑颖 《软件》 2016年第1期132-135,138,共5页
就精确系数不算太严格的情况而言,针对各种大型数据集,通过对比各种聚类算法,提出了一种部分优先聚类算法。然后在此基础之上分析研究聚类成员的产生过程与聚类融合方式,通过设计共识函数并利用加权方式确定类中心,在部分优先聚类算法... 就精确系数不算太严格的情况而言,针对各种大型数据集,通过对比各种聚类算法,提出了一种部分优先聚类算法。然后在此基础之上分析研究聚类成员的产生过程与聚类融合方式,通过设计共识函数并利用加权方式确定类中心,在部分优先聚类算法的基础上进行聚类融合,从而使算法的计算准度加以提升。通过不断的实验,我们可以感受到优化之后算法的显著优势,这不仅体现在其可靠性,同时在其稳定性以及扩展性、鲁棒性等方面都得到了很好的展现。 展开更多
关键词 部分优先聚类算法 聚类融合 效率 精度
下载PDF
基于非负矩阵分解的谱聚类集成SAR图像分割 被引量:16
6
作者 邓晓政 焦李成 卢山 《电子学报》 EI CAS CSCD 北大核心 2011年第12期2905-2909,共5页
本文提出了一种新颖的基于非负矩阵分解的谱聚类集成SAR图像分割框架.首先,个体分割结果的产生采用基于Nystrom逼近的谱聚类方法,使用不同的尺度参数,得到具有差异性的个体分割结果;其次,使用非负矩阵分解的方法来合并这些个体分割结果... 本文提出了一种新颖的基于非负矩阵分解的谱聚类集成SAR图像分割框架.首先,个体分割结果的产生采用基于Nystrom逼近的谱聚类方法,使用不同的尺度参数,得到具有差异性的个体分割结果;其次,使用非负矩阵分解的方法来合并这些个体分割结果,使用非负矩阵分解方法的优点在于其合乎人类大脑感知的直观体验,并具有明确的物理含义;最后,根据合并得到的像素点隶属度关系得到SAR图像分割结果.为了验证本文方法的有效性,对3幅纹理图像和4幅SAR图像进行分割实验,并对比K-means方法、基于Nystrom逼近的谱聚类方法、Meta-clustering方法,本文的方法无论是定性还是定量分析都是较好的,并具有一定的实用性. 展开更多
关键词 合成孔径雷达 图像分割 聚类集成 谱聚类 非负矩阵分解
下载PDF
基于聚类融合技术的电力用户负荷模式提取方法 被引量:16
7
作者 李玉娇 黄青平 +2 位作者 刘松 陈雨 刘鹏 《电测与仪表》 北大核心 2018年第16期137-141,152,共6页
针对电力大数据背景下智能电力用户负荷模式提取的可靠性不高且传统单一聚类算法聚类结果不稳定的问题,提出一种基于主成分分析与聚类融合相结合的电力用户负荷模式提取方法。首先,对负荷数据进行预处理,通过主成分分析法减少特征间分... 针对电力大数据背景下智能电力用户负荷模式提取的可靠性不高且传统单一聚类算法聚类结果不稳定的问题,提出一种基于主成分分析与聚类融合相结合的电力用户负荷模式提取方法。首先,对负荷数据进行预处理,通过主成分分析法减少特征间分类信息冗余实现高维特征的降维。然后,用四种聚类方法分别对降维后的数据集进行聚类分析,得到具有差异性的聚类成员。最后,利用共识矩阵对所得聚类成员进行聚类融合,得到优于单一聚类算法的最终聚类结果。通过电网实际用电数据验证了所提负荷模式提取方法能够提高聚类准确率并降低计算复杂性,并用有效性指标Silhouette对最终聚类结果进行评价。 展开更多
关键词 聚类融合 电力用户 负荷模式 模式提取 评价指标
下载PDF
基于密度峰值的聚类集成 被引量:15
8
作者 褚睿鸿 王红军 +1 位作者 杨燕 李天瑞 《自动化学报》 EI CSCD 北大核心 2016年第9期1401-1412,共12页
聚类集成的目的是为了提高聚类结果的准确性、稳定性和鲁棒性.通过集成多个基聚类结果可以产生一个较优的结果.本文提出了一个基于密度峰值的聚类集成模型,主要完成三个方面的工作:1)在研究已有的各聚类集成算法和模型后发现各基聚类结... 聚类集成的目的是为了提高聚类结果的准确性、稳定性和鲁棒性.通过集成多个基聚类结果可以产生一个较优的结果.本文提出了一个基于密度峰值的聚类集成模型,主要完成三个方面的工作:1)在研究已有的各聚类集成算法和模型后发现各基聚类结果可以用密度表示;2)使用改进的最大信息系数(Rapid computation of the maximal information coefficient,Rapid Mic)表示各基聚类结果之间的相关性,使用这种相关性来衡量原始数据在经过基聚类器聚类后相互之间的密度关系;3)改进密度峰值(Density peaks,DP)算法进行聚类集成.最后,使用一些标准数据集对所设计的模型进行评估.实验结果表明,相比经典的聚类集成模型,本文提出的模型聚类集成效果更佳. 展开更多
关键词 聚类集成 近邻传播 密度峰值 相似性矩阵
下载PDF
考虑簇间重叠关系的负荷曲线多重聚类集成算法 被引量:8
9
作者 孙玉芹 王松雷 +3 位作者 黄冬梅 孙园 胡安铎 孙锦中 《电网技术》 EI CSCD 北大核心 2022年第5期1982-1989,共8页
负荷聚类用于对负荷种类进行划分,从而制定节能策略,有助于实现“碳达峰、碳中和”。基于现有算法的不足,该文提出一种考虑簇间重叠关系的负荷曲线多重聚类集成算法。首先利用人工定义的层次聚类划分中心构造标签可信空间,以评判层次聚... 负荷聚类用于对负荷种类进行划分,从而制定节能策略,有助于实现“碳达峰、碳中和”。基于现有算法的不足,该文提出一种考虑簇间重叠关系的负荷曲线多重聚类集成算法。首先利用人工定义的层次聚类划分中心构造标签可信空间,以评判层次聚类算法的标签可信度,进而形成多重可信簇;其次基于潜在簇和潜在聚类中心的概念,利用同时考虑负荷曲线数值和形态特性的相似度度量函数构建可信簇的簇间相似矩阵,最后使用谱聚类作为最终集成手段完成标签的对齐,得到最终聚类结果。该文算法与层次聚类和谱聚类算法的结果对比表明,该文在轮廓系数S,戴维森堡丁指标D和Calinski-Harabaz指标H上均有较好表现,且拥有更为合理的曲线聚类图像,从而验证了算法的有效性。 展开更多
关键词 智能电网 负荷聚类 层次聚类 谱聚类 聚类集成 局部假设
下载PDF
基于多模型聚类集成的锅炉烟气NO_x排放量预测模型 被引量:10
10
作者 甄成刚 刘怀远 《热力发电》 CAS 北大核心 2019年第4期33-40,共8页
电站锅炉烟气NO_x排放量的预测控制对电站的经济效益和环境污染治理有重要影响。为了提高NO_x排放量预测模型的精度,本文提出了一种基于多模型聚类集成的锅炉烟气NO_x排放量建模方法。首先根据输出NO_x排放量的高低划分数据空间,通过基... 电站锅炉烟气NO_x排放量的预测控制对电站的经济效益和环境污染治理有重要影响。为了提高NO_x排放量预测模型的精度,本文提出了一种基于多模型聚类集成的锅炉烟气NO_x排放量建模方法。首先根据输出NO_x排放量的高低划分数据空间,通过基于相关性分析的变量权重和基于信息熵的分层聚类确定参与聚类的变量,然后利用提出的多模型聚类集成(VMSC)算法聚类得到各子空间的隶属度矩阵,最后采用融合隶属度的最小二乘法对各子空间的最小二乘支持向量机(LS-SVM)模型进行集成。仿真结果表明,通过集成模糊C均值聚类(FCM)和有监督的遗传算法-软模糊聚类(GA-SFCM)的VMSC算法提高了建模的精度,比单一模型的仿真性能更好。 展开更多
关键词 多模型 聚类集成 GA-SFCM LS-SVM 有监督模糊聚类 NOX排放量
下载PDF
基于聚类融合的混合属性数据增量聚类算法 被引量:9
11
作者 李桃迎 陈燕 +1 位作者 张金松 秦胜君 《控制与决策》 EI CSCD 北大核心 2012年第4期603-608,共6页
针对传统增量聚类方法对混合属性数据聚类时存在不稳定、随机性大和准确性不够高的缺点,提出一种基于聚类融合的混合属性数据增量聚类算法.该算法以传统增量聚类为基础,采用多种聚类算法的结果进行融合来代替原有单一划分,并重新修正了... 针对传统增量聚类方法对混合属性数据聚类时存在不稳定、随机性大和准确性不够高的缺点,提出一种基于聚类融合的混合属性数据增量聚类算法.该算法以传统增量聚类为基础,采用多种聚类算法的结果进行融合来代替原有单一划分,并重新修正了阈值的取值范围.实验表明,所提出的算法利用原有数据的特征,提高了聚类的稳定性和精确性,具有很好的聚类效果. 展开更多
关键词 聚类融合 增量聚类 矢量量化 模糊κ-均值
原文传递
Adaptive Spectral Clustering Ensemble Selection via Resampling and Population-Based Incremental Learning Algorithm 被引量:5
12
作者 XU Yuanchun JIA Jianhua 《Wuhan University Journal of Natural Sciences》 CAS 2011年第3期228-236,共9页
In this paper, we explore a novel ensemble method for spectral clustering. In contrast to the traditional clustering ensemble methods that combine all the obtained clustering results, we propose the adaptive spectral ... In this paper, we explore a novel ensemble method for spectral clustering. In contrast to the traditional clustering ensemble methods that combine all the obtained clustering results, we propose the adaptive spectral clustering ensemble method to achieve a better clustering solution. This method can adaptively assess the number of the component members, which is not owned by many other algorithms. The component clusterings of the ensemble system are generated by spectral clustering (SC) which bears some good characteristics to engender the diverse committees. The selection process works by evaluating the generated component spectral clustering through resampling technique and population-based incremental learning algorithm (PBIL). Experimental results on UCI datasets demonstrate that the proposed algorithm can achieve better results compared with traditional clustering ensemble methods, especially when the number of component clusterings is large. 展开更多
关键词 spectral clustering clustering ensemble selective ensemble RESAMPLING population-based incremental learning algorithm (PBIL) data clustering
原文传递
一种三层加权文本聚类集成方法
13
作者 李娜 徐森 +4 位作者 徐秀芳 许贺洋 郭乃瑄 刘轩绮 周天 《智能系统学报》 CSCD 北大核心 2024年第4期807-816,共10页
为了提高聚类集成效果,本文设计了一种对点、簇、划分进行加权的统一框架,提出一种三层加权文本聚类集成方法。首先根据基聚类生成超图邻接矩阵,然后依次对点、簇、划分进行加权获得加权邻接矩阵,最后用层次凝聚聚类算法获得最终结果。... 为了提高聚类集成效果,本文设计了一种对点、簇、划分进行加权的统一框架,提出一种三层加权文本聚类集成方法。首先根据基聚类生成超图邻接矩阵,然后依次对点、簇、划分进行加权获得加权邻接矩阵,最后用层次凝聚聚类算法获得最终结果。在多个真实文本数据集上进行实验,结果表明,与未加权及其他层面加权相比,三层加权方法可以获得更好的聚类效果,三层加权相较于未加权的平均提升幅度为12.02%;与近年来的其他8种加权方法相比,该方法在所有数据集上的平均排名位列第一,验证了本文方法的有效性。 展开更多
关键词 文本聚类 聚类集成 加权聚类集成 三层加权 加权聚类 多层加权 聚类分析 无监督学习
下载PDF
云计算下基于改进遗传算法的聚类融合算法 被引量:9
14
作者 徐占洋 郑克长 《计算机应用》 CSCD 北大核心 2018年第2期458-463,共6页
针对无监督聚类缺少数据分类等先验信息、基聚类的准确性受聚类算法影响以及一般聚类融合算法空间复杂度高的问题,提出一种基于改进遗传算法的聚类融合算法(CEIGA);同时针对传统聚类融合算法已经不能满足大规模数据处理对于时间的要求... 针对无监督聚类缺少数据分类等先验信息、基聚类的准确性受聚类算法影响以及一般聚类融合算法空间复杂度高的问题,提出一种基于改进遗传算法的聚类融合算法(CEIGA);同时针对传统聚类融合算法已经不能满足大规模数据处理对于时间的要求的问题,提出一种云计算下使用Hadoop平台的基于改进遗传算法的并行聚类融合算法(PCEIGA)。首先,基聚类生成机制产生的基聚类划分在完成簇标签转化后进行基因编码作为遗传算法的初始种群。其次,通过改进遗传算法的选择算子,保证基聚类的多样性;再根据改进的选择算子对染色体进行交叉和变异操作并使用精英策略得到下一代种群,保证基聚类的准确性。如此循环,使聚类融合最终结果达到全局最优,提高算法准确度。通过设计两个Map Reduce过程并加入Combine过程减少节点通信,提高算法运行效率。最后,在UCI数据集上比较了CEIGA、PCEIGA和四个先进的聚类融合算法。实验结果表明,与先进的聚类融合算法相比,CEIGA性能最好;而PCEIGA能在不影响聚类结果准确度的前提下明显降低算法运行时间,提高算法效率。 展开更多
关键词 云计算 遗传算法 聚类融合 选择算子 并行
下载PDF
一种改进的多视图聚类集成算法 被引量:8
15
作者 邓强 杨燕 王浩 《计算机科学》 CSCD 北大核心 2017年第1期65-70,共6页
近年来,针对大数据的数据挖掘技术和机器学习算法研究变得日趋重要。在聚类领域,随着多视图数据的大量出现,多视图聚类已经成为了一类重要的聚类方法。然而,大多数现有的多视图聚类算法受算法参数设置、数据样本等影响,具有聚类结果不... 近年来,针对大数据的数据挖掘技术和机器学习算法研究变得日趋重要。在聚类领域,随着多视图数据的大量出现,多视图聚类已经成为了一类重要的聚类方法。然而,大多数现有的多视图聚类算法受算法参数设置、数据样本等影响,具有聚类结果不稳定、参数需要反复调节等缺点。基于多视图K-means算法和聚类集成技术,提出了一种改进的多视图聚类集成算法,其提高了聚类的准确性、鲁棒性和稳定性。其次,由于单机环境下的多视图聚类算法难以对海量的数据进行处理,结合分布式处理技术,实现了一种分布式的多视图并行聚类算法。实验证明,并行算法在处理大数据时的时间效率有很大提升,适合于大数据环境下的多视图聚类分析。 展开更多
关键词 多视图聚类 聚类集成 分布式计算 并行化
下载PDF
一种融合多特征聚类集成的室内点云分割方法 被引量:8
16
作者 曾碧 黄文 《计算机工程》 CAS CSCD 北大核心 2018年第3期281-286,共6页
针对特定场景下传统点云分割算法不精确及特征描述不全面的问题,提出一种融合2D和3D多特征的近邻传播(AP)聚类集成分割方法。从点云中获得一组表征复杂室内场景不同点云类别的描述子,如彩色图像特征、曲率、法向量、旋转图像等,根据它... 针对特定场景下传统点云分割算法不精确及特征描述不全面的问题,提出一种融合2D和3D多特征的近邻传播(AP)聚类集成分割方法。从点云中获得一组表征复杂室内场景不同点云类别的描述子,如彩色图像特征、曲率、法向量、旋转图像等,根据它们之间的差异性,通过对每类特征进行AP聚类得到聚类成员,建立聚类成员簇间一致性矩阵,并利用Ncut算法进行图分割获得最终的点云分割结果。实验结果表明,该算法相较传统的点云分割算法能更准确地区分室内复杂三维点云场景,并且具有更好的稳定性。 展开更多
关键词 点云分割 特征融合 近邻传播聚类算法 聚类成员 聚类集成
下载PDF
基于MapReduce的K-means聚类集成 被引量:8
17
作者 冀素琴 石洪波 《计算机工程》 CAS CSCD 2013年第9期84-87,共4页
针对传统聚类算法难以高效进行海量数据聚类分析的问题,提出一种基于MapReduce框架的K-means聚类集成算法。利用K-means算法生成不同聚簇数目的基聚类结果,改进共协关系矩阵,依据数据点对出现次数进行集成,自动得出最终聚类结果。实验... 针对传统聚类算法难以高效进行海量数据聚类分析的问题,提出一种基于MapReduce框架的K-means聚类集成算法。利用K-means算法生成不同聚簇数目的基聚类结果,改进共协关系矩阵,依据数据点对出现次数进行集成,自动得出最终聚类结果。实验结果表明,该算法能够有效地改善聚类质量,具有良好的扩展性,适用于海量数据的聚类分析。 展开更多
关键词 海量数据 聚类 MAPREDUCE框架 K—means算法 共协关系矩阵 聚类集成
下载PDF
基于群体智慧的簇连接聚类集成算法 被引量:7
18
作者 张恒山 高宇坤 +1 位作者 陈彦萍 王忠民 《计算机研究与发展》 EI CSCD 北大核心 2018年第12期2611-2619,共9页
利用群体智慧原理,将多个相互独立的聚类算法的结果进行聚合,将显著提高聚类结果的准确性.基于群体智慧的簇连接聚类集成算法,首先使用群体智慧理论的独立性、分散性、多样性原则引导个体聚类结果的生成,然后提出基于连接三元组的聚类... 利用群体智慧原理,将多个相互独立的聚类算法的结果进行聚合,将显著提高聚类结果的准确性.基于群体智慧的簇连接聚类集成算法,首先使用群体智慧理论的独立性、分散性、多样性原则引导个体聚类结果的生成,然后提出基于连接三元组的聚类集成算法对个体聚类结果进行分组聚合,将分组聚合的结果再次进行聚合得到最终的聚类结果.该算法的优点包括:1)通过簇的分组和权重调整,避免了对基聚类生成的簇进行选择,有利于充分利用已生成簇的信息;2)采用连接三元组算法计算数据之间的相似性,可以充分挖掘数据点之间的关系.对不同数据集的实验研究表明:该算法相对传统的集成聚类算法以及群体智慧与机器学习相结合的集成聚类算法,可以进一步提高集成聚类结果的准确性. 展开更多
关键词 群体智慧 聚类集成 连接三元组 聚类集成选择 数据挖掘
下载PDF
一种基于聚类融合欠抽样的不平衡数据分类方法 被引量:7
19
作者 张枭山 罗强 《计算机科学》 CSCD 北大核心 2015年第B11期63-66,共4页
在面对现实中广泛存在的不平衡数据分类问题时,大多数传统分类算法假定数据集类分布是平衡的,分类结果偏向多数类,效果不理想。为此,提出了一种基于聚类融合欠抽样的改进AdaBoost分类算法。该算法首先进行聚类融合,根据样本权值从每个... 在面对现实中广泛存在的不平衡数据分类问题时,大多数传统分类算法假定数据集类分布是平衡的,分类结果偏向多数类,效果不理想。为此,提出了一种基于聚类融合欠抽样的改进AdaBoost分类算法。该算法首先进行聚类融合,根据样本权值从每个簇中抽取一定比例的多数类和全部的少数类组成平衡数据集。使用AdaBoost算法框架,对多数类和少数类的错分类给予不同的权重调整,选择性地集成分类效果较好的几个基分类器。实验结果表明,该算法在处理不平衡数据分类上具有一定的优势。 展开更多
关键词 机器学习 不平衡数据 聚类融合 欠抽样 集成学习
下载PDF
基于三阶张量的大规模数据谱聚类集成算法
20
作者 仵匀政 杜韬 +2 位作者 周劲 陈迪 王心耕 《大数据》 2024年第3期133-148,共16页
为了降低大规模数据谱聚类计算负担,进一步提高聚类的准确性和鲁棒性,提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先,提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵;然后将稀疏亲和子矩阵表示为二部图,通过图... 为了降低大规模数据谱聚类计算负担,进一步提高聚类的准确性和鲁棒性,提出了一种基于三阶张量的大规模数据谱聚类集成算法。首先,提出一种混合代表最近邻近似方法构造数据间的稀疏亲和子矩阵;然后将稀疏亲和子矩阵表示为二部图,通过图分割的方法得到初步聚类结果;最后,提出三阶张量集成方法,将多个聚类结果进行融合,得到最终的聚类结果。在大规模的真实数据集和合成数据集上验证,相较经典的谱聚类算法、聚类集成算法以及近年来对其改进的算法,该算法表现出更优异的性能。 展开更多
关键词 数据聚类 大规模数据 谱聚类 三阶张量 聚类集成
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部