期刊文献+
共找到81篇文章
< 1 2 5 >
每页显示 20 50 100
基于近邻传播算法的半监督聚类 被引量:165
1
作者 肖宇 于剑 《软件学报》 EI CSCD 北大核心 2008年第11期2803-2813,共11页
提出了一种基于近邻传播(affinity propagation,简称AP)算法的半监督聚类方法.AP是在数据点的相似度矩阵的基础上进行聚类.对于规模很大的数据集,AP算法是一种快速、有效的聚类方法,这是其他传统的聚类算法所不能及的,比如:K中心聚类算... 提出了一种基于近邻传播(affinity propagation,简称AP)算法的半监督聚类方法.AP是在数据点的相似度矩阵的基础上进行聚类.对于规模很大的数据集,AP算法是一种快速、有效的聚类方法,这是其他传统的聚类算法所不能及的,比如:K中心聚类算法.但是,对于一些聚类结构比较复杂的数据集,AP算法往往不能得到很好的聚类结果.使用已知的标签数据或者成对点约束对数据形成的相似度矩阵进行调整,进而达到提高AP算法的聚类性能.实验结果表明,该方法不仅提高了AP对复杂数据的聚类结果,而且在约束对数量较多时,该方法要优于相关比对算法. 展开更多
关键词 半监督聚类 近邻传播 相似度矩阵 成对点约束 先验知识
下载PDF
密度敏感的半监督谱聚类 被引量:94
2
作者 王玲 薄列峰 焦李成 《软件学报》 EI CSCD 北大核心 2007年第10期2412-2422,共11页
聚类通常被认为是一种无监督的数据分析方法,然而在实际问题中可以很容易地获得有限的样本先验信息,如样本的成对限制信息.大量研究表明,在聚类搜索过程中充分利用先验信息会显著提高聚类算法的性能.首先分析了在聚类过程中仅利用成对... 聚类通常被认为是一种无监督的数据分析方法,然而在实际问题中可以很容易地获得有限的样本先验信息,如样本的成对限制信息.大量研究表明,在聚类搜索过程中充分利用先验信息会显著提高聚类算法的性能.首先分析了在聚类过程中仅利用成对限制信息存在的不足,尝试探索数据集本身固有的先验信息——空间一致性先验信息,并提出利用这类先验信息的具体方法.接着,将两类先验信息同时引入经典的谱聚类算法中,提出一种密度敏感的半监督谱聚类算法(density-sensitivesemi-supervisedspectralclusteringalgorithm,简称DS-SSC).两类先验信息在指导聚类搜索的过程中能够起到相辅相成的作用,这使得DS-SSC算法相对于仅利用成对限制信息的聚类算法在聚类性能上有了显著的提高.在UCI基准数据集、USPS手写体数字集以及TREC的文本数据集上的实验结果验证了这一点. 展开更多
关键词 谱聚类 半监督聚类 成对限制 先验信息
下载PDF
基于成对约束的判别型半监督聚类分析 被引量:51
3
作者 尹学松 胡思良 陈松灿 《软件学报》 EI CSCD 北大核心 2008年第11期2791-2802,共12页
现有一些典型的半监督聚类方法一方面难以有效地解决成对约束的违反问题,另一方面未能同时处理高维数据.通过提出一种基于成对约束的判别型半监督聚类分析方法来同时解决上述问题.该方法有效地利用了监督信息集成数据降维和聚类,即在投... 现有一些典型的半监督聚类方法一方面难以有效地解决成对约束的违反问题,另一方面未能同时处理高维数据.通过提出一种基于成对约束的判别型半监督聚类分析方法来同时解决上述问题.该方法有效地利用了监督信息集成数据降维和聚类,即在投影空间中使用基于成对约束的K均值算法对数据聚类,再利用聚类结果选择投影空间.同时,该算法降低了基于约束的半监督聚类算法的计算复杂度,并解决了聚类过程中成对约束的违反问题.在一组真实数据集上的实验结果表明,与现有相关半监督聚类算法相比,新方法不仅能够处理高维数据,还有效地提高了聚类性能. 展开更多
关键词 半监督聚类 成对约束 闭包中心 投影矩阵 聚类分析
下载PDF
有监督的距离度量学习算法研究进展 被引量:23
4
作者 沈媛媛 严严 王菡子 《自动化学报》 EI CSCD 北大核心 2014年第12期2673-2686,共14页
近年来,距离度量学习已成为计算机视觉和模式识别等领域最为活跃的研究课题之一.如何利用训练数据学习得到有效的距离度量来衡量目标之间的相似性是该类研究的关键问题.针对有监督的距离度量学习问题,目前已提出了大量的研究算法.结合... 近年来,距离度量学习已成为计算机视觉和模式识别等领域最为活跃的研究课题之一.如何利用训练数据学习得到有效的距离度量来衡量目标之间的相似性是该类研究的关键问题.针对有监督的距离度量学习问题,目前已提出了大量的研究算法.结合近年已发表相关文献对有监督的距离度量学习算法进行了详细的介绍和讨论.根据样本信息利用方式的不同,将其划分成基于成对约束和非成对约束的距离度量学习算法,重点介绍了一些常用的典型算法,分析了每种算法的原理和优缺点,最后是未来发展方向和趋势的展望. 展开更多
关键词 距离度量学习 马氏距离 成对约束 非成对约束
下载PDF
半监督聚类综述 被引量:18
5
作者 秦悦 丁世飞 《计算机科学》 CSCD 北大核心 2019年第9期15-21,共7页
半监督聚类是结合半监督学习与聚类分析而提出的新的学习方法,其在机器学习中得到了广泛的重视和应用。传统无监督聚类算法在划分数据时并不需要任何数据属性,但在实际应用中,存在少量带有独立类标签或成对约束的监督信息的数据样本,学... 半监督聚类是结合半监督学习与聚类分析而提出的新的学习方法,其在机器学习中得到了广泛的重视和应用。传统无监督聚类算法在划分数据时并不需要任何数据属性,但在实际应用中,存在少量带有独立类标签或成对约束的监督信息的数据样本,学者们致力于将这些为数不多的监督信息运用于聚类,以得到更优的聚类结果,从而提出了半监督聚类。文中主要介绍了半监督聚类的理论基础和算法思想,并对半监督聚类的最新研究进展进行了综述。首先,对半监督学习的研究现状和分类进行了概述,并将生成式半监督学习、半监督SVM、基于图的半监督学习和协同训练这4种分类方法进行了对比;其次,针对半监督学习的聚类进行了详细的描述,并对4种典型半监督聚类算法(Cop-Kmeans算法、LCop-Kmeans算法、Seeded-Kmeans算法和SC-Kmeans算法)的算法思想进行了分析和总结,同时对这4种算法的优缺点进行了评价;然后,按照基于约束的半监督聚类和基于距离的半监督聚类两种情况,分别对半监督聚类的研究现状进行了阐述;最后,探讨了半监督聚类在生物信息学、图像分割以及计算机其他领域内的应用以及未来的研究方向。文中旨在使初学者能够快速了解半监督聚类的进展,理解典型的算法思想,并在之后的实际应用中能起到一定的指导作用。 展开更多
关键词 半监督学习 聚类 成对约束 标签 半监督聚类 机器学习
下载PDF
基于成对约束的交叉熵半监督聚类算法 被引量:13
6
作者 李晁铭 徐圣兵 郝志峰 《模式识别与人工智能》 EI CSCD 北大核心 2017年第7期598-608,共11页
极大熵聚类(MEC)目标函数中缺乏成对约束的有效信息表达,在拥有少量成对约束的情况下,可能导致有效监督信息的浪费.在MEC的基础上,文中提出基于成对约束的交叉熵半监督聚类算法.利用样本交叉熵表达成对约束信息,并作为惩罚项引入至MEC... 极大熵聚类(MEC)目标函数中缺乏成对约束的有效信息表达,在拥有少量成对约束的情况下,可能导致有效监督信息的浪费.在MEC的基础上,文中提出基于成对约束的交叉熵半监督聚类算法.利用样本交叉熵表达成对约束信息,并作为惩罚项引入至MEC的目标函数中,通过拉格朗日最优化处理目标函数,得出聚类中心与隶属度的迭代公式.实验表明,文中算法能有效利用少量的成对约束监督信息提高聚类性能,在实际数据应用中性能较好. 展开更多
关键词 极大熵聚类(MEC) 成对约束 交叉熵 半监督聚类
下载PDF
基于PCA和半监督聚类的入侵检测算法研究 被引量:10
7
作者 丁彦 李永忠 《山东大学学报(工学版)》 CAS 北大核心 2012年第5期41-46,共6页
针对网络入侵检测数据存在大量冗余信息和传统聚类算法对离群点检测不足的问题,提出一种基于主成分分析(principal component analysis,PCA)和半监督聚类的入侵检测算法。首先使用PCA对数据进行特征提取,消除数据间的冗余属性;然后利用... 针对网络入侵检测数据存在大量冗余信息和传统聚类算法对离群点检测不足的问题,提出一种基于主成分分析(principal component analysis,PCA)和半监督聚类的入侵检测算法。首先使用PCA对数据进行特征提取,消除数据间的冗余属性;然后利用少量已标记样本和成对约束信息,通过引入竞争凝聚让系统主动学习,以实现对大量未知样本的检测。在入侵检测数据集和UCI基准数据集上的实验结果表明,该算法能有效提高系统的性能。 展开更多
关键词 入侵检测 PCA 半监督聚类 成对约束 竞争凝聚
原文传递
改进的半监督模糊聚类算法 被引量:7
8
作者 高翠芳 吴小俊 张松顺 《控制与决策》 EI CSCD 北大核心 2010年第1期115-120,共6页
针对Grira等近期提出的利用点对约束的半监督模糊聚类算法,其约束项与竞争聚类算法(CA)的目标函数之间数量级不一致,造成隶属度调整过度的问题,在重新定义目标函数的基础上提出一种改进算法,约束惩罚函数采用约束点对中两个样本新的联... 针对Grira等近期提出的利用点对约束的半监督模糊聚类算法,其约束项与竞争聚类算法(CA)的目标函数之间数量级不一致,造成隶属度调整过度的问题,在重新定义目标函数的基础上提出一种改进算法,约束惩罚函数采用约束点对中两个样本新的联合表达式,使数量级与经典模糊聚类算法一致.实验结果显示,新算法的约束项与CA目标函数之间能很好地协调合作,并能通过对模糊隶属度的适度调整,实现更准确的聚类. 展开更多
关键词 半监督模糊聚类 竞争聚类算法 点对约束 惩罚代价函数
原文传递
基于稀疏表示的半监督降维方法 被引量:8
9
作者 张春涛 郭皎 徐家良 《计算机工程与应用》 CSCD 北大核心 2011年第20期181-183,187,共4页
提出一种基于稀疏表示的半监督降维方法(SpSSDR)。不同于其他基于图的半监督降维方法分步构图,SpSSDR通过稀疏重构系数来同时定义图上边连接性及边权重,再结合边约束信息进行降维。在高维人脸数据上的实验表明,SpSSDR不仅对噪声鲁棒,对... 提出一种基于稀疏表示的半监督降维方法(SpSSDR)。不同于其他基于图的半监督降维方法分步构图,SpSSDR通过稀疏重构系数来同时定义图上边连接性及边权重,再结合边约束信息进行降维。在高维人脸数据上的实验表明,SpSSDR不仅对噪声鲁棒,对边信息的利用也更有效。 展开更多
关键词 降维 连接性与权重 稀疏表示 边约束
下载PDF
基于半监督自动谱聚类算法的网络故障检测 被引量:6
10
作者 姜大庆 夏士雄 周勇 《计算机工程与应用》 CSCD 2012年第30期89-94,共6页
针对网络故障检测中利用先验知识不足和多数谱聚类算法需事先确定聚类数的问题,提出一种新的基于成对约束信息传播与自动确定聚类数相结合的半监督自动谱聚类算法。通过学习一种新的相似性测度函数来满足约束条件,改进NJW聚类算法,对非... 针对网络故障检测中利用先验知识不足和多数谱聚类算法需事先确定聚类数的问题,提出一种新的基于成对约束信息传播与自动确定聚类数相结合的半监督自动谱聚类算法。通过学习一种新的相似性测度函数来满足约束条件,改进NJW聚类算法,对非规范化的Laplacian矩阵特征向量进行自动谱聚类,从而提高聚类性能。在UCI标准数据集和网络实测数据上的实验表明,该算法较相关比对算法聚类准确率更高,可满足网络故障检测的实际需要。 展开更多
关键词 半监督聚类 谱聚类 成对约束 相似度矩阵 自动聚类 网络故障检测
下载PDF
基于混合距离学习的鲁棒的模糊C均值聚类算法 被引量:6
11
作者 卞则康 王士同 《智能系统学报》 CSCD 北大核心 2017年第4期450-458,共9页
距离度量对模糊聚类算法FCM的聚类结果有关键性的影响。实际应用中存在这样一种场景,聚类的数据集中存在着一定量的带标签的成对约束集合的辅助信息。为了充分利用这些辅助信息,首先提出了一种基于混合距离学习方法,它能利用这样的辅助... 距离度量对模糊聚类算法FCM的聚类结果有关键性的影响。实际应用中存在这样一种场景,聚类的数据集中存在着一定量的带标签的成对约束集合的辅助信息。为了充分利用这些辅助信息,首先提出了一种基于混合距离学习方法,它能利用这样的辅助信息来学习出数据集合的距离度量公式。然后,提出了一种基于混合距离学习的鲁棒的模糊C均值聚类算法(HR-FCM算法),它是一种半监督的聚类算法。算法HR-FCM既保留了GIFP-FCM(Generalized FCM algorithm with improved fuzzy partitions)算法的鲁棒性等性能,也因为所采用更为合适的距离度量而具有更好的聚类性能。实验结果证明了所提算法的有效性。 展开更多
关键词 距离度量 FCM聚类算法 成对约束 辅助信息 混合距离 半监督 GIFP—FCM 鲁棒性
下载PDF
基于流形距离的半监督近邻传播聚类算法 被引量:6
12
作者 冯晓磊 于洪涛 《计算机应用研究》 CSCD 北大核心 2011年第10期3656-3658,3664,共4页
通过学习数据集的低维流形结构,给出一种流形距离测度;结合成对约束信息,调整数据的相似度矩阵,将其作为近邻传播算法的输入,提出了基于流形距离的半监督近邻传播聚类算法(SAP-MD)。通过在UCI标准数据集上的仿真实验表明,SAP-MD算法相... 通过学习数据集的低维流形结构,给出一种流形距离测度;结合成对约束信息,调整数据的相似度矩阵,将其作为近邻传播算法的输入,提出了基于流形距离的半监督近邻传播聚类算法(SAP-MD)。通过在UCI标准数据集上的仿真实验表明,SAP-MD算法相比于仅利用成对约束信息的聚类算法,在聚类性能上有很大提高。 展开更多
关键词 近邻传播聚类 流形学习 半监督聚类 成对约束信息 流形距离
下载PDF
半监督图核降维方法 被引量:6
13
作者 吴遐 张道强 《计算机科学与探索》 CSCD 2010年第7期629-636,共8页
基于图结构的数据表示和分析,在机器学习领域正得到越来越广泛的关注。以往研究主要集中在为图数据定义一个度量其相似性关系的核函数即图核,一旦定义出图核,就可以用标准的支持向量机(SVM)来对图数据进行分类。将图核方法进行扩充,先... 基于图结构的数据表示和分析,在机器学习领域正得到越来越广泛的关注。以往研究主要集中在为图数据定义一个度量其相似性关系的核函数即图核,一旦定义出图核,就可以用标准的支持向量机(SVM)来对图数据进行分类。将图核方法进行扩充,先利用核主成分分析(kPCA)对图核诱导的高维特征空间中的数据进行降维,得到与原始图数据相对应的低维向量表示的数据,然后对这些新得到的数据用传统机器学习方法进行分析;通过在kPCA中利用图数据中的成对约束形式的监督信息,得到基于图核的半监督降维方法。在MUTAG和PTC等标准图数据集上的实验结果验证了所提方法的有效性。 展开更多
关键词 图分类 图核 成对约束 半监督降维
下载PDF
结构复杂数据的半监督聚类 被引量:6
14
作者 黄添强 余养强 秦小麟 《控制与决策》 EI CSCD 北大核心 2010年第1期14-19,共6页
基于成对限制,提出一种半监督聚类算法(SCCD),它能够处理存在多种密度结构复杂的数据且识别任意形状的簇.利用成对限制反映的多密度分布信息计算基于密度的聚类算法(DBSCAN)的邻域半径参数Eps,并利用不同参数的DBSCAN算法处理复杂形状... 基于成对限制,提出一种半监督聚类算法(SCCD),它能够处理存在多种密度结构复杂的数据且识别任意形状的簇.利用成对限制反映的多密度分布信息计算基于密度的聚类算法(DBSCAN)的邻域半径参数Eps,并利用不同参数的DBSCAN算法处理复杂形状且密度变化的数据集.实验结果表明,SCCD算法能在噪声环境下发现任意形状且多密度的簇,性能优于已有同类算法. 展开更多
关键词 半监督聚类 多密度数据 基于密度聚类 成对限制
原文传递
成对约束的属性加权半监督模糊核聚类算法 被引量:5
15
作者 贺杨成 王士同 江南 《计算机工程与应用》 CSCD 北大核心 2011年第24期136-138,162,共4页
在机器学习和数据挖掘中,带约束的半监督聚类是一个活跃的研究领域。为了利用约束条件获得表现更优异的聚类效果,提出了一种成对约束的属性加权半监督聚类算法,该方法充分考虑了属性间的不平衡性,在传统模糊聚类算法中融合半监督学习机... 在机器学习和数据挖掘中,带约束的半监督聚类是一个活跃的研究领域。为了利用约束条件获得表现更优异的聚类效果,提出了一种成对约束的属性加权半监督聚类算法,该方法充分考虑了属性间的不平衡性,在传统模糊聚类算法中融合半监督学习机制并通过Mercer核把原始的观察空间映射到高维特征空间。实验结果表明,该算法优于相似的成对约束的竞争群算法(PCCA)。 展开更多
关键词 半监督聚类 成对约束 模糊聚类
下载PDF
一种成对约束限制的半监督文本聚类算法 被引量:5
16
作者 王纵虎 刘速 《计算机科学》 CSCD 北大核心 2016年第12期183-188,共6页
半监督聚类能利用少量标记数据来提高聚类算法性能,但大部分文本聚类算法无法直接应用成对约束等先验信息。针对文本数据高维稀疏的特点,提出了一种半监督文本聚类算法。将成对约束信息扩展后嵌入文档相似度矩阵,在此基础上根据已划分... 半监督聚类能利用少量标记数据来提高聚类算法性能,但大部分文本聚类算法无法直接应用成对约束等先验信息。针对文本数据高维稀疏的特点,提出了一种半监督文本聚类算法。将成对约束信息扩展后嵌入文档相似度矩阵,在此基础上根据已划分与未划分文档之间的统计信息逐步找出剩余未划分文本集合中密集的且与已划分聚类中心集合相似度较小的K个初始聚类中心集合,然后将剩余的相对较难区分的文档结合成对约束限制信息划分到K个初始聚类中心集合,最后通过融合成对约束违反惩罚的收敛准则函数对聚类结果进行进一步优化。算法在聚类过程中自动确定初始聚类中心集合,避免了K均值算法对初始聚类中心选择的敏感性。在几个中英文数据集上的实验结果表明,所提算法能有效地利用少量的成对约束先验信息提高聚类效果。 展开更多
关键词 聚类 半监督 向量空间模型 成对约束 文本
下载PDF
基于PSVM的主动学习肿块检测方法 被引量:3
17
作者 王颖 高新波 +1 位作者 李洁 王秀美 《计算机研究与发展》 EI CSCD 北大核心 2012年第3期572-578,共7页
肿块区域通常形态各异、差异性较大,并且与正常组织相比没有明显的区别,严重影响了肿块自动检测系统的性能.为了能够有效地提高乳腺X线图像中肿块的检测灵敏度,通过引入包含了样本间相互制约关系的具有成对约束的SVM (PSVM)算法,提出了... 肿块区域通常形态各异、差异性较大,并且与正常组织相比没有明显的区别,严重影响了肿块自动检测系统的性能.为了能够有效地提高乳腺X线图像中肿块的检测灵敏度,通过引入包含了样本间相互制约关系的具有成对约束的SVM (PSVM)算法,提出了一种基于PSVM 的主动学习机制.其中,由系统根据样本的不确定性和相互之间的特征匹配距离,主动选择应该反馈给训练集的成对样本.实验结果表明,这种基于PSVM的主动学习方法,能够充分利用样本所包含的信息,使得检测方法具有更好的推广能力和检测性能. 展开更多
关键词 计算机辅助检测 肿块检测 成对约束 成对约束支持向量机 主动学习
下载PDF
基于成对约束的主动半监督文本聚类 被引量:4
18
作者 钟将 刘龙海 梁传伟 《计算机工程》 CAS CSCD 北大核心 2011年第13期183-186,共4页
在主动选取成对约束方法的基础上,提出一种基于成对约束的主动半监督文本聚类方法。利用潜在语义索引方法对文本特征空间进行降维,在聚类过程中,采用构造的约束选取方法主动地选取成对约束信息,并利用选取的成对约束信息指导文本聚类。... 在主动选取成对约束方法的基础上,提出一种基于成对约束的主动半监督文本聚类方法。利用潜在语义索引方法对文本特征空间进行降维,在聚类过程中,采用构造的约束选取方法主动地选取成对约束信息,并利用选取的成对约束信息指导文本聚类。实验结果表明,该方法能利用少量的监督信息提高文本聚类的分类准确率。 展开更多
关键词 文本聚类 半监督聚类 潜在语义索引 成对约束
下载PDF
基于半监督聚类方法的管道运行状态识别研究
19
作者 方明月 冯早 朱雪峰 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期435-445,共11页
目前工业现场采集的大部分数据缺失标记信息,若仅使用其中的标记数据和未标记数据的局部信息会造成学习器的性能下降,而传统半监督学习对标记数据的利用具有随机性且没有考虑监督信息数量的变化对性能的影响.针对上述问题,提出一种主动... 目前工业现场采集的大部分数据缺失标记信息,若仅使用其中的标记数据和未标记数据的局部信息会造成学习器的性能下降,而传统半监督学习对标记数据的利用具有随机性且没有考虑监督信息数量的变化对性能的影响.针对上述问题,提出一种主动学习策略下基于最小生成树的变分贝叶斯推理半监督高斯混合模型,利用主动学习策略在标记信息中重新筛选构建高质量成对约束信息,利用最小生成树聚类来初始化模型参数,提升模型在标记样本数量受扰动时的鲁棒性.选用实验室采集的管道状态检测数据集对提出的模型进行验证,实验结果表明,当标记样本占总体样本的比例从50%下降到10%时,提出的组合模型的预测准确率依旧保持在72.4%以上,而且,当某一类别的样本完全失去监督信息时,该组合模型的聚类效果仍然可以分析判断数据类别的所属类型. 展开更多
关键词 半监督聚类 主动学习策略 高斯混合模型 成对约束
下载PDF
基于半监督聚类方法的测试用例选择技术 被引量:4
20
作者 程雪梅 杨秋辉 +1 位作者 翟宇鹏 陈伟 《计算机科学》 CSCD 北大核心 2018年第1期249-254,共6页
回归测试的目的是保证软件修改后没有引入新的错误。但是随着软件的演化,回归测试用例集不断增大,为了控制成本,回归测试用例选择技术应运而生。近年来,聚类分析技术被运用到回归测试用例选择问题中。将半监督学习引入到聚类技术中,提... 回归测试的目的是保证软件修改后没有引入新的错误。但是随着软件的演化,回归测试用例集不断增大,为了控制成本,回归测试用例选择技术应运而生。近年来,聚类分析技术被运用到回归测试用例选择问题中。将半监督学习引入到聚类技术中,提出了判别型半监督K-means聚类方法(Discriminative Semi-supervised K-means clustering Method,DSKM)。该方法从回归测试的历史执行记录中挖掘出隐藏的成对约束信息,同时利用大量的无标签样本和少量的有标签样本进行学习,优化聚类的结果,并进一步优化测试用例选择的结果。实验表明,相对于ConstrainedKmeans方法和SSKM方法,DSKM方法能够更好地提高约简率并保持覆盖率。 展开更多
关键词 回归测试 测试用例选择 K-MEANS算法 成对约束 线性判别分析 半监督聚类
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部