期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
侵蚀聚类
1
作者 杜明晶 吴福玉 +1 位作者 李宇蕊 董永权 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3459-3471,共13页
基于密度的聚类是一种经典的聚类分析方法,它能够在不指定类簇数目的情况下发现非球形类簇.但真实复杂数据集中存在类簇边界模糊、数据密度不均、数据分布复杂等问题.当前,能够同时应对这三种问题的研究工作相对较少.对此,本文从自然世... 基于密度的聚类是一种经典的聚类分析方法,它能够在不指定类簇数目的情况下发现非球形类簇.但真实复杂数据集中存在类簇边界模糊、数据密度不均、数据分布复杂等问题.当前,能够同时应对这三种问题的研究工作相对较少.对此,本文从自然世界的侵蚀现象中汲取灵感,提出侵蚀聚类(Erosion Clustering,EC)算法.本算法引入动态密度估计方法和侵蚀策略,逐层识别和剔除位于类簇边界上的数据,进而发现各个类簇潜在的核心区域;采用基于互可达图的聚类方法实现核心区域的聚类;设计基于局部密度峰值的分配方式完成边界数据的划分.在12个基准数据集上的实验结果表明,EC算法的聚类性能比7种对比算法分别在修正兰德指标、修正互信息、F1分数上平均提高了96%、53%和36%. 展开更多
关键词 密度聚类 聚类分析 密度估计 局部密度峰值 k近邻 侵蚀策略
下载PDF
基于三种近邻网络的聚类算法研究
2
作者 马闯 吴涛 段梦雅 《佳木斯大学学报(自然科学版)》 CAS 2014年第5期779-782,共4页
根据K近邻、共享K近邻和互K近邻三种近邻算法的思想分别构造复杂网络,然后通过复杂网络的社团发现算法来实现对样本的聚类.最后,将三种方法分别在人工构造的非凸类簇数据集和UCI数据集上进行仿真实验,结果表明三种方法都是可行的,且互K... 根据K近邻、共享K近邻和互K近邻三种近邻算法的思想分别构造复杂网络,然后通过复杂网络的社团发现算法来实现对样本的聚类.最后,将三种方法分别在人工构造的非凸类簇数据集和UCI数据集上进行仿真实验,结果表明三种方法都是可行的,且互K近邻网络聚类方法还具有识别一定数量孤立点功能. 展开更多
关键词 k近邻 共享k近邻 k近邻 社团发现 聚类
下载PDF
基于RSKNN分类改进算法
3
作者 兰天 郭躬德 《计算机系统应用》 2013年第12期85-92,共8页
RSKNN算法是K近邻算法的一种改进算法,该算法基于变精度粗糙集理论,能在保证一定分类精度的前提下,有效地降低分类样本的计算量,并且提高计算效率和分类精度.由于RSKNN算法对属性的依赖度较高,在分类时容易受到伪近邻的影响,导致RSKNN... RSKNN算法是K近邻算法的一种改进算法,该算法基于变精度粗糙集理论,能在保证一定分类精度的前提下,有效地降低分类样本的计算量,并且提高计算效率和分类精度.由于RSKNN算法对属性的依赖度较高,在分类时容易受到伪近邻的影响,导致RSKNN算法的分类精度受到一定程度的影响.针对存在问题,本文提出一种新颖的基于RSKNN算法的改进算法SMwRSKNN,该算法在RSKNN算法的基础上引入类别子空间的思想,以降低冗余属性和伪近邻对分类的影响.在UCI公共数据集上的实验结果表明,SMwRSKNN算法比RSKNN算法具有更高的分类精度. 展开更多
关键词 变精度粗糙集 类别上 下近似 k近邻 类别子空间
下载PDF
基于互K近邻图的自动图像标注与快速求解算法 被引量:5
4
作者 郭玉堂 《计算机科学》 CSCD 北大核心 2011年第2期277-280,共4页
图像语义具有模糊性、复杂性、抽象性等特点,在提取图像语义时仅用低层特征进行描述是不够的,需要结合图像相关内容,以便提高图像标注的精确度。为此,提出了基于互K近邻图的图像标注方法,该方法用一个互K近邻图融合了图像的低层特征之... 图像语义具有模糊性、复杂性、抽象性等特点,在提取图像语义时仅用低层特征进行描述是不够的,需要结合图像相关内容,以便提高图像标注的精确度。为此,提出了基于互K近邻图的图像标注方法,该方法用一个互K近邻图融合了图像的低层特征之间、标注词之间以及图像与标注词间的相互关系。利用互K近邻图实现了根据两个节点间的相互关系来提取语义信息,弥补了基于K近邻图的方法中单方向挖掘节点信息的不足,有效地提高了图像标注的性能。在对互K近邻图结构分析的基础上,结合重启随机游走,提出了一种快速求解算法,该算法在不明显降低图像标注精度下,实现了快速求解。在Corel图像数据集上进行了实验,结果验证了所提方法的有效性。 展开更多
关键词 图像标注 k近邻 重启随机游走 快速求解
下载PDF
SMwKnn:基于类别子空间距离加权的互k近邻算法 被引量:7
5
作者 卢伟胜 郭躬德 +1 位作者 严宣辉 陈黎飞 《计算机科学》 CSCD 北大核心 2014年第2期166-169,共4页
互k最近邻算法(mKnnc)是k最近邻分类算法(Knn)的一种改进算法,该算法用互k最近邻原则对训练样本以及k最近邻进行噪声消除,从而提高算法的分类效果。然而在利用互k最近邻原则进行噪声消除时,并没有将类别属性考虑进去,因此有可能把真实... 互k最近邻算法(mKnnc)是k最近邻分类算法(Knn)的一种改进算法,该算法用互k最近邻原则对训练样本以及k最近邻进行噪声消除,从而提高算法的分类效果。然而在利用互k最近邻原则进行噪声消除时,并没有将类别属性考虑进去,因此有可能把真实有效的数据当成噪声消除掉,从而影响分类效果。基于类别子空间距离加权的互k最近邻算法考虑到近邻的距离权重,既能消除冗余或无用属性对最近邻分类算法依赖的相似性度量的影响,又能较好地消除邻居中的噪声点。最后在UCI公共数据集上的实验结果验证了该算法的有效性。 展开更多
关键词 类别子空间 k近邻 距离加权 子空间
下载PDF
GwMKnn:针对类属性数据加权的MKnn算法 被引量:1
6
作者 陈雪云 郭躬德 +1 位作者 陈黎飞 卢伟胜 《计算机系统应用》 2013年第8期103-108,158,共7页
互k近邻MKnn算法是k-近邻算法的一种有效改进算法,但其对类属性数据通常采用属性值相同为0,不同为1的方法处理,从而在类属性数据较多的数据集上分类效率受到一定程度的抑制.针对MKnn对类属性数据处理方法的不足,对类属性数据的处理引进... 互k近邻MKnn算法是k-近邻算法的一种有效改进算法,但其对类属性数据通常采用属性值相同为0,不同为1的方法处理,从而在类属性数据较多的数据集上分类效率受到一定程度的抑制.针对MKnn对类属性数据处理方法的不足,对类属性数据的处理引进类别基尼系数的概念,对同类样本,用基尼系数统计某一类属性中不同值分布对这个类的贡献度作为此类属性的权重,并以此作为估算不同样本之间的相似性对MKnn进行优化,扩宽MKnn的使用面.实验结果验证了该方法的有效性. 展开更多
关键词 类属性数据 k-近邻 k-近邻 基尼系数
下载PDF
GSwMKnn:基于类别基尼系数子空间的加权互K近邻算法 被引量:1
7
作者 陈雪云 卢伟胜 《计算机系统应用》 2014年第2期137-141,132,共6页
在高维数据空间中,存在大量冗余或无用的属性,这使得在子空间中寻找目标类更为有效.为此文章提出基于类别基尼系数子空间的加权互k近邻算法,利用类别基尼系数求出其对应的软子空间并将待分类样本和训练样本投影到各个类别子空间中,再在... 在高维数据空间中,存在大量冗余或无用的属性,这使得在子空间中寻找目标类更为有效.为此文章提出基于类别基尼系数子空间的加权互k近邻算法,利用类别基尼系数求出其对应的软子空间并将待分类样本和训练样本投影到各个类别子空间中,再在各软子空间中使用类别基尼系数加权距离互k近邻算法计算出待分类样本在各个子空间的投票权重并叠加,最终得出待分类样本的类标签.在公共数据集上的实验结果验证了该方法的有效性. 展开更多
关键词 类属性数据 子空间 k-近邻 基尼系数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部