期刊文献+
共找到599篇文章
< 1 2 30 >
每页显示 20 50 100
离群点挖掘方法综述 被引量:69
1
作者 薛安荣 姚林 +2 位作者 鞠时光 陈伟鹤 马汉达 《计算机科学》 CSCD 北大核心 2008年第11期13-18,27,共7页
离群点挖掘可揭示稀有事件和现象、发现有趣的模式,有着广阔的应用前景,因此引起广泛关注。首先介绍离群点的定义、引起离群的原因和离群点挖掘算法的分类,对基于距离和基于密度的离群点挖掘算法进行了比较详细的讨论,指出了其优缺点和... 离群点挖掘可揭示稀有事件和现象、发现有趣的模式,有着广阔的应用前景,因此引起广泛关注。首先介绍离群点的定义、引起离群的原因和离群点挖掘算法的分类,对基于距离和基于密度的离群点挖掘算法进行了比较详细的讨论,指出了其优缺点和发展方向,重点对当前研究的热点——高维大数据量的挖掘、空间数据挖掘、时序离群点挖掘和离群点挖掘技术的应用进行了讨论,指出了进一步研究方向。 展开更多
关键词 离群点挖掘 局部离群点 子空间 剪枝 空间离群点 高维数据 数据流
下载PDF
特征选择稳定性研究综述 被引量:37
2
作者 刘艺 曹建军 +1 位作者 刁兴春 周星 《软件学报》 EI CSCD 北大核心 2018年第9期2559-2579,共21页
随着大数据的发展和机器学习的广泛应用,各行业的数据量呈现大规模的增长,高维性是这些数据的重要特点,采用特征选择对高维数据进行降维是一种预处理方法.特征选择稳定性是其中重要的研究内容,它是指特征选择方法对训练样本的微小扰动... 随着大数据的发展和机器学习的广泛应用,各行业的数据量呈现大规模的增长,高维性是这些数据的重要特点,采用特征选择对高维数据进行降维是一种预处理方法.特征选择稳定性是其中重要的研究内容,它是指特征选择方法对训练样本的微小扰动具有一定鲁棒性.提高特征选择稳定性有助于发现相关特征,增强特征可信度,进一步降低开销.在回顾现有特征选择稳定性提升方法的基础上对其进行分类,分析比较各类方法的特点和适用范围,总结特征选择稳定性中的相关评估工作,并通过实验剖析其中稳定性度量指标的性能,进而对比4种集成方法的效用.最后讨论当前工作的局限性,指出未来的研究方向. 展开更多
关键词 高维数据 特征选择 稳定性 稳定性指标 集成选择 演化算法
下载PDF
自适应的软子空间聚类算法 被引量:33
3
作者 陈黎飞 郭躬德 姜青山 《软件学报》 EI CSCD 北大核心 2010年第10期2513-2523,共11页
软子空间聚类是高维数据分析的一种重要手段.现有算法通常需要用户事先设置一些全局的关键参数,且没有考虑子空间的优化.提出了一个新的软子空间聚类优化目标函数,在最小化子空间簇类的簇内紧凑度的同时,最大化每个簇类所在的投影子空间... 软子空间聚类是高维数据分析的一种重要手段.现有算法通常需要用户事先设置一些全局的关键参数,且没有考虑子空间的优化.提出了一个新的软子空间聚类优化目标函数,在最小化子空间簇类的簇内紧凑度的同时,最大化每个簇类所在的投影子空间.通过推导得到一种新的局部特征加权方式,以此为基础提出一种自适应的k-means型软子空间聚类算法.该算法在聚类过程中根据数据集及其划分的信息,动态地计算最优的算法参数.在实际应用和合成数据集上的实验结果表明,该算法大幅度提高了聚类精度和聚类结果的稳定性. 展开更多
关键词 聚类 高维数据 子空间 特征加权 自适应性
下载PDF
基于随机森林的不平衡特征选择算法 被引量:32
4
作者 尹华 胡玉平 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第5期59-65,共7页
数据高维不平衡是当前数据挖掘的挑战。针对传统特征选择方法基于类别平衡假设,导致在不平衡数据上效果不理想的问题,利用随机森林内嵌的变量选择机制,构造了一个新的不平衡随机森林特征选择算法IBRFVS。IBRFVS在平衡的取样数据上构造... 数据高维不平衡是当前数据挖掘的挑战。针对传统特征选择方法基于类别平衡假设,导致在不平衡数据上效果不理想的问题,利用随机森林内嵌的变量选择机制,构造了一个新的不平衡随机森林特征选择算法IBRFVS。IBRFVS在平衡的取样数据上构造多样决策树,采用交叉验证方式获取单棵决策树的特征重要性度量值。各决策树的权重和特征重要性度量的加权平均决定了最终的特征重要性序列,其中,决策树的权重由该决策树与集成预测的一致性程度决定。在UCI数据集上的随机森林超参数选择和预处理对比验证实验中显示,四种超参数K经验取值中,当K的取值为特征数的平方根时,IBRFVS性能较为稳定且优于传统特征选择算法。 展开更多
关键词 不平衡数据 高维数据 特征选择 随机森林
下载PDF
异常点挖掘研究进展 被引量:22
5
作者 王宏鼎 童云海 +2 位作者 谭少华 唐世渭 杨冬青 《智能系统学报》 2006年第1期67-73,共7页
异常点是数据集中与其他数据显著不同的数据.一个人的噪声对另一个人而言可能是有用的数据,因此,随着人们对数据质量、欺诈检测、网络入侵、故障诊断、自动军事侦察等问题的关注,异常点挖掘在信息科学研究领域日益受到重视.在充分调研... 异常点是数据集中与其他数据显著不同的数据.一个人的噪声对另一个人而言可能是有用的数据,因此,随着人们对数据质量、欺诈检测、网络入侵、故障诊断、自动军事侦察等问题的关注,异常点挖掘在信息科学研究领域日益受到重视.在充分调研国内外异常点挖掘研究文献基础上,系统地综述了数据库研究领域中异常点挖掘的研究现状,对已有各种异常点挖掘方法进行了总结和比较,并结合当前研究热点,展望了异常点挖掘未来的研究方向及其面临的挑战. 展开更多
关键词 异常点 挖掘方法 局部异常点 数据流 高维数据
下载PDF
一种有效的量化交易数据相似性搜索方法 被引量:26
6
作者 杨风召 朱扬勇 《计算机研究与发展》 EI CSCD 北大核心 2004年第2期361-368,共8页
量化交易数据与一般交易数据的不同之处在于它在各个维上的值是数值型而不是二值型的 研究这种数据的有效的相似性搜索方法是一个重要而具有挑战性的课题 提出了一个新的相似性度量函数Hsim() ,这个度量函数可以较好地克服Lp 等传统的... 量化交易数据与一般交易数据的不同之处在于它在各个维上的值是数值型而不是二值型的 研究这种数据的有效的相似性搜索方法是一个重要而具有挑战性的课题 提出了一个新的相似性度量函数Hsim() ,这个度量函数可以较好地克服Lp 等传统的距离函数在高维空间中的缺点 ,并能将二值型和数值型数据距离的计算整合到一个统一的框架中去 结合量化交易数据的特点 ,构造了定义在该函数上的相似性索引结构 ,并对建立在该索引结构上的相似性查询方法进行了阐述 实验表明 ,这种搜索方法对量化交易数据的相似性搜索有较高的修剪率 。 展开更多
关键词 相似性搜索 高维数据 距离函数 量化交易数据 索引结构
下载PDF
基于局部信息熵的加权子空间离群点检测算法 被引量:27
7
作者 倪巍伟 陈耿 +2 位作者 陆介平 吴英杰 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2008年第7期1189-1194,共6页
离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象."维度灾殃"现象的存在使得很多已有的离群点检测算法对高维数据不再有效.针对这一问题,提出基于局部信息熵的加权子空间... 离群点检测作为数据挖掘的一个重要研究方向,可以从大量数据中发现少量与多数数据有明显区别的数据对象."维度灾殃"现象的存在使得很多已有的离群点检测算法对高维数据不再有效.针对这一问题,提出基于局部信息熵的加权子空间离群点检测算法SPOD.通过对数据对象在各维进行邻域信息熵分析,生成数据对象相应的离群子空间和属性权向量,对离群子空间中的属性赋以较高的权值,进一步提出子空间加权距离等概念.采用基于密度离群点检测的思想,分析计算数据对象的子空间离群影响因子,判断是否为离群点.算法能够有效地适应于高维数据离群点检测,理论分析和实验结果表明算法是有效可行的. 展开更多
关键词 高维数据 离群点检测 信息熵 子空间挖掘 权向量
下载PDF
稳健局部线性嵌入方法 被引量:12
8
作者 谭璐 吴翊 易东云 《国防科技大学学报》 EI CAS CSCD 北大核心 2004年第6期91-95,共5页
针对局部线性嵌入方法对于噪声的敏感性,从分析噪声对数据集局部特性的影响入手,提出了稳健局部线性嵌入方法。通过与局部线性嵌入方法的理论分析和实例对比,表明稳健局部线性嵌入方法不仅对噪声影响不敏感,而且对邻域的选择有较好的适... 针对局部线性嵌入方法对于噪声的敏感性,从分析噪声对数据集局部特性的影响入手,提出了稳健局部线性嵌入方法。通过与局部线性嵌入方法的理论分析和实例对比,表明稳健局部线性嵌入方法不仅对噪声影响不敏感,而且对邻域的选择有较好的适应性,可更好地挖掘数据集的本征特性,具有更强的数据可视化能力。 展开更多
关键词 局部线性嵌入 高维数据 降维 邻域
下载PDF
高维数据相似性度量方法研究 被引量:18
9
作者 谢明霞 郭建忠 +1 位作者 张海波 陈科 《计算机工程与科学》 CSCD 北大核心 2010年第5期92-96,共5页
将低维空间中的距离度量方法(如Lk-范数)应用于高维空间时,随着维数的增加,对象之间距离的对比性将不复存在。研究高维数据有效的距离或相似(相异)度度量方法是一个重要且具有挑战性的课题。通过对传统的距离度量或相似性(相异性)度量... 将低维空间中的距离度量方法(如Lk-范数)应用于高维空间时,随着维数的增加,对象之间距离的对比性将不复存在。研究高维数据有效的距离或相似(相异)度度量方法是一个重要且具有挑战性的课题。通过对传统的距离度量或相似性(相异性)度量方法在高维空间中表现出的不适应性的分析,并对现有的应用于高维数据的相似性度量方法进行总结,提出了高维数据相似性度量函数Hsim(X,Y)的改进方法HDsim(X,Y)。函数HDsim(X,Y)整合了各类型数据的相似性度量方法,在处理数值型、二值型以及分类属性数据上充分体现了原Hsim(X,Y)处理数值型数据、Jaccard系数处理二值数据以及匹配率处理分类属性数据的优越性。通过有效性及实例分析,充分论证了HDsim(X,Y)在高维空间中的有效性。 展开更多
关键词 高维数据 相似性度量 属性相似性 空间相似性
下载PDF
基于Spark的改进随机森林算法 被引量:17
10
作者 孙悦 袁健 《电子科技》 2019年第4期60-63,67,共5页
针对基于单机的经典随机森林算法无法满足海量数据处理需求的问题,文中采用Spark分布式存储计算技术设计并实现了改进的随机森林算法。首先计算特征的重要程度,将特征分为公共特征、独有特征和非重要特征;然后按顺序和比例分别在各个特... 针对基于单机的经典随机森林算法无法满足海量数据处理需求的问题,文中采用Spark分布式存储计算技术设计并实现了改进的随机森林算法。首先计算特征的重要程度,将特征分为公共特征、独有特征和非重要特征;然后按顺序和比例分别在各个特征子空间中随机选择特征;最后通过Spark集群进行实验,分析改进的随机森林算法分类性能、加速比和效率。结果证实改进的算法提高了随机森林构建效率,可以用来解决海量数据挖掘问题,具有良好的可扩展性。 展开更多
关键词 随机森林 SPARK 特征空间 RELIEFF算法 高维数据 分类模型
下载PDF
基于深度学习与随机森林的高维数据特征选择 被引量:16
11
作者 冯晓荣 瞿国庆 《计算机工程与设计》 北大核心 2019年第9期2494-2501,共8页
针对特征选择算法对高维大数据降维效果与稳定性差的缺点,提出一种基于深度学习与随机森林的大数据特征选择算法。设计基于随机森林的特征消除算法,对高维大数据集进行特征降维处理;采用保留的特征对受限玻尔兹曼机进行训练,确定受限玻... 针对特征选择算法对高维大数据降维效果与稳定性差的缺点,提出一种基于深度学习与随机森林的大数据特征选择算法。设计基于随机森林的特征消除算法,对高维大数据集进行特征降维处理;采用保留的特征对受限玻尔兹曼机进行训练,确定受限玻尔兹曼机的模型结构与权重;使用训练受限玻尔兹曼机的学习参数初始化一个多层神经网络,通过标准的后向传播方法训练多层神经网络。基于多组数据集的实验结果表明,该算法提高了高维数据集特征选择的化简效果,保持了较高的稳定性与鲁棒性。 展开更多
关键词 特征选择 大数据 高维数据 深度学习 随机森林 受限玻尔兹曼机
下载PDF
隐私保护数据挖掘研究进展 被引量:15
12
作者 张海涛 黄慧慧 +1 位作者 徐亮 高莎莎 《计算机应用研究》 CSCD 北大核心 2013年第12期3529-3535,共7页
近年来隐私保护数据挖掘已经成为数据挖掘的研究热点,并取得了丰富的研究成果。但是,随着移动通信、嵌入式、定位等技术的发展与物联网、位置服务、基于位置的社交网络等应用的出现,具有个人隐私的信息内容更加丰富,利用数据挖掘工具对... 近年来隐私保护数据挖掘已经成为数据挖掘的研究热点,并取得了丰富的研究成果。但是,随着移动通信、嵌入式、定位等技术的发展与物联网、位置服务、基于位置的社交网络等应用的出现,具有个人隐私的信息内容更加丰富,利用数据挖掘工具对数据进行综合分析更容易侵犯个人隐私。针对新的应用需求,对隐私保护数据挖掘方法进行深入研究具有重要的现实意义。在分析现有的隐私保护数据挖掘方法分类与技术特点的基础上,提出现有方法并应用于新型分布式系统架构应用系统、高维数据及时空数据等领域存在的挑战性问题,并指出了今后研究的方向。 展开更多
关键词 隐私保护数据挖掘 新型分布式系统 高维数据 时空数据
下载PDF
基于属性值集中度的分类数据聚类有效性内部评价指标 被引量:14
13
作者 傅立伟 武森 《工程科学学报》 EI CSCD 北大核心 2019年第5期682-693,共12页
针对分类数据,通过数据对象在属性值上的集中程度定义了新的基于属性值集中度的类内相似度(similarity based on concentration of attribute values,CONC),用于衡量聚类结果中类内各数据对象之间的相似度;通过不同类的特征属性值的差... 针对分类数据,通过数据对象在属性值上的集中程度定义了新的基于属性值集中度的类内相似度(similarity based on concentration of attribute values,CONC),用于衡量聚类结果中类内各数据对象之间的相似度;通过不同类的特征属性值的差异程度定义了基于强度向量差异的类间差异度(dissimilarity based on discrepancy of SVs,DCRP),用于衡量两个类之间的差异度.基于CONC和DCRP提出了新的分类数据聚类有效性内部评价指标(clustering validation based on concentration of attribute values,CVC),它具有以下3个特点:(1)在评价每个类内相似度时,不仅依靠类内各数据对象的特征,还考虑了整个数据集的信息;(2)采用几个特征属性值的差异评价两个类的差异度,确保评价过程不丢失有效的聚类信息,同时可以消除噪音的影响;(3)在评价类内相似度及类间差异度时,消除了数据对象个数对评价过程的影响.采用加州大学欧文分校提出的用于机器学习的数据库(UCI)进行实验,将CVC与类别效用(category utility,CU)指标、基于主观因素的分类数据指标(categorical data clustering with subjective factors,CDCS)指标和基于信息熵的内部评价指标(information entropy,IE)等内部评价指标进行对比,通过外部评价指标标准交互信息(normalized mutual information,NMI)验证内部评价效果.实验表明相对其他内部评价指标,CVC指标可以更有效地评价聚类结果.此外,CVC指标相对于NMI指标,不需要数据集以外的信息,更具实用性. 展开更多
关键词 聚类分析 聚类内部有效性评价指标 分类数据 高维数据 相似度 差异度
原文传递
LLE算法及其应用 被引量:8
14
作者 邓星亮 吴清 《兵工自动化》 2005年第3期65-66,共2页
LLE算法针对非线性降维问题,利用线性重构的局部对称性找出高维数据空间中的非线性结构。并在保持各数据点临近位置关系情况下,把高维空间数据点映射为低维空间对应的数据点。其计算步骤包括:计算、寻找数据点或邻居数据点、构造数据点... LLE算法针对非线性降维问题,利用线性重构的局部对称性找出高维数据空间中的非线性结构。并在保持各数据点临近位置关系情况下,把高维空间数据点映射为低维空间对应的数据点。其计算步骤包括:计算、寻找数据点或邻居数据点、构造数据点及计算权值矩阵,并通过权值矩阵计算低维向量。 展开更多
关键词 LLE算法 高维数据 低维空间 非线性降维 数据点映射
下载PDF
基于相似性度量的高维数据聚类算法研究 被引量:13
15
作者 王晓阳 张洪渊 +1 位作者 沈良忠 池万乐 《计算机技术与发展》 2013年第5期30-33,共4页
高维数据空间中的高维数据相似性度量问题是一个具有挑战性的课题。针对传统数据相似性度量算法在高维数据空间的不适应性,通过对传统的距离度量方法进行分析,结合高维数据特性,提出了高维数据相似性度量函数Esim(X,Y)。将其与已有的相... 高维数据空间中的高维数据相似性度量问题是一个具有挑战性的课题。针对传统数据相似性度量算法在高维数据空间的不适应性,通过对传统的距离度量方法进行分析,结合高维数据特性,提出了高维数据相似性度量函数Esim(X,Y)。将其与已有的相似性度量函数Hsim(X,Y)进行比较,得出改进的算法在高维相似性度量方面的优越性,特别是在高值数据之间与低值数据之间的相对差异方面更具优势。利用数值型数据集进行实验分析,验证了该函数在高维数据空间聚类的有效性和合理性。 展开更多
关键词 高维数据 相似性度量 数据聚类
下载PDF
采用属性聚类的高维子空间聚类算法 被引量:13
16
作者 牛琨 张舒博 陈俊亮 《北京邮电大学学报》 EI CAS CSCD 北大核心 2007年第3期1-5,共5页
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩... 为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意2个非冗余属性的相关度,进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感. 展开更多
关键词 子空间聚类 高维数据 属性聚类
下载PDF
基于改进的MRMR算法和代价敏感分类的财务预警研究 被引量:12
17
作者 罗康洋 王国强 《统计与信息论坛》 CSSCI 北大核心 2020年第3期77-85,共9页
针对上市公司财务预警数据呈现出的高维和不平衡的双重特性,基于改进的MRMR算法和代价敏感分类构建财务预警模型并进行实证分析。首先,为了克服财务预警数据的不平衡性对特征选择和分类的不利影响,使用组合采样技术SMOTE+ENN进行数据平... 针对上市公司财务预警数据呈现出的高维和不平衡的双重特性,基于改进的MRMR算法和代价敏感分类构建财务预警模型并进行实证分析。首先,为了克服财务预警数据的不平衡性对特征选择和分类的不利影响,使用组合采样技术SMOTE+ENN进行数据平衡化处理。其次,利用绝对值余弦度量构建改进的MRMR算法并进行特征选择。最后,将支持向量机、L2-逻辑回归和CART决策树及其对应代价敏感模型作为比较模型进行财务预警研究。通过大量实证分析显示,SMOTE+ENN的引入有效提升了ST公司样本及其对应特征的重要性。在不影响财务预警模型总体分类性能的前提下,改进的MRMR算法可以得到更为简洁的预测特征集,且组合模型MRMR_FDAQ+CSSVM的预测结果最优,因此建议优先将该模型应用于上市公司财务危机的预测。 展开更多
关键词 高维数据 不平衡数据集 财务预警 MRMR算法 代价敏感分类模型
下载PDF
一种适用于高维非线性特征数据的聚类算法及应用 被引量:12
18
作者 姜洪权 王岗 +3 位作者 高建民 高智勇 高瑞琪 郭旗 《西安交通大学学报》 EI CAS CSCD 北大核心 2017年第12期49-55,90,共8页
针对高维数据聚类分析中数据之间具有多种非线性特征关系,导致数据分布不均、传统相似性度量失效及结果类中心难以精准表征等问题,提出了一种基于核主元分析(KPCA)与密度聚类(DBSCAN)的高维非线性特征数据聚类分析技术。首先,为有效提... 针对高维数据聚类分析中数据之间具有多种非线性特征关系,导致数据分布不均、传统相似性度量失效及结果类中心难以精准表征等问题,提出了一种基于核主元分析(KPCA)与密度聚类(DBSCAN)的高维非线性特征数据聚类分析技术。首先,为有效提取高维数据的非线性特征,利用KPCA理论将原始数据映射到更高维数据空间,利用主元分析获得数据变化的方向集合,并进行降维分析;然后,通过重新定义数据样本在主元空间的相似性距离对传统DBSCAN聚类方法进行改进,并利用3δ统计理论对各簇中心的进行表征,从而实现高维数据的精确分类与类中心知识表达。以实际高血压患者群体聚类问题为例对方法进行了有效性验证,实验表明,所提方法可以有效获取原始数据的非线性特征,实现患者个体特征群体的有效划分及簇类中心知识的表达,解决传统DBSCAN聚类方法对高维数据不适用的问题。 展开更多
关键词 非线性 高维数据 核主元分析 密度聚类
下载PDF
基于频繁模式的离群点挖掘在入侵检测中的应用 被引量:11
19
作者 王茜 唐锐 《计算机应用研究》 CSCD 北大核心 2013年第4期1208-1211,共4页
针对网络安全数据高维度的特征,对传统离群点检测不能有效发现的网络数据中入侵行为细节进行检测。提出一种基于频繁模式的算法,通过检测数据项的频繁模式和关联规则,剥离数据流中或安全日志数据中的噪声和异常点,计算安全数据的加权频... 针对网络安全数据高维度的特征,对传统离群点检测不能有效发现的网络数据中入侵行为细节进行检测。提出一种基于频繁模式的算法,通过检测数据项的频繁模式和关联规则,剥离数据流中或安全日志数据中的噪声和异常点,计算安全数据的加权频繁离群因子,精确定位离群点,最后从中自动筛选出异常属性。实验证明,该方法在较好的空间复杂性与时间复杂性下,能有效地发现在高维安全数据中异常的属性。 展开更多
关键词 频繁模式 离群点 入侵检测 高维数据
下载PDF
具有抗噪性能适用高维数据的增量式聚类算法 被引量:10
20
作者 邵俊健 王士同 《计算机科学与探索》 CSCD 北大核心 2019年第9期1553-1566,共14页
针对含有噪声的高维数据的聚类问题,提出一种使用新的距离度量方式的增量式聚类算法ANFCM(c+p)。由于传统的模糊C均值聚类算法对初始化聚类中心比较敏感,所提出的聚类算法将单程FCM的增量机制(称为SpFCM)与FCPM中使用的初始化聚类中心... 针对含有噪声的高维数据的聚类问题,提出一种使用新的距离度量方式的增量式聚类算法ANFCM(c+p)。由于传统的模糊C均值聚类算法对初始化聚类中心比较敏感,所提出的聚类算法将单程FCM的增量机制(称为SpFCM)与FCPM中使用的初始化聚类中心的策略相结合,即将先前数据块的聚类中心附近的几个样本点添加到下一个数据块进行聚类,以避免FCM对噪声的敏感性。此外,所提出的聚类算法使用一种新的改进后的距离度量的同时,使用修正后的约束条件和目标函数。通过以上改进,可以有效区分已知类和未知类在算法中的不同影响程度,并加强类之间的相互影响程度。实验结果表明,该算法对高维噪声数据具有很好的聚类效果和鲁棒性。 展开更多
关键词 高斯噪声 增量式聚类算法 距离度量 高维数据 FCPM算法
下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部