期刊文献+
共找到42,728篇文章
< 1 2 250 >
每页显示 20 50 100
聚类算法研究 被引量:1069
1
作者 孙吉贵 刘杰 赵连宇 《软件学报》 EI CSCD 北大核心 2008年第1期48-61,共14页
对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括;另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进... 对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括;另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进行模拟实验,并分别就同一种聚类算法、不同的数据集以及同一个数据集、不同的聚类算法的聚类情况进行对比分析.最后通过综合上述两方面信息给出聚类分析的研究热点、难点、不足和有待解决的一些问题.上述工作将为聚类分析和数据挖掘等研究提供有益的参考. 展开更多
关键词 算法 实验
下载PDF
彩色图像分割方法综述 被引量:322
2
作者 林开颜 吴军辉 徐立鸿 《中国图象图形学报(A辑)》 CSCD 北大核心 2005年第1期1-10,共10页
由于彩色图像提供了比灰度图像更为丰富的信息,因此彩色图像处理正受到人们越来越多的关注。彩色图像分割是彩色图像处理的重要问题,彩色图像分割可以看成是灰度图像分割技术在各种颜色空间上的应用,为了使该领域的研究人员对当前各种... 由于彩色图像提供了比灰度图像更为丰富的信息,因此彩色图像处理正受到人们越来越多的关注。彩色图像分割是彩色图像处理的重要问题,彩色图像分割可以看成是灰度图像分割技术在各种颜色空间上的应用,为了使该领域的研究人员对当前各种彩色图像分割方法有较全面的了解,因此对各种彩色图像分割方法进行了系统论述,即先对各种颜色空间进行简单介绍,然后对直方图阈值法、特征空间聚类、基于区域的方法、边缘检测、模糊方法、神经元网络、基于物理模型方法等主要的彩色图像分割技术进行综述,并比较了它们的优缺点,通过比较发现模糊技术由于能很好地表达和处理不确定性问题,因此在彩色图像分割领域会有更广阔的应用前景。 展开更多
关键词 彩色图像分割 彩色图像处理 灰度图像 颜色空间 边缘检测 特征空间 综述 表达 方法
下载PDF
大数据下的机器学习算法综述 被引量:323
3
作者 何清 李宁 +1 位作者 罗文娟 史忠植 《模式识别与人工智能》 EI CSCD 北大核心 2014年第4期327-336,共10页
随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界... 随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题.文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状.此外,并行是处理大数据的主流方法,因此介绍一些并行算法,并引出大数据环境下机器学习研究所面临的问题.最后指出大数据机器学习的研究趋势. 展开更多
关键词 大数据 机器学习 并行算法
下载PDF
数据挖掘中的聚类算法综述 被引量:225
4
作者 贺玲 吴玲达 蔡益朝 《计算机应用研究》 CSCD 北大核心 2007年第1期10-13,共4页
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了数据挖掘中聚类算法的研究现状,分析比较了它们的性能差异和各自存在的优点及问题,并结合多媒体领域的应用需求指出了其今后的发展趋势。
关键词 数据挖掘 算法
下载PDF
聚类算法综述 被引量:200
5
作者 章永来 周耀鉴 《计算机应用》 CSCD 北大核心 2019年第7期1869-1882,共14页
大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大... 大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大类,并特别对大数据聚类作了较为系统的分析与总结。此外,概述并分析了各类聚类算法的研究进展及其应用概况,并结合研究课题讨论了算法的发展趋势。 展开更多
关键词 相似性度量 大数据 小数据 评价
下载PDF
基于项目聚类的协同过滤推荐算法 被引量:147
6
作者 邓爱林 左子叶 朱扬勇 《小型微型计算机系统》 CSCD 北大核心 2004年第9期1665-1670,共6页
推荐系统是电子商务中最重要的技术之一 ,协同过滤是推荐系统中采用最为广泛也是最成功的推荐技术 .随着电子商务系统用户数目和商品数目日益增加 ,在整个用户空间上寻找目标用户的最近邻居非常耗时 ,导致推荐系统的实时性要求难以保证 ... 推荐系统是电子商务中最重要的技术之一 ,协同过滤是推荐系统中采用最为广泛也是最成功的推荐技术 .随着电子商务系统用户数目和商品数目日益增加 ,在整个用户空间上寻找目标用户的最近邻居非常耗时 ,导致推荐系统的实时性要求难以保证 .针对上述问题 ,本文提出了一种基于项目聚类的协同过滤推荐算法 ,根据用户对项目评分的相似性对项目进行聚类 ,生成相应的聚类中心 ,在此基础上计算目标项目与聚类中心的相似性 ,从而只需要在与目标项目最相似的若干个聚类中就能寻找到目标项目的大部分最近邻居并产生推荐列表 .实验结果表明 。 展开更多
关键词 电子商务 推荐系统 协同过滤 平均绝对偏差
下载PDF
初始聚类中心优化的k-means算法 被引量:152
7
作者 袁方 周志勇 宋鑫 《计算机工程》 CAS CSCD 北大核心 2007年第3期65-66,共2页
传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表... 传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。 展开更多
关键词 数据挖掘 K-MEANS算法 中心
下载PDF
数据挖掘中的聚类方法 被引量:88
8
作者 王实 高文 《计算机科学》 CSCD 北大核心 2000年第4期42-45,共4页
从空间X中给定一个有限的取样点集(或从数据库中取得有限例子的集合),{x^i}_(i 1)~M,聚类的目标是将数据聚集成类,使得类间的相似性尽量小,而类内的相似性尽量大。分类问题(监督)和聚类问题根本的不同是:分类问题中,我们知道训练例的分... 从空间X中给定一个有限的取样点集(或从数据库中取得有限例子的集合),{x^i}_(i 1)~M,聚类的目标是将数据聚集成类,使得类间的相似性尽量小,而类内的相似性尽量大。分类问题(监督)和聚类问题根本的不同是:分类问题中,我们知道训练例的分类属性值,而在聚类问题中,就需要我们在训练例中找到这个分类属性值。1 展开更多
关键词 数据挖掘 机器学习 数据库
下载PDF
基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究 被引量:148
9
作者 何勇 李晓丽 邵咏妮 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2006年第5期850-853,共4页
提出了一种用近红外光谱技术快速鉴别苹果品种的新方法,首先用主成分分析法对苹果品种进行聚类分析并获取苹果的近红外指纹图谱,再结合人工神经网络技术进行品种鉴别。主成分分析表明,主成分1和主成分2的累积可信度已达98%,以主成分1和... 提出了一种用近红外光谱技术快速鉴别苹果品种的新方法,首先用主成分分析法对苹果品种进行聚类分析并获取苹果的近红外指纹图谱,再结合人工神经网络技术进行品种鉴别。主成分分析表明,主成分1和主成分2的累积可信度已达98%,以主成分1和2对所有建模样本的得分值做出的得分图,对不同种类苹果具有很好的聚类作用。利用主成分分析得到的载荷图可以得到对于苹果品种敏感的特征波段,用特征波段图谱作为神经网络的输入建立三层BP人工神经网络模型。每个品种各25个苹果共75个用来建立神经网络模型,余下的共15个用于预测。对未知的15个样本进行预测,品种识别准确率达到100%。说明文章提出的方法具有很好的分类和鉴别作用,为苹果的品种鉴别提供了一种新方法。 展开更多
关键词 近红外光谱 苹果 主成分分析 人工神经网络
下载PDF
数据挖掘综述 被引量:91
10
作者 钟晓 马少平 +1 位作者 张钹 俞瑞钊 《模式识别与人工智能》 EI CSCD 北大核心 2001年第1期48-55,共8页
数据挖掘技术是一个新兴的、非常重要的、具有广阔应用前景和富有挑战性的研究领域。本文结合具体实例,从概念、方法、特点、任务、过程、应用以及所面临的挑战等各方面对其作了较详细的评述。
关键词 数据挖掘 关联规则 数据库
原文传递
体质的聚类研究 被引量:108
11
作者 何裕民 王莉 +3 位作者 石凤亭 楚更武 张大凤 徐云 《中国中医基础医学杂志》 CAS CSCD 1996年第5期7-9,共3页
体质的聚类研究何裕民*王莉*石凤亭**(上海中医药大学上海200032)楚更武***张大凤****徐云*(上海农业科学院医院上海200331)关键词体质聚类体质学说是近年来现代中医研究中很受重视的一大领域。人们企盼这... 体质的聚类研究何裕民*王莉*石凤亭**(上海中医药大学上海200032)楚更武***张大凤****徐云*(上海农业科学院医院上海200331)关键词体质聚类体质学说是近年来现代中医研究中很受重视的一大领域。人们企盼这方面的突破,能对中医“证”的研究及... 展开更多
关键词 体质 体质学说 中医学
下载PDF
一种基于密度的快速聚类算法 被引量:89
12
作者 周水庚 周傲英 +1 位作者 曹晶 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2000年第11期1287-1292,共6页
聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了... 聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了一种基于密度的快速聚类算法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 ,实现快速聚类 .对二维空间数据测试表明 :快速算法能够有效地对大规模数据库进行聚类 ,速度上数倍于已有 DBSCAN算法 . 展开更多
关键词 数据挖掘 密度 快速算法 数据库
下载PDF
聚类/分类中的粒度原理 被引量:95
13
作者 卜东波 白硕 李国杰 《计算机学报》 EI CSCD 北大核心 2002年第8期810-816,共7页
从信息粒度的角度来剖析聚类和分类技术 ,试图使用信息粒度原理的框架来统一聚类和分类 .从信息粒度的观点来看 ,聚类是在一个统一的粒度下进行计算 ,而分类却是在不同的粒度下进行计算 .该文还根据粒度原理设计了一种崭新的分类算法 ,... 从信息粒度的角度来剖析聚类和分类技术 ,试图使用信息粒度原理的框架来统一聚类和分类 .从信息粒度的观点来看 ,聚类是在一个统一的粒度下进行计算 ,而分类却是在不同的粒度下进行计算 .该文还根据粒度原理设计了一种崭新的分类算法 ,在大规模中文文本分类的应用实践表明这种分类算法有较强的泛化能力 . 展开更多
关键词 粒度原理 信息粒度 粗集 人工智能 信息处理
下载PDF
基于云计算的居民用电行为分析模型研究 被引量:133
14
作者 张素香 刘建明 +1 位作者 赵丙镇 曹津平 《电网技术》 EI CSCD 北大核心 2013年第6期1542-1546,共5页
对智能小区的居民用电行为展开研究,基于云计算平台和并行k-means聚类算法,建立了峰时耗电率、负荷率、谷电系数等时间序列特征,并采用熵权法计算各类特征权重,实验数据来自已建的智能小区中的600名用户。实验结果表明,智能小区的居民... 对智能小区的居民用电行为展开研究,基于云计算平台和并行k-means聚类算法,建立了峰时耗电率、负荷率、谷电系数等时间序列特征,并采用熵权法计算各类特征权重,实验数据来自已建的智能小区中的600名用户。实验结果表明,智能小区的居民用户被分成空置房、上班族、上班族+老人、老人家庭、商业用户等5类用户,聚类的准确率达到了91.2%,证明文中基于云计算平台和并行k_means聚类算法的居民用电行为分析模型是有效的。 展开更多
关键词 云计算 居民用电行为
下载PDF
聚类有效性评价综述 被引量:117
15
作者 杨燕 靳蕃 KAMEL Mohamed 《计算机应用研究》 CSCD 北大核心 2008年第6期1630-1632,1638,共4页
在聚类分析应用中,迫切需要一种客观公正的质量评价方法来评判聚类结果的有效性。为此,从外部评价法、内部评价法和相对评价法三个方面,归纳综述了常用的聚类有效性评价方法,并讨论了模糊聚类评价法和聚类最佳类别数的自动确定问题。
关键词 评价 有效性指数
下载PDF
基于内容的图像分割方法综述 被引量:130
16
作者 姜枫 顾庆 +3 位作者 郝慧珍 李娜 郭延文 陈道蓄 《软件学报》 EI CSCD 北大核心 2017年第1期160-183,共24页
图像分割是指将图像分成若干具有相似性质的区域的过程,是许多图像处理任务的预处理步骤.近年来,国内外学者主要研究基于图像内容的分割算法.在广泛调研大量文献和最新成果的基础上,将图像分割算法分为基于图论的方法、基于像素聚类的... 图像分割是指将图像分成若干具有相似性质的区域的过程,是许多图像处理任务的预处理步骤.近年来,国内外学者主要研究基于图像内容的分割算法.在广泛调研大量文献和最新成果的基础上,将图像分割算法分为基于图论的方法、基于像素聚类的方法和语义分割方法这3种类型并分别加以介绍.对每类方法所包含的典型算法,尤其是最近几年利用深度网络技术的语义图像分割方法的基本思想、优缺点进行了分析、对比和总结.介绍了图像分割常用的基准数据集和算法评价标准,并用实验对各种图像分割算法进行对比.最后进行总结,并对未来可能的发展趋势加以展望. 展开更多
关键词 图像分割 图论 语义分割 深度神经网络
下载PDF
不同类型茶园昆虫、蜘蛛群落结构分析 被引量:81
17
作者 谭济才 邓欣 袁哲明 《生态学报》 CAS CSCD 北大核心 1998年第3期289-294,共6页
应用多样性指数、排序和聚类分析方法研究了不同生态环境和防治处理的茶园昆虫、蜘蛛群落结构。结果表明:在生态控制的茶园,由于完全不使用化学农药,昆虫和蜘蛛的丰富度、多样性指数、均匀度均较大。综合防治的茶园次之。而主要依靠... 应用多样性指数、排序和聚类分析方法研究了不同生态环境和防治处理的茶园昆虫、蜘蛛群落结构。结果表明:在生态控制的茶园,由于完全不使用化学农药,昆虫和蜘蛛的丰富度、多样性指数、均匀度均较大。综合防治的茶园次之。而主要依靠化学防治的茶园,丰富度减少,多样性指数和均匀度降低,经常出现害虫暴发成灾的现象。生态环境复杂的茶园比生态环境单调的茶园、成龄茶园比幼龄茶园的多样性指数和均匀度也较高。因此,化学农药和生态环境是造成茶园昆虫、蜘蛛群落结构差异的主要因素。 展开更多
关键词 茶园 群落结构 排序 昆虫 蜘蛛
下载PDF
基于轮廓系数的聚类有效性分析 被引量:117
18
作者 朱连江 马炳先 赵学泉 《计算机应用》 CSCD 北大核心 2010年第12期139-141,198,共4页
针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果... 针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果的判断,在标准数据集上的实验结果有效地验证了这点。并进一步将此有效性分析方法应用于文本聚类。 展开更多
关键词 K均值算法 轮廓系数 有效性分析 无监督
下载PDF
图像分割方法综述研究 被引量:115
19
作者 周莉莉 姜枫 《计算机应用研究》 CSCD 北大核心 2017年第7期1921-1928,共8页
图像分割是计算机视觉领域重要和基础性的问题,也是颇具挑战性的任务。为了解该问题的研究现状、存在问题及发展前景,在广泛调研现有文献和最新成果的基础上,针对2000年之后主流的图像分割方法进行了研究,将之分为四类:基于图论的方法... 图像分割是计算机视觉领域重要和基础性的问题,也是颇具挑战性的任务。为了解该问题的研究现状、存在问题及发展前景,在广泛调研现有文献和最新成果的基础上,针对2000年之后主流的图像分割方法进行了研究,将之分为四类:基于图论的方法、基于聚类的方法、基于分类的方法以及结合聚类和分类的方法,对每类方法所包含的典型算法,尤其是该领域最近几年发表的最新文章的基本思想、优缺点进行介绍和分析。最后介绍了图像分割常用的基准数据集和算法评价指标,对比各种算法并总结全文,对未来可能的发展趋势进行了展望。 展开更多
关键词 图像分割 图论
下载PDF
基于DBSCAN聚类算法的研究与实现 被引量:77
20
作者 荣秋生 颜君彪 郭国强 《计算机应用》 CSCD 北大核心 2004年第4期45-46,61,共3页
高密度聚类作为数据挖掘中聚类算法的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的类。文中分析了传统的聚类算法及局限性,讨论了一个基于高密度聚类算法的实现过程,使得算法可自动发现高维子空间,处理高维... 高密度聚类作为数据挖掘中聚类算法的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的类。文中分析了传统的聚类算法及局限性,讨论了一个基于高密度聚类算法的实现过程,使得算法可自动发现高维子空间,处理高维数据表格,得到较快的聚类速度和最佳的聚类效果。 展开更多
关键词 数据挖掘 高密度 网格 DBSCAN
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部