期刊文献+
共找到43,453篇文章
< 1 2 250 >
每页显示 20 50 100
聚类算法研究 被引量:1069
1
作者 孙吉贵 刘杰 赵连宇 《软件学报》 EI CSCD 北大核心 2008年第1期48-61,共14页
对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括;另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进... 对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括;另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进行模拟实验,并分别就同一种聚类算法、不同的数据集以及同一个数据集、不同的聚类算法的聚类情况进行对比分析.最后通过综合上述两方面信息给出聚类分析的研究热点、难点、不足和有待解决的一些问题.上述工作将为聚类分析和数据挖掘等研究提供有益的参考. 展开更多
关键词 聚类 算法 实验
下载PDF
大数据下的机器学习算法综述 被引量:323
2
作者 何清 李宁 +1 位作者 罗文娟 史忠植 《模式识别与人工智能》 EI CSCD 北大核心 2014年第4期327-336,共10页
随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界... 随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题.文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状.此外,并行是处理大数据的主流方法,因此介绍一些并行算法,并引出大数据环境下机器学习研究所面临的问题.最后指出大数据机器学习的研究趋势. 展开更多
关键词 大数据 机器学习 分类 聚类 并行算法
下载PDF
中国区域经济增长集聚的空间统计分析 被引量:254
3
作者 吴玉鸣 徐建华 《地理科学》 CSCD 北大核心 2004年第6期654-659,共6页
运用空间统计和计量经济学MoranI指数法及时空数据(PanelData)模型分析了中国31个省级区域经济增长集聚及其影响因素。结果显示:①中国省域经济增长具有明显的空间依赖性,在地理空间上存在集聚现象,区域经济增长在时空上呈现出明显的空... 运用空间统计和计量经济学MoranI指数法及时空数据(PanelData)模型分析了中国31个省级区域经济增长集聚及其影响因素。结果显示:①中国省域经济增长具有明显的空间依赖性,在地理空间上存在集聚现象,区域经济增长在时空上呈现出明显的空间效应,忽视空间效应将造成模型设定的偏差和计量结果的非科学性;②空间相关以及由此带来的国际国内贸易及外资等经济活动频繁程度,在很大程度上引起了31个省域区际经济增长的空间不均衡,空间集聚使得在经济增长过程中地理区位(距离)产生的空间成本降低,但地理特征将深刻作用于区域经济增长空间集聚的中心和外围关系;③外商直接投资、国际与区际贸易、人力资本、技术创新等因素对中国区域经济增长的贡献非常重要,但它却不能轻易改变经济地理的规则,经济增长因素在地理空间上的非均衡集聚导致了迥然不同的区域经济增长格局。 展开更多
关键词 区域经济增长 集聚 空间相关性 MORAN指数 时空数据(Panel Data)模型
下载PDF
数据挖掘中的聚类算法综述 被引量:225
4
作者 贺玲 吴玲达 蔡益朝 《计算机应用研究》 CSCD 北大核心 2007年第1期10-13,共4页
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了数据挖掘中聚类算法的研究现状,分析比较了它们的性能差异和各自存在的优点及问题,并结合多媒体领域的应用需求指出了其今后的发展趋势。
关键词 数据挖掘 聚类 聚类算法
下载PDF
Web信息检索研究进展 被引量:118
5
作者 王继成 萧嵘 +1 位作者 孙正兴 张福炎 《计算机研究与发展》 EI CSCD 北大核心 2001年第2期187-193,共7页
Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,... Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,有关 Web信息检索最新技术的比较完整的分析又十分缺乏 .在此 ,对 Web信息检索技术进行了综述 ,从 Web信息检索系统的层次化分类 (搜索引擎与目录、元搜索引擎、信息检索 agent)、一般机制和关键新技术 (基于超链的相关度排序、检索结果的联机聚类、基于概念的检索、相关度反馈 )等方面加以阐述 。 展开更多
关键词 WEB 信息检索 搜索引擎 元搜索引擎 INTERNET
下载PDF
能量均衡的无线传感器网络非均匀分簇路由协议 被引量:221
6
作者 蒋畅江 石为人 +2 位作者 唐贤伦 王平 向敏 《软件学报》 EI CSCD 北大核心 2012年第5期1222-1232,共11页
提出了一种能量高效均衡、非均匀分簇和簇间多跳路由有机结合的无线传感器网络分布式分簇路由协议DEBUC(distributed energy-balanced unequal clustering routing protocol).该协议采用基于时间的簇头竞争算法,广播时间取决于候选簇头... 提出了一种能量高效均衡、非均匀分簇和簇间多跳路由有机结合的无线传感器网络分布式分簇路由协议DEBUC(distributed energy-balanced unequal clustering routing protocol).该协议采用基于时间的簇头竞争算法,广播时间取决于候选簇头的剩余能量和其邻居节点的剩余能量.同时,通过控制不同位置候选簇头的竞争范围,使得距离基站较近的簇的几何尺寸较小.这样,网络中不同位置节点之间的簇内和簇间通信能耗得以互相补偿.DEBUC采用簇间多跳路由,根据节点剩余能量、簇内通信代价和簇间通信代价,每个簇头在邻居簇头集合中运用贪婪算法选择其中继节点.仿真实验结果表明,DEBUC能够有效地节约单个节点能量、均衡网络能耗、延长网络生存周期. 展开更多
关键词 无线传感器网络 路由协议 分簇
下载PDF
聚类算法综述 被引量:200
7
作者 章永来 周耀鉴 《计算机应用》 CSCD 北大核心 2019年第7期1869-1882,共14页
大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大... 大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大类,并特别对大数据聚类作了较为系统的分析与总结。此外,概述并分析了各类聚类算法的研究进展及其应用概况,并结合研究课题讨论了算法的发展趋势。 展开更多
关键词 聚类 相似性度量 大数据聚类 小数据聚类 聚类评价
下载PDF
基于支持向量机与无监督聚类相结合的中文网页分类器 被引量:108
8
作者 李晓黎 刘继敏 史忠植 《计算机学报》 EI CSCD 北大核心 2001年第1期62-68,共7页
提出了一种将支持向量机与无监督聚类相结合的新分类算法 ,给出了一种新的网页表示方法并应用于网页分类问题 .该算法首先利用无监督聚类分别对训练集中正例和反例聚类 ,然后挑选一些例子训练 SVM并获得 SVM分类器 .任何网页可以通过比... 提出了一种将支持向量机与无监督聚类相结合的新分类算法 ,给出了一种新的网页表示方法并应用于网页分类问题 .该算法首先利用无监督聚类分别对训练集中正例和反例聚类 ,然后挑选一些例子训练 SVM并获得 SVM分类器 .任何网页可以通过比较其与聚类中心的距离决定采用无监督聚类方法或 SVM分类器进行分类 .该算法充分利用了 SVM准确率高与无监督聚类速度快的优点 .实验表明它不仅具有较高的训练效率 ,而且有很高的精确度 . 展开更多
关键词 支持向量机 无监督聚类 中文网页分类器 INTERNET 机器学习
下载PDF
模糊聚类分析理论与应用研究进展 被引量:113
9
作者 何清 《模糊系统与数学》 CSCD 1998年第2期89-94,共6页
本文对模糊聚类分析在国内的理论与应用情况作了综述和评价,并介绍了作者在该领域的一些新成果。
关键词 聚类分析 模糊图 模糊等价矩阵 模糊聚类分析
下载PDF
一种基于参考点和密度的快速聚类算法 被引量:108
10
作者 马帅 王腾蛟 +2 位作者 唐世渭 杨冬青 高军 《软件学报》 EI CSCD 北大核心 2003年第6期1089-1095,共7页
数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算... 数据的规模越来越大,要求数据挖掘算法有很高的执行效率.基于密度的聚类是聚类分析中的一种,其主要优点是发现任意形状的聚类和对噪音数据不敏感.提出了一种新的基于参考点和密度的CURD(clustering using references and density)聚类算法,其创新点在于,通过参考点来准确地反映数据的空间几何特征,然后基于参考点对数据进行分析处理.CURD算法保持了基于密度的聚类算法的上述优点,而且CURD算法具有近似线性的时间复杂性,因此CURD算法适合对大规模数据的挖掘.理论分析和实验结果也证明了CURD算法具有处 理任意形状的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的基于R*-树的DBSCAN算法. 展开更多
关键词 快速聚类算法 密度 高维 参考点 数据挖掘
下载PDF
基于项目聚类的协同过滤推荐算法 被引量:147
11
作者 邓爱林 左子叶 朱扬勇 《小型微型计算机系统》 CSCD 北大核心 2004年第9期1665-1670,共6页
推荐系统是电子商务中最重要的技术之一 ,协同过滤是推荐系统中采用最为广泛也是最成功的推荐技术 .随着电子商务系统用户数目和商品数目日益增加 ,在整个用户空间上寻找目标用户的最近邻居非常耗时 ,导致推荐系统的实时性要求难以保证 ... 推荐系统是电子商务中最重要的技术之一 ,协同过滤是推荐系统中采用最为广泛也是最成功的推荐技术 .随着电子商务系统用户数目和商品数目日益增加 ,在整个用户空间上寻找目标用户的最近邻居非常耗时 ,导致推荐系统的实时性要求难以保证 .针对上述问题 ,本文提出了一种基于项目聚类的协同过滤推荐算法 ,根据用户对项目评分的相似性对项目进行聚类 ,生成相应的聚类中心 ,在此基础上计算目标项目与聚类中心的相似性 ,从而只需要在与目标项目最相似的若干个聚类中就能寻找到目标项目的大部分最近邻居并产生推荐列表 .实验结果表明 。 展开更多
关键词 电子商务 推荐系统 协同过滤 聚类 平均绝对偏差
下载PDF
初始聚类中心优化的k-means算法 被引量:152
12
作者 袁方 周志勇 宋鑫 《计算机工程》 CAS CSCD 北大核心 2007年第3期65-66,共2页
传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表... 传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。 展开更多
关键词 数据挖掘 聚类 K-MEANS算法 聚类中心
下载PDF
数据挖掘中的聚类方法 被引量:88
13
作者 王实 高文 《计算机科学》 CSCD 北大核心 2000年第4期42-45,共4页
从空间X中给定一个有限的取样点集(或从数据库中取得有限例子的集合),{x^i}_(i 1)~M,聚类的目标是将数据聚集成类,使得类间的相似性尽量小,而类内的相似性尽量大。分类问题(监督)和聚类问题根本的不同是:分类问题中,我们知道训练例的分... 从空间X中给定一个有限的取样点集(或从数据库中取得有限例子的集合),{x^i}_(i 1)~M,聚类的目标是将数据聚集成类,使得类间的相似性尽量小,而类内的相似性尽量大。分类问题(监督)和聚类问题根本的不同是:分类问题中,我们知道训练例的分类属性值,而在聚类问题中,就需要我们在训练例中找到这个分类属性值。1 展开更多
关键词 数据挖掘 聚类 机器学习 数据库
下载PDF
基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究 被引量:148
14
作者 何勇 李晓丽 邵咏妮 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2006年第5期850-853,共4页
提出了一种用近红外光谱技术快速鉴别苹果品种的新方法,首先用主成分分析法对苹果品种进行聚类分析并获取苹果的近红外指纹图谱,再结合人工神经网络技术进行品种鉴别。主成分分析表明,主成分1和主成分2的累积可信度已达98%,以主成分1和... 提出了一种用近红外光谱技术快速鉴别苹果品种的新方法,首先用主成分分析法对苹果品种进行聚类分析并获取苹果的近红外指纹图谱,再结合人工神经网络技术进行品种鉴别。主成分分析表明,主成分1和主成分2的累积可信度已达98%,以主成分1和2对所有建模样本的得分值做出的得分图,对不同种类苹果具有很好的聚类作用。利用主成分分析得到的载荷图可以得到对于苹果品种敏感的特征波段,用特征波段图谱作为神经网络的输入建立三层BP人工神经网络模型。每个品种各25个苹果共75个用来建立神经网络模型,余下的共15个用于预测。对未知的15个样本进行预测,品种识别准确率达到100%。说明文章提出的方法具有很好的分类和鉴别作用,为苹果的品种鉴别提供了一种新方法。 展开更多
关键词 近红外光谱 苹果 主成分分析 人工神经网络 聚类
下载PDF
基于数据分区的DBSCAN算法 被引量:98
15
作者 周水庚 周傲英 曹晶 《计算机研究与发展》 EI CSCD 北大核心 2000年第10期1153-1159,共7页
数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用 .DBSCAN是一种基于密度的空间聚类算法 ,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点 .但由于直接对数据库进行操作 ,在数据量大的时... 数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用 .DBSCAN是一种基于密度的空间聚类算法 ,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点 .但由于直接对数据库进行操作 ,在数据量大的时候就需要较多的内存和 I/O开销 ;此外 ,当数据密度和聚类间的距离不均匀时聚类质量较差 .为此 ,在分析 DBSCAN算法不足的基础上 ,提出了一个基于数据分区的 DBSCAN算法 .测试结果表明新算法不仅提高了聚类速度 ,而且改善了聚类质量 . 展开更多
关键词 空间数据库 数据挖掘 数据分区 DBSCAN算法
下载PDF
数据挖掘综述 被引量:91
16
作者 钟晓 马少平 +1 位作者 张钹 俞瑞钊 《模式识别与人工智能》 EI CSCD 北大核心 2001年第1期48-55,共8页
数据挖掘技术是一个新兴的、非常重要的、具有广阔应用前景和富有挑战性的研究领域。本文结合具体实例,从概念、方法、特点、任务、过程、应用以及所面临的挑战等各方面对其作了较详细的评述。
关键词 数据挖掘 关联规则 聚类 数据库
原文传递
从多角度分析现有聚类算法(英文) 被引量:86
17
作者 钱卫宁 周傲英 《软件学报》 EI CSCD 北大核心 2002年第8期1382-1394,共13页
聚类是数据挖掘中研究的重要问题之一.聚类分析就是把数据集分成簇,以使得簇内数据尽量相似,簇间数据尽量不同.不同的聚类方法采用不同的相似测度和技术.从以下3个角度分析现有流行聚类算法: (1)聚类尺度; (2)算法框架; (3)簇的表示.在... 聚类是数据挖掘中研究的重要问题之一.聚类分析就是把数据集分成簇,以使得簇内数据尽量相似,簇间数据尽量不同.不同的聚类方法采用不同的相似测度和技术.从以下3个角度分析现有流行聚类算法: (1)聚类尺度; (2)算法框架; (3)簇的表示.在此基础上,分析了一些综合或概括了一些其他方法的算法.由于分析从3个角度进行,所提出的方法能够涵盖,并区分绝大多数现有聚类算法.所做的工作是自调节聚类方法以及聚类基准测试研究的基础. 展开更多
关键词 多角度分析 聚类算法 数据挖掘 数据库 数据集
下载PDF
一种基于密度的快速聚类算法 被引量:89
18
作者 周水庚 周傲英 +1 位作者 曹晶 胡运发 《计算机研究与发展》 EI CSCD 北大核心 2000年第11期1287-1292,共6页
聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了... 聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了一种基于密度的快速聚类算法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 ,实现快速聚类 .对二维空间数据测试表明 :快速算法能够有效地对大规模数据库进行聚类 ,速度上数倍于已有 DBSCAN算法 . 展开更多
关键词 数据挖掘 聚类 密度 快速算法 数据库
下载PDF
基于云计算的居民用电行为分析模型研究 被引量:133
19
作者 张素香 刘建明 +1 位作者 赵丙镇 曹津平 《电网技术》 EI CSCD 北大核心 2013年第6期1542-1546,共5页
对智能小区的居民用电行为展开研究,基于云计算平台和并行k-means聚类算法,建立了峰时耗电率、负荷率、谷电系数等时间序列特征,并采用熵权法计算各类特征权重,实验数据来自已建的智能小区中的600名用户。实验结果表明,智能小区的居民... 对智能小区的居民用电行为展开研究,基于云计算平台和并行k-means聚类算法,建立了峰时耗电率、负荷率、谷电系数等时间序列特征,并采用熵权法计算各类特征权重,实验数据来自已建的智能小区中的600名用户。实验结果表明,智能小区的居民用户被分成空置房、上班族、上班族+老人、老人家庭、商业用户等5类用户,聚类的准确率达到了91.2%,证明文中基于云计算平台和并行k_means聚类算法的居民用电行为分析模型是有效的。 展开更多
关键词 云计算 聚类 居民用电行为
下载PDF
聚类有效性评价综述 被引量:117
20
作者 杨燕 靳蕃 KAMEL Mohamed 《计算机应用研究》 CSCD 北大核心 2008年第6期1630-1632,1638,共4页
在聚类分析应用中,迫切需要一种客观公正的质量评价方法来评判聚类结果的有效性。为此,从外部评价法、内部评价法和相对评价法三个方面,归纳综述了常用的聚类有效性评价方法,并讨论了模糊聚类评价法和聚类最佳类别数的自动确定问题。
关键词 聚类 聚类评价 有效性指数
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部