期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
42,728
篇文章
<
1
2
…
250
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
聚类算法研究
被引量:
1069
1
作者
孙吉贵
刘杰
赵连宇
《软件学报》
EI
CSCD
北大核心
2008年第1期48-61,共14页
对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括;另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进...
对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括;另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进行模拟实验,并分别就同一种聚类算法、不同的数据集以及同一个数据集、不同的聚类算法的聚类情况进行对比分析.最后通过综合上述两方面信息给出聚类分析的研究热点、难点、不足和有待解决的一些问题.上述工作将为聚类分析和数据挖掘等研究提供有益的参考.
展开更多
关键词
聚
类
算法
实验
下载PDF
职称材料
彩色图像分割方法综述
被引量:
322
2
作者
林开颜
吴军辉
徐立鸿
《中国图象图形学报(A辑)》
CSCD
北大核心
2005年第1期1-10,共10页
由于彩色图像提供了比灰度图像更为丰富的信息,因此彩色图像处理正受到人们越来越多的关注。彩色图像分割是彩色图像处理的重要问题,彩色图像分割可以看成是灰度图像分割技术在各种颜色空间上的应用,为了使该领域的研究人员对当前各种...
由于彩色图像提供了比灰度图像更为丰富的信息,因此彩色图像处理正受到人们越来越多的关注。彩色图像分割是彩色图像处理的重要问题,彩色图像分割可以看成是灰度图像分割技术在各种颜色空间上的应用,为了使该领域的研究人员对当前各种彩色图像分割方法有较全面的了解,因此对各种彩色图像分割方法进行了系统论述,即先对各种颜色空间进行简单介绍,然后对直方图阈值法、特征空间聚类、基于区域的方法、边缘检测、模糊方法、神经元网络、基于物理模型方法等主要的彩色图像分割技术进行综述,并比较了它们的优缺点,通过比较发现模糊技术由于能很好地表达和处理不确定性问题,因此在彩色图像分割领域会有更广阔的应用前景。
展开更多
关键词
彩色图像分割
彩色图像处理
灰度图像
颜色空间
边缘检测
聚
类
特征空间
综述
表达
方法
下载PDF
职称材料
大数据下的机器学习算法综述
被引量:
323
3
作者
何清
李宁
+1 位作者
罗文娟
史忠植
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第4期327-336,共10页
随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界...
随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题.文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状.此外,并行是处理大数据的主流方法,因此介绍一些并行算法,并引出大数据环境下机器学习研究所面临的问题.最后指出大数据机器学习的研究趋势.
展开更多
关键词
大数据
机器学习
分
类
聚
类
并行算法
下载PDF
职称材料
数据挖掘中的聚类算法综述
被引量:
225
4
作者
贺玲
吴玲达
蔡益朝
《计算机应用研究》
CSCD
北大核心
2007年第1期10-13,共4页
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了数据挖掘中聚类算法的研究现状,分析比较了它们的性能差异和各自存在的优点及问题,并结合多媒体领域的应用需求指出了其今后的发展趋势。
关键词
数据挖掘
聚
类
聚
类
算法
下载PDF
职称材料
聚类算法综述
被引量:
200
5
作者
章永来
周耀鉴
《计算机应用》
CSCD
北大核心
2019年第7期1869-1882,共14页
大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大...
大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大类,并特别对大数据聚类作了较为系统的分析与总结。此外,概述并分析了各类聚类算法的研究进展及其应用概况,并结合研究课题讨论了算法的发展趋势。
展开更多
关键词
聚
类
相似性度量
大数据
聚
类
小数据
聚
类
聚
类
评价
下载PDF
职称材料
基于项目聚类的协同过滤推荐算法
被引量:
147
6
作者
邓爱林
左子叶
朱扬勇
《小型微型计算机系统》
CSCD
北大核心
2004年第9期1665-1670,共6页
推荐系统是电子商务中最重要的技术之一 ,协同过滤是推荐系统中采用最为广泛也是最成功的推荐技术 .随着电子商务系统用户数目和商品数目日益增加 ,在整个用户空间上寻找目标用户的最近邻居非常耗时 ,导致推荐系统的实时性要求难以保证 ...
推荐系统是电子商务中最重要的技术之一 ,协同过滤是推荐系统中采用最为广泛也是最成功的推荐技术 .随着电子商务系统用户数目和商品数目日益增加 ,在整个用户空间上寻找目标用户的最近邻居非常耗时 ,导致推荐系统的实时性要求难以保证 .针对上述问题 ,本文提出了一种基于项目聚类的协同过滤推荐算法 ,根据用户对项目评分的相似性对项目进行聚类 ,生成相应的聚类中心 ,在此基础上计算目标项目与聚类中心的相似性 ,从而只需要在与目标项目最相似的若干个聚类中就能寻找到目标项目的大部分最近邻居并产生推荐列表 .实验结果表明 。
展开更多
关键词
电子商务
推荐系统
协同过滤
聚
类
平均绝对偏差
下载PDF
职称材料
初始聚类中心优化的k-means算法
被引量:
152
7
作者
袁方
周志勇
宋鑫
《计算机工程》
CAS
CSCD
北大核心
2007年第3期65-66,共2页
传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表...
传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。
展开更多
关键词
数据挖掘
聚
类
K-MEANS算法
聚
类
中心
下载PDF
职称材料
数据挖掘中的聚类方法
被引量:
88
8
作者
王实
高文
《计算机科学》
CSCD
北大核心
2000年第4期42-45,共4页
从空间X中给定一个有限的取样点集(或从数据库中取得有限例子的集合),{x^i}_(i 1)~M,聚类的目标是将数据聚集成类,使得类间的相似性尽量小,而类内的相似性尽量大。分类问题(监督)和聚类问题根本的不同是:分类问题中,我们知道训练例的分...
从空间X中给定一个有限的取样点集(或从数据库中取得有限例子的集合),{x^i}_(i 1)~M,聚类的目标是将数据聚集成类,使得类间的相似性尽量小,而类内的相似性尽量大。分类问题(监督)和聚类问题根本的不同是:分类问题中,我们知道训练例的分类属性值,而在聚类问题中,就需要我们在训练例中找到这个分类属性值。1
展开更多
关键词
数据挖掘
聚
类
机器学习
数据库
下载PDF
职称材料
基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究
被引量:
148
9
作者
何勇
李晓丽
邵咏妮
《光谱学与光谱分析》
SCIE
EI
CAS
CSCD
北大核心
2006年第5期850-853,共4页
提出了一种用近红外光谱技术快速鉴别苹果品种的新方法,首先用主成分分析法对苹果品种进行聚类分析并获取苹果的近红外指纹图谱,再结合人工神经网络技术进行品种鉴别。主成分分析表明,主成分1和主成分2的累积可信度已达98%,以主成分1和...
提出了一种用近红外光谱技术快速鉴别苹果品种的新方法,首先用主成分分析法对苹果品种进行聚类分析并获取苹果的近红外指纹图谱,再结合人工神经网络技术进行品种鉴别。主成分分析表明,主成分1和主成分2的累积可信度已达98%,以主成分1和2对所有建模样本的得分值做出的得分图,对不同种类苹果具有很好的聚类作用。利用主成分分析得到的载荷图可以得到对于苹果品种敏感的特征波段,用特征波段图谱作为神经网络的输入建立三层BP人工神经网络模型。每个品种各25个苹果共75个用来建立神经网络模型,余下的共15个用于预测。对未知的15个样本进行预测,品种识别准确率达到100%。说明文章提出的方法具有很好的分类和鉴别作用,为苹果的品种鉴别提供了一种新方法。
展开更多
关键词
近红外光谱
苹果
主成分分析
人工神经网络
聚
类
下载PDF
职称材料
数据挖掘综述
被引量:
91
10
作者
钟晓
马少平
+1 位作者
张钹
俞瑞钊
《模式识别与人工智能》
EI
CSCD
北大核心
2001年第1期48-55,共8页
数据挖掘技术是一个新兴的、非常重要的、具有广阔应用前景和富有挑战性的研究领域。本文结合具体实例,从概念、方法、特点、任务、过程、应用以及所面临的挑战等各方面对其作了较详细的评述。
关键词
数据挖掘
关联规则
聚
类
数据库
原文传递
体质的聚类研究
被引量:
108
11
作者
何裕民
王莉
+3 位作者
石凤亭
楚更武
张大凤
徐云
《中国中医基础医学杂志》
CAS
CSCD
1996年第5期7-9,共3页
体质的聚类研究何裕民*王莉*石凤亭**(上海中医药大学上海200032)楚更武***张大凤****徐云*(上海农业科学院医院上海200331)关键词体质聚类体质学说是近年来现代中医研究中很受重视的一大领域。人们企盼这...
体质的聚类研究何裕民*王莉*石凤亭**(上海中医药大学上海200032)楚更武***张大凤****徐云*(上海农业科学院医院上海200331)关键词体质聚类体质学说是近年来现代中医研究中很受重视的一大领域。人们企盼这方面的突破,能对中医“证”的研究及...
展开更多
关键词
体质
聚
类
体质学说
中医学
下载PDF
职称材料
一种基于密度的快速聚类算法
被引量:
89
12
作者
周水庚
周傲英
+1 位作者
曹晶
胡运发
《计算机研究与发展》
EI
CSCD
北大核心
2000年第11期1287-1292,共6页
聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了...
聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了一种基于密度的快速聚类算法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 ,实现快速聚类 .对二维空间数据测试表明 :快速算法能够有效地对大规模数据库进行聚类 ,速度上数倍于已有 DBSCAN算法 .
展开更多
关键词
数据挖掘
聚
类
密度
快速算法
数据库
下载PDF
职称材料
聚类/分类中的粒度原理
被引量:
95
13
作者
卜东波
白硕
李国杰
《计算机学报》
EI
CSCD
北大核心
2002年第8期810-816,共7页
从信息粒度的角度来剖析聚类和分类技术 ,试图使用信息粒度原理的框架来统一聚类和分类 .从信息粒度的观点来看 ,聚类是在一个统一的粒度下进行计算 ,而分类却是在不同的粒度下进行计算 .该文还根据粒度原理设计了一种崭新的分类算法 ,...
从信息粒度的角度来剖析聚类和分类技术 ,试图使用信息粒度原理的框架来统一聚类和分类 .从信息粒度的观点来看 ,聚类是在一个统一的粒度下进行计算 ,而分类却是在不同的粒度下进行计算 .该文还根据粒度原理设计了一种崭新的分类算法 ,在大规模中文文本分类的应用实践表明这种分类算法有较强的泛化能力 .
展开更多
关键词
聚
类
分
类
粒度原理
信息粒度
粗集
人工智能
信息处理
下载PDF
职称材料
基于云计算的居民用电行为分析模型研究
被引量:
133
14
作者
张素香
刘建明
+1 位作者
赵丙镇
曹津平
《电网技术》
EI
CSCD
北大核心
2013年第6期1542-1546,共5页
对智能小区的居民用电行为展开研究,基于云计算平台和并行k-means聚类算法,建立了峰时耗电率、负荷率、谷电系数等时间序列特征,并采用熵权法计算各类特征权重,实验数据来自已建的智能小区中的600名用户。实验结果表明,智能小区的居民...
对智能小区的居民用电行为展开研究,基于云计算平台和并行k-means聚类算法,建立了峰时耗电率、负荷率、谷电系数等时间序列特征,并采用熵权法计算各类特征权重,实验数据来自已建的智能小区中的600名用户。实验结果表明,智能小区的居民用户被分成空置房、上班族、上班族+老人、老人家庭、商业用户等5类用户,聚类的准确率达到了91.2%,证明文中基于云计算平台和并行k_means聚类算法的居民用电行为分析模型是有效的。
展开更多
关键词
云计算
聚
类
居民用电行为
下载PDF
职称材料
聚类有效性评价综述
被引量:
117
15
作者
杨燕
靳蕃
KAMEL Mohamed
《计算机应用研究》
CSCD
北大核心
2008年第6期1630-1632,1638,共4页
在聚类分析应用中,迫切需要一种客观公正的质量评价方法来评判聚类结果的有效性。为此,从外部评价法、内部评价法和相对评价法三个方面,归纳综述了常用的聚类有效性评价方法,并讨论了模糊聚类评价法和聚类最佳类别数的自动确定问题。
关键词
聚
类
聚
类
评价
有效性指数
下载PDF
职称材料
基于内容的图像分割方法综述
被引量:
130
16
作者
姜枫
顾庆
+3 位作者
郝慧珍
李娜
郭延文
陈道蓄
《软件学报》
EI
CSCD
北大核心
2017年第1期160-183,共24页
图像分割是指将图像分成若干具有相似性质的区域的过程,是许多图像处理任务的预处理步骤.近年来,国内外学者主要研究基于图像内容的分割算法.在广泛调研大量文献和最新成果的基础上,将图像分割算法分为基于图论的方法、基于像素聚类的...
图像分割是指将图像分成若干具有相似性质的区域的过程,是许多图像处理任务的预处理步骤.近年来,国内外学者主要研究基于图像内容的分割算法.在广泛调研大量文献和最新成果的基础上,将图像分割算法分为基于图论的方法、基于像素聚类的方法和语义分割方法这3种类型并分别加以介绍.对每类方法所包含的典型算法,尤其是最近几年利用深度网络技术的语义图像分割方法的基本思想、优缺点进行了分析、对比和总结.介绍了图像分割常用的基准数据集和算法评价标准,并用实验对各种图像分割算法进行对比.最后进行总结,并对未来可能的发展趋势加以展望.
展开更多
关键词
图像分割
图论
聚
类
语义分割
深度神经网络
下载PDF
职称材料
不同类型茶园昆虫、蜘蛛群落结构分析
被引量:
81
17
作者
谭济才
邓欣
袁哲明
《生态学报》
CAS
CSCD
北大核心
1998年第3期289-294,共6页
应用多样性指数、排序和聚类分析方法研究了不同生态环境和防治处理的茶园昆虫、蜘蛛群落结构。结果表明:在生态控制的茶园,由于完全不使用化学农药,昆虫和蜘蛛的丰富度、多样性指数、均匀度均较大。综合防治的茶园次之。而主要依靠...
应用多样性指数、排序和聚类分析方法研究了不同生态环境和防治处理的茶园昆虫、蜘蛛群落结构。结果表明:在生态控制的茶园,由于完全不使用化学农药,昆虫和蜘蛛的丰富度、多样性指数、均匀度均较大。综合防治的茶园次之。而主要依靠化学防治的茶园,丰富度减少,多样性指数和均匀度降低,经常出现害虫暴发成灾的现象。生态环境复杂的茶园比生态环境单调的茶园、成龄茶园比幼龄茶园的多样性指数和均匀度也较高。因此,化学农药和生态环境是造成茶园昆虫、蜘蛛群落结构差异的主要因素。
展开更多
关键词
茶园
群落结构
排序
聚
类
昆虫
蜘蛛
下载PDF
职称材料
基于轮廓系数的聚类有效性分析
被引量:
117
18
作者
朱连江
马炳先
赵学泉
《计算机应用》
CSCD
北大核心
2010年第12期139-141,198,共4页
针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果...
针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果的判断,在标准数据集上的实验结果有效地验证了这点。并进一步将此有效性分析方法应用于文本聚类。
展开更多
关键词
聚
类
K均值算法
轮廓系数
有效性分析
无监督
下载PDF
职称材料
图像分割方法综述研究
被引量:
115
19
作者
周莉莉
姜枫
《计算机应用研究》
CSCD
北大核心
2017年第7期1921-1928,共8页
图像分割是计算机视觉领域重要和基础性的问题,也是颇具挑战性的任务。为了解该问题的研究现状、存在问题及发展前景,在广泛调研现有文献和最新成果的基础上,针对2000年之后主流的图像分割方法进行了研究,将之分为四类:基于图论的方法...
图像分割是计算机视觉领域重要和基础性的问题,也是颇具挑战性的任务。为了解该问题的研究现状、存在问题及发展前景,在广泛调研现有文献和最新成果的基础上,针对2000年之后主流的图像分割方法进行了研究,将之分为四类:基于图论的方法、基于聚类的方法、基于分类的方法以及结合聚类和分类的方法,对每类方法所包含的典型算法,尤其是该领域最近几年发表的最新文章的基本思想、优缺点进行介绍和分析。最后介绍了图像分割常用的基准数据集和算法评价指标,对比各种算法并总结全文,对未来可能的发展趋势进行了展望。
展开更多
关键词
图像分割
图论
聚
类
分
类
下载PDF
职称材料
基于DBSCAN聚类算法的研究与实现
被引量:
77
20
作者
荣秋生
颜君彪
郭国强
《计算机应用》
CSCD
北大核心
2004年第4期45-46,61,共3页
高密度聚类作为数据挖掘中聚类算法的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的类。文中分析了传统的聚类算法及局限性,讨论了一个基于高密度聚类算法的实现过程,使得算法可自动发现高维子空间,处理高维...
高密度聚类作为数据挖掘中聚类算法的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的类。文中分析了传统的聚类算法及局限性,讨论了一个基于高密度聚类算法的实现过程,使得算法可自动发现高维子空间,处理高维数据表格,得到较快的聚类速度和最佳的聚类效果。
展开更多
关键词
数据挖掘
聚
类
高密度
网格
DBSCAN
下载PDF
职称材料
题名
聚类算法研究
被引量:
1069
1
作者
孙吉贵
刘杰
赵连宇
机构
吉林大学计算机科学与技术学院
出处
《软件学报》
EI
CSCD
北大核心
2008年第1期48-61,共14页
基金
Supported by the National Natural Science Foundation of Chinaunder GrantNos.60473003,60573073(国家自然科学基金)
the Major Research Program of National Natural Science Foundation of Chinaunder GrantNo.60496321(国家自然科学基金重大项目)
文摘
对近年来聚类算法的研究现状与新进展进行归纳总结.一方面对近年来提出的较有代表性的聚类算法,从算法思想、关键技术和优缺点等方面进行分析概括;另一方面选择一些典型的聚类算法和一些知名的数据集,主要从正确率和运行效率两个方面进行模拟实验,并分别就同一种聚类算法、不同的数据集以及同一个数据集、不同的聚类算法的聚类情况进行对比分析.最后通过综合上述两方面信息给出聚类分析的研究热点、难点、不足和有待解决的一些问题.上述工作将为聚类分析和数据挖掘等研究提供有益的参考.
关键词
聚
类
算法
实验
Keywords
clustering
algorithm
experiment
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
彩色图像分割方法综述
被引量:
322
2
作者
林开颜
吴军辉
徐立鸿
机构
同济大学现代农业科学与工程研究院
出处
《中国图象图形学报(A辑)》
CSCD
北大核心
2005年第1期1-10,共10页
文摘
由于彩色图像提供了比灰度图像更为丰富的信息,因此彩色图像处理正受到人们越来越多的关注。彩色图像分割是彩色图像处理的重要问题,彩色图像分割可以看成是灰度图像分割技术在各种颜色空间上的应用,为了使该领域的研究人员对当前各种彩色图像分割方法有较全面的了解,因此对各种彩色图像分割方法进行了系统论述,即先对各种颜色空间进行简单介绍,然后对直方图阈值法、特征空间聚类、基于区域的方法、边缘检测、模糊方法、神经元网络、基于物理模型方法等主要的彩色图像分割技术进行综述,并比较了它们的优缺点,通过比较发现模糊技术由于能很好地表达和处理不确定性问题,因此在彩色图像分割领域会有更广阔的应用前景。
关键词
彩色图像分割
彩色图像处理
灰度图像
颜色空间
边缘检测
聚
类
特征空间
综述
表达
方法
Keywords
color image segmentation, color space, histogram thresholding, edge detection, fuzzy techniques, neural networks
分类号
TB114.3 [理学—概率论与数理统计]
TP391 [理学—数学]
下载PDF
职称材料
题名
大数据下的机器学习算法综述
被引量:
323
3
作者
何清
李宁
罗文娟
史忠植
机构
中国科学院计算技术研究所智能信息处理重点实验室
中国科学院大学
河北大学数学与计算机学院
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第4期327-336,共10页
基金
国家自然科学基金项目(No.61175052
61203297
+4 种基金
61035003
61363058)
国家863计划项目(No.2014AA012205
2013AA01A606
2012AA011003)资助
文摘
随着产业界数据量的爆炸式增长,大数据概念受到越来越多的关注.由于大数据的海量、复杂多样、变化快的特性,对于大数据环境下的应用问题,传统的在小数据上的机器学习算法很多已不再适用.因此,研究大数据环境下的机器学习算法成为学术界和产业界共同关注的话题.文中主要分析和总结当前用于处理大数据的机器学习算法的研究现状.此外,并行是处理大数据的主流方法,因此介绍一些并行算法,并引出大数据环境下机器学习研究所面临的问题.最后指出大数据机器学习的研究趋势.
关键词
大数据
机器学习
分
类
聚
类
并行算法
Keywords
Big Data
Machine Learning
Classification
Clustering
Parallel Algorithm
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
数据挖掘中的聚类算法综述
被引量:
225
4
作者
贺玲
吴玲达
蔡益朝
机构
国防科学技术大学信息系统与管理学院
出处
《计算机应用研究》
CSCD
北大核心
2007年第1期10-13,共4页
基金
国家自然科学基金资助项目(60473117)
文摘
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了数据挖掘中聚类算法的研究现状,分析比较了它们的性能差异和各自存在的优点及问题,并结合多媒体领域的应用需求指出了其今后的发展趋势。
关键词
数据挖掘
聚
类
聚
类
算法
Keywords
Data Mining
Clustering
Clustering Algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
聚类算法综述
被引量:
200
5
作者
章永来
周耀鉴
机构
中北大学软件学院
出处
《计算机应用》
CSCD
北大核心
2019年第7期1869-1882,共14页
基金
国家自然科学基金资助项目(6160051296)~~
文摘
大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大类,并特别对大数据聚类作了较为系统的分析与总结。此外,概述并分析了各类聚类算法的研究进展及其应用概况,并结合研究课题讨论了算法的发展趋势。
关键词
聚
类
相似性度量
大数据
聚
类
小数据
聚
类
聚
类
评价
Keywords
clustering
similarity measurement
big data clustering
small data clustering
clustering evaluation
分类号
TP301 [自动化与计算机技术—计算机系统结构]
TP18 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
基于项目聚类的协同过滤推荐算法
被引量:
147
6
作者
邓爱林
左子叶
朱扬勇
机构
复旦大学计算机与信息技术系
出处
《小型微型计算机系统》
CSCD
北大核心
2004年第9期1665-1670,共6页
基金
国家 8 63计划 ( 2 0 0 1AA113 181)资助
文摘
推荐系统是电子商务中最重要的技术之一 ,协同过滤是推荐系统中采用最为广泛也是最成功的推荐技术 .随着电子商务系统用户数目和商品数目日益增加 ,在整个用户空间上寻找目标用户的最近邻居非常耗时 ,导致推荐系统的实时性要求难以保证 .针对上述问题 ,本文提出了一种基于项目聚类的协同过滤推荐算法 ,根据用户对项目评分的相似性对项目进行聚类 ,生成相应的聚类中心 ,在此基础上计算目标项目与聚类中心的相似性 ,从而只需要在与目标项目最相似的若干个聚类中就能寻找到目标项目的大部分最近邻居并产生推荐列表 .实验结果表明 。
关键词
电子商务
推荐系统
协同过滤
聚
类
平均绝对偏差
Keywords
E Commerce
recommendation systems
collaborative filtering
clustering
MAE
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
初始聚类中心优化的k-means算法
被引量:
152
7
作者
袁方
周志勇
宋鑫
机构
河北大学数学与计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第3期65-66,共2页
基金
河北省科技厅攻关计划基金资助项目(05213573)
河北省教育厅科研计划基金资助项目(2004406)
文摘
传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。
关键词
数据挖掘
聚
类
K-MEANS算法
聚
类
中心
Keywords
Data mining
Clustering
K-means algorithm
Clustering center
分类号
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
数据挖掘中的聚类方法
被引量:
88
8
作者
王实
高文
机构
中国科学院计算技术研究所
出处
《计算机科学》
CSCD
北大核心
2000年第4期42-45,共4页
文摘
从空间X中给定一个有限的取样点集(或从数据库中取得有限例子的集合),{x^i}_(i 1)~M,聚类的目标是将数据聚集成类,使得类间的相似性尽量小,而类内的相似性尽量大。分类问题(监督)和聚类问题根本的不同是:分类问题中,我们知道训练例的分类属性值,而在聚类问题中,就需要我们在训练例中找到这个分类属性值。1
关键词
数据挖掘
聚
类
机器学习
数据库
Keywords
Data mining,Clustering
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究
被引量:
148
9
作者
何勇
李晓丽
邵咏妮
机构
浙江大学生物工程与食品科学学院
出处
《光谱学与光谱分析》
SCIE
EI
CAS
CSCD
北大核心
2006年第5期850-853,共4页
基金
国家自然科学基金项目(30270773)
高等学校优秀青年教师教学科研奖励计划(02411)
浙江省自然科学基金人才基金项目(RC02067)资助
文摘
提出了一种用近红外光谱技术快速鉴别苹果品种的新方法,首先用主成分分析法对苹果品种进行聚类分析并获取苹果的近红外指纹图谱,再结合人工神经网络技术进行品种鉴别。主成分分析表明,主成分1和主成分2的累积可信度已达98%,以主成分1和2对所有建模样本的得分值做出的得分图,对不同种类苹果具有很好的聚类作用。利用主成分分析得到的载荷图可以得到对于苹果品种敏感的特征波段,用特征波段图谱作为神经网络的输入建立三层BP人工神经网络模型。每个品种各25个苹果共75个用来建立神经网络模型,余下的共15个用于预测。对未知的15个样本进行预测,品种识别准确率达到100%。说明文章提出的方法具有很好的分类和鉴别作用,为苹果的品种鉴别提供了一种新方法。
关键词
近红外光谱
苹果
主成分分析
人工神经网络
聚
类
Keywords
Near infrared spectral
Apple
Principal component analysis (PCA)
Artificial neural network
Clustering
分类号
S123 [农业科学—农业基础科学]
TH744.1 [机械工程—光学工程]
下载PDF
职称材料
题名
数据挖掘综述
被引量:
91
10
作者
钟晓
马少平
张钹
俞瑞钊
机构
浙江大学计算机系人工智能研究所智能软件实验室
清华大学计算机科学技术系
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2001年第1期48-55,共8页
文摘
数据挖掘技术是一个新兴的、非常重要的、具有广阔应用前景和富有挑战性的研究领域。本文结合具体实例,从概念、方法、特点、任务、过程、应用以及所面临的挑战等各方面对其作了较详细的评述。
关键词
数据挖掘
关联规则
聚
类
数据库
Keywords
Data Mining, Association Rule, Classification, Clustering
分类号
TP311.131 [自动化与计算机技术—计算机软件与理论]
原文传递
题名
体质的聚类研究
被引量:
108
11
作者
何裕民
王莉
石凤亭
楚更武
张大凤
徐云
机构
上海中医药大学
上海农业科学院医院
出处
《中国中医基础医学杂志》
CAS
CSCD
1996年第5期7-9,共3页
文摘
体质的聚类研究何裕民*王莉*石凤亭**(上海中医药大学上海200032)楚更武***张大凤****徐云*(上海农业科学院医院上海200331)关键词体质聚类体质学说是近年来现代中医研究中很受重视的一大领域。人们企盼这方面的突破,能对中医“证”的研究及...
关键词
体质
聚
类
体质学说
中医学
分类号
R223 [医药卫生—中医基础理论]
下载PDF
职称材料
题名
一种基于密度的快速聚类算法
被引量:
89
12
作者
周水庚
周傲英
曹晶
胡运发
机构
复旦大学计算机科学系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2000年第11期1287-1292,共6页
基金
国家自然科学基金项目!(项目编号 6 97430 0 1)
国家教委博士点教育基金
文摘
聚类是数据挖掘领域中的一个重要研究方向 .聚类技术在统计数据分析、模式识别、图像处理等领域有广泛应用 .迄今为止人们提出了许多用于大规模数据库的聚类算法 .基于密度的聚类算法 DBSCAN就是一个典型代表 .以 DBSCAN为基础 ,提出了一种基于密度的快速聚类算法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 ,实现快速聚类 .对二维空间数据测试表明 :快速算法能够有效地对大规模数据库进行聚类 ,速度上数倍于已有 DBSCAN算法 .
关键词
数据挖掘
聚
类
密度
快速算法
数据库
Keywords
spatial database, data mining, clustering, density, fast algorithm, representative objects
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
聚类/分类中的粒度原理
被引量:
95
13
作者
卜东波
白硕
李国杰
机构
中国科学院计算技术研究所
出处
《计算机学报》
EI
CSCD
北大核心
2002年第8期810-816,共7页
基金
国家自然科学基金 ( 6 97730 0 8)
国家"九七三"重点基础研究发展规划项目 ( G19980 30 5 10 )资助
文摘
从信息粒度的角度来剖析聚类和分类技术 ,试图使用信息粒度原理的框架来统一聚类和分类 .从信息粒度的观点来看 ,聚类是在一个统一的粒度下进行计算 ,而分类却是在不同的粒度下进行计算 .该文还根据粒度原理设计了一种崭新的分类算法 ,在大规模中文文本分类的应用实践表明这种分类算法有较强的泛化能力 .
关键词
聚
类
分
类
粒度原理
信息粒度
粗集
人工智能
信息处理
Keywords
Classification (of information)
Rough set theory
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于云计算的居民用电行为分析模型研究
被引量:
133
14
作者
张素香
刘建明
赵丙镇
曹津平
机构
国网信息通信有限公司
出处
《电网技术》
EI
CSCD
北大核心
2013年第6期1542-1546,共5页
基金
国家863高技术基金项目(智能配用电信息及通信支撑技术研究与开发
2011AA05A116)
+1 种基金
2011年国家科技重大专项(泛在网络下多终端协同的网络控制平台及关键技术
2011ZX03005-004-01)~~
文摘
对智能小区的居民用电行为展开研究,基于云计算平台和并行k-means聚类算法,建立了峰时耗电率、负荷率、谷电系数等时间序列特征,并采用熵权法计算各类特征权重,实验数据来自已建的智能小区中的600名用户。实验结果表明,智能小区的居民用户被分成空置房、上班族、上班族+老人、老人家庭、商业用户等5类用户,聚类的准确率达到了91.2%,证明文中基于云计算平台和并行k_means聚类算法的居民用电行为分析模型是有效的。
关键词
云计算
聚
类
居民用电行为
Keywords
cloud computing
clustering
residentialelectricity consumption behavior
分类号
TM721 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
聚类有效性评价综述
被引量:
117
15
作者
杨燕
靳蕃
KAMEL Mohamed
机构
西南交通大学信息科学与技术学院
Dept.of Electrical&Computing Engineering
出处
《计算机应用研究》
CSCD
北大核心
2008年第6期1630-1632,1638,共4页
基金
四川省重大基础研究基金子项目(04JY029-001-4)
文摘
在聚类分析应用中,迫切需要一种客观公正的质量评价方法来评判聚类结果的有效性。为此,从外部评价法、内部评价法和相对评价法三个方面,归纳综述了常用的聚类有效性评价方法,并讨论了模糊聚类评价法和聚类最佳类别数的自动确定问题。
关键词
聚
类
聚
类
评价
有效性指数
Keywords
clustering
clustering evaluation
validity index
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于内容的图像分割方法综述
被引量:
130
16
作者
姜枫
顾庆
郝慧珍
李娜
郭延文
陈道蓄
机构
计算机软件新技术国家重点实验室(南京大学)
南京大学计算机科学与技术系
南京理工大学泰州科技学院移动互联网学院
南京工程学院通信工程系
出处
《软件学报》
EI
CSCD
北大核心
2017年第1期160-183,共24页
基金
国家自然科学基金(61373012
91218302
+3 种基金
61321491
61373059)
江苏省高校自然科学研究项目(15KJB520016)
江苏省自然科学基金(BK20150016)~~
文摘
图像分割是指将图像分成若干具有相似性质的区域的过程,是许多图像处理任务的预处理步骤.近年来,国内外学者主要研究基于图像内容的分割算法.在广泛调研大量文献和最新成果的基础上,将图像分割算法分为基于图论的方法、基于像素聚类的方法和语义分割方法这3种类型并分别加以介绍.对每类方法所包含的典型算法,尤其是最近几年利用深度网络技术的语义图像分割方法的基本思想、优缺点进行了分析、对比和总结.介绍了图像分割常用的基准数据集和算法评价标准,并用实验对各种图像分割算法进行对比.最后进行总结,并对未来可能的发展趋势加以展望.
关键词
图像分割
图论
聚
类
语义分割
深度神经网络
Keywords
image segmentation
graph theory
clustering
semantic segmentation
deep neural network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
不同类型茶园昆虫、蜘蛛群落结构分析
被引量:
81
17
作者
谭济才
邓欣
袁哲明
机构
湖南农业大学植物保护系
出处
《生态学报》
CAS
CSCD
北大核心
1998年第3期289-294,共6页
基金
湖南省"八五"重大课题
文摘
应用多样性指数、排序和聚类分析方法研究了不同生态环境和防治处理的茶园昆虫、蜘蛛群落结构。结果表明:在生态控制的茶园,由于完全不使用化学农药,昆虫和蜘蛛的丰富度、多样性指数、均匀度均较大。综合防治的茶园次之。而主要依靠化学防治的茶园,丰富度减少,多样性指数和均匀度降低,经常出现害虫暴发成灾的现象。生态环境复杂的茶园比生态环境单调的茶园、成龄茶园比幼龄茶园的多样性指数和均匀度也较高。因此,化学农药和生态环境是造成茶园昆虫、蜘蛛群落结构差异的主要因素。
关键词
茶园
群落结构
排序
聚
类
昆虫
蜘蛛
Keywords
tea plantation,community structure,ordination and cluster.
分类号
S435.711 [农业科学—农业昆虫与害虫防治]
S476.2 [农业科学—植物保护]
下载PDF
职称材料
题名
基于轮廓系数的聚类有效性分析
被引量:
117
18
作者
朱连江
马炳先
赵学泉
机构
济南大学信息科学与工程学院
联通系统集成有限公司山东省分公司
出处
《计算机应用》
CSCD
北大核心
2010年第12期139-141,198,共4页
基金
国家自然科学基金资助项目(60903099)
文摘
针对聚类结果进行有效性研究的方法有多种。通过对多种不同聚类有效性分析方法的比较,提出了一种新的基于轮廓系数的聚类有效性分析方法,并将其应用于K-m eans算法的评测中。与其他有效性分析方法相比,该方法可以更好实现对于聚类效果的判断,在标准数据集上的实验结果有效地验证了这点。并进一步将此有效性分析方法应用于文本聚类。
关键词
聚
类
K均值算法
轮廓系数
有效性分析
无监督
Keywords
clustering
K-means algorithm
silhouette coefficient
validity analysis
unsupervised
分类号
TP391.72 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
图像分割方法综述研究
被引量:
115
19
作者
周莉莉
姜枫
机构
南京理工大学泰州科技学院移动互联网学院
出处
《计算机应用研究》
CSCD
北大核心
2017年第7期1921-1928,共8页
基金
国家自然科学基金资助项目(61373012)
江苏省高校自然科学研究项目(15KJB520016)
文摘
图像分割是计算机视觉领域重要和基础性的问题,也是颇具挑战性的任务。为了解该问题的研究现状、存在问题及发展前景,在广泛调研现有文献和最新成果的基础上,针对2000年之后主流的图像分割方法进行了研究,将之分为四类:基于图论的方法、基于聚类的方法、基于分类的方法以及结合聚类和分类的方法,对每类方法所包含的典型算法,尤其是该领域最近几年发表的最新文章的基本思想、优缺点进行介绍和分析。最后介绍了图像分割常用的基准数据集和算法评价指标,对比各种算法并总结全文,对未来可能的发展趋势进行了展望。
关键词
图像分割
图论
聚
类
分
类
Keywords
image segmentation
graph theory
clustering
classification
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于DBSCAN聚类算法的研究与实现
被引量:
77
20
作者
荣秋生
颜君彪
郭国强
机构
湖南文理学院计算机科学与技术系
出处
《计算机应用》
CSCD
北大核心
2004年第4期45-46,61,共3页
基金
国家973计划资助项目(G1998030409)
文摘
高密度聚类作为数据挖掘中聚类算法的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的类。文中分析了传统的聚类算法及局限性,讨论了一个基于高密度聚类算法的实现过程,使得算法可自动发现高维子空间,处理高维数据表格,得到较快的聚类速度和最佳的聚类效果。
关键词
数据挖掘
聚
类
高密度
网格
DBSCAN
Keywords
data mining
clustering
high density
Grid
DBSCAN
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
聚类算法研究
孙吉贵
刘杰
赵连宇
《软件学报》
EI
CSCD
北大核心
2008
1069
下载PDF
职称材料
2
彩色图像分割方法综述
林开颜
吴军辉
徐立鸿
《中国图象图形学报(A辑)》
CSCD
北大核心
2005
322
下载PDF
职称材料
3
大数据下的机器学习算法综述
何清
李宁
罗文娟
史忠植
《模式识别与人工智能》
EI
CSCD
北大核心
2014
323
下载PDF
职称材料
4
数据挖掘中的聚类算法综述
贺玲
吴玲达
蔡益朝
《计算机应用研究》
CSCD
北大核心
2007
225
下载PDF
职称材料
5
聚类算法综述
章永来
周耀鉴
《计算机应用》
CSCD
北大核心
2019
200
下载PDF
职称材料
6
基于项目聚类的协同过滤推荐算法
邓爱林
左子叶
朱扬勇
《小型微型计算机系统》
CSCD
北大核心
2004
147
下载PDF
职称材料
7
初始聚类中心优化的k-means算法
袁方
周志勇
宋鑫
《计算机工程》
CAS
CSCD
北大核心
2007
152
下载PDF
职称材料
8
数据挖掘中的聚类方法
王实
高文
《计算机科学》
CSCD
北大核心
2000
88
下载PDF
职称材料
9
基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究
何勇
李晓丽
邵咏妮
《光谱学与光谱分析》
SCIE
EI
CAS
CSCD
北大核心
2006
148
下载PDF
职称材料
10
数据挖掘综述
钟晓
马少平
张钹
俞瑞钊
《模式识别与人工智能》
EI
CSCD
北大核心
2001
91
原文传递
11
体质的聚类研究
何裕民
王莉
石凤亭
楚更武
张大凤
徐云
《中国中医基础医学杂志》
CAS
CSCD
1996
108
下载PDF
职称材料
12
一种基于密度的快速聚类算法
周水庚
周傲英
曹晶
胡运发
《计算机研究与发展》
EI
CSCD
北大核心
2000
89
下载PDF
职称材料
13
聚类/分类中的粒度原理
卜东波
白硕
李国杰
《计算机学报》
EI
CSCD
北大核心
2002
95
下载PDF
职称材料
14
基于云计算的居民用电行为分析模型研究
张素香
刘建明
赵丙镇
曹津平
《电网技术》
EI
CSCD
北大核心
2013
133
下载PDF
职称材料
15
聚类有效性评价综述
杨燕
靳蕃
KAMEL Mohamed
《计算机应用研究》
CSCD
北大核心
2008
117
下载PDF
职称材料
16
基于内容的图像分割方法综述
姜枫
顾庆
郝慧珍
李娜
郭延文
陈道蓄
《软件学报》
EI
CSCD
北大核心
2017
130
下载PDF
职称材料
17
不同类型茶园昆虫、蜘蛛群落结构分析
谭济才
邓欣
袁哲明
《生态学报》
CAS
CSCD
北大核心
1998
81
下载PDF
职称材料
18
基于轮廓系数的聚类有效性分析
朱连江
马炳先
赵学泉
《计算机应用》
CSCD
北大核心
2010
117
下载PDF
职称材料
19
图像分割方法综述研究
周莉莉
姜枫
《计算机应用研究》
CSCD
北大核心
2017
115
下载PDF
职称材料
20
基于DBSCAN聚类算法的研究与实现
荣秋生
颜君彪
郭国强
《计算机应用》
CSCD
北大核心
2004
77
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
250
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部