期刊文献+
共找到397篇文章
< 1 2 20 >
每页显示 20 50 100
数据挖掘中的聚类算法综述 被引量:228
1
作者 贺玲 吴玲达 蔡益朝 《计算机应用研究》 CSCD 北大核心 2007年第1期10-13,共4页
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了数据挖掘中聚类算法的研究现状,分析比较了它们的性能差异和各自存在的优点及问题,并结合多媒体领域的应用需求指出了其今后的发展趋势。
关键词 数据挖掘 聚类 聚类算法
下载PDF
结合降维技术的电力负荷曲线集成聚类算法 被引量:139
2
作者 张斌 庄池杰 +4 位作者 胡军 陈水明 张明明 王科 曾嵘 《中国电机工程学报》 EI CSCD 北大核心 2015年第15期3741-3749,共9页
电力负荷曲线聚类是配用电大数据挖掘的基础。分析3种典型聚类有效性指标,指出Davies-Bouldin有效性指标更适用于评估负荷曲线的聚类结果。研究基于层次、基于划分、基于密度、基于模型等类型的聚类算法,从聚类效率和聚类质量两方面评... 电力负荷曲线聚类是配用电大数据挖掘的基础。分析3种典型聚类有效性指标,指出Davies-Bouldin有效性指标更适用于评估负荷曲线的聚类结果。研究基于层次、基于划分、基于密度、基于模型等类型的聚类算法,从聚类效率和聚类质量两方面评价各种算法。层次聚类的质量较高,效率较低;划分聚类的效率较高,质量较低。针对单一聚类算法的不足,研究基于经典聚类算法的集成聚类算法并将其应用于负荷曲线聚类。该算法包括bootstrap重采样、划分聚类、层次聚类3步,对不同规模数据集的聚类结果表明集成算法具有更好的性能,特别适用于大规模数据集聚类。针对电力负荷曲线的特征,研究多种数据集降维算法,在降维后的数据集上进行集成聚类,比较各种降维算法的信息损失和计算效率。研究结果表明,对于大规模电力负荷曲线的聚类问题,结合主成分分析降维的集成聚类算法可以取得最佳效果。 展开更多
关键词 能源互联网 电力大数据 负荷曲线 聚类有效性 集成聚类算法
下载PDF
文档聚类综述 被引量:65
3
作者 刘远超 王晓龙 +1 位作者 徐志明 关毅 《中文信息学报》 CSCD 北大核心 2006年第3期55-62,共8页
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行... 聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行了综述。最后还介绍了聚类质量评测问题。 展开更多
关键词 计算机应用 中文信息处理 综述 文档聚类 降维 概念相关 聚类算法
下载PDF
面向海量用户用电特性感知的分布式聚类算法 被引量:67
4
作者 朱文俊 王毅 +3 位作者 罗敏 林国营 程将南 康重庆 《电力系统自动化》 EI CSCD 北大核心 2016年第12期21-27,共7页
智能电表的普及促进了配用电大数据的发展。通过对用户用电数据的挖掘和用电特性的感知,能够有效识别用户用电模式、评估需求响应潜力、指导电价制定等。然而,用户用电数据一方面随时间不断更新,增长迅速,呈海量态势;另一方面,数据采集... 智能电表的普及促进了配用电大数据的发展。通过对用户用电数据的挖掘和用电特性的感知,能够有效识别用户用电模式、评估需求响应潜力、指导电价制定等。然而,用户用电数据一方面随时间不断更新,增长迅速,呈海量态势;另一方面,数据采集点分布在用户侧,具有极强的分散性。针对海量、分散的用电数据带来的挑战,文中提出一种新的分布式聚类算法。首先利用自适应k-means聚类算法对分布在各区域的用电数据进行局部聚类分析,提取各局部数据的典型负荷曲线,构建局部模型;然后利用传统聚类算法对获取的局部模型进行二次聚类分析,获取全局的典型负荷曲线,构建全局模型;最后向局部数据中心反馈全局聚类结果,实现全局聚类分析。通过爱尔兰实际量测用电数据证明了所提出算法的有效性。 展开更多
关键词 分布式聚类 自适应k-means 聚类算法 大数据 负荷曲线 态势感知
下载PDF
基于特征加权理论的数据聚类算法 被引量:40
5
作者 费贤举 李虹 田国忠 《沈阳工业大学学报》 EI CAS 北大核心 2018年第1期77-81,共5页
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,... 针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值. 展开更多
关键词 数据挖掘 数据聚类 特征加权 软子空间聚类 竞争合并机制 模糊聚类算法 聚类中心 聚类数目
下载PDF
二分网络研究 被引量:39
6
作者 吴亚晶 张鹏 +1 位作者 狄增如 樊瑛 《复杂系统与复杂性科学》 EI CSCD 2010年第1期1-12,共12页
对二分网络的研究现状进行综述。将二分网络的研究方法归纳为两种思路:把二分网络投影到单顶点网络进行分析和直接基于原始二分网络进行分析。对二分网络已有的实证研究作一个简单的介绍,包括科学家合作网、听众与歌曲网络、演员合作网... 对二分网络的研究现状进行综述。将二分网络的研究方法归纳为两种思路:把二分网络投影到单顶点网络进行分析和直接基于原始二分网络进行分析。对二分网络已有的实证研究作一个简单的介绍,包括科学家合作网、听众与歌曲网络、演员合作网等经典二分网络。简单描述了二分网络的统计性质,介绍二分网络社团结构的定义,并对几种基于原始二分网络的聚类方法进行了说明。从动态模型和静态模型两方面来介绍二分网络的演化模型。最后对二分网络的研究现状进行小结并对未来发展做出展望。 展开更多
关键词 二分网络 实证研究 集聚系数 社团结构 聚类方法 演化模型
下载PDF
文本聚类综述 被引量:21
7
作者 吴启明 易云飞 《河池学院学报》 2008年第2期86-91,共6页
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Text clustering)的应用,然后对文本聚类算法、聚类关键技术进行... 聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Text clustering)的应用,然后对文本聚类算法、聚类关键技术进行了综述。 展开更多
关键词 文本聚类 综述 降维 聚类算法 聚类评价
下载PDF
一种新的混合聚类算法 被引量:18
8
作者 吴文丽 刘玉树 赵基海 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第1期16-18,共3页
聚类是数据挖掘的主要技术之一,是一种无导师监督的模式识别方式。聚类分析就是按照数据间的相似程度,依据特定的准则将数据划分成不同子类。K-平均算法是经典的聚类算法。蚂蚁聚类算法是近来涌现的新的聚类算法,它通过模拟蚁群的智能... 聚类是数据挖掘的主要技术之一,是一种无导师监督的模式识别方式。聚类分析就是按照数据间的相似程度,依据特定的准则将数据划分成不同子类。K-平均算法是经典的聚类算法。蚂蚁聚类算法是近来涌现的新的聚类算法,它通过模拟蚁群的智能行为进行聚类分析,已经在数据挖掘中得到应用。通过分析蚂蚁聚类算法和K-平均算法两种不同聚类算法的基本思想,将两种算法结合得到混合聚类算法,仿真实验证明混合聚类算法的算法性能优于蚂蚁算法和K-平均算法。 展开更多
关键词 群体智能 蚂蚁聚类算法 K-平均算法 混合聚类
下载PDF
一种隶属关系不确定的可能性模糊聚类方法 被引量:23
9
作者 陈健美 陆虎 +4 位作者 宋余庆 宋顺林 徐景 谢从华 倪巍伟 《计算机研究与发展》 EI CSCD 北大核心 2008年第9期1486-1492,共7页
模糊聚类是聚类分析的一个重要分支,模糊C-均值聚类算法及其改进算法都是一种基于概率约束的聚类方法,所采用隶属度的取值形式体现了数据集的绝对隶属程度,常常出现不理想的聚类结果.对此,提出了不确定隶属的概念,在此基础上,通过提出... 模糊聚类是聚类分析的一个重要分支,模糊C-均值聚类算法及其改进算法都是一种基于概率约束的聚类方法,所采用隶属度的取值形式体现了数据集的绝对隶属程度,常常出现不理想的聚类结果.对此,提出了不确定隶属的概念,在此基础上,通过提出两个基于相对隶属程度的判断准则参数,设计出一种新的基于隶属关系不确定的可能性模糊聚类新算法,并给出了具体算法实现.新算法将迭代过程中数据集对聚类簇隶属的可能性与不确定性关系引入目标函数中,达到明显的优化聚类结果的功效.理论分析和实验结果表明,相对其他聚类算法,新算法具有更高的聚类正确率. 展开更多
关键词 模糊聚类 不确定隶属关系 可能性隶属度 不确定性隶属度 聚类算法
下载PDF
基于语义距离的高效文本聚类算法 被引量:15
10
作者 冯少荣 肖文俊 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第5期30-37,共8页
针对现有文本聚类算法忽略了词之间的语义信息,导致文本的相似度计算不够精确的问题,提出了一种基于语义进行文本聚类的新方法.该方法从语义上具体分析文本,利用文本的具体语义来计算文本间的相似度.聚类采用最近邻聚类算法,并提出第二... 针对现有文本聚类算法忽略了词之间的语义信息,导致文本的相似度计算不够精确的问题,提出了一种基于语义进行文本聚类的新方法.该方法从语义上具体分析文本,利用文本的具体语义来计算文本间的相似度.聚类采用最近邻聚类算法,并提出第二次聚类算法来改进最近邻算法对输入次序敏感的问题.根据相似度权重优胜劣汰类特征词,使得最后类特征词越来越逼近类的主题.实验结果表明,文中所提出的算法在聚类精度和召回率上均优于基于向量空间模型的k-Means聚类算法. 展开更多
关键词 文本聚类 语义距离 相似度 最近邻聚类 聚类算法
下载PDF
基于ZigBee技术的矿井人员定位系统研究 被引量:15
11
作者 张维勇 俞海 +1 位作者 张芬 蔡志文 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第9期1087-1090,共4页
文章在分析矿井下通信技术和现有井下人员定位系统的基础上,阐述了新兴的ZigBee无线通信技术在井下人员定位系统中的应用,重点讨论和分析了组团协议。该系统将更加便于矿井人员的生产管理,提高安全性。
关键词 组团协议 分簇算法 人员定位 ZIGBEE技术
下载PDF
一种基于三角模糊数多指标信息的FCM聚类算法 被引量:17
12
作者 樊治平 于春海 尤天慧 《控制与决策》 EI CSCD 北大核心 2004年第12期1407-1411,共5页
针对一类具有不确定性三角模糊数多指标信息的聚类分析问题,基于传统的数值信息FCM聚类算法,提出一种新的聚类分析算法.首先描述了具有三角模糊数多指标信息的聚类分析问题,提出并证明了基于三角模糊数多指标信息的关于最优划分和最优... 针对一类具有不确定性三角模糊数多指标信息的聚类分析问题,基于传统的数值信息FCM聚类算法,提出一种新的聚类分析算法.首先描述了具有三角模糊数多指标信息的聚类分析问题,提出并证明了基于三角模糊数多指标信息的关于最优划分和最优聚类中心确定的两个定理;然后根据这两个定理,进一步给出了基于三角模糊数信息的FCM聚类算法的迭代步骤;最后通过一个算例说明了该聚类算法的具体应用. 展开更多
关键词 聚类分析 三角模糊数 FCM聚类算法 最优模糊划分 模糊集
下载PDF
一种基于区间数多指标信息的FCM聚类算法 被引量:13
13
作者 于春海 樊治平 《系统工程学报》 CSCD 2004年第4期387-393,共7页
针对一类具有不确定性区间数多指标信息的聚类分析问题,基于传统的数值信息FCM(fuzzyc_means)聚类算法,提出了一种新的聚类分析算法.首先描述了具有区间数多指标信息的聚类分析问题,其次提出并证明了基于区间数多指标信息的关于最优划... 针对一类具有不确定性区间数多指标信息的聚类分析问题,基于传统的数值信息FCM(fuzzyc_means)聚类算法,提出了一种新的聚类分析算法.首先描述了具有区间数多指标信息的聚类分析问题,其次提出并证明了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理.然后根据提出的两个定理,进一步给出了基于区间数信息的FCM聚类算法的迭代步骤.最后,通过一个算例说明了给出的聚类算法. 展开更多
关键词 聚类分析 区间数 FCM聚类算法 模糊集
下载PDF
基于Fast Unfolding聚类算法的规模化分布式光伏电源集群划分 被引量:18
14
作者 王磊 张帆 +2 位作者 寇凌峰 徐毅虎 侯小刚 《太阳能学报》 EI CAS CSCD 北大核心 2021年第10期29-34,共6页
该文分析了接入节点的光伏电源与负荷的相关特性,选取节点净负荷、光伏电源有功和无功调节容量为划分指标,并考虑节点之间的电气距离特性,通过节点相似性计算公式量化光伏电源节点间运行特性的相似性,利用Fast Unfolding聚类算法进行光... 该文分析了接入节点的光伏电源与负荷的相关特性,选取节点净负荷、光伏电源有功和无功调节容量为划分指标,并考虑节点之间的电气距离特性,通过节点相似性计算公式量化光伏电源节点间运行特性的相似性,利用Fast Unfolding聚类算法进行光伏电源集群的划分。在划分的过程中引入复杂网络模块度函数的概念,通过优化模块度函数,无需人为设定集群的数目即可得到合理的集群划分结果。 展开更多
关键词 大规模系统 聚类分析 聚类算法 光伏电源 模块度函数
下载PDF
数据挖掘中变量聚类方法的应用研究 被引量:9
15
作者 汤效琴 戴汝源 徐琪 《计算机工程与应用》 CSCD 北大核心 2004年第24期171-173,194,共4页
讨论了变量聚类方法中相同类型变量相似性测度方法,首次提出一种关于混合变量间相似性测度的方法。并将基于变量的聚类分析和模糊聚类结合起来,为解决数据挖掘中基于变量聚类问题提供了有效的分析工具。最后给出一个应用实例。
关键词 数据挖掘 变量聚类 模糊聚类算法
下载PDF
信息过滤的模糊聚类模型 被引量:6
16
作者 张晓冬 张书杰 王万亭 《计算机工程与应用》 CSCD 北大核心 2002年第9期34-36,共3页
针对Internet信息过滤问题,运用模糊聚类方法建立了一个用于信息过滤的聚类模型。该模型不仅考虑了文档间的语义联系,而且,又对文档集进行了进一步的分类,增强了类内的耦和性,减少了类间的关联性。最后,给出了一个模糊聚类算法。
关键词 信息过滤 模糊聚类 聚类算法 奇异值分解 INTERNET
下载PDF
WEKA环境下基于模糊理论的聚类算法 被引量:15
17
作者 郑世明 苗壮 +1 位作者 宋自林 高志年 《解放军理工大学学报(自然科学版)》 EI 北大核心 2012年第1期22-26,共5页
因特网上的数据规模大、动态性强,通常发现的知识或规则很可能是不精确和不完备的。为了克服以上不足,引入模糊理论,通过寻找模糊相似上近似集进行合理聚类,在确定聚类数目的过程中,利用平均信息熵进行最佳聚类。同时将模糊聚类算法嵌入... 因特网上的数据规模大、动态性强,通常发现的知识或规则很可能是不精确和不完备的。为了克服以上不足,引入模糊理论,通过寻找模糊相似上近似集进行合理聚类,在确定聚类数目的过程中,利用平均信息熵进行最佳聚类。同时将模糊聚类算法嵌入WEKA平台,利用WEKA中的类和可视化功能,扩充了WEKA中的聚类算法。实验表明,算法对含有噪声的、分布不规则的大数据集具有很高的精度和收敛速度。 展开更多
关键词 模糊集 数据挖掘 模糊聚类 相似上近似 WEKA 聚类算法
下载PDF
聚类分析研究进展 被引量:13
18
作者 夏师 梁碧珍 +1 位作者 陆月然 罗明山 《现代计算机》 2009年第3期20-23,共4页
聚类是数据挖掘中重要的研究课题,是数据挖掘中一种重要的挖掘任务和挖掘方法。介绍聚类分析及其过程,讨论划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法等聚类算法及其不足之处,提出聚类研究今后的发展趋势及... 聚类是数据挖掘中重要的研究课题,是数据挖掘中一种重要的挖掘任务和挖掘方法。介绍聚类分析及其过程,讨论划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法等聚类算法及其不足之处,提出聚类研究今后的发展趋势及研究重点。 展开更多
关键词 数据挖掘 聚类分析 聚类算法 聚类过程
下载PDF
基于动态粒子群优化与K-means聚类的图像分割算法 被引量:15
19
作者 李立军 张晓光 《现代电子技术》 北大核心 2018年第10期164-168,共5页
为了解决K-means聚类算法图像分割质量过度依赖于初始聚类中心选取,且易于陷入局部最优解等问题,提出一种基于动态粒子群优化(DPSO)与K-means聚类的图像分割算法(DPSOK)。通过动态调整惯性系数与学习因子来增强PSO算法的性能;然后计算... 为了解决K-means聚类算法图像分割质量过度依赖于初始聚类中心选取,且易于陷入局部最优解等问题,提出一种基于动态粒子群优化(DPSO)与K-means聚类的图像分割算法(DPSOK)。通过动态调整惯性系数与学习因子来增强PSO算法的性能;然后计算粒子群适应度方差,找准切换至K-means算法时机;随后,将DPSO输出结果用来初始化K-means聚类中心,使其收敛至全局最优解;最后,通过最小化目标函数的多次迭代,使K-means的聚类中心不断更新,直到收敛。实验结果表明,DPSOK能有效提高K-means的全局搜索能力,在图像分割中它比K-means,PSO获得了更好的分割效果,且与粒子群优化和K-means算法相比,DPSOK算法具有更高的分割质量与效率。 展开更多
关键词 图像分割 动态粒子群优化 K-MEANS聚类 适应度方差 聚类算法 DPSOK
下载PDF
数据挖掘聚类算法研究 被引量:13
20
作者 喻彪 骆雯 赖朝安 《现代制造工程》 CSCD 北大核心 2009年第3期141-145,共5页
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了大部分常用聚类算法的主要特点,对一些经典聚类算法进行比较,并提出了相关结论,最后对几种新型的聚类算法进行基本概括。
关键词 聚类 数据挖掘 聚类算法
下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部