期刊文献+
共找到4,934篇文章
< 1 2 247 >
每页显示 20 50 100
数据挖掘中的聚类算法综述 被引量:225
1
作者 贺玲 吴玲达 蔡益朝 《计算机应用研究》 CSCD 北大核心 2007年第1期10-13,共4页
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了数据挖掘中聚类算法的研究现状,分析比较了它们的性能差异和各自存在的优点及问题,并结合多媒体领域的应用需求指出了其今后的发展趋势。
关键词 数据挖掘 聚类 聚类算法
下载PDF
K-Means聚类算法研究综述 被引量:277
2
作者 杨俊闯 赵超 《计算机工程与应用》 CSCD 北大核心 2019年第23期7-14,63,共9页
K-均值(K-Means)算法是聚类分析中一种基于划分的算法,同时也是无监督学习算法。其具有思想简单、效果好和容易实现的优点,广泛应用于机器学习等领域。但是K-Means算法也有一定的局限性,比如:算法中聚类数目K值难以确定,初始聚类中心如... K-均值(K-Means)算法是聚类分析中一种基于划分的算法,同时也是无监督学习算法。其具有思想简单、效果好和容易实现的优点,广泛应用于机器学习等领域。但是K-Means算法也有一定的局限性,比如:算法中聚类数目K值难以确定,初始聚类中心如何选取,离群点的检测与去除,距离和相似性度量等。从多个方面对K-Means算法的改进措施进行概括,并和传统K-Means算法进行比较,分析了改进算法的优缺点,指出了其中存在的问题。对K-Means算法的发展方向和趋势进行了展望。 展开更多
关键词 K-MEANS 聚类算法 聚类中心 离群点
下载PDF
异构传感器网络的分布式能量有效成簇算法 被引量:159
3
作者 卿利 朱清新 王明文 《软件学报》 EI CSCD 北大核心 2006年第3期481-489,共9页
为了延长网络的生存时间,需要设计能量有效的协议,以适应传感器网络的特点.成簇算法是传感器网络中减少能量消耗的一种关键技术,它能够增强网络的扩展性和延长网络的生存时间.研究了异构传感器网络中成簇算法在节省能量方面的性能,提出... 为了延长网络的生存时间,需要设计能量有效的协议,以适应传感器网络的特点.成簇算法是传感器网络中减少能量消耗的一种关键技术,它能够增强网络的扩展性和延长网络的生存时间.研究了异构传感器网络中成簇算法在节省能量方面的性能,提出一种适应异构无线传感器网络的分布式能量有效的成簇方案.此方案基于节点剩余能量与网络节点的平均能量的比例来选举簇头节点.较高初始能量和剩余能量的节点比低能量节点拥有更多的机会成为簇头节点,从而使网络能量均匀消耗,延长网络的生存时间.模拟实验结果显示,与现有的重要成簇方案相比,新的成簇算法在异构网络下提供了更长的网络生存时间和更大的网络有效吞吐量. 展开更多
关键词 无线传感器网络 成簇算法 异构环境 能量有效
下载PDF
基于关键词共现频率的热点分析方法研究 被引量:163
4
作者 吴晓秋 吕娜 《情报理论与实践》 CSSCI 北大核心 2012年第8期115-119,共5页
关键词共现可以有效地反映学科领域的研究热点,为科学研究提供辅助支持。文章系统梳理基于共现频率的共词分析相关度算法、聚类算法、可视化方法等,评价现有聚类算法,并针对k-means聚类算法提出改进构想。
关键词 关键词 共现频率 聚类算法 分析方法
原文传递
数据挖掘中聚类算法研究进展 被引量:145
5
作者 周涛 陆惠玲 《计算机工程与应用》 CSCD 2012年第12期100-111,共12页
聚类分析是数据挖掘中重要的研究内容之一,对聚类准则进行了总结,对五类传统的聚类算法的研究现状和进展进行了较为全面的总结,就一些新的聚类算法进行了梳理,根据样本归属关系、样本数据预处理、样本的相似性度量、样本的更新策略、样... 聚类分析是数据挖掘中重要的研究内容之一,对聚类准则进行了总结,对五类传统的聚类算法的研究现状和进展进行了较为全面的总结,就一些新的聚类算法进行了梳理,根据样本归属关系、样本数据预处理、样本的相似性度量、样本的更新策略、样本的高维性和与其他学科的融合等六个方面对聚类中近20多个新算法,如粒度聚类、不确定聚类、量子聚类、核聚类、谱聚类、聚类集成、概念聚类、球壳聚类、仿射聚类、数据流聚类等,分别进行了详细的概括。这对聚类是一个很好的总结,对聚类的发展具有积极意义。 展开更多
关键词 数据挖掘 聚类算法 聚类准则
下载PDF
发掘多值属性的关联规则 被引量:61
6
作者 张朝晖 陆玉昌 张钹 《软件学报》 EI CSCD 北大核心 1998年第11期801-805,共5页
属性值可以取布尔量或多值量.从以布尔量描述的数据中发掘关联规则已经有比较成熟的系统和方法,而对于多值量则不然.将多值量的数据转化为布尔型的数据是一条方便、有效的途径.提出一种算法,根据数据本身的情况决定多值量的划分,... 属性值可以取布尔量或多值量.从以布尔量描述的数据中发掘关联规则已经有比较成熟的系统和方法,而对于多值量则不然.将多值量的数据转化为布尔型的数据是一条方便、有效的途径.提出一种算法,根据数据本身的情况决定多值量的划分,进而将划分后的区段映射为布尔量,在此基础上可发掘容易理解且具有概括性的、有效的关联规则. 展开更多
关键词 数据采掘 关联规则 数据库 知识发现
下载PDF
文档聚类综述 被引量:65
7
作者 刘远超 王晓龙 +1 位作者 徐志明 关毅 《中文信息学报》 CSCD 北大核心 2006年第3期55-62,共8页
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行... 聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文档聚类的应用背景和体系结构,然后对文档聚类算法、聚类空间的构造和降维方法、文档聚类中的语义问题进行了综述。最后还介绍了聚类质量评测问题。 展开更多
关键词 计算机应用 中文信息处理 综述 文档聚类 降维 概念相关 聚类算法
下载PDF
基于聚类算法的风电场动态等值 被引量:94
8
作者 陈树勇 王聪 +3 位作者 申洪 高宁超 朱琳 兰华 《中国电机工程学报》 EI CSCD 北大核心 2012年第4期11-19,24,共9页
风电机组在实际运行时,受尾流效应等因素影响,运行状态并不相同。为提高风电场实际运行模型的精度,提出了一种适用于双馈式风力发电机的动态等值建模方法。它将风电机组的状态变量矩阵作为分群指标,利用聚类算法将矩阵中的数据进行分群... 风电机组在实际运行时,受尾流效应等因素影响,运行状态并不相同。为提高风电场实际运行模型的精度,提出了一种适用于双馈式风力发电机的动态等值建模方法。它将风电机组的状态变量矩阵作为分群指标,利用聚类算法将矩阵中的数据进行分群,将同群的风电机组等值成为一台风力发电机,实现了风电场的动态等值。利用PSD/BPA平台,对系统侧故障与风速变化2种情况仿真,并与传统等值方法及风电场详细模型对比。仿真结果表明,采用仿真过程中的状态变量作为分群指标是合理的,该模型与详细模型的动态特性基本一致,可以用来描述风电场的实际运行状态。 展开更多
关键词 双馈式风力发电机 聚类算法 状态变量 动态等值 电力系统分析
下载PDF
EADEEG:能量感知的无线传感器网络数据收集协议 被引量:67
9
作者 刘明 曹建农 +3 位作者 陈贵海 陈力军 王晓敏 龚海刚 《软件学报》 EI CSCD 北大核心 2007年第5期1092-1109,共18页
提出了一种基于簇结构的无线传感器网络数据收集协议EADEEG(an energy-aware data gathering protocol for wireless sensor networks).EADEEG通过最小化网络通信开销以及良好的能量负载平衡方法,可以有效地延长网络寿命.与以前的相关... 提出了一种基于簇结构的无线传感器网络数据收集协议EADEEG(an energy-aware data gathering protocol for wireless sensor networks).EADEEG通过最小化网络通信开销以及良好的能量负载平衡方法,可以有效地延长网络寿命.与以前的相关研究相比,EADEEG采用了一种全新的簇头竞争参数,能够更好地解决节点能量异构问题.此外,EADEEG也采用了一种简单而有效的簇内节点调度算法,通过控制活动节点的密度,可以在不增加额外控制开销的条件下关闭冗余节点并保证覆盖要求,因此可以进一步延长网络寿命.模拟实验证明,在节点初始能量同构和异构两种情况下,EADEEG协议都能够满足用户对覆盖率的要求,并在网络寿命上大幅度优于LEACH(low energy adaptive clustering hierarchy),PEGASIS(power-efficient gathering in sensor information systems)和DEEG(distributed energy-efficient data gathering and aggregation protocol)协议. 展开更多
关键词 数据收集 能量感知 簇算法 簇内覆盖
下载PDF
基于k-means聚类算法的研究 被引量:87
10
作者 黄韬 刘胜辉 谭艳娜 《计算机技术与发展》 2011年第7期54-57,62,共5页
分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法。通过将对数据集的多次采样,选取最终较优的初始聚类中心,使... 分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法。通过将对数据集的多次采样,选取最终较优的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响度大大降低;同时,在选取初始聚类中心后,对初值进行数据标准化处理,使聚类效果进一步提高。通过UCI数据集上的数据对新算法Hk-means进行检测,结果显示Hk-means算法比原始的k-means算法在聚类效果上有显著的提高,并对相关领域有借鉴意义。 展开更多
关键词 数据挖掘 聚类算法 K-MEANS算法
下载PDF
负载均衡感知的无线传感器网络容错分簇算法 被引量:80
11
作者 苏金树 郭文忠 +1 位作者 余朝龙 陈国龙 《计算机学报》 EI CSCD 北大核心 2014年第2期445-456,共12页
好的分簇算法能够有效减少网络能耗和提高网络可靠性,但是簇间负载的不均衡性和通信的不可靠性会严重影响分簇算法的性能.针对这个问题,该文首先提出了一个负载均衡感知的无线传感器网络容错分簇算法.该方法引入了遗传算法的随机两点交... 好的分簇算法能够有效减少网络能耗和提高网络可靠性,但是簇间负载的不均衡性和通信的不可靠性会严重影响分簇算法的性能.针对这个问题,该文首先提出了一个负载均衡感知的无线传感器网络容错分簇算法.该方法引入了遗传算法的随机两点交叉算子和随机单点变异算子,从而设计了一种以种群粒子优劣为依据的自适应惯性权重调整策略,并提出了一种自适应的离散粒子群优化算法.算法设计同时考虑负载均衡和能量消耗两个优化目标,给出一种基于自适应离散粒子群优化的簇首选举机制;其次,为了保证网络上数据传输的可靠性,以最小生成树为基础,提出了一种用于保证簇首二连通性的簇间连通算法,通过消除网络中的割点,以保证网络的二连通性.仿真实验结果表明,该文提出算法在负载均衡和二连通性上有较好的性能,能有效减少了网络能耗,延长网络生命周期,并提高网络可靠性. 展开更多
关键词 无线传感器网络 分簇算法 负载均衡 粒子群优化 二连通性 物联网中图法
下载PDF
核密度估计及其在聚类算法构造中的应用 被引量:63
12
作者 李存华 孙志挥 +1 位作者 陈耿 胡云 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1712-1719,共8页
经典数理统计学中的核密度估计理论是构造基于数据集密度函数聚类算法的理论基础 ,采用分箱近似的快速核密度函数估计方法同样为构造高效的聚类算法提供了依据 通过对核密度估计理论及其快速分箱核近似方法的讨论 ,给出分箱近似密度估... 经典数理统计学中的核密度估计理论是构造基于数据集密度函数聚类算法的理论基础 ,采用分箱近似的快速核密度函数估计方法同样为构造高效的聚类算法提供了依据 通过对核密度估计理论及其快速分箱核近似方法的讨论 ,给出分箱近似密度估计相对于核密度估计的均方误差界 ,提出基于网格数据重心的分箱核近似方法 在不改变计算复杂度的条件下 ,基于网格数据重心的分箱核近似密度函数计算可以有效地降低近似误差 ,这一思想方法对于构造高效大规模数据聚类分析算法具有指导意义 展开更多
关键词 核密度估计 分箱规则 聚类算法
下载PDF
面向海量用户用电特性感知的分布式聚类算法 被引量:67
13
作者 朱文俊 王毅 +3 位作者 罗敏 林国营 程将南 康重庆 《电力系统自动化》 EI CSCD 北大核心 2016年第12期21-27,共7页
智能电表的普及促进了配用电大数据的发展。通过对用户用电数据的挖掘和用电特性的感知,能够有效识别用户用电模式、评估需求响应潜力、指导电价制定等。然而,用户用电数据一方面随时间不断更新,增长迅速,呈海量态势;另一方面,数据采集... 智能电表的普及促进了配用电大数据的发展。通过对用户用电数据的挖掘和用电特性的感知,能够有效识别用户用电模式、评估需求响应潜力、指导电价制定等。然而,用户用电数据一方面随时间不断更新,增长迅速,呈海量态势;另一方面,数据采集点分布在用户侧,具有极强的分散性。针对海量、分散的用电数据带来的挑战,文中提出一种新的分布式聚类算法。首先利用自适应k-means聚类算法对分布在各区域的用电数据进行局部聚类分析,提取各局部数据的典型负荷曲线,构建局部模型;然后利用传统聚类算法对获取的局部模型进行二次聚类分析,获取全局的典型负荷曲线,构建全局模型;最后向局部数据中心反馈全局聚类结果,实现全局聚类分析。通过爱尔兰实际量测用电数据证明了所提出算法的有效性。 展开更多
关键词 分布式聚类 自适应k-means 聚类算法 大数据 负荷曲线 态势感知
下载PDF
改进模糊划分的FCM聚类算法的一般化研究 被引量:55
14
作者 朱林 王士同 邓赵红 《计算机研究与发展》 EI CSCD 北大核心 2009年第5期814-822,共9页
聚类分析是无监督模式识别中的一种重要方法,已广泛应用于数据挖掘、图像处理、计算机视觉、生物信息和文本分析中.在聚类算法中,模糊指数m对聚类结果有十分重要的影响.针对IFP-FCM算法模糊指数m被限定为2的问题,提出了一般化的改进模... 聚类分析是无监督模式识别中的一种重要方法,已广泛应用于数据挖掘、图像处理、计算机视觉、生物信息和文本分析中.在聚类算法中,模糊指数m对聚类结果有十分重要的影响.针对IFP-FCM算法模糊指数m被限定为2的问题,提出了一般化的改进模糊划分的FCM聚类算法GIFP-FCM.通过引入新的隶属度约束,解决了IFP-FCM算法模糊指数m的一般化问题;同时GIFP-FCM算法从Voronoi距离和竞争学习的角度对其鲁棒性和快速收敛性进行了合理解释;其次,通过引入模糊程度系数α,使得FCM算法和IFP-FCM算法分别表示为GIFP-FCM算法在α等于0和α趋于1时的特例.实验结果表明,GIFP-FCM算法较之于IFP-FCM和FCM算法具有更好的鲁棒性和参数适应性;在纹理图像分割中,GIFP-FCM也明显优于IFP-FCM和FCM算法. 展开更多
关键词 聚类算法 竞争学习 模糊划分 Voronoi距离 纹理图像分割
下载PDF
基于k-means聚类算法的低压台区线损异常辨别方法 被引量:58
15
作者 陈洪涛 蔡慧 +2 位作者 李熊 王颖 郑恩辉 《南方电网技术》 CSCD 北大核心 2019年第2期2-6,共5页
目前电力公司对于台区线损异常的判断是当线损率超过一定阈值时为线损异常,这样的判断具有片面性和局限性。针对如何有效辨别线损异常的问题,在研究聚类算法和线损率数据特性的基础上,提出了一种基于k-means聚类算法的线损异常辨别方法... 目前电力公司对于台区线损异常的判断是当线损率超过一定阈值时为线损异常,这样的判断具有片面性和局限性。针对如何有效辨别线损异常的问题,在研究聚类算法和线损率数据特性的基础上,提出了一种基于k-means聚类算法的线损异常辨别方法。首先将低压台区线损率进行一次k-means聚类分成3类,然后根据各类数据的数量状况判断是否进行二次分类,最终根据平均线损率的大小、聚类中心的距离等因素,判断该低压台区是否存在线损异常,对聚类结果中线损率高的那一类数据的时间离散度进行分析,得到低压台区线损异常的程度。实验结果证明,该方法具有一定的实际应用效果,可以提高线损异常判断的准确性。 展开更多
关键词 线损率 线损异常 数据挖掘 聚类算法
下载PDF
低压电力线通信分簇路由算法及网络重构 被引量:49
16
作者 戚佳金 刘晓胜 +2 位作者 徐殿国 李琰 牟英峰 《中国电机工程学报》 EI CSCD 北大核心 2008年第4期65-71,共7页
低压配电网具有物理拓扑未知和电力线信道时变性特征。为提高低压配电网窄带电力线载波通信系统可靠性,提出并讨论一种基于非交叠分簇算法的电力线通信组网及路由重构方法。该算法可以根据信道质量的变化动态地建立、维护、优化电力线... 低压配电网具有物理拓扑未知和电力线信道时变性特征。为提高低压配电网窄带电力线载波通信系统可靠性,提出并讨论一种基于非交叠分簇算法的电力线通信组网及路由重构方法。该算法可以根据信道质量的变化动态地建立、维护、优化电力线通信网络路由,保证通信网络的有效性。在此基础上,进一步提出并比较两种组网时间序列分配算法,完善了该路由算法。仿真试验表明,该路由算法具有很大的灵活性、实用性和有效性。 展开更多
关键词 电力线通信 分簇算法 网络重构 动态路由 信道时序控制
下载PDF
基于关联规则和复杂系统熵聚类的膝骨关节炎用药规律研究 被引量:52
17
作者 潘建科 洪坤豪 +3 位作者 刘军 杨济源 黄永明 罗明辉 《中国实验方剂学杂志》 CAS CSCD 北大核心 2015年第12期201-204,共4页
目的:基于中医传承辅助平台(TCMISS)软件,分析膝骨关节炎中药处方的用药规律。方法:收集近5年治疗膝骨关节炎文献中的中药处方,采用关联规则apriori算法、复杂系统熵聚类等无监督数据挖掘方法,分析处方中各种药物的使用频次、归经及药... 目的:基于中医传承辅助平台(TCMISS)软件,分析膝骨关节炎中药处方的用药规律。方法:收集近5年治疗膝骨关节炎文献中的中药处方,采用关联规则apriori算法、复杂系统熵聚类等无监督数据挖掘方法,分析处方中各种药物的使用频次、归经及药物间的关联规则,挖掘药物核心组合和新处方。结果:对筛选出的263个中药处方进行分析,确定处方中药物的使用频次、归经及药物间的关联规则,挖掘出16个核心组合和4首新处方。结论:膝骨关节炎常用的药物为活血化瘀药、补血药、补气药、补阳药、祛风湿散寒药等,具有补肾、活血功效的药物是主要组成部分。药物归经主要为肝、肾两经。治法主要是补益肝肾、活血化瘀。中医传承辅助平台(TCMISS)有助于处方的用药规律研究。 展开更多
关键词 膝骨关节炎 组方规律 关联规则 聚类算法
原文传递
密度峰值聚类算法综述 被引量:47
18
作者 陈叶旺 申莲莲 +3 位作者 钟才明 王田 陈谊 杜吉祥 《计算机研究与发展》 EI CSCD 北大核心 2020年第2期378-394,共17页
密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度... 密度峰值聚类(density peak,DPeak)算法是一种简单有效的聚类算法,它可将任意维度数据映射成2维,在降维后的空间中建构出数据之间的层次关系,可以非常容易地从中挑选出密度高、且与其他密度更高区域相隔较远的数据点.这些点被称为密度峰值点,可以用来作为聚类中心.根据建构好的层次关系,该算法提供了2种不同的方式完成最后聚类:一种是与用户交互的决策图,另一种是自动化方式.跟踪了DPeak近年来的发展与应用动态,对该算法的各种改进或变种从以下3方面进行了总结和梳理:首先,介绍了DPeak算法原理,对其在聚类算法分类体系中的位置进行了讨论.将其与5个主要的聚类算法做了比较之后,发现DPeak与均值漂移聚类算法(mean shift)有诸多相似之处,因而认为其可能为mean shift的一个特殊变种.其次,讨论了DPeak的几个不足之处,如复杂度较高、自适应性不足、精度低和高维数据适用性差等,将针对这些缺点进行改进的相关算法做了分类讨论.此外,梳理了DPeak算法在不同领域中的应用,如自然语言处理、生物医学应用、光学应用等.最后,探讨了密度峰值聚类算法所存在的问题及挑战,同时对进一步的工作进行展望. 展开更多
关键词 聚类算法 密度峰值 大数据 数据挖掘 密度聚类
下载PDF
基于关联规则和复杂系统熵聚类的痛风用药规律研究 被引量:47
19
作者 潘碧琦 潘建科 +3 位作者 刘军 杨济源 洪坤豪 马振尉 《中华中医药杂志》 CAS CSCD 北大核心 2014年第6期2040-2043,共4页
目的:基于中医传承辅助平台(TCMISS)软件分析痛风中药处方的用药规律。方法:收集近5年治疗痛风文献的中药处方,采用关联规则apriori算法、复杂系统熵聚类等无监督数据挖掘方法,分析处方中各种药物的使用频次及药物之间的关联规则,挖掘... 目的:基于中医传承辅助平台(TCMISS)软件分析痛风中药处方的用药规律。方法:收集近5年治疗痛风文献的中药处方,采用关联规则apriori算法、复杂系统熵聚类等无监督数据挖掘方法,分析处方中各种药物的使用频次及药物之间的关联规则,挖掘药物核心组合和新处方。结果:对筛选出的127个中药处方进行分析,确定处方中药物的使用频次,药物之间的关联规则,挖掘出14个核心组合和7首新处方。结论:痛风常用的药物以清热药、活血药、利水渗湿药和芳香化湿药为主,治法主要是清热燥湿、利水渗湿消肿和活血化瘀。中医传承辅助平台(TCMISS)有助于处方的用药规律研究。 展开更多
关键词 痛风 组方规律 关联规则 聚类算法
原文传递
K-means聚类算法的研究 被引量:45
20
作者 韩晓红 胡彧 《太原理工大学学报》 CAS 北大核心 2009年第3期236-239,共4页
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初... 为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。 展开更多
关键词 数据挖掘 K—means算法 初始聚类中心 聚类分析
下载PDF
上一页 1 2 247 下一页 到第
使用帮助 返回顶部