期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于邻域的K中心点聚类算法 被引量:32
1
作者 谢娟英 郭文娟 谢维信 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期16-22,共7页
提出一种基于邻域的K中心点聚类算法,该算法利用数据集样本的自然分布信息定义数据对象的邻域半径和相应邻域,选择位于样本分布密集区且相距较远的K个数据对象作为初始聚类中心,以期改进快速K中心点算法在选取初始中心点时有可能使多个... 提出一种基于邻域的K中心点聚类算法,该算法利用数据集样本的自然分布信息定义数据对象的邻域半径和相应邻域,选择位于样本分布密集区且相距较远的K个数据对象作为初始聚类中心,以期改进快速K中心点算法在选取初始中心点时有可能使多个初始中心位于同一类簇的潜在缺陷.通过UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集实验测试,表明提出的基于邻域的K中心点算法不仅具有很好的聚类效果,而且运行时间短,对噪音数据有很强的抗干扰性能,优于传统K中心点算法和Park等人的快速K中心点算法. 展开更多
关键词 邻域 k中心点算法 样本密度 聚类 样本空间分布
下载PDF
基于K中心点的文档聚类算法 被引量:4
2
作者 吴景岚 朱文兴 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第5期88-91,共4页
K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚类算法,然后提出一个改进算法,该算法不增加计算的复杂性,显著改进文档的聚类结果.最后,将该改进算法作为... K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚类算法,然后提出一个改进算法,该算法不增加计算的复杂性,显著改进文档的聚类结果.最后,将该改进算法作为局部搜索过程嵌入到迭代局部搜索结构中,构造一个基于K中心点的迭代局部搜索文档聚类算法,进一步改进了文档聚类结果.试验结果表明该算法显著改进了文档聚类结果. 展开更多
关键词 k中心点算法 文档聚类 迭代局部搜索
下载PDF
改进的k中心点算法在茶叶拼配中的应用 被引量:7
3
作者 邢光林 胡一然 +1 位作者 孙翀 帖军 《中南民族大学学报(自然科学版)》 CAS 北大核心 2017年第4期126-130,共5页
为了提高茶叶拼配效率,节约人工成本,实现茶叶企业效益最大化,探讨了将茶叶拼配问题建模成多维层次空间聚类问题,并通过定义多维概念分层空间中的相似性度量准则,提出了改进的k中心点算法求解最优拼配方案,并引入Dewey编码提高了求解效... 为了提高茶叶拼配效率,节约人工成本,实现茶叶企业效益最大化,探讨了将茶叶拼配问题建模成多维层次空间聚类问题,并通过定义多维概念分层空间中的相似性度量准则,提出了改进的k中心点算法求解最优拼配方案,并引入Dewey编码提高了求解效率.根据真实数据集上的实验表明:同等实验条件下较人工拼配方式而言,文中所提出的茶叶拼配智能化求解方法大大提高了茶叶企业工作效率和经济利益. 展开更多
关键词 茶叶拼配 空间聚类 多维概念分层 DEWEY编码 k中心点算法
下载PDF
一种基于K中心点算法的测试用例集约简方法 被引量:3
4
作者 陈阳梅 丁晓明 《计算机科学》 CSCD 北大核心 2012年第B06期422-424,共3页
测试用例集约简的目的是用尽可能少的测试用例充分测试给定的测试目标。引入聚类分析中K中心点(K-medoids)算法的思想将每一个测试用例作为一个结点并寻找其相似性,将得到的聚类分析结果再根据测试需求从各簇中选择测试用例,从而得到约... 测试用例集约简的目的是用尽可能少的测试用例充分测试给定的测试目标。引入聚类分析中K中心点(K-medoids)算法的思想将每一个测试用例作为一个结点并寻找其相似性,将得到的聚类分析结果再根据测试需求从各簇中选择测试用例,从而得到约简的测试用例集。仿真实验的结果证明了该方法的可行性和有效性。 展开更多
关键词 测试用例集约简 聚类分析 k中心点算法 错误检测率
下载PDF
基于云计算的ACO-K中心点资源优化算法 被引量:2
5
作者 孟颖 罗可 +1 位作者 刘建华 姚丽娟 《计算机工程与应用》 CSCD 2013年第5期103-107,219,共6页
云计算是计算网络模型研究的热点领域,能实现几种资源共享和资源动态配置。然而,云计算中存储资源如何快速路由,减少动态负荷,兼顾全局负载平衡是有待解决的问题。ACO是一种仿生优化算法,具有健壮性强、智能搜索、全局优化、易与其他算... 云计算是计算网络模型研究的热点领域,能实现几种资源共享和资源动态配置。然而,云计算中存储资源如何快速路由,减少动态负荷,兼顾全局负载平衡是有待解决的问题。ACO是一种仿生优化算法,具有健壮性强、智能搜索、全局优化、易与其他算法结合等优点。K中心点算法是K均值的改进算法,鲁棒性强,不易受极端数据的影响。结合这两种算法的优点,提出一种基于云计算环境下的ACO-K中心点资源分配优化算法,得到最优的计算资源,提高云计算的效率。通过仿真验证了该算法的有效性。 展开更多
关键词 云计算 资源分配 k中心点算法 蚁群算法(ACO) 动态负荷
下载PDF
基于向量空间的文档聚类算法分析 被引量:2
6
作者 陶惠 张妍 郝光权 《电脑知识与技术(过刊)》 2011年第7X期4781-4782,4793,共3页
随着科技的发展,网络信息迅速增加,而文本聚类技术则成为web文本挖掘中的研究热点。该文详细介绍了文档聚类算法中的基于划分的k-means算法,对于k-means算法的缺陷,又介绍了对k-means算法有所改善的k中心点算法,并比较二者的优缺点。
关键词 文档聚类 向量空间模型 k-MEANS算法 k中心点算法
下载PDF
基于多源海事数据的大型船舶精细化分段乘潮研究 被引量:2
7
作者 张新宇 郭文强 +1 位作者 王婧贇 杨炳栋 《地球信息科学学报》 CSCD 北大核心 2022年第9期1688-1700,共13页
针对大型船舶长航道乘潮进港窗口期时长不充足问题,本文提出了基于船舶自动识别系统(Automatic Identification System,AIS)数据、港口潮汐数据、官方电子海图数据和航道地理位置数据等多源海事数据的大型船舶长航道精细化分段乘潮模型... 针对大型船舶长航道乘潮进港窗口期时长不充足问题,本文提出了基于船舶自动识别系统(Automatic Identification System,AIS)数据、港口潮汐数据、官方电子海图数据和航道地理位置数据等多源海事数据的大型船舶长航道精细化分段乘潮模型。首先,基于AIS数据采用K中心点算法对大型船舶乘潮航行行为特征进行挖掘,识别出大型船舶乘潮航迹关键点,计算大型船舶乘潮航行行为变化关键船位点。接着,结合长航道地理环境特征和大型船舶航行行为特征对长航道进行精细化分段,在此基础上基于港口潮汐数据构建大型船舶精细化分段乘潮窗口期计算模型。其次,设计乘潮历时自适应排列算法求解大型船舶乘潮最长窗口期;然后,以黄骅港综合港区航道为例验证了本文所提出的精细化分段乘潮模型。最后,基于电子海图数据利用地理信息系统平台实现大型船舶精细化分段乘潮三维动态推演,进一步验证大型船舶精细化分段乘潮航行的安全性。结果表明,该模型能够有效增加大型船舶乘潮进港窗口期时长,提高大型船舶乘潮进港效率,可为港航管理部门制定大型船舶进港计划提供理论指导。 展开更多
关键词 多源海事数据 k中心点算法 精细化 分段乘潮 窗口期 历时排列 地理信息系统 三维动态推演
原文传递
改进K中心点算法在入侵检测的应用
8
作者 魏明军 田昆 《河北能源职业技术学院学报》 2017年第4期57-59,共3页
传统K中心点算法虽然改进了K均值算法对噪声和孤立点数据敏感的不足,但是仍存在着初始聚类中心和聚类个数k难以确定的问题,因此,针对算法存在的问题,提出一种基于密度的改进K中心点算法。该算法会根据数据集数据的分布情况自主确定聚类... 传统K中心点算法虽然改进了K均值算法对噪声和孤立点数据敏感的不足,但是仍存在着初始聚类中心和聚类个数k难以确定的问题,因此,针对算法存在的问题,提出一种基于密度的改进K中心点算法。该算法会根据数据集数据的分布情况自主确定聚类个数k和k个聚类中心点。最后,通过在入侵检测领域KDD Cup99数据集上实验测试表明,改进K中心点算法不仅能够自动形成k个聚类,而且具有较高的入侵检测率和较低的漏报率,聚类和入侵检测的效果均优于传统的K中心点算法。 展开更多
关键词 入侵检测 k中心点算法 改进k中心点算法 聚类分析
下载PDF
数据挖掘概念及国内外现状 被引量:1
9
作者 肖天灿 陈志刚 《计算机光盘软件与应用》 2012年第20期13-14,17,共3页
随着信息技术的高速发展,人们积累的数据量急剧增长,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。其主要任务是关联分析、分类、预测时序模式和偏差分析等。是知识发现(... 随着信息技术的高速发展,人们积累的数据量急剧增长,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。其主要任务是关联分析、分类、预测时序模式和偏差分析等。是知识发现(knowledge discovery in database)的关键步骤。数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。起初各种商业数据是存储在计算机的数据库中的,然后发展到可对数据库进行查询和访问,进而发展到对数据库的即时遍历。数据挖掘使数据库技术进入了一个更高级的阶段,它不仅能对过去的数据进行查询和遍历,并且能够找出过去数据之间的潜在联系,从而促进信息的传递。 展开更多
关键词 DATAMINING 数据仓库 OLAP k均值算法 k中心点算法
下载PDF
一种基于全局K-均值聚类的改进算法
10
作者 李燕梅 《电脑与电信》 2017年第11期25-27,共3页
全局K-均值聚类算法需要随机选取初始的聚类中心,本文基于K中心点算法的思想,将其作为全局K-均值聚类算法的初始聚类中心,并对全局K-均值聚类算法进行改进。依托人工模拟数据和学习库中的数据分析,对比两种算法的性能,得出改进算法聚类... 全局K-均值聚类算法需要随机选取初始的聚类中心,本文基于K中心点算法的思想,将其作为全局K-均值聚类算法的初始聚类中心,并对全局K-均值聚类算法进行改进。依托人工模拟数据和学习库中的数据分析,对比两种算法的性能,得出改进算法聚类时间短,鲁棒性强的结论。 展开更多
关键词 全局k-均值聚类算法 k中心点算法 改进
下载PDF
基于k中心点算法的TOPO服务器算法的研究 被引量:1
11
作者 王美 李晓峰 +1 位作者 孟令军 张立军 《计算机技术与发展》 2014年第4期122-125,130,共5页
在一个城域网中,数字电视机顶盒在对节目进行下载的时候,拥有这个节目资源的机顶盒的数量也许有很多个,怎么才能找到最近的一个机顶盒进行节目的下载是网络负载均衡中比较重要的问题,也是文中的研究目的。文中需要建立一个网络拓扑结构... 在一个城域网中,数字电视机顶盒在对节目进行下载的时候,拥有这个节目资源的机顶盒的数量也许有很多个,怎么才能找到最近的一个机顶盒进行节目的下载是网络负载均衡中比较重要的问题,也是文中的研究目的。文中需要建立一个网络拓扑结构,给对应的机顶盒分配相应的IP地址,将这些已知的信息存放到数据库中,使用VS2010软件进行编程,在具体实现过程中运用到了数据挖掘中的k中心点算法,最终找到距离最近的机顶盒的地址下载目标资源。 展开更多
关键词 网络负载均衡 数据库 VS2010 k中心点算法
下载PDF
基于频繁模式的长尾文本聚类算法 被引量:1
12
作者 宋中山 张广凯 +1 位作者 尹帆 帖军 《计算机系统应用》 2019年第4期139-144,共6页
短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在"长尾现象",传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets... 短文本聚类一直是信息提取领域的热门话题,大规模的短文本数据中存在"长尾现象",传统算法对其聚类时会面临特征纬度高,小类别信息丢失的问题,针对对上述问题的研究,本文提出一种频繁项协同剪枝迭代聚类算法(Frequent Itemsets collaborative Pruning iteration Clustering framework, FIPC).该算法将迭代聚类框架与K中心点算法相结合,运用协同剪枝策略,实现对小类别文本聚类,实验结果证明该聚类算法能够有效的提高小类别短文本信息聚类的精确度,并能避免聚类中类簇重叠的问题. 展开更多
关键词 文本聚类 长尾现象 频繁模式 k中心点算法
下载PDF
改进SOM和快速K中心点银行客户细分
13
作者 吴虹颖 郑山红 苏珂 《长春工业大学学报》 CAS 2021年第3期279-284,共6页
动态设置自组织神经网络的学习速率,加快自我组织进程,利用改进后的SOM训练样本数据得到的原型向量数据量远小于初始数据量且保持原拓扑结构不变,再用快速K中心点算法对该原型向量聚类并用CH指标判定最佳聚类个数。结合巴雷托分析法和... 动态设置自组织神经网络的学习速率,加快自我组织进程,利用改进后的SOM训练样本数据得到的原型向量数据量远小于初始数据量且保持原拓扑结构不变,再用快速K中心点算法对该原型向量聚类并用CH指标判定最佳聚类个数。结合巴雷托分析法和客户价值矩阵将Standard银行客户划分为四类,为不同客户群体提供针对性营销建议。 展开更多
关键词 银行客户细分 SOM算法 快速k中心点算法 聚类分析
下载PDF
WEKA数据挖掘平台及其二次开发 被引量:35
14
作者 陈慧萍 林莉莉 +1 位作者 王建东 苗新蕊 《计算机工程与应用》 CSCD 北大核心 2008年第19期76-79,共4页
在开源数据挖掘平台WEKA上进行了挖掘测试和分析,并分析了其存在的主要问题。为了克服WEKA系统在聚类方面的薄弱性,在WEKA的开源环境下进行二次开发,扩充了聚类算法。介绍了将k-中心点轮换算法嵌入到WEKA平台的过程,充分利用了开源WEKA... 在开源数据挖掘平台WEKA上进行了挖掘测试和分析,并分析了其存在的主要问题。为了克服WEKA系统在聚类方面的薄弱性,在WEKA的开源环境下进行二次开发,扩充了聚类算法。介绍了将k-中心点轮换算法嵌入到WEKA平台的过程,充分利用了开源WEKA中的类和可视化功能,并对嵌入的算法和原有聚类算法进行了对比分析。该算法改进了传统的k-中心点算法,避免陷入局部最优,而且它对初始点不太敏感,可以获取更好的聚类效果。 展开更多
关键词 数据挖掘 WEkA平台 聚类 k-中心点轮换算法
下载PDF
一种基于粒子群的聚类算法 被引量:14
15
作者 姚丽娟 罗可 孟颖 《计算机工程与应用》 CSCD 2012年第13期150-153,175,共5页
针对K-中心点算法对初始化敏感和容易陷入局部极值的缺点,提出一种基于粒子群算法和密度初始化改进的K-中心点聚类算法。该算法初始化时选择距离较远的k个候选范围作为k个聚类中心的选择范围,即粒子的初始值都在该k个范围内。通过粒子... 针对K-中心点算法对初始化敏感和容易陷入局部极值的缺点,提出一种基于粒子群算法和密度初始化改进的K-中心点聚类算法。该算法初始化时选择距离较远的k个候选范围作为k个聚类中心的选择范围,即粒子的初始值都在该k个范围内。通过粒子群算法优化聚类中心,以解决K-中心点算法因为聚类中心迭代计算较为复杂而导致的时间复杂度较高的问题。实验结果表明,该算法具有较高的正确率,较小的时间复杂度,综合性能更加稳定。 展开更多
关键词 粒子群算法 k-中心点算法 密度初始化 聚类
下载PDF
失稳模态识别方法及其在动态安全域中的运用 被引量:9
16
作者 闵亮 余贻鑫 +1 位作者 Stephen T Lee Pei Zhang 《电力系统自动化》 EI CSCD 北大核心 2004年第11期28-32,共5页
提出了一种快速识别初始运行点附近失稳模态的方法,该方法基于大量计算观察到的初始运行点附近不同运行点注入下模型的可达性格纳姆矩阵元素近乎不变的性质,将基于K-中心点算法的同调识别和初加速度法相结合,快速识别初始运行点附近的... 提出了一种快速识别初始运行点附近失稳模态的方法,该方法基于大量计算观察到的初始运行点附近不同运行点注入下模型的可达性格纳姆矩阵元素近乎不变的性质,将基于K-中心点算法的同调识别和初加速度法相结合,快速识别初始运行点附近的失稳模态,为实用动态安全域(PDSR)直接法提供了临界点搜索建议,改善了PDSR法。该方法的有效性在New England 10机39节点系统得到了验证。 展开更多
关键词 实用动态安全域 可达性格纳姆矩阵 k-中心点算法 同调识别 失稳模态
下载PDF
基于优化人工鱼群算法的混合聚类研究 被引量:5
17
作者 田琳 田力威 刘启文 《计算机工程与设计》 CSCD 北大核心 2014年第3期1041-1045,共5页
为了提高混合聚类算法的准确率,提出基于优化人工鱼群算法的混合聚类算法。引入人工鱼群算法,辅以鲁棒性更强的K中心点算法优化了混合聚类方法的聚集效果。通过对人工鱼的行为和参数进行改善,避免了聚类效果易受离群点影响的问题,对理... 为了提高混合聚类算法的准确率,提出基于优化人工鱼群算法的混合聚类算法。引入人工鱼群算法,辅以鲁棒性更强的K中心点算法优化了混合聚类方法的聚集效果。通过对人工鱼的行为和参数进行改善,避免了聚类效果易受离群点影响的问题,对理噪声数据的处理更好。结合K-中心点算法与人工鱼群算法的优势,解决了聚类算法初值依赖性,克服了鱼群算法后期迭代速度慢问题。仿真结果表明,该算法全局优化性能稳定,收敛速度加快,聚类效果明显提高,获得了较优的中心点与清晰地聚类划分。 展开更多
关键词 混合聚类 人工鱼群算法 优化参数 k-中心点算法 聚类效果
下载PDF
红斑鳞状皮肤病的聚类分析 被引量:4
18
作者 张宜 谢娟英 +3 位作者 李静 陈媛媛 贺瑞瑞 李燕 《济南大学学报(自然科学版)》 北大核心 2017年第3期181-187,共7页
针对红斑鳞状皮肤病鉴别诊断难题,提出利用聚类分析进行诊断;采用3种k-均值、2种k-中心点、最小生成树以及密度峰值点快速搜索聚类算法对该疾病数据进行分析,比较各算法对该疾病的聚类误差平方和、聚类结果 Rand指数、Jaccard系数、调整... 针对红斑鳞状皮肤病鉴别诊断难题,提出利用聚类分析进行诊断;采用3种k-均值、2种k-中心点、最小生成树以及密度峰值点快速搜索聚类算法对该疾病数据进行分析,比较各算法对该疾病的聚类误差平方和、聚类结果 Rand指数、Jaccard系数、调整Rand指数以及聚类准确率;比较各算法对预处理的数据子集的聚类结果与文献中采用k-均值算法对未预处理的该数据子集的聚类结果。结果表明:邻域k-中心点算法对红斑鳞状皮肤病有很好的聚类效果,聚类准确率、聚类结果 Rand指数、Jaccard系数、调整Rand指数均优于对比算法,密度全局k-均值算法的聚类效果次之,全局k-均值算法取得最佳聚类误差平方和;k-均值算法对预处理数据子集的聚类准确率最高,邻域k-中心点与密度全局k-均值算法的聚类准确率相等;数据预处理可提高k-均值算法对该疾病的诊断准确率。 展开更多
关键词 红斑鳞状皮肤病 k-均值算法 k-中心点算法 最小生成树 密度峰值 聚类分析
下载PDF
结合商品标题和描述的在线评论特征词选择方法研究 被引量:4
19
作者 梁昌勇 王倩倩 +1 位作者 陆文星 丁勇 《现代图书情报技术》 CSSCI 北大核心 2011年第5期49-54,共6页
目前,国内外对在线评论特征词的研究很少考虑到卖家发布的商品标题和描述信息,这使得数据挖掘过程盲目,挖掘结果准确率不高。采用聚类分析方法,把商品标题和描述考虑进来,搭建三层挖掘模型对在线评论进行研究和分析,提出定位L-K-中心点... 目前,国内外对在线评论特征词的研究很少考虑到卖家发布的商品标题和描述信息,这使得数据挖掘过程盲目,挖掘结果准确率不高。采用聚类分析方法,把商品标题和描述考虑进来,搭建三层挖掘模型对在线评论进行研究和分析,提出定位L-K-中心点算法。实验结果证明,该方法能提高挖掘的准确率,减少挖掘时间。 展开更多
关键词 聚类 特征词 定位 k-中心点算法
原文传递
一种高效的物联网移动Agent路由规划算法 被引量:3
20
作者 晏勇 《西南师范大学学报(自然科学版)》 CAS 北大核心 2020年第11期73-79,共7页
针对现有物联网数据聚合方法存在网络生命周期短和数据传输时延较高等问题,提出了一种高效的基于马尔可夫决策过程(Markov Decision Process,MDP)的移动Agent物联网数据聚合路由规划算法.该算法使用k-中心点算法对物联网设备进行分簇,... 针对现有物联网数据聚合方法存在网络生命周期短和数据传输时延较高等问题,提出了一种高效的基于马尔可夫决策过程(Markov Decision Process,MDP)的移动Agent物联网数据聚合路由规划算法.该算法使用k-中心点算法对物联网设备进行分簇,基于角度的移动Agent分配过程将簇头分成若干组,利用MDP参数(设备和信宿间的欧式距离、设备的剩余能量及其数据优先级)为每组簇头中的每个移动Agent提供路由规划,以实现高效的数据聚合.实验结果表明:与其他方法相比,本文方法在物联网的网络生存周期、能耗、数据传输时延和可靠性方面均有明显的改善. 展开更多
关键词 马尔可夫决策过程 k-中心点算法 数据聚合 路由规划
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部