期刊文献+
共找到86篇文章
< 1 2 5 >
每页显示 20 50 100
基于K中心点和粗糙集的KNN分类算法 被引量:8
1
作者 文武 李培强 《计算机工程与设计》 北大核心 2018年第11期3389-3394,共6页
为有效解决KNN算法在文本分类时效率随着数据规模的增大而降低这一问题,提出基于K中心点(K-Medoids)和粗糙集(rough set)的KNN分类方法 (KRS-KNN)。通过K中心点算法对文本数据集进行聚合,形成类簇,计算簇心和其它样本点的相异度,将相异... 为有效解决KNN算法在文本分类时效率随着数据规模的增大而降低这一问题,提出基于K中心点(K-Medoids)和粗糙集(rough set)的KNN分类方法 (KRS-KNN)。通过K中心点算法对文本数据集进行聚合,形成类簇,计算簇心和其它样本点的相异度,将相异度大于最后簇心相异度的样本剔除,运用粗糙集理论对得到的每个类簇进行分割,通过上、下作差得到的边界样本,通过KNN算法确定其最终类别。实验结果表明,文本数据的计算规模得到了降低,提高了文本数据的分类效率。 展开更多
关键词 文本分类 k中心点 粗糙集 相异度 样本剔除
下载PDF
基于优化初始聚类中心的K中心点算法 被引量:5
2
作者 段桂芹 邹臣嵩 刘锋 《计算机与现代化》 2019年第4期1-5,共5页
针对K中心点算法的初始聚类中心可能过于临近、代表性不足、稳定性差等问题,提出一种改进的K中心点算法。将样本集间的平均距离与样本间的平均距离的比值作为样本的密度参数,精简了高密度点集合中候选代表点的数量,采用最大距离乘积法... 针对K中心点算法的初始聚类中心可能过于临近、代表性不足、稳定性差等问题,提出一种改进的K中心点算法。将样本集间的平均距离与样本间的平均距离的比值作为样本的密度参数,精简了高密度点集合中候选代表点的数量,采用最大距离乘积法选择密度较大且距离较远的K个样本作为初始聚类中心,兼顾聚类中心的代表性和分散性。在UCI数据集上的实验结果表明,与传统K中心点算法和其他2种改进聚类算法相比,新提出的算法不仅聚类结果更加准确,同时也具有更快的收敛速度和更高的稳定性。 展开更多
关键词 密度 初始聚类中心 k中心点 绝对误差
下载PDF
基于K中心点聚类分析的大地电磁阻抗识别 被引量:3
3
作者 赵玄 严家斌 +1 位作者 皇祥宇 胡涛 《地球科学与环境学报》 CAS 北大核心 2018年第6期779-786,共8页
在大地电磁场复杂的观测环境中,信号会受到不同类型或程度的噪声干扰。传统阻抗估计或提取方法(如功率谱法、Robust法等)难以获得稳定的阻抗值。利用大地电磁阻抗的实虚分量特性,受噪声干扰小的信号阻抗分布集中,受噪声干扰严重的信号... 在大地电磁场复杂的观测环境中,信号会受到不同类型或程度的噪声干扰。传统阻抗估计或提取方法(如功率谱法、Robust法等)难以获得稳定的阻抗值。利用大地电磁阻抗的实虚分量特性,受噪声干扰小的信号阻抗分布集中,受噪声干扰严重的信号阻抗分布散乱。引入K中心点聚类分析对阻抗进行提取与识别,并利用阻抗欧氏距离来描述阻抗间的相似性,依据相似性把受干扰小的信号阻抗划分到一类,受干扰大的信号阻抗划分到不同的类。依据相干度准则和紧凑性准则等类的选取准则,甄别出干扰环境中阻抗所在的最佳类。通过仿真实验和实例分析,验证了K中心点聚类分析能在噪声环境中识别出高质量的信号,恢复出真实阻抗值。 展开更多
关键词 阻抗估计 实虚分量 聚类分析 k中心点 阻抗欧氏距离 相干度 紧凑性 数值模拟
下载PDF
基于改进K中心点的语音分组识别算法 被引量:1
4
作者 李云 《电子设计工程》 2020年第10期152-155,共4页
针对语音分组识别中,分组数量多时,识别率下降,分组数量少时,识别时间增加这一问题,提出一种改进K中心点的语音分组识别算法。该算法先将同一语音进行分段均值降维,然后将不同语音经过K中心点聚类分组。识别时先判断所在语音组,再进行... 针对语音分组识别中,分组数量多时,识别率下降,分组数量少时,识别时间增加这一问题,提出一种改进K中心点的语音分组识别算法。该算法先将同一语音进行分段均值降维,然后将不同语音经过K中心点聚类分组。识别时先判断所在语音组,再进行模式匹配。实验结果表明,相比于传统K均值聚类和传统K中心点算法,该算法能减少识别时间,提高识别率。 展开更多
关键词 语音识别 k中心点 k均值聚类 欧氏距离
下载PDF
一种基于混合聚类的空间索引算法
5
作者 韩秋英 马骏 张少辉 《电脑知识与技术》 2009年第12Z期10047-10048,10056,共3页
R-Tree允许兄弟节点之间的相互重叠,具有多路查找的特点,而Hilbert R-Tree也不能有效降低子空间的相互重叠,直接影响查询效率。提出了一种基于混合聚类的空间索引算法,将K-means和K中心点引入索引结构,改变了经典K-means算法对初始聚类... R-Tree允许兄弟节点之间的相互重叠,具有多路查找的特点,而Hilbert R-Tree也不能有效降低子空间的相互重叠,直接影响查询效率。提出了一种基于混合聚类的空间索引算法,将K-means和K中心点引入索引结构,改变了经典K-means算法对初始聚类中心的随机选取,减少了叶节点的MBR面积和各个子空间的重叠。通过实验表明,该算法具有更快的响应速度和查询效率。 展开更多
关键词 空间索引 混合聚类 HILBERT R-TREE k-MEANS k中心点 空间查询
下载PDF
大数据环境下基于K中心点优化算法的Web服务组合 被引量:1
6
作者 刘锋 邹臣嵩 崔炜 《计算机与现代化》 2020年第12期20-24,共5页
在当前Web服务海量增加、现有Web服务选择算法低效、用户匹配度差的基础上,针对K中心点算法存在的质点偏移、准确率低和容易发生畸变等问题,提出一种大数据环境下基于K中心点优化算法的Web服务组合方法。该方法是在大数据环境下,根据不... 在当前Web服务海量增加、现有Web服务选择算法低效、用户匹配度差的基础上,针对K中心点算法存在的质点偏移、准确率低和容易发生畸变等问题,提出一种大数据环境下基于K中心点优化算法的Web服务组合方法。该方法是在大数据环境下,根据不同用户需求满意度及Web服务QoS参数,对基于优化初始聚类中心的K中心点算法的Web服务选择及最优Web服务组合进行研究。同时针对不同的选择方法对服务动态选择及组合的准确度、迭代更新次数、候选集选择时间及选择总时间进行实验分析,验证了本文研究方法的有效性和可靠性。 展开更多
关键词 匹配度 大数据 k中心点 服务组合
下载PDF
基于检测域划分的虚拟机异常检测算法
7
作者 吴天舒 陈蜀宇 +1 位作者 张涵翠 周真 《计算机应用》 CSCD 北大核心 2016年第4期1066-1069,共4页
虚拟机的正常运行是支撑云平台服务的重要条件,由于云平台下虚拟机存在数量规模大、运行环境随时间动态变化的特点,管理系统难以针对每个虚拟机进行训练数据采集以及统计模型的训练。为了提高在上述环境下异常检测系统的实时性和识别能... 虚拟机的正常运行是支撑云平台服务的重要条件,由于云平台下虚拟机存在数量规模大、运行环境随时间动态变化的特点,管理系统难以针对每个虚拟机进行训练数据采集以及统计模型的训练。为了提高在上述环境下异常检测系统的实时性和识别能力,提出基于改进k中心点聚类算法的检测域划分机制,在聚类迭代更新步骤上进行优化,以提升检测域划分的速度,并通过检测域策略的应用来提高虚拟机异常检测的效率和准确率。实验及分析表明,改进的聚类算法拥有更低的时间复杂度,采用检测域划分机制的检测方法在虚拟机异常检测中拥有更高的效率和准确率。 展开更多
关键词 异常检测 云平台 大规模虚拟机 k中心点 检测域
下载PDF
一种改进的全局K-均值聚类算法 被引量:47
8
作者 谢娟英 蒋帅 +2 位作者 王春霞 张琰 谢维信 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第2期18-22,共5页
将快速K中心点聚类算法确定初始中心点的思想应用于全局K-均值聚类算法,对其选取下一个簇的最佳初始中心的方法进行改进,提出选取下一个簇的最佳初始中心的一种新方法.该新方法选择一个周围样本分布相对密集,且距离现有簇的中心比较远... 将快速K中心点聚类算法确定初始中心点的思想应用于全局K-均值聚类算法,对其选取下一个簇的最佳初始中心的方法进行改进,提出选取下一个簇的最佳初始中心的一种新方法.该新方法选择一个周围样本分布相对密集,且距离现有簇的中心比较远的样本为下一个簇的最佳初始中心,得到一种改进的全局K-均值聚类算法.改进后的算法不仅可以避免将噪音点作为下一个簇的最佳初始中心点,而且在不影响聚类效果的基础上缩短了聚类时间.通过UCI机器学习数据库数据以及随机生成的人工模拟数据实验测试,证明改进的全局K-均值聚类算法与全局K-均值聚类算法及快速全局K-均值聚类算法相比在聚类时间上更优越. 展开更多
关键词 k-均值 全局k-均值 快速全局k-均值 k中心点
下载PDF
基于邻域的K中心点聚类算法 被引量:32
9
作者 谢娟英 郭文娟 谢维信 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第4期16-22,共7页
提出一种基于邻域的K中心点聚类算法,该算法利用数据集样本的自然分布信息定义数据对象的邻域半径和相应邻域,选择位于样本分布密集区且相距较远的K个数据对象作为初始聚类中心,以期改进快速K中心点算法在选取初始中心点时有可能使多个... 提出一种基于邻域的K中心点聚类算法,该算法利用数据集样本的自然分布信息定义数据对象的邻域半径和相应邻域,选择位于样本分布密集区且相距较远的K个数据对象作为初始聚类中心,以期改进快速K中心点算法在选取初始中心点时有可能使多个初始中心位于同一类簇的潜在缺陷.通过UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集实验测试,表明提出的基于邻域的K中心点算法不仅具有很好的聚类效果,而且运行时间短,对噪音数据有很强的抗干扰性能,优于传统K中心点算法和Park等人的快速K中心点算法. 展开更多
关键词 邻域 k中心点算法 样本密度 聚类 样本空间分布
下载PDF
基于划分的聚类算法研究综述 被引量:15
10
作者 贾瑷玮 《电子设计工程》 2014年第23期38-41,共4页
在数据挖掘的所有算法中,聚类分析尤为重要.基于划分的聚类算法就是用统计分析的方法研究分类问题.本文介绍了聚类的定义及聚类算法的种类,详细阐述了K均值聚类算法和K中心点聚类算法的基本原理并对它们的性能进行分析,对近年来各学者... 在数据挖掘的所有算法中,聚类分析尤为重要.基于划分的聚类算法就是用统计分析的方法研究分类问题.本文介绍了聚类的定义及聚类算法的种类,详细阐述了K均值聚类算法和K中心点聚类算法的基本原理并对它们的性能进行分析,对近年来各学者对基于划分的聚类算法的研究现状进行了梳理,对其具体应用实例做了简要介绍。 展开更多
关键词 数据挖掘 聚类 k均值聚类算法 k中心点聚类算法
下载PDF
基于k中心点聚类的稳态电能质量预警阈值研究 被引量:14
11
作者 刘建华 刘艳梅 +2 位作者 冯纯纯 李锦程 张屹修 《电测与仪表》 北大核心 2018年第23期41-45,共5页
对稳态电能质量预警阈值的研究是适应电能质量预警系统的开发。针对目前稳态电能质量预警阈值确定方法复杂单一的问题,提出了一种基于k中心点聚类的稳态电能质量阈值确定方法。该方法是在对电能质量数据进行聚类分析的基础上,使用基于... 对稳态电能质量预警阈值的研究是适应电能质量预警系统的开发。针对目前稳态电能质量预警阈值确定方法复杂单一的问题,提出了一种基于k中心点聚类的稳态电能质量阈值确定方法。该方法是在对电能质量数据进行聚类分析的基础上,使用基于距离的平方和误差作为聚类质量的度量,根据阈值确定的实际情况取k=2,自然地将所有数据分为正常类和异常类两类,在此基础上进行阈值的选取。实验结果证明,在确定电能质量阈值的问题上,该方法具有良好的效果和效率。 展开更多
关键词 电能质量 预警阈值 k中心点聚类
下载PDF
基于Raft算法改进的实用拜占庭容错共识算法 被引量:8
12
作者 王谨东 李强 《计算机应用》 CSCD 北大核心 2023年第1期122-129,共8页
针对应用于联盟链的实用拜占庭容错(PBFT)共识算法可扩展性不足、通信开销大等问题,提出了一种基于Raft算法改进的实用拜占庭容错共识算法K-RPBFT。首先,将区块链分片,使用K-medoids聚类算法将所有节点划分为多个节点簇,每个节点簇构成... 针对应用于联盟链的实用拜占庭容错(PBFT)共识算法可扩展性不足、通信开销大等问题,提出了一种基于Raft算法改进的实用拜占庭容错共识算法K-RPBFT。首先,将区块链分片,使用K-medoids聚类算法将所有节点划分为多个节点簇,每个节点簇构成一个分片,从而将全局共识改进为分层次的多中心共识;然后,每个分片的聚类中心节点之间使用PBFT算法进行共识,而在分片内部使用基于监督节点改进的Raft算法进行共识。K-RPBFT算法的片内监督机制赋予了Raft算法一定的拜占庭容错能力,并提升了算法的安全性。实验分析表明,相较于PBFT算法,K-RPBFT算法在具备拜占庭容错能力的同时能够大幅降低共识的通信开销与共识时延,提升共识效率与吞吐量,并且具有良好的可扩展性与动态性,使联盟链能够应用于更广泛的场景中。 展开更多
关键词 区块链 共识算法 实用拜占庭容错 Raft算法 k中心点聚类算法
下载PDF
基于k中心点聚类的图像二值化方法 被引量:10
13
作者 唐涛 覃晓 +1 位作者 易宗剑 韩冬越 《计算机科学与探索》 CSCD 北大核心 2015年第2期234-241,共8页
在机器视觉和模式识别的研究中,将图像变换为二值图像是能够更高效识别图像中的特定区域或者目标的关键。提出了一种基于k中心点聚类算法的图像二值化方法(image binarization k-medoids-based clustering,IBk MC)。该方法使用基于距离... 在机器视觉和模式识别的研究中,将图像变换为二值图像是能够更高效识别图像中的特定区域或者目标的关键。提出了一种基于k中心点聚类算法的图像二值化方法(image binarization k-medoids-based clustering,IBk MC)。该方法使用基于距离的平方和误差作为聚类质量度量,根据图像二值化的领域知识将k的值取为2,自然地将图像分为前景类和背景类两类。实验结果证明,针对复杂环境下的自然图像,该方法在效果和效率上优于OSTU(最大类间方差)阈值化方法。 展开更多
关键词 图像二值化 k中心点聚类 阈值
下载PDF
多判据融合的配电网谐振接地系统单相接地故障选线方法 被引量:9
14
作者 黄妍妍 李天友 +1 位作者 黄建业 蔡金锭 《供用电》 2016年第11期56-62,共7页
利用配电网谐振接地系统单相接地故障的零序电流经广义S变换得到时频矩阵,提取奇异值和、能量矩以及相角综合相似性系数这3种互补且能更准确表征故障特征的特征量,利用K中心点聚类方式进行多判据融合选线。仿真结果表明,该故障选线方法... 利用配电网谐振接地系统单相接地故障的零序电流经广义S变换得到时频矩阵,提取奇异值和、能量矩以及相角综合相似性系数这3种互补且能更准确表征故障特征的特征量,利用K中心点聚类方式进行多判据融合选线。仿真结果表明,该故障选线方法能够适用于不同工况,选线准确率和可靠性较高。 展开更多
关键词 广义S变换 故障选线 奇异值分解 能量矩 k中心点聚类
下载PDF
基于K中心点的文档聚类算法 被引量:4
15
作者 吴景岚 朱文兴 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第5期88-91,共4页
K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚类算法,然后提出一个改进算法,该算法不增加计算的复杂性,显著改进文档的聚类结果.最后,将该改进算法作为... K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚类算法,然后提出一个改进算法,该算法不增加计算的复杂性,显著改进文档的聚类结果.最后,将该改进算法作为局部搜索过程嵌入到迭代局部搜索结构中,构造一个基于K中心点的迭代局部搜索文档聚类算法,进一步改进了文档聚类结果.试验结果表明该算法显著改进了文档聚类结果. 展开更多
关键词 k中心点算法 文档聚类 迭代局部搜索
下载PDF
基于参数优化VMD和改进K聚类判据融合的配电网故障选线方法 被引量:2
16
作者 王建元 张宇辉 刘铖 《南方电网技术》 CSCD 北大核心 2023年第7期135-145,共11页
针对现有暂态量选线方法易受到故障相角、过渡电阻、噪声、谐波及判据阈值的影响,提出基于参数优化变分模态分解(variational mode decomposition,VMD)和改进K聚类判据融合的选线方法。首先对分解过程的3个关键性参数进行动态优化,利用... 针对现有暂态量选线方法易受到故障相角、过渡电阻、噪声、谐波及判据阈值的影响,提出基于参数优化变分模态分解(variational mode decomposition,VMD)和改进K聚类判据融合的选线方法。首先对分解过程的3个关键性参数进行动态优化,利用信号频谱及分量特性确定VMD分解层数,并以算术优化算法求取最佳惩罚因子,剔除了工频、噪声及谐波干扰,再根据分解层数与各模态频谱确定模态中心频率以提高分解效率。其次,以优化后的VMD获取余弦相似度、高频幅值和直流能量作为互补的故障选线判据值。最后以改进K聚类算法实现多判据融合,弥补了单一判据的局限性。理论分析、仿真与实测结果表明,所提方法适用于分布式电源接入的电网,不受故障位置、故障相角及过渡电阻的影响,具有优异的抗谐波与噪声干扰性能。 展开更多
关键词 故障选线 变分模态分解 算术优化算法 k中心点聚类 抗噪性
下载PDF
状态演化模式挖掘在交通流预测中的应用 被引量:2
17
作者 颜镝 宋苏 《计算机应用》 CSCD 北大核心 2005年第3期649-651,共3页
在交通流诱导中,交通流量的预测是研究热点。为了提取交通流变化的特征规律,针对交通流的数据特点,采用了状态演化模式挖掘的框架对其进行挖掘,提出了一种交通流量模式和规则发现的方法,并且通过实验对这种方法进行了验证。
关键词 状态演化模式挖掘 线性分段化 k中心点 GSP
下载PDF
改进的k中心点算法在茶叶拼配中的应用 被引量:4
18
作者 邢光林 胡一然 +1 位作者 孙翀 帖军 《中南民族大学学报(自然科学版)》 CAS 北大核心 2017年第4期126-130,共5页
为了提高茶叶拼配效率,节约人工成本,实现茶叶企业效益最大化,探讨了将茶叶拼配问题建模成多维层次空间聚类问题,并通过定义多维概念分层空间中的相似性度量准则,提出了改进的k中心点算法求解最优拼配方案,并引入Dewey编码提高了求解效... 为了提高茶叶拼配效率,节约人工成本,实现茶叶企业效益最大化,探讨了将茶叶拼配问题建模成多维层次空间聚类问题,并通过定义多维概念分层空间中的相似性度量准则,提出了改进的k中心点算法求解最优拼配方案,并引入Dewey编码提高了求解效率.根据真实数据集上的实验表明:同等实验条件下较人工拼配方式而言,文中所提出的茶叶拼配智能化求解方法大大提高了茶叶企业工作效率和经济利益. 展开更多
关键词 茶叶拼配 空间聚类 多维概念分层 DEWEY编码 k中心点算法
下载PDF
结肠癌患者诊断的基因标志物识别算法 被引量:1
19
作者 谢娟英 樊雯 《模式识别与人工智能》 EI CSCD 北大核心 2017年第11期1019-1029,共11页
为了得到具有强分类信息的极少结肠癌特征基因,实现对结肠癌患者的准确识别,文中提出结肠癌患者诊断的基因标志物识别算法.首先提出基因密度和基因距离的概念,构造以基因密度和基因距离分别为横纵坐标的基因2D空间散列图,选择处于密度... 为了得到具有强分类信息的极少结肠癌特征基因,实现对结肠癌患者的准确识别,文中提出结肠癌患者诊断的基因标志物识别算法.首先提出基因密度和基因距离的概念,构造以基因密度和基因距离分别为横纵坐标的基因2D空间散列图,选择处于密度峰值点的基因构成优选基因子集,然后采用密度峰值K中心点(DP_K-medoids)算法对降维后的结肠数据集样本进行聚类分析.基因距离和样本距离分别采用欧氏距离、曼哈顿距离、切比雪夫距离和夹角余弦距离度量.实验表明,在夹角余弦距离下,文中算法可以选择到具有高准确率、高灵敏度、高特异度和高马修斯相关系数的规模较小的结肠癌基因子集. 展开更多
关键词 聚类 k中心点(k-medoids)算法 密度峰值k中心点(DP_k—medoids)算法 基因选择 结肠癌
下载PDF
基于多源海事数据的大型船舶精细化分段乘潮研究 被引量:2
20
作者 张新宇 郭文强 +1 位作者 王婧贇 杨炳栋 《地球信息科学学报》 CSCD 北大核心 2022年第9期1688-1700,共13页
针对大型船舶长航道乘潮进港窗口期时长不充足问题,本文提出了基于船舶自动识别系统(Automatic Identification System,AIS)数据、港口潮汐数据、官方电子海图数据和航道地理位置数据等多源海事数据的大型船舶长航道精细化分段乘潮模型... 针对大型船舶长航道乘潮进港窗口期时长不充足问题,本文提出了基于船舶自动识别系统(Automatic Identification System,AIS)数据、港口潮汐数据、官方电子海图数据和航道地理位置数据等多源海事数据的大型船舶长航道精细化分段乘潮模型。首先,基于AIS数据采用K中心点算法对大型船舶乘潮航行行为特征进行挖掘,识别出大型船舶乘潮航迹关键点,计算大型船舶乘潮航行行为变化关键船位点。接着,结合长航道地理环境特征和大型船舶航行行为特征对长航道进行精细化分段,在此基础上基于港口潮汐数据构建大型船舶精细化分段乘潮窗口期计算模型。其次,设计乘潮历时自适应排列算法求解大型船舶乘潮最长窗口期;然后,以黄骅港综合港区航道为例验证了本文所提出的精细化分段乘潮模型。最后,基于电子海图数据利用地理信息系统平台实现大型船舶精细化分段乘潮三维动态推演,进一步验证大型船舶精细化分段乘潮航行的安全性。结果表明,该模型能够有效增加大型船舶乘潮进港窗口期时长,提高大型船舶乘潮进港效率,可为港航管理部门制定大型船舶进港计划提供理论指导。 展开更多
关键词 多源海事数据 k中心点算法 精细化 分段乘潮 窗口期 历时排列 地理信息系统 三维动态推演
原文传递
上一页 1 2 5 下一页 到第
使用帮助 返回顶部