期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于萤火虫优化的加权K-means算法 被引量:41
1
作者 陈小雪 尉永清 +1 位作者 任敏 孟媛媛 《计算机应用研究》 CSCD 北大核心 2018年第2期466-470,共5页
针对传统K-means算法易受初始聚类中心和异常数据的影响等缺陷,利用萤火虫优化算法全局搜索能力强、收敛速度快的优势,对K-means算法的初始聚类中心进行优化,并通过引用一种加权的欧氏距离,减少异常数据等不确定因素带来的不良影响,提... 针对传统K-means算法易受初始聚类中心和异常数据的影响等缺陷,利用萤火虫优化算法全局搜索能力强、收敛速度快的优势,对K-means算法的初始聚类中心进行优化,并通过引用一种加权的欧氏距离,减少异常数据等不确定因素带来的不良影响,提出了一种基于萤火虫优化的加权K-means算法。该算法在提升聚类性能的同时,有效增强了算法的收敛速度。在实验阶段,通过UCI数据集中的几组数据对该算法进行了聚类实验及有效性测试,实验结果充分表明了该算法的有效性及优越性。 展开更多
关键词 加权k-means 聚类 萤火虫算法
下载PDF
基于局部PSO-LSSVM的水泥f-CaO测量方法研究 被引量:9
2
作者 王秀莲 孙旭晨 +2 位作者 王卓 苑明哲 刘钊 《控制工程》 CSCD 北大核心 2014年第6期807-811,共5页
针对水泥熟料质量指标游离氧化钙含量难以实时检测的问题,提出一种基于局部pso-lssvm的软测量建模方法。在构建局部建模数据集时,同时考虑了数据样本之间的加权欧氏距离与向量的夹角,使得训练数据的选取更加具有实际意义。由于局部建模... 针对水泥熟料质量指标游离氧化钙含量难以实时检测的问题,提出一种基于局部pso-lssvm的软测量建模方法。在构建局部建模数据集时,同时考虑了数据样本之间的加权欧氏距离与向量的夹角,使得训练数据的选取更加具有实际意义。由于局部建模的时间开销较大,首先,采用加权k均值聚类算法对历史数据库进行聚类分析得到若干子样本集;其次,在与当前输入数据加权欧氏距离最小的子样本集中,建立基于pso-lssvm算法的局部软测量模型,计算得到当前游离氧化钙含量值;最后,应用实际数据进行训练和验证,结果表明,该方法较全局建模具有更好的泛化能力,能够满足水泥熟料游离氧化钙含量检测的实时性要求,对于实现水泥烧成系统的优化控制,提高能源利用率具有重要意义。 展开更多
关键词 游离氧化钙 加权k均值聚类 局部建模 最小二乘支持向量机 粒子群优化
下载PDF
一种加权K-means聚类算法及其应用 被引量:4
3
作者 沈秀娟 薛烁 《曲靖师范学院学报》 2022年第3期1-7,共7页
K-means聚类方法是比较经典的聚类分析方法之一,因执行效率快,算法简单等优点在许多领域得到广泛应用.传统的K-means聚类算法没有考虑各指标的重要性,实际上,指标的重要性是有差异的,应当区别对待.基于此,改进传统的K-means聚类方法,提... K-means聚类方法是比较经典的聚类分析方法之一,因执行效率快,算法简单等优点在许多领域得到广泛应用.传统的K-means聚类算法没有考虑各指标的重要性,实际上,指标的重要性是有差异的,应当区别对待.基于此,改进传统的K-means聚类方法,提出了加权K-means聚类算法.为验证改进算法的优越性,以R软件自带的鸢尾花卉数据集iris作为实验数据,设定了三个实验进行对比分析,实验结果表明加权K-means聚类算法收敛速度较快,分类的结果更接近原始分类,效果更好.为进一步说明加权K-means聚类算法的实用性,以103所高校部分指标为实验数据用该算法进行了聚类分析. 展开更多
关键词 k-means聚类 加权k-means聚类 标准差系数法 高校聚类
下载PDF
基于随机森林和加权K均值聚类的网络入侵检测系统 被引量:7
4
作者 任晓芳 赵德群 秦健勇 《微型电脑应用》 2016年第7期21-24,共4页
目前,许多误用检测系统无法检测未知攻击,而异常检测系统虽然能够精确检测未知攻击,但具有较高的误报警率。为此,提出了一种基于随机森林和加权K均值聚类算法的混合入侵检测系统。首先,利用随机森林算法从训练集中建立入侵模型,构建误... 目前,许多误用检测系统无法检测未知攻击,而异常检测系统虽然能够精确检测未知攻击,但具有较高的误报警率。为此,提出了一种基于随机森林和加权K均值聚类算法的混合入侵检测系统。首先,利用随机森林算法从训练集中建立入侵模型,构建误用检测模型,通过网络连接的特征匹配来检测已知攻击。然后,利用加权K均值算法构建异常检测模块,根据随机森林算法获得的特征,将不确定性攻击的网络连接数据进行聚类,进而实现未知攻击的检测。在KDD′99数据库中的实验表明,该系统具有较高的检测率和较低的误报警率。 展开更多
关键词 入侵检测系统 随机森林 加权k-均值聚类 误用检测 异常检测
下载PDF
Blind source separation by weighted K-means clustering 被引量:5
5
作者 Yi Qingming 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2008年第5期882-887,共6页
Blind separation of sparse sources (BSSS) is discussed. The BSSS method based on the conventional K-means clustering is very fast and is also easy to implement. However, the accuracy of this method is generally not ... Blind separation of sparse sources (BSSS) is discussed. The BSSS method based on the conventional K-means clustering is very fast and is also easy to implement. However, the accuracy of this method is generally not satisfactory. The contribution of the vector x(t) with different modules is theoretically proved to be unequal, and a weighted K-means clustering method is proposed on this grounds. The proposed algorithm is not only as fast as the conventional K-means clustering method, but can also achieve considerably accurate results, which is demonstrated by numerical experiments. 展开更多
关键词 blind source separation underdetermined mixing sparse representation weighted k-means clustering.
下载PDF
基于加权K-Means和局部BPNN的票房预测模型 被引量:6
6
作者 米传民 鲁月 林清同 《计算机系统应用》 2019年第2期15-23,共9页
电影作为典型的短周期、体验型产品,其票房收益受众多因素的共同影响,因此对其票房进行预测较为困难.本文主要构建了一种基于加权K-均值以及局部BP神经网络(BPNN)的票房预测模型对目前的票房预测模型存在的不足进行改进,从而提高票房预... 电影作为典型的短周期、体验型产品,其票房收益受众多因素的共同影响,因此对其票房进行预测较为困难.本文主要构建了一种基于加权K-均值以及局部BP神经网络(BPNN)的票房预测模型对目前的票房预测模型存在的不足进行改进,从而提高票房预测的精度:(1)构建基于随机森林的影响因素影响力测量模型,并以此为依据对票房影响因素进行筛选,以此来简化后续预测模型的输入;(2)考虑到不同影响因素对票房的影响力不同的现实情况,为了解决以往研究中对影响因素权重平均分配的问题,本文构建了基于加权K-均值和局部BP神经网络的票房预测模型,以因素影响力为依据对样本数据进行加权的K-均值聚类,并基于子样本构建局部BP神经网络模型进行票房预测.实验证明,本文所构建的模型平均绝对百分比误差(MAPE)为8.49%,低于对比实验的10.39%,可以看出本文构建的基于加权K-均值以及局部BP神经网络的票房预测模型的预测结果要优于对比模型的预测结果. 展开更多
关键词 电影票房 预测 加权k-均值 BP神经网络
下载PDF
改进的基于区域的运动目标分割方法 被引量:1
7
作者 葛庆国 吴晓娟 江冬梅 《计算机工程》 CAS CSCD 北大核心 2004年第24期106-108,共3页
针对视频监控系统,提出了一种改进的基于区域的运动目标分割方法。与传统方法相比,在运动检测阶段,结合时域差分和背景差分进行运动检测,并通过自适应方法进行背景更新;在差分图像二值化时,采用自适应阈值方法来代替传统的手工确定阈值... 针对视频监控系统,提出了一种改进的基于区域的运动目标分割方法。与传统方法相比,在运动检测阶段,结合时域差分和背景差分进行运动检测,并通过自适应方法进行背景更新;在差分图像二值化时,采用自适应阈值方法来代替传统的手工确定阈值法;对于区域分割,使用基于加权平方欧式距离的均值聚类算法代替传统的均值聚类算法。实验结果表明该改进方法比传统方法具有更好的实时性、鲁棒性和有效性。 展开更多
关键词 背景差分 自适应阈值 加权k均值聚类 运动估计
下载PDF
改进K-means聚类算法行驶工况及油耗研究 被引量:4
8
作者 苏小会 张玉西 +1 位作者 徐淑萍 尚煜 《计算机工程与科学》 CSCD 北大核心 2021年第11期2020-2026,共7页
为解决传统聚类算法初始中心易陷入局部最优、耗时长的问题,提出一种改进的K-means聚类优化算法。该算法引入最大最小距离和加权欧氏距离,从剩余聚类点距离均值和出发,避免孤立点和边缘数据的影响。利用比重法对主成分进行改进,以由此... 为解决传统聚类算法初始中心易陷入局部最优、耗时长的问题,提出一种改进的K-means聚类优化算法。该算法引入最大最小距离和加权欧氏距离,从剩余聚类点距离均值和出发,避免孤立点和边缘数据的影响。利用比重法对主成分进行改进,以由此获得的特征影响因子作为初始特征权重,构建一种加权欧氏距离度量。根据特征贡献率对聚类的影响,筛选具有代表性的特征因子凸显聚类效果,最终合成汽车行驶工况,分析瞬时油耗。结果表明,所提算法构建行驶工况的速度-加速度联合分布差异值仅为1.05%,比传统K-means聚类省时44.2%,行驶工况拟合度较高,能反映实际车辆的运行特征及油耗。 展开更多
关键词 行驶工况 影响因子 特征权重 加权k-means聚类
下载PDF
基于逻辑回归函数的加权K-means聚类算法 被引量:8
9
作者 林丽 薛芳 《集美大学学报(自然科学版)》 CAS 2021年第2期139-145,共7页
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高。针对这个不足,提出一种特征加权的K-means算法进行优化。首先,运用Softmax和Sigmoid... 传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高。针对这个不足,提出一种特征加权的K-means算法进行优化。首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其次,优化初始聚类中心选择策略,选择距离较大的K个样本作为初始聚类中心,可有效避免样本的错误聚类及空簇问题。实验结果表明,在UCI标准数据集中采用加权K-means聚类算法可以有效减少迭代次数,提高聚类的准确率、精确率和召回率。 展开更多
关键词 欧式距离 特征加权的k-means算法 逻辑回归函数 初始聚类中心
下载PDF
海上应急资源调度多目标模型优化 被引量:8
10
作者 朱小林 陈昌定 《中国航海》 CSCD 北大核心 2019年第1期56-62,共7页
为优化海上应急救援系统中应急资源位置-分配问题的决策,建立基于事件类型的应急物资与船舶分配多目标模型。该模型在综合各项因素的基础上,以缩短事件响应时间、降低船队运营成本和协调船舶工作量与应急物资调度之间的不匹配关系为目标... 为优化海上应急救援系统中应急资源位置-分配问题的决策,建立基于事件类型的应急物资与船舶分配多目标模型。该模型在综合各项因素的基础上,以缩短事件响应时间、降低船队运营成本和协调船舶工作量与应急物资调度之间的不匹配关系为目标,确定不同目标分量权重下合理的船舶、物资分配计划。选取渤海海域内的726个灾难事件点、8种灾难事件作为仿真算例进行验证。研究结果表明:该模型能有效满足实际配置需求,可优化海上应急资源调度计划。 展开更多
关键词 海上应急物流 应急资源调度 层次分析法 加权k-means聚类算法
下载PDF
基于密度聚类算法的电力通信监测分析 被引量:6
11
作者 张明明 刘文盼 +1 位作者 宋浒 夏飞 《自动化仪表》 CAS 2022年第11期73-78,共6页
为解决传统基于密度的噪声应用空间聚类(DBSCAN)算法对输入参数设置敏感,以及传统的边缘计算框架计算成本高、计算时间过长等问题,创新性地提出了一种单遍权重K-means(SPWK)聚类算法。构建了电力通信网络故障及入侵监测模型,并将深度强... 为解决传统基于密度的噪声应用空间聚类(DBSCAN)算法对输入参数设置敏感,以及传统的边缘计算框架计算成本高、计算时间过长等问题,创新性地提出了一种单遍权重K-means(SPWK)聚类算法。构建了电力通信网络故障及入侵监测模型,并将深度强化学习技术与边缘计算相结合,以降低计算成本和计算时长。仿真试验结果表明:SPWK聚类算法的迭代次数更少,平均执行时间以及总聚类时间分别低于其他算法67.5%、37.5%,加速比高出76.4%以上,聚类效率更高;边缘计算优化方法的服务器占用时间以及计算等待时间分别低于其他算法70.4%以上和79.2%以上,性能更优;电力通信监测模型对异常数据的平均识别准确率高出其他算法23.86%以上,入侵检测率高出其他算法4.8%以上,误报率降低65.4%以上,具备优异的检测性能。综上所述,所提故障及入侵监测模型以及边缘计算优化方法的性能均优于其他流行方法,适合在电力通信监测研究中推广使用。 展开更多
关键词 基于密度的噪声应用空间聚类算法 单遍权重k-means聚类算法 边缘计算 电力通信监测 故障检测 入侵检测
下载PDF
基于加权K-means聚类算法的机动通信网络自动划分方法 被引量:2
12
作者 王均春 冀云刚 《计算机与网络》 2022年第2期56-59,共4页
针对机动通信网络规划中的网络划分需求,提出了一种基于加权K-means聚类算法的网络自动划分方法。算法通过采用Elbow方法确定聚类数量,并在初始聚类中心选择中考虑了节点连通度,克服了传统K-means算法初始聚类中心的不确定性,通过对不... 针对机动通信网络规划中的网络划分需求,提出了一种基于加权K-means聚类算法的网络自动划分方法。算法通过采用Elbow方法确定聚类数量,并在初始聚类中心选择中考虑了节点连通度,克服了传统K-means算法初始聚类中心的不确定性,通过对不同特征分配相应权重,进一步提升了聚类效果。实验结果说明该算法在机动通信网络自动划分中具有良好的准确率,为后续网络规划提供了基础支撑。 展开更多
关键词 网络划分 加权k-means 网络规划 节点联通度
下载PDF
基于W-Kmeans算法的DNS流量异常检测 被引量:5
13
作者 林成虎 李晓东 +2 位作者 金键 尉迟学彪 吴军 《计算机工程与设计》 CSCD 北大核心 2013年第6期2104-2108,共5页
为了对DNS查询进行有效检测,及时发现DNS流量异常,提出了适合于检测DNS流量异常的权重Kmeans(W-Kmeans)算法。对CN顶级域2009年5月19日的原始查询日志抽取有用信息,提取相关的向量特征,对不同的向量特征赋予不同的权重值。利用W-Kmeans... 为了对DNS查询进行有效检测,及时发现DNS流量异常,提出了适合于检测DNS流量异常的权重Kmeans(W-Kmeans)算法。对CN顶级域2009年5月19日的原始查询日志抽取有用信息,提取相关的向量特征,对不同的向量特征赋予不同的权重值。利用W-Kmeans算法对查询日志进行聚类检测,并分析了算法各种参数选择的影响。5.19事件的DNS查询检测结果表明,W-Kmeans算法可以有效检测DNS流量异常的发生。 展开更多
关键词 域名系统 权重k均值 聚类检测 异常检测 流量异常检测
下载PDF
基于加权K均值聚类的多属性初至拾取方法 被引量:4
14
作者 周竹生 曾维祖 +1 位作者 刘思琴 陈文样 《地震学报》 CSCD 北大核心 2020年第2期177-186,I0001,共11页
为提高初至拾取方法的准确性和自适应能力,将变异系数加权K均值聚类算法引入初至拾取中。首先提取均方根振幅、相邻道相关性、线积分、振幅谱主频等多种地震属性;然后针对地震属性进行加权K均值聚类,自动识别初至所在时窗;最后结合相位... 为提高初至拾取方法的准确性和自适应能力,将变异系数加权K均值聚类算法引入初至拾取中。首先提取均方根振幅、相邻道相关性、线积分、振幅谱主频等多种地震属性;然后针对地震属性进行加权K均值聚类,自动识别初至所在时窗;最后结合相位校正法,实现时窗内初至波起跳时间的拾取。在此基础上通过实际数据测试,并与长短时窗能量比法、反向传播神经网络方法对比,验证了本文方法的有效性与可行性。结果表明,基于加权K均值聚类的多属性初至拾取方法能较快速、准确地拾取低信噪比数据的初至,并且无需人为判断时窗,从而提高了拾取的自适应能力。 展开更多
关键词 地震属性 加权k均值聚类 初至拾取 初至波
下载PDF
大规模数据集的多层聚类算法 被引量:1
15
作者 金慧珍 赵辽英 《杭州电子科技大学学报(自然科学版)》 2008年第3期27-30,共4页
针对大多谱聚类算法由于计算复杂度高而不适于大规模数据的问题,提出了一种能处理大规模数据集的多层算法。该算法把海量数据根据一定的相关性逐级分组成小数据集,再对分组后的小数据集用谱聚类算法进行聚类,最后利用权核K均值聚类逐级... 针对大多谱聚类算法由于计算复杂度高而不适于大规模数据的问题,提出了一种能处理大规模数据集的多层算法。该算法把海量数据根据一定的相关性逐级分组成小数据集,再对分组后的小数据集用谱聚类算法进行聚类,最后利用权核K均值聚类逐级微调,完成全部数据的聚类。通过对UCI数据库中的数据集和图像分割的仿真实验,结果表明该算法的聚类效果很好。 展开更多
关键词 谱聚类 聚类 图像分割
下载PDF
基于μPMU的智能配电网预想故障集组合筛选方法 被引量:2
16
作者 符杨 司马超 +3 位作者 田书欣 蔡鹏程 顾吉平 刘舒 《电气传动》 2023年第1期59-65,73,共8页
智能配电网预想故障集筛选是系统安全态势评估的重要基础。为了全面精准感知智能配电网的安全风险,引入具有实时性、同步性、准确性和量测数据全面性的微型同步相量测量单元(μPMU),提出一种基于其高密集采样数据的融合类内与类间距离... 智能配电网预想故障集筛选是系统安全态势评估的重要基础。为了全面精准感知智能配电网的安全风险,引入具有实时性、同步性、准确性和量测数据全面性的微型同步相量测量单元(μPMU),提出一种基于其高密集采样数据的融合类内与类间距离的加权K-means聚类方法(KICIC)和云理论的预想故障集组合筛选排序方法。首先遍历智能配电网各节点发生各故障类型的场景构建故障数据集;然后采用KICIC算法进行故障数据集聚类分析,进而基于云模型的云数字特征客观量化评估故障类严重度不确定性的危害并输出预想故障集;最后算例结果表明:融合KICIC聚类和云模型的预想故障集组合筛选排序方法从数据挖掘层面实现高风险预想故障集的可靠筛选。 展开更多
关键词 智能配电网 预想故障集组合筛选 融合类内与类间距离的加权k-means聚类方法(kICIC) 云理论 微型同步相量测量单元(μPMU)
下载PDF
搜索日志中命名实体识别
17
作者 任育伟 吕学强 +1 位作者 李卓 徐丽萍 《现代图书情报技术》 CSSCI 2015年第6期49-56,共8页
【目的】搜索日志中命名实体识别对于优化搜索意图,提高搜索引擎服务质量存在重要意义。【方法】利用种子命名实体和模板匹配原则抽取候选命名实体并聚类,聚类后进行候选命名实体识别特征抽取,包括频次、不同模板数、模板权重特征。融... 【目的】搜索日志中命名实体识别对于优化搜索意图,提高搜索引擎服务质量存在重要意义。【方法】利用种子命名实体和模板匹配原则抽取候选命名实体并聚类,聚类后进行候选命名实体识别特征抽取,包括频次、不同模板数、模板权重特征。融合这些特征构造命名实体识别权重计算公式,并合理调整特征影响参数。【结果】对根据权重提取的命名实体进行标注和统计,发现P@500值平均达到75%左右,比Pa@ca方法高出7%。【局限】对模板敏感性弱的命名实体不能精确抽取。【结论】通过计算该方法抽取结果指标P@N值,并和其他方法抽取结果指标进行比较,证明该方法的有效性。 展开更多
关键词 搜索日志 模板权重类 k-means聚类 特征权重 种子命名实体
原文传递
基于熵加权子空间算法的旅游数据聚类分析
18
作者 陈丹 褚宏伟 +1 位作者 吴雅琴 胡俊 《旅游研究》 2021年第5期18-31,共14页
大数据背景下,高维旅游数据的急剧增长使得传统聚类算法效果欠佳,而熵加权子空间算法可有效地实现高维数据聚类,获取特征对不同类的影响,从而提升聚类效果。文章通过爬取同程网上的部分云南游记数据,获取有关云南旅游的游记信息;借助中... 大数据背景下,高维旅游数据的急剧增长使得传统聚类算法效果欠佳,而熵加权子空间算法可有效地实现高维数据聚类,获取特征对不同类的影响,从而提升聚类效果。文章通过爬取同程网上的部分云南游记数据,获取有关云南旅游的游记信息;借助中文分词、关键词提取、词性识别等自然语言处理技术,并结合百度地图API游记信息,构建所需旅游数据矩阵;基于用户—关键词矩阵,采用熵加权子空间算法对旅游景点和作者进行聚类;综合考虑邓恩指数和轮廓系数两个内部指标,对聚类结果进行评价。评价结果表明:采用熵加权子空间算法对云南游记数据聚类时,其集簇个数为3的效果最好。 展开更多
关键词 熵加权子空间算法 旅游数据 子空间聚类 数据挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部