期刊文献+
共找到1,733篇文章
< 1 2 87 >
每页显示 20 50 100
新的K-均值算法最佳聚类数确定方法 被引量:90
1
作者 周世兵 徐振源 唐旭清 《计算机工程与应用》 CSCD 北大核心 2010年第16期27-31,共5页
K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,... K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。 展开更多
关键词 k-均值 有效性指标 初始中心
下载PDF
基于Logistic模型的中国各省碳排放预测 被引量:73
2
作者 杜强 陈乔 杨锐 《长江流域资源与环境》 CAS CSSCI CSCD 北大核心 2013年第2期143-151,共9页
在"碳排放量与能源消费成正比"假设的基础上,对中国30个省区2011~2020年碳排放进行了预测。首先对中国30个省区1987~2010年的历史累计排放量和人均累计排放量进行计算,依据历史累计排放量和人均累计排放量两个指标,运用K-... 在"碳排放量与能源消费成正比"假设的基础上,对中国30个省区2011~2020年碳排放进行了预测。首先对中国30个省区1987~2010年的历史累计排放量和人均累计排放量进行计算,依据历史累计排放量和人均累计排放量两个指标,运用K-均值聚类分析法将中国各省区碳排放分成了5类。分别绘出5类区域中各省的历年碳排放量曲线,并进行数据分析,发现:以2002年为界线,2002年前后两个时段中国各省区碳排放变化差异很大。这一现象说明2002年以前的各省碳排放趋势并不能表征未来年份各省的碳排放。在此结论的基础上,构建了碳排放量增长的Logistic预测模型,并以2002~2010年碳排放数据为样本数据,对2011~2020年中国各省区碳排放进行了预测。为了验证预测模型的精确性,利用Logistic预测模型对中国30个省区2002~2010年的碳排放进行了预测,并将预测值与实际排放值进行比较发现,除了宁夏自治区的误差达14.58%外,其他地区的误差均在7%以下。除宁夏外的中国各省区预测误差的平均值为6.22%,由此验证了Logistic预测模型的精确性。同时,也说明对中国30个省区2011~2020年碳排放的预测值具有较高的可信性。本研究为中国各省未来碳排放政策的制定提供了方法与数据支持。 展开更多
关键词 LOGISTIC模型 中国各省 碳排放 预测 k-均值
原文传递
学习特征权值对K-均值聚类算法的优化 被引量:48
3
作者 王熙照 王亚东 +1 位作者 湛燕 袁方 《计算机研究与发展》 EI CSCD 北大核心 2003年第6期869-873,共5页
K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这... K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这些权值优化聚类效果 由于K 均值算法是迭代算法 ,很难直接确定其权值以优化聚类结果 ,因此提出了一种间接的学习权值算法以改进聚类结果 从数学意义上讲 ,这种权值学习相当于欧氏空间中对一组点进行了一个线性变换 展开更多
关键词 k-均值 相似度量 特征权值 梯度下降技术
下载PDF
一种改进的k-均值聚类算法 被引量:41
4
作者 徐义峰 陈春明 徐云青 《计算机应用与软件》 CSCD 北大核心 2008年第3期275-277,共3页
针对k-均值(k-means)聚类算法中随机选取初始聚类中心的缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的方法。实验结果表明,改进后的算法能改善其聚类性能,并能取得较高的分类准确率。
关键词 k-均值 中心 数据分布
下载PDF
基于样本空间分布密度的初始聚类中心优化K-均值算法 被引量:53
5
作者 谢娟英 郭文娟 +1 位作者 谢维信 高新波 《计算机应用研究》 CSCD 北大核心 2012年第3期888-892,共5页
针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定... 针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。 展开更多
关键词 k-均值 初始中心 邻域 样本分布密度
下载PDF
基于告警信号文本挖掘的电力调度故障诊断 被引量:52
6
作者 汪崔洋 江全元 +3 位作者 唐雅洁 朱炳铨 项中明 唐剑 《电力自动化设备》 EI CSCD 北大核心 2019年第4期126-132,共7页
电力调度系统在电力系统故障过程中会收到大量告警信号,若调度员无法在短时间内做出决策,则可能使故障扩大,为此提出基于告警信号文本挖掘的电力调度故障诊断方法,该方法包括告警信号文本预处理和故障诊断2个阶段。在第一阶段,基于隐马... 电力调度系统在电力系统故障过程中会收到大量告警信号,若调度员无法在短时间内做出决策,则可能使故障扩大,为此提出基于告警信号文本挖掘的电力调度故障诊断方法,该方法包括告警信号文本预处理和故障诊断2个阶段。在第一阶段,基于隐马尔可夫模型(HMM)对告警信号文本进行分词并去除其中的停用词以构建本体词典,并采用向量空间模型(VSM)使文本向量化;在第二阶段,使用滑动时间窗读取实时告警信号,提出一种2层算法,第一层采用支持向量机(SVM)对滑窗内的告警信号进行分类,若分类结果判断为发生故障,则启动第二层k-均值聚类法提取较高可能性的故障供调度员参考。以某电力调度系统实际告警信号作为算例,验证了所提方法的可行性。 展开更多
关键词 电力调度 文本挖掘 向量空间模型 支持向量机 k-均值
下载PDF
基于K-均值聚类多场景时序特性分析的分布式电源多目标规划 被引量:52
7
作者 彭春华 于蓉 孙惠娟 《电力自动化设备》 EI CSCD 北大核心 2015年第10期58-65,共8页
若不考虑分布式电源出力及负荷需求的波动性及不确定性,可能导致分布式电源规划容量偏大或系统电压改善程度降低。深入分析分布式电源出力时序波动特性,并引入K-均值聚类多场景概率分析方法,以降低上述波动性及不确定性对配电网的影响;... 若不考虑分布式电源出力及负荷需求的波动性及不确定性,可能导致分布式电源规划容量偏大或系统电压改善程度降低。深入分析分布式电源出力时序波动特性,并引入K-均值聚类多场景概率分析方法,以降低上述波动性及不确定性对配电网的影响;以最大化年寿命周期收益率和电压分布改善率作为目标函数,建立分布式电源多目标规划模型,并采用多目标复合微分进化算法对其求解和基于最短归一化距离法实现多目标总体最优解决策。以IEEE33节点配电系统为例进行分布式电源多目标规划,验证了所提方法的有效性和优越性。 展开更多
关键词 分布式电源 规划 时序特性 多场景概率 k-均值 多目标决策
下载PDF
基于K-均值聚类算法的行驶工况构建方法 被引量:45
8
作者 秦大同 詹森 +1 位作者 漆正刚 陈淑江 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2016年第2期383-389,共7页
提出一种基于K-均值聚类算法的城市循环工况构建方法,该方法通过实车采集某城市道路行驶工况的数据,将工况数据预处理后划分为工况块,运用平均速度、行驶距离和巡航时间比3个参数对工况块进行K-均值聚类分析,采用距离聚类中心越近越能... 提出一种基于K-均值聚类算法的城市循环工况构建方法,该方法通过实车采集某城市道路行驶工况的数据,将工况数据预处理后划分为工况块,运用平均速度、行驶距离和巡航时间比3个参数对工况块进行K-均值聚类分析,采用距离聚类中心越近越能代表簇特征的原则选取工况块,最终拟合出某城市循环工况,并对其从特征参数、转毂实验和废气分析采集的油耗和排放数据3个方面与其他典型城市循环工况进行了对比。对比分析结果表明:采用本方法构建的城市循环工况能够很好地反映某地实际交通道路状况,具有实用价值。 展开更多
关键词 车辆工况 行驶工况 k-均值 燃油消耗量 污染物排放
下载PDF
基于机器视觉的小麦害虫分割算法研究 被引量:28
9
作者 陈月华 胡晓光 张长利 《农业工程学报》 EI CAS CSCD 北大核心 2007年第12期187-191,共5页
农业病虫害的自动识别是精准农业研究方向之一。以小麦蚜虫为例,运用机器视觉技术对非特定场景下害虫的分类和分割算法进行了研究。在分类上,训练了SVM分类器和基于k-均值聚类的分类方法。比较得出,SVM分类器和k-均值聚类算法在处理精... 农业病虫害的自动识别是精准农业研究方向之一。以小麦蚜虫为例,运用机器视觉技术对非特定场景下害虫的分类和分割算法进行了研究。在分类上,训练了SVM分类器和基于k-均值聚类的分类方法。比较得出,SVM分类器和k-均值聚类算法在处理精度和速度上各有优势;在分割上,运用合并和分裂相结合的区域生长算法分割害虫和叶片,进行自动识别。分析表明,该算法对害虫的分类效果好、分割识别准确率达到90.7%,速度能够满足实时处理的要求,为农业机械精准施药提供了技术上的支持。 展开更多
关键词 机器视觉 图像分割 支持向量机 k-均值 区域生长
下载PDF
基于平均差异度优选初始聚类中心的改进K-均值聚类算法 被引量:30
10
作者 李武 赵娇燕 严太山 《控制与决策》 EI CSCD 北大核心 2017年第4期759-762,共4页
针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已... 针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已选聚类中心的差异度大于样本集总体平均差异度的样本作为初始聚类中心.实验表明,改进后的算法不仅提高了聚类结果的稳定性和正确率,而且迭代次数明显减少,收敛速度快. 展开更多
关键词 k-均值 初始中心 样本差异度
原文传递
基于改进K-均值聚类的图像分割算法研究 被引量:25
11
作者 李翠 冯冬青 《郑州大学学报(理学版)》 CAS 北大核心 2011年第1期109-113,共5页
为了实现彩色图像的准确分割,研究了在HLS颜色空间中基于优化初始中心的加权K-均值彩色图像聚类算法.首先对大样本的目标颜色进行数理统计,获取优化的初始聚类中心,从而实现准确分类和避免K-均值容易陷入局部最优的问题;然后在HLS颜色... 为了实现彩色图像的准确分割,研究了在HLS颜色空间中基于优化初始中心的加权K-均值彩色图像聚类算法.首先对大样本的目标颜色进行数理统计,获取优化的初始聚类中心,从而实现准确分类和避免K-均值容易陷入局部最优的问题;然后在HLS颜色空间中引入加权欧氏距离来度量对象间的相关性,通过调整系数使对象不同的颜色属性内在特征得以充分利用.实验证明,该算法在保持K-均值聚类简洁、收敛速度快的同时能产生更好的聚类效果,实现彩色图像的快速准确分割. 展开更多
关键词 k-均值 加权欧氏距离 初始中心 HLS颜色空间
下载PDF
稀疏表示与病态混叠盲分离 被引量:26
12
作者 何昭水 谢胜利 傅予力 《中国科学(E辑)》 CSCD 北大核心 2006年第8期864-879,共16页
Bofill(2001)等人首次针对两个传感器的稀疏信号盲分离问题进行了讨论.但也正如Bofill自己所指出的那样,此方法存在局限性,特别是其中的势函数的参数选择缺乏理论指导,而且此方法不宜推广到具有三个或更多的传感器的情形.因此这里回避Bo... Bofill(2001)等人首次针对两个传感器的稀疏信号盲分离问题进行了讨论.但也正如Bofill自己所指出的那样,此方法存在局限性,特别是其中的势函数的参数选择缺乏理论指导,而且此方法不宜推广到具有三个或更多的传感器的情形.因此这里回避Bofill势函数方法,建立了K-PCA方法(即K-聚类与主成分分析PCA相结合的方法).新方法克服了Bofill方法参数选择的困难,可以方便地应用于三个及其以上传感器的情况,而且具有实现简单、混叠矩阵估计精度高的特点.另外,为了检验混叠矩阵A的估计是否一定有效,给出了相应的判别准则.仿真结果表明了该方法的可行性和准确性. 展开更多
关键词 病态混叠 盲分离 稀疏表示 主成分分析 k-均值
原文传递
储层品质因子RQI结合聚类算法进行储层分类评价研究 被引量:27
13
作者 张程恩 潘保芝 刘倩茹 《国外测井技术》 2012年第4期11-13,3,共3页
利用储层品质因子RQI进行分类评价时不同储层界限值通常难以确定,利用K-均值聚类很好的解决了这一问题,RQI累计曲线也证实了分类界限划分的准确性。针对研究区实际储层资料,分类符合率高达96%,表明了分类的有效性,在实际生产中取得了很... 利用储层品质因子RQI进行分类评价时不同储层界限值通常难以确定,利用K-均值聚类很好的解决了这一问题,RQI累计曲线也证实了分类界限划分的准确性。针对研究区实际储层资料,分类符合率高达96%,表明了分类的有效性,在实际生产中取得了很好的应用效果。 展开更多
关键词 储层品质因子 k-均值 模糊 储层分
下载PDF
基于改进k-均值聚类的负荷概率模型 被引量:25
14
作者 陈凡 刘海涛 +1 位作者 黄正 张雪娇 《电力系统保护与控制》 EI CSCD 北大核心 2013年第22期128-133,共6页
提出采用改进的k-均值聚类方法对电力系统小时负荷进行聚类,避免了传统k-均值聚类存在的聚类中心初始值难以确定、聚类结果不稳定的问题。在建立聚类负荷模型的基础上,进一步建立了考虑负荷不确定性和相关性的负荷概率模型。RBTS和IEEE ... 提出采用改进的k-均值聚类方法对电力系统小时负荷进行聚类,避免了传统k-均值聚类存在的聚类中心初始值难以确定、聚类结果不稳定的问题。在建立聚类负荷模型的基础上,进一步建立了考虑负荷不确定性和相关性的负荷概率模型。RBTS和IEEE RTS79算例分析结果表明,采用所建立的聚类负荷模型时的发电系统可靠性计算结果精度高,节省了状态抽样法的计算时间;负荷不确定性和相关性对发电系统可靠性有较大影响。所建立的负荷概率模型为采用解析法和状态抽样法进行发电和发输电系统可靠性评估提供了基础。 展开更多
关键词 k-均值 层次 负荷模型 不确定性 相关性
下载PDF
基于聚类预分割和高低精度距离重构的彩色浮选泡沫图像分割 被引量:25
15
作者 阳春华 杨尽英 +2 位作者 牟学民 周开军 桂卫华 《电子与信息学报》 EI CSCD 北大核心 2008年第6期1286-1290,共5页
该文针对矿物浮选过程泡沫图像质量不理想、气泡大小形状灰度不均的问题,提出一种基于聚类预分割和高低精度距离重构的泡沫图像分割方法。首先,利用k-均值聚类进行前景泡沫与背景矿浆彩色图像分割,依据灰度分布和形状分布特征对提取到... 该文针对矿物浮选过程泡沫图像质量不理想、气泡大小形状灰度不均的问题,提出一种基于聚类预分割和高低精度距离重构的泡沫图像分割方法。首先,利用k-均值聚类进行前景泡沫与背景矿浆彩色图像分割,依据灰度分布和形状分布特征对提取到的泡沫图像进行滤波;然后,基于形态重构提出结合高低精度距离变换对距离图像进行重构,同时利用面积重构h顶改进变换为分水岭变换提取准确的特征标识;最后利用分水岭算法得到分水线,从而完成浮选泡沫的分割。由分割后的泡沫图像可统计分析出气泡个数与尺寸等物理特征参数从而为浮选控制提供依据。仿真结果表明了方法的有效性。 展开更多
关键词 泡沫图像 k-均值 面积重构 距离变换 分水岭变换
下载PDF
基于聚类和支持向量机的非线性时间序列故障预报 被引量:22
16
作者 张军峰 胡寿松 《控制理论与应用》 EI CAS CSCD 北大核心 2007年第1期64-68,共5页
针对非线性时间序列故障预报问题,提出了一种基于聚类和支持向量机的方法.将正常的时间序列按照K-均值聚类算法进行聚类学习,同时利用支持向量机回归的时间序列预测算法获得预测序列,然后通过比较聚类所得的正常原型和预测序列的相似... 针对非线性时间序列故障预报问题,提出了一种基于聚类和支持向量机的方法.将正常的时间序列按照K-均值聚类算法进行聚类学习,同时利用支持向量机回归的时间序列预测算法获得预测序列,然后通过比较聚类所得的正常原型和预测序列的相似性实现故障预报.仿真结果表明:本文提出的方法更能满足实时性的要求,也更为准确. 展开更多
关键词 故障预报 k-均值 支持向量回归 时间序列预测
下载PDF
MapReduce框架下支持差分隐私保护的k-means聚类方法 被引量:24
17
作者 李洪成 吴晓平 陈燕 《通信学报》 EI CSCD 北大核心 2016年第2期124-130,共7页
针对传统隐私保护方法无法应对任意背景知识下恶意分析的问题,提出了分布式环境下满足差分隐私的k-means算法。该算法利用Map Reduce计算框架,由主任务控制k-means迭代执行;指派Mapper分任务独立并行计算各数据片中每条记录与聚类中心... 针对传统隐私保护方法无法应对任意背景知识下恶意分析的问题,提出了分布式环境下满足差分隐私的k-means算法。该算法利用Map Reduce计算框架,由主任务控制k-means迭代执行;指派Mapper分任务独立并行计算各数据片中每条记录与聚类中心的距离并标记其属于的聚类;指派Reducer分任务计算同一聚类中的记录数量num和属性向量之和sum,并利用Laplace机制产生的噪声扰动num和sum,进而实现隐私保护。根据差分隐私的组合特性,从理论角度证明整个算法满足ε-差分隐私保护。实验结果证明了该方法在提高隐私性和时效性的情况下,保证了较好的可用性。 展开更多
关键词 数据挖掘 k-均值 MAP REDUCE 差分隐私保护 Laplace机制
下载PDF
基于双次Otsu算法的野外荔枝多类色彩目标快速识别 被引量:23
18
作者 彭红星 邹湘军 +3 位作者 陈丽娟 熊俊涛 陈科尹 林桂潮 《农业机械学报》 EI CAS CSCD 北大核心 2014年第4期61-68,75,共9页
针对目前野外环境下多类目标识别速度偏慢,导致机器人视觉定位精度低和工作效率不高的难题,以野外环境下成熟荔枝的多类色彩目标识别为例,提出了一种双次Otsu分割算法对多类色彩目标进行识别。首先为了提高算法的效率,改进了传统的Otsu... 针对目前野外环境下多类目标识别速度偏慢,导致机器人视觉定位精度低和工作效率不高的难题,以野外环境下成熟荔枝的多类色彩目标识别为例,提出了一种双次Otsu分割算法对多类色彩目标进行识别。首先为了提高算法的效率,改进了传统的Otsu算式;然后对目标色彩图像的背景、果梗、果实分别用改进的Otsu算法进行粗分割和细分割。最后通过与K-均值聚类(K-means)算法、模糊C均值聚类(FCM)算法、Otsu和K-means结合算法、Otsu和FCM结合算法这4种算法进行对比,双次Otsu算法从分割质量及其正确分割率、运行时间、稳定性3方面都优于其他4种算法。实验结果表明,双次Otsu算法对色彩目标的成熟荔枝识别的时间少于0.2 s。 展开更多
关键词 荔枝 双次Otsu分割算法 多目标 k-均值 模糊C均值
下载PDF
基于颜色特征的玉米种子纯度识别 被引量:21
19
作者 闫小梅 刘双喜 +1 位作者 张春庆 王金星 《农业工程学报》 EI CAS CSCD 北大核心 2010年第S1期46-50,共5页
为准确快速的识别出玉米种子中的杂粒,提高玉米种的纯度,该文提出一种以玉米种子冠部与侧面颜色作为特征向量进行纯度识别的新方法。该方法首先将玉米种子原始图像进行背景分割、单粒提取,然后进行冠部核心区域及侧面RGB、HSV颜色特征... 为准确快速的识别出玉米种子中的杂粒,提高玉米种的纯度,该文提出一种以玉米种子冠部与侧面颜色作为特征向量进行纯度识别的新方法。该方法首先将玉米种子原始图像进行背景分割、单粒提取,然后进行冠部核心区域及侧面RGB、HSV颜色特征向量的提取,最后采用Fisher判别理论将多维特征向量投影到一维空间中,进行K-均值聚类分析。试验结果证明:利用Fisher判别理论在一维空间上进行K-均值聚类分析,玉米种子纯度的识别率高于93.75%。影响玉米种子正确识别率的主要因素是投影方向的选择及正确的冠部核心区域的提取。 展开更多
关键词 种子 颜色 识别 Fisher判别理论 k-均值
下载PDF
K-均值聚类中心分析法实现红外人体目标分割 被引量:20
20
作者 云廷进 郭永彩 高潮 《光电工程》 EI CAS CSCD 北大核心 2008年第3期140-144,共5页
针对由于不同红外成像设备参数差异以及目标周围环境影响而造成的红外目标分割阈值自动选取算法的鲁棒性差这一问题,本文从红外成像的机理出发,提出了一个新的解决方案并加以实现。首先对图像的直方图采用K-均值聚类,然后通过对聚类中... 针对由于不同红外成像设备参数差异以及目标周围环境影响而造成的红外目标分割阈值自动选取算法的鲁棒性差这一问题,本文从红外成像的机理出发,提出了一个新的解决方案并加以实现。首先对图像的直方图采用K-均值聚类,然后通过对聚类中心分布特点的分析,确定图像分割的阈值。该方法不需要事先对图像进行均衡和对背景分布进行假设。实验结果表明,算法具有良好的鲁棒性。 展开更多
关键词 k-均值 红外图像分割 阈值选取 人体检测
下载PDF
上一页 1 2 87 下一页 到第
使用帮助 返回顶部