期刊文献+
共找到87篇文章
< 1 2 5 >
每页显示 20 50 100
基于最大信息系数和近似马尔科夫毯的特征选择方法 被引量:49
1
作者 孙广路 宋智超 +2 位作者 刘金来 朱素霞 何勇军 《自动化学报》 EI CSCD 北大核心 2017年第5期795-805,共11页
最大信息系数(Maximum information coefficient,MIC)可以对变量间的线性和非线性关系,以及非函数依赖关系进行有效度量.本文首先根据最大信息系数理论,提出了一种评价各维特征间以及每维特征与类别间相关性的度量标准,然后提出了基于... 最大信息系数(Maximum information coefficient,MIC)可以对变量间的线性和非线性关系,以及非函数依赖关系进行有效度量.本文首先根据最大信息系数理论,提出了一种评价各维特征间以及每维特征与类别间相关性的度量标准,然后提出了基于新度量标准的近似马尔科夫毯特征选择方法,删除冗余特征.在此基础上提出了基于特征排序和近似马尔科夫毯的两阶段特征选择方法,分别对特征的相关性和冗余性进行分析,选择有效的特征子集.在UCI和ASU上的多个公开数据集上的对比实验表明,本文提出的方法总体优于快速相关滤波(Fast correlation-based filter,FCBF)方法,与Relief F,FAST,Lasso和RFS方法相比也具有优势. 展开更多
关键词 特征选择 最大信息系数 近似马尔科夫毯 特征相关性 特征冗余性
下载PDF
数据驱动与预测误差驱动融合的短期负荷预测输入变量选择方法研究 被引量:39
2
作者 郑睿程 顾洁 +2 位作者 金之俭 彭虹桥 蔡珑 《中国电机工程学报》 EI CSCD 北大核心 2020年第2期487-500,共14页
短期负荷预测是电力系统安全经济运行的基础。由于负荷变化受众多因素影响,选择合适的变量集对于提高预测性能至关重要。针对数据驱动型与预测误差驱动型变量选择方法各自的特点,以及传统变量选择方法在相关性度量指标与选择策略上存在... 短期负荷预测是电力系统安全经济运行的基础。由于负荷变化受众多因素影响,选择合适的变量集对于提高预测性能至关重要。针对数据驱动型与预测误差驱动型变量选择方法各自的特点,以及传统变量选择方法在相关性度量指标与选择策略上存在的问题,该文提出基于正交化最大信息系数、特征协同与随机森林的变量选择方法。该方法将数据驱动与预测误差驱动进行两阶段融合,前者作为变量预筛选阶段,后者完成变量精选,实现选择质量与计算复杂度的平衡;选择过程中综合考虑变量间的相关度、冗余度与协同度,能有效提高短期负荷预测的性能;通过算例从选择的变量集、预测误差大小、预测误差稳定性等方面验证该方法相对于传统短期负荷预测变量选择方法的优势。 展开更多
关键词 短期负荷预测 变量选择 数据驱动 预测误差驱动 最大信息系数
下载PDF
基于特征气体关联特征的变压器故障诊断方法 被引量:33
3
作者 梁永亮 郭汉琮 薛永端 《高电压技术》 EI CAS CSCD 北大核心 2019年第2期386-392,共7页
现有的基于油中溶解气体分析(dissolved gases analysis, DGA)的变压器故障诊断方法未能充分挖掘不同故障下特征气体间的关联特征。基于此,论文提出一种基于故障特征气体间关联特征的变压器故障诊断方法。利用最大信息系数(maximal info... 现有的基于油中溶解气体分析(dissolved gases analysis, DGA)的变压器故障诊断方法未能充分挖掘不同故障下特征气体间的关联特征。基于此,论文提出一种基于故障特征气体间关联特征的变压器故障诊断方法。利用最大信息系数(maximal information coefficient, MIC)方法定量表征不同故障类型下特征气体间的关联程度,并使用受试者工作特征(receiveroperatingcharacteristic,ROC)曲线获得不同故障类型下特征气体间的关联特征量及其分布范围,进而建立变压器故障诊断模糊推理系统;针对实际使用中数据采集周期较长的问题,对比选取了牛顿插值方法扩大待识别样本数据,保证了提取特征的有效性。针对选取的故障时序数据,论文所提方法的故障诊断准确率达到了100%,远高于三比值法和大卫三角法,说明论文所提方法充分地利用了故障特征气体间的关联特征,有效地提升了基于DGA的变压器故障诊断方法的性能,为基于DGA的变压器故障诊断提供了一种新的特征。 展开更多
关键词 DGA 变压器 故障诊断 最大信息系数 ROC曲线 模糊推理系统 牛顿插值法
下载PDF
基于UTCI-MIC与振幅压缩灰色模型的用户侧微电网短期负荷预测方法 被引量:24
4
作者 薛阳 张宁 +2 位作者 吴海东 俞志程 李蕊 《电网技术》 EI CSCD 北大核心 2020年第2期556-563,共8页
短期负荷预测是保障用户侧微电网经济、安全运行的基础。现有研究表明,综合考虑气象、地理等影响因素的负荷预测模型在一定程度上提升了预测准确率。但在具有明显城市特征的用户侧微电网负荷预测中存在局限性,其预测结果呈现显著偏差,... 短期负荷预测是保障用户侧微电网经济、安全运行的基础。现有研究表明,综合考虑气象、地理等影响因素的负荷预测模型在一定程度上提升了预测准确率。但在具有明显城市特征的用户侧微电网负荷预测中存在局限性,其预测结果呈现显著偏差,使得基于该结果的潮流计算偏离实际情况,危及系统的安全运行。针对此问题,提出了一种新型热气候指数–最大信息系数(universal thermal climate indexmaximal information coefficient,UTCI-MIC)与振幅压缩灰色模型的用户侧微电网短期负荷预测方法。首先,该模型采用经验模态分解将用电负荷分解为波动负荷和趋势负荷曲线;其次,建立了考虑相似日的MIC矩阵与涵盖多时刻气象、地理区位、城市特征因素的UTCI热环境评估方法,用于波动负荷预测;最后,将基于振幅压缩灰色模型获得的趋势预测结果与波动预测结果重构,得到用电负荷预测结果。案例验证表明,所提方法可有效预测城市特征明显的用户侧负荷变动情况,其预测准确率可达96.91%以上,为城市电网的能量管理系统和电力市场交易提供重要参考。 展开更多
关键词 短期负荷预测 用户侧微电网 通用热气候指数 最大信息系数 经验模态分解 振幅压缩 灰色模型
下载PDF
用于短期电力负荷预测的日负荷特性分类及特征集重构策略 被引量:23
5
作者 徐先峰 赵依 +2 位作者 刘状壮 李陇杰 卢勇 《电网技术》 EI CSCD 北大核心 2022年第4期1548-1556,共9页
准确的负荷预测是电力系统安全稳定运行的重要保障。当充分考虑多因素影响,海量输入数据的前端预处理与变量遴选对提高负荷预测精度至关重要。针对传统时间变量信息模糊、维数冗余问题,引入基于余弦相似度的k-means聚类分析技术实现日... 准确的负荷预测是电力系统安全稳定运行的重要保障。当充分考虑多因素影响,海量输入数据的前端预处理与变量遴选对提高负荷预测精度至关重要。针对传统时间变量信息模糊、维数冗余问题,引入基于余弦相似度的k-means聚类分析技术实现日负荷特性分类,并通过分类标签替代传统时间变量;考虑到负荷与多因素在小时粒度下的耦合关系,提出了基于特征集重构和最大信息系数的特征筛选策略,实现小时粒度的精细化特征筛选;最后引入了具备强大信息挖掘能力的时间卷积网络,实现高精度短期电力负荷预测。实验结果表明,应用提出的上述2个改进策略后,替换低效时间变量和小时粒度的最优特征集使输入数据质量进一步优化,显著提升了多个经典模型的预测性能,而结合改进策略的时间卷积网络模型具有更高的预测精度;且文章方法适用于全年各时段的预测,具备良好的可移植性和鲁棒性。 展开更多
关键词 短期电力负荷预测 时间卷积网络 聚类分析 特征筛选 最大信息系数
下载PDF
基于最大信息系数和多目标Stacking集成学习的综合能源系统多元负荷预测 被引量:20
6
作者 崔树银 汪昕杰 《电力自动化设备》 EI CSCD 北大核心 2022年第5期32-39,81,共9页
精确的多元负荷预测对于综合能源系统的能源调度与运行规划起到重要的作用。对电、热、冷负荷单独进行预测的传统方法会忽略多元负荷间的耦合关系。针对这一问题,提出一种基于多目标Stacking集成学习的多元负荷协同预测模型。引入最大... 精确的多元负荷预测对于综合能源系统的能源调度与运行规划起到重要的作用。对电、热、冷负荷单独进行预测的传统方法会忽略多元负荷间的耦合关系。针对这一问题,提出一种基于多目标Stacking集成学习的多元负荷协同预测模型。引入最大信息系数对多元负荷及天气因素进行相关性分析,并提出负荷耦合形态指标来深度挖掘多元负荷间的耦合关系;将多目标回归与Stacking集成学习模型相结合,建立多元负荷协同预测模型;通过实际算例验证所提模型的有效性,算例结果表明,与其他预测模型相比,所提模型预测精度更高。 展开更多
关键词 多目标回归 Stacking集成学习 综合能源系统 最大信息系数 正则化贪心森林算法
下载PDF
基于最大信息系数的变压器过热故障特征选择 被引量:15
7
作者 陈如意 江军 +3 位作者 陈珉 冯汭琪 李晨 张潮海 《电力工程技术》 2020年第2期140-145,共6页
改良三比值法只关注若干个气体浓度比值,信息利用不充分,而且气体浓度的随机误差对故障诊断结果有影响,因此文中将变压器故障特征气体扩充为单种气体增长率、多种气体比值和相对浓度等62个故障特征,通过具有稳健性的最大信息系数提取与... 改良三比值法只关注若干个气体浓度比值,信息利用不充分,而且气体浓度的随机误差对故障诊断结果有影响,因此文中将变压器故障特征气体扩充为单种气体增长率、多种气体比值和相对浓度等62个故障特征,通过具有稳健性的最大信息系数提取与变压器故障状态相关度高的故障特征。同时为了避免筛选特征之间的冗余性,采用相关系数筛选冗余性小的特征组合,并采用距离相关系数和多种分类器进行检验。结果表明与油中溶解气体相比,筛选特征集合与变压器过热故障状态联系更加紧密,且针对过热故障类型的诊断精度,筛选特征集合在样本类别不平衡时性能更优,突破了单一分类器性能上限。 展开更多
关键词 最大信息系数 Pearson系数 特征选择 油中溶解气体 故障诊断
下载PDF
基于相似日匹配及TCN-Attention的短期光伏出力预测 被引量:13
8
作者 陈禹帆 温蜜 +1 位作者 张凯 余珊 《电测与仪表》 北大核心 2022年第10期108-116,共9页
短期光伏出力预测对电力系统生产调度计划的合理制定极其重要,有助于促进光伏发电并网和消纳。光伏出力受气象特征影响较大,其过程具有波动性、间歇性、不可控等特点,导致快速、精准地进行短期光伏出力预测成为一项挑战。对此,文章提出... 短期光伏出力预测对电力系统生产调度计划的合理制定极其重要,有助于促进光伏发电并网和消纳。光伏出力受气象特征影响较大,其过程具有波动性、间歇性、不可控等特点,导致快速、精准地进行短期光伏出力预测成为一项挑战。对此,文章提出一种基于相似日匹配及TCN-Attention的组合预测模型。文章采用时间序列形态聚类算法和最大信息系数对光伏出力的相似性进行刻画,避免全部历史数据作为输入所产生的数据冗余,利用可并行计算的时序卷积网络学习光伏出力特征,引入Attention机制突出关键气象特征的影响,有效提高模型训练速度和预测精度。基于实际数据的实验结果表明,较之其他预测方法,文章提出的方法具有信息提取直接、训练速度快、预测精度高等优点。 展开更多
关键词 短期光伏出力预测 时序卷积网络 Attention机制 形态聚类 最大信息系数
下载PDF
相关分析技术在直流电压下XLPE电缆局部放电信号特征提取与筛选中的应用 被引量:14
9
作者 杨丰源 许永鹏 +3 位作者 钱勇 李喆 盛戈皞 江秀臣 《电网技术》 EI CSCD 北大核心 2018年第5期1653-1660,共8页
目前,关于直流电压下局部放电信号特征提取技术的研究极少。用于表征连续放电间相关关系的特征散点图是常用的统计分析方法,但现阶段仅用于定性分析放电现象。引入互信息、最大信息系数(maximal information coefficient,MIC)、最大... 目前,关于直流电压下局部放电信号特征提取技术的研究极少。用于表征连续放电间相关关系的特征散点图是常用的统计分析方法,但现阶段仅用于定性分析放电现象。引入互信息、最大信息系数(maximal information coefficient,MIC)、最大信息非参数扩展类(maximal information-based non-parametric exploration,MINE)等先进的非线性相关特征分析手段,提取该类散点图定量特征。基于互信息的MIC和MINE具有普适性、公平性和对称性等重要特性。最终共提取了36个相关特征参数,与22个传统统计算子一起组成特征指纹。之后,使用最大相关最小冗余(mR MR)算法选取最优特征指纹空间并使用MIC进行优化。利用XLPE单芯电缆制作了绝缘内部气隙、主绝缘表面划伤、高压端毛刺电晕、半导电层爬电4类典型绝缘缺陷模型,将文中方法应用于试验数据分析。最终确定了含有48个参数的最优特征指纹,使用人工神经网络等机器学习方法进行模式识别可获得91%的平均识别精度。该结果表明,使用文中方法提取的散点图非线性特征可以有效反映放电模式。 展开更多
关键词 交联聚乙烯电缆 直流局部放电 特征提取 相关分析 最大信息系数
下载PDF
基于CNN-GRU的光伏电站电压轨迹预测 被引量:12
10
作者 冯裕祺 李辉 +3 位作者 李利娟 周彦博 谭貌 彭寒梅 《中国电力》 CSCD 北大核心 2022年第7期163-171,共9页
光伏电站出力随机性易引发并网点电压大幅度波动,通过趋势预测提前调控是提高电压稳定性的有效途径。为了提升电压趋势预测精度,提出一种基于卷积神经网络(convolutional neural networks,CNN)和门控循环单元(gated recurrent unit,GRU... 光伏电站出力随机性易引发并网点电压大幅度波动,通过趋势预测提前调控是提高电压稳定性的有效途径。为了提升电压趋势预测精度,提出一种基于卷积神经网络(convolutional neural networks,CNN)和门控循环单元(gated recurrent unit,GRU)的电压轨迹预测方法。首先,通过采集单元提取电压数据构建时间序列;然后,计算电压时间序列的自相关系数及其与外部变量间的最大信息系数(maximal information coefficient,MIC),分析电压时间序列与外部变量在时序上的关联性;再通过CNN网络提取输入数据的高层特征;最后输入至GRU网络完成电压轨迹预测。通过某地光伏电站实测数据进行验证,结果表明:本文模型与GRU、长短期记忆网络(long short-term memory,LSTM)、CNN-LSTM、支持向量回归(support vector regression,SVR)等模型相比预测准确度更高。 展开更多
关键词 光伏电站 电压轨迹预测 最大信息系数 卷积神经网络 门控循环单元
下载PDF
页岩气井初期产能主控因素“Pearson-MIC”分析方法 被引量:12
11
作者 马文礼 李治平 +3 位作者 高闯 孙玉平 张静平 邓思哲 《中国科技论文》 CAS 北大核心 2018年第15期1765-1771,共7页
页岩气初期产能直接影响单井最终采收率,分析页岩气初期产能主控因素,对页岩气开发方案的设计与优化有重要意义。基于文献调研,定性研究各种因素对页岩气初期产能的影响机理;运用皮尔逊-最大信息系数(Pearson-maximal information coeff... 页岩气初期产能直接影响单井最终采收率,分析页岩气初期产能主控因素,对页岩气开发方案的设计与优化有重要意义。基于文献调研,定性研究各种因素对页岩气初期产能的影响机理;运用皮尔逊-最大信息系数(Pearson-maximal information coefficient,Pearson-MIC)相关性综合分析方法,对各因素与页岩气初期产能之间的相关性进行定量计算;按照一定筛选原则,优选页岩气初期产能主控因素,对比传统相关性分析方法,证明本文方法的可靠性。研究表明:对页岩气初期产能有直接影响的因素主要包括地质因素8个,工程因素10个;页岩气初期产能主控因素包括优质页岩厚度、总有机碳含量、含气量、压力系数、脆性矿物含量、优质储层钻遇程度、压裂段数、射孔簇数、总液量、单段砂量、施工排量;相比传统相关性分析方法,"Pearson-MIC"相关性综合分析方法的评价结果要更可靠。 展开更多
关键词 页岩气 初期产能 最大信息系数 Pearson相关系数 主控因素
下载PDF
基于集成学习和反馈策略的贝叶斯网络结构学习 被引量:12
12
作者 王守会 覃飙 《计算机学报》 EI CAS CSCD 北大核心 2021年第6期1051-1063,共13页
为解决单一结构学习算法中普遍存在的学习效果差、易陷入局部最优等问题,本文通过引入最大信息系数MIC(Maximal Information Coefficient)和集成学习思想,提出了一种新的贝叶斯网络结构学习算法.该算法首先利用MIC确定节点间的依赖关系... 为解决单一结构学习算法中普遍存在的学习效果差、易陷入局部最优等问题,本文通过引入最大信息系数MIC(Maximal Information Coefficient)和集成学习思想,提出了一种新的贝叶斯网络结构学习算法.该算法首先利用MIC确定节点间的依赖关系并得到初始网络,接着使用Bootstrap方法对数据样本进行采样获得若干样本集.依次使用每个样本集,在给定初始网络的基础上,通过BDe评分和禁忌搜索算法训练生成贝叶斯网络并将其用邻接矩阵表示.进而利用集成学习策略,根据得到的若干邻接矩阵计算每条边的权重,并通过设定权重阈值得到集成学习结果.根据集成学习结果利用反馈策略更新初始网络并进入下一次迭代,经过不断迭代最终得到贝叶斯网络结构.最后在7种不同大小的标准数据集中进行实验,计算F1值(F 1-score)、汉明距离HD(Hamming Distance)和学习到的正确边数(TP),并与其它算法进行对比分析.结果表明本文提出的算法在可行性、有效性和普适性上更优. 展开更多
关键词 集成学习 贝叶斯网络 结构学习 反馈策略 最大信息系数
下载PDF
基于最大互信息系数属性选择的冷轧产品机械性能预测 被引量:11
13
作者 颜弋凡 安路达 吕志民 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第1期68-75,共8页
对于冷轧产品机械性能预测建模时面对的需要对全流程众多影响工艺参数属性选择的问题,提出基于最大互信息系数(MIC)属性选择的机械性能预测建模方法。该方法首先利用MIC算法计算各性能指标和工艺参数之间的相关性度量,然后根据各相关度... 对于冷轧产品机械性能预测建模时面对的需要对全流程众多影响工艺参数属性选择的问题,提出基于最大互信息系数(MIC)属性选择的机械性能预测建模方法。该方法首先利用MIC算法计算各性能指标和工艺参数之间的相关性度量,然后根据各相关度量选择形成工艺参数属性子集用于性能预测模型建模及预测。研究结果表明:该建模方法构建的冷轧产品性能预测模型的预测精度高于全工艺参数模型、Pearson相关系数选择和经验知识选择,另外该方法也能选择出一些传统方法不能选择出的非线性影响关系的工艺参数。最优特征子集模型预测效果从原始全工艺参数模型的平均相对误差2.90%下降到2.30%。 展开更多
关键词 最大互信息系数 冷轧 机械性能预测 属性选择
下载PDF
基于最大相关信息系数的FCBF特征选择算法 被引量:11
14
作者 张俐 袁玉宇 王枞 《北京邮电大学学报》 EI CAS CSCD 北大核心 2018年第4期86-90,共5页
在相关性快速过滤特征选择算法(FCBF)基础上,通过最大相关系数的方式改进FCBF算法.首先,通过最大相关系数和对称不确定性度量准则,计算出每个特征与标签之间的相关度量值,并按照数值大小顺序进行排序;其次,通过最大相关系数和近似马... 在相关性快速过滤特征选择算法(FCBF)基础上,通过最大相关系数的方式改进FCBF算法.首先,通过最大相关系数和对称不确定性度量准则,计算出每个特征与标签之间的相关度量值,并按照数值大小顺序进行排序;其次,通过最大相关系数和近似马尔可夫毯原理进行无关特征和冗余特征的筛选,最终选择出最优特征子集.在加利福尼亚大学欧文分校的机器学习库(UCI)的8个公开数据集中进行对比实验结果表明基于最大相关系数的特征选择算法(NFCBF)总体优于FCBF算法,它所选择出特征数比FCBF算法所选择特征数平均少了3.625个,分类准确率平均提高了0.075%.与互信息最大算法(MIM)、最少的绝对收缩和选择算法(Lasso)和岭算法(Ridge)等相比也具有明显的优势. 展开更多
关键词 最大相关系数 快速过滤特征选择 特征相关 特征冗余 分类
原文传递
Xgboost算法在区域用电预测中的应用! 被引量:11
15
作者 许裕栗 杨晶 +1 位作者 李柠 甘中学 《自动化仪表》 CAS 2018年第7期1-5,共5页
针对区域用户用电预测的影响因素众多、用户行为模式差异的特点,提出一种基于Xgboost算法的综合预测方法。该方法从周期、趋势、扰动三方面考虑用电的影响因素,搜集用户历史用电数据和气象数据,对数据中的缺失值进行补充,并对数据进行... 针对区域用户用电预测的影响因素众多、用户行为模式差异的特点,提出一种基于Xgboost算法的综合预测方法。该方法从周期、趋势、扰动三方面考虑用电的影响因素,搜集用户历史用电数据和气象数据,对数据中的缺失值进行补充,并对数据进行平滑化处理。将所得用户数据进行K-means聚类,从而得到不同类别的用户。运用最大信息系数(MIC)计算各影响因素与用户用电量的相关性大小,依据相关性大小对不同影响因素排序,进而提取主要影响因素。利用Xgboost算法构建不同用户类别的用电预测模型,对不同类别用户进行用电预测,进而获得区域整体用电情况。采用实际用电数据,调整算法参数,对综合方法进行仿真分析,并与其他方法进行对比。结果表明,该方法综合考虑了多方面影响因素,划分了不同的用户群落,具有更高的精度和可靠性。Xgboost算法在区域用电预测中具有较好的应用前景。 展开更多
关键词 用电预测 K-MEANS 最大信息系数 Xgboost模型 决策树
下载PDF
基于注意力机制的Encoder-Decoder光伏发电预测模型 被引量:9
16
作者 宋良才 索贵龙 +2 位作者 胡军涛 窦艳梅 崔志永 《计算机与现代化》 2020年第9期112-117,共6页
影响光伏发电系统出力的天气因素具有很大的波动性和不连续性,因此需要创建合适的预测模型来对光伏出力特性进行精准预测,从而保证电网系统的有效运行。本文通过最大信息系数选择合适的历史光伏发电数据,将其作为特征之一进行输入数据重... 影响光伏发电系统出力的天气因素具有很大的波动性和不连续性,因此需要创建合适的预测模型来对光伏出力特性进行精准预测,从而保证电网系统的有效运行。本文通过最大信息系数选择合适的历史光伏发电数据,将其作为特征之一进行输入数据重构,并在由LSTM神经元构建的Encoder-Decoder模型上引入注意力机制,最终得到结合注意力机制的Encoder-Decoder光伏发电预测模型。经实际光伏电厂算例分析,验证了所提模型在光伏发电预测方面的准确性和适用性。 展开更多
关键词 光伏发电 最大信息系数 长短期记忆神经网络 Encoder-Decoder框架 注意力机制
下载PDF
综合布料滤波与改进随机森林的点云分类算法 被引量:9
17
作者 薛豆豆 程英蕾 +2 位作者 释小松 秦先详 文沛 《激光与光电子学进展》 CSCD 北大核心 2020年第22期184-192,共9页
城区激光雷达点云建筑物提取技术是近年来发展的热点,如何准确区分植被、建筑物以及人造物,提高分类精度一直是研究难点。为此,针对分类精度较低的问题,提出一种基于随机森林的点云分类算法。首先使用改进布料滤波算法对点云数据进行地... 城区激光雷达点云建筑物提取技术是近年来发展的热点,如何准确区分植被、建筑物以及人造物,提高分类精度一直是研究难点。为此,针对分类精度较低的问题,提出一种基于随机森林的点云分类算法。首先使用改进布料滤波算法对点云数据进行地面滤波;其次,构建决策树并进行基于最大互信息系数的相关性分析,选出相关系数最小、精度最高的决策树,得到弱相关随机森林模型;最后,对决策结果进行加权投票处理,得到一种综合布料滤波和加权弱相关随机森林的点云分类算法,并通过Vaihingen城区数据集对算法进行验证。实验表明,与传统随机森林分类算法相比,本文算法提高了4.2%的分类精度,也提高了算法效率。 展开更多
关键词 图像处理 激光雷达 布料滤波算法 随机森林 点云归一化 最大互信息系数
原文传递
基于MIC-CFS-LSTM的SCR出口NO_(x)浓度动态预测 被引量:4
18
作者 吴康洛 黄俊 +4 位作者 李峥辉 阮斌 罗圣 卢志民 姚顺春 《洁净煤技术》 CAS CSCD 北大核心 2023年第6期142-150,共9页
针对燃煤机组选择性催化还原(SCR)系统出口氮氧化物(NO_(x))预测模型精度不高的问题,提出一种基于最大信息系数(MIC)和长短期记忆(LSTM)神经网络的预测模型方法。首先采用MIC估计各变量的延迟时间,对数据进行时延重构;然后采用重构后数... 针对燃煤机组选择性催化还原(SCR)系统出口氮氧化物(NO_(x))预测模型精度不高的问题,提出一种基于最大信息系数(MIC)和长短期记忆(LSTM)神经网络的预测模型方法。首先采用MIC估计各变量的延迟时间,对数据进行时延重构;然后采用重构后数据的MIC值作为评价各输入变量和输出变量间相关性大小的指标,并结合基于关联性的特征选择算法(CFS)进行输入变量筛选;最后基于时延重构和变量筛选后的数据,采用LSTM神经网络建立了SCR出口氮氧化物浓度动态预测模型。该模型被用于广东某320 MW燃煤机组实际运行数据分析。结果表明,经时延重构和变量筛选后所建立的LSTM预测模型具有较高精度,优于深度神经网络(DNN)模型和径向基函数(RBF)神经网络模型,平均绝对百分比误差达2.58%,均方根误差达2.02,可满足现场运用要求。 展开更多
关键词 SCR NO_(x)浓度预测 时延分析 变量选择 最大信息系数 长短期记忆神经网络
下载PDF
基于对数变换和最大信息系数PCA的过程监测 被引量:8
19
作者 王中伟 宋宏 +1 位作者 李帅 周晓锋 《科学技术与工程》 北大核心 2017年第16期259-265,共7页
主元分析(principal component analysis,PCA)被广泛应用于工业生产过程监测。PCA假设数据服从高斯分布且协方差矩阵仅能评估变量间的线性关系,无法衡量变量间非线性依赖程度。基于此,提出了一种基于对数变换和最大信息系数(maximal inf... 主元分析(principal component analysis,PCA)被广泛应用于工业生产过程监测。PCA假设数据服从高斯分布且协方差矩阵仅能评估变量间的线性关系,无法衡量变量间非线性依赖程度。基于此,提出了一种基于对数变换和最大信息系数(maximal information coefficient,MIC)PCA的过程监测方法。首先,应用对数变换对过程数据进行变换,在一定程度上改善数据分布。然后,采用可以度量变量间的非线性相关性的MIC矩阵替换协方差矩阵,从而改善对非线性非高斯过程的监测效果。最后通过在田纳西-伊斯曼过程(tennessee eastman process,TE)仿真研究验证了该方法的可行性和有效性。 展开更多
关键词 主元分析方法 最大信息系数 对数变换 过程监测
下载PDF
基于最大信息系数的永久性房颤差异表达基因识别 被引量:6
20
作者 刘汉明 饶妮妮 +3 位作者 李益 罗恒荣 杨阳 杨锋 《中国生物医学工程学报》 CAS CSCD 北大核心 2015年第1期8-16,共9页
心房颤动是一种常见的、与年龄相关的心律失常,由其所导致的脑卒中具有高致残率和致死率。通过对高通量基因表达谱的分析,可以帮助理解心房颤动的生物学过程和功能紊乱机制,并发现相关致病基因。新型的非参数统计方法——最大信息系数,... 心房颤动是一种常见的、与年龄相关的心律失常,由其所导致的脑卒中具有高致残率和致死率。通过对高通量基因表达谱的分析,可以帮助理解心房颤动的生物学过程和功能紊乱机制,并发现相关致病基因。新型的非参数统计方法——最大信息系数,在探索双变量之间的关联方面具有独特的优点。利用该方法,发现差异与非差异基因表达值与样本表型之间的关联程度不同,构建差异表达基因识别方法。对永久性房颤基因表达谱GSE2240的分析,识别出41个差异表达基因,其中有14基因是已有工作未发现的新差异表达基因。信号通路和富集分析表明,这些差异表达基因与房颤高度相关。同时,对乳腺癌基因表达数据GSE24037的分析,进一步说明该方法在差异表达基因识别方面的有效性。最大信息系数的非参数特性与抗噪能力,使它非常适合于差异表达基因的识别。 展开更多
关键词 最大信息系数 心房颤动 差异表达基因
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部