期刊文献+
共找到79篇文章
< 1 2 4 >
每页显示 20 50 100
基于改进LightGBM的电力系统暂态稳定评估方法 被引量:55
1
作者 周挺 杨军 +4 位作者 周强明 谭本东 周悦 徐箭 孙元章 《电网技术》 EI CSCD 北大核心 2019年第6期1931-1940,共10页
实际获得的电力系统运行数据,普遍存在由广域测量系统(WAMS)测量误差造成的噪声,并且具备类别不平衡的特点,导致基于机器学习的电力系统暂态稳定评估算法的分类性能受到很大的影响。提出了一种基于改进轻梯度提升机(modified light grad... 实际获得的电力系统运行数据,普遍存在由广域测量系统(WAMS)测量误差造成的噪声,并且具备类别不平衡的特点,导致基于机器学习的电力系统暂态稳定评估算法的分类性能受到很大的影响。提出了一种基于改进轻梯度提升机(modified light gradient boosting machine)模型的暂态稳定评估方法,采用直方图算法对数据进行离散化,增强模型对噪声的鲁棒性;在训练中对失稳样本赋予更高的权重,平衡样本数量差异造成的影响;并在损失函数中引入正则项来控制模型复杂度,减少过拟合,从而适应电力系统多样的运行情况。在新英格兰10机39节点系统和美国南卡罗莱纳州500节点实际电网上的仿真结果表明,与其他机器学习方法相比,所提方法在噪声干扰下不容易过拟合,具有更好的鲁棒性:在保持较高总体评估准确率的同时,对失稳样本具有更高的识别率;与其他集成学习模型相比,所提方法在速度上也具有明显优势。 展开更多
关键词 暂态稳定评估 机器学习 类别不平衡 噪声 改进 lightgbm
下载PDF
基于LightGBM和DNN的智能配电网在线拓扑辨识 被引量:37
2
作者 裴宇婷 秦超 余贻鑫 《天津大学学报(自然科学与工程技术版)》 EI CSCD 北大核心 2020年第9期939-950,共12页
为提高电网的安全运行水平和经济性,灵活的可重构的网络拓扑结构是未来智能配电网的基本特征.而配电管理系统(DMS)中的大部分功能,如状态估计,潮流计算和电压控制等,都基于网络当前的拓扑结构.因此,拓扑辨识是DMS的基础功能之一,研究更... 为提高电网的安全运行水平和经济性,灵活的可重构的网络拓扑结构是未来智能配电网的基本特征.而配电管理系统(DMS)中的大部分功能,如状态估计,潮流计算和电压控制等,都基于网络当前的拓扑结构.因此,拓扑辨识是DMS的基础功能之一,研究更为高效和准确的智能配电网拓扑辨识方法具有重要意义.结合配电网的结构和运行特点,建立了基于机器学习的智能配电网拓扑辨识框架,并提出了基于LightGBM和深度神经网络(DNN)的配电网在线拓扑辨识方法.该方法借助LightGBM实现特征选择,筛选出对配电网拓扑辨识最有效的少量量测,以深度神经网络实现配电网运行断面量测数据与其拓扑结构间的映射.考虑实际应用中可能存在量测数据丢失的情况,提出了基于最小方差的缺失值填补方法.同样利用样本间的最小方差进行未知拓扑的甄别,并借助增量学习机制,通过增量训练DNN模型实现拓扑知识库的更新.与现有方法相比,本文提出的拓扑辨识方法仅需要配电网中少量节点的运行断面量测数据,同时适用于辐射状和弱环网结构,计算效率可支持在线拓扑辨识.通过IEEE 33节点配电网和PG&E 69节点配电网验证了所提方法的有效性与优越性,并分析了对于不同噪声水平情况、量测特征值缺失和存在未知拓扑的适应性. 展开更多
关键词 智能配电网 拓扑辨识 机器学习 lightgbm 深度神经网络
下载PDF
一种机器学习方法在湖北定时气温预报中的应用试验 被引量:20
3
作者 谭江红 陈伟亮 王珊珊 《气象科技进展》 2018年第5期46-50,共5页
利用2015—2017年湖北89个气象站地面观测温度、欧洲中心再分析资料和0~12 h预报资料回归模式输出要素与地面气温之间的关系,建立了LightGBM模型,并在2018年数据集上进行测试。结果表明,定时气温平均绝对误差由模式本身的1.8℃下降到1.... 利用2015—2017年湖北89个气象站地面观测温度、欧洲中心再分析资料和0~12 h预报资料回归模式输出要素与地面气温之间的关系,建立了LightGBM模型,并在2018年数据集上进行测试。结果表明,定时气温平均绝对误差由模式本身的1.8℃下降到1.1℃,2℃以内预报准确率由65.9%上升至86.6%,决定系数(拟合优度)高达0.97。该模型已经在武汉中心气象台业务化,初步选取定时气温中的极值进行2018年2—6月预报评分,24 h高、低温预报准确率分别为76.9%和91.4%,在客观产品中排名前列,较数值预报模式产品提升明显,低温预报准确率超过预报员水平。LightGBM作为一个年轻的机器学习框架,在气象要素预报方面具备良好的应用前景。 展开更多
关键词 机器学习 决策树 lightgbm 气温 预报试验
下载PDF
基于改进LightGBM模型的汽车故障预测方法研究 被引量:15
4
作者 颜诗旋 朱平 刘钊 《汽车工程》 EI CSCD 北大核心 2020年第6期815-819,825,共6页
针对机器学习技术在汽车行业的应用中存在的汽车故障数据规模大和类别不平衡引起的模型训练速度慢、故障查全率低的问题,对LightGBM模型进行两方面的改进:模型训练时,设置类别权重和L1正则化项修正模型的损失函数,并通过贝叶斯优化获得... 针对机器学习技术在汽车行业的应用中存在的汽车故障数据规模大和类别不平衡引起的模型训练速度慢、故障查全率低的问题,对LightGBM模型进行两方面的改进:模型训练时,设置类别权重和L1正则化项修正模型的损失函数,并通过贝叶斯优化获得修正项系数的取值;模型预测时,使用阈值移动法降低模型的分类阈值。在斯堪尼亚货车故障数据集上进行验证。结果表明,本文中所提出的改进LightGBM模型训练速度快,故障查全率高,具备工程应用价值。 展开更多
关键词 机器学习 汽车故障预测 lightgbm模型 类别不平衡
下载PDF
我国涉农企业科技成果转化效率提升路径研究——基于SSBM-网络DEA与Light GBM方法 被引量:11
5
作者 林青宁 毛世平 《农业技术经济》 CSSCI 北大核心 2022年第5期4-17,共14页
涉农企业科技成果转化效率关乎农业科技与经济“两张皮”问题,为此本文在构建SSBM-网络DEA模型测算涉农企业科技成果转化效率的基础上,基于系统论的视角,构建涉农企业科技成果转化生态系统,将涉农科技成果转化效率影响路径分解为转化能... 涉农企业科技成果转化效率关乎农业科技与经济“两张皮”问题,为此本文在构建SSBM-网络DEA模型测算涉农企业科技成果转化效率的基础上,基于系统论的视角,构建涉农企业科技成果转化生态系统,将涉农科技成果转化效率影响路径分解为转化能力、转化保障、转化动力与转化环境四大指标,共10项二级指标,并使用LightGBM机器学习方法探究其路径优化问题,主要得到以下研究结论。(1)2009—2017年我国涉农企业科技成果转化效率整体呈上升趋势,但均值仅为0.421,整体效率损失较大。(2)涉农企业科技成果转化效率主要由转化能力贡献(贡献度为68.93%);转化保障、转化动力与转化环境的贡献度较低(贡献度分别为15.64%、14.73%与0.7%),突出表现在协同创新、融资环境与制度环境的促进作用不明显。为此,提出了优化我国涉农企业科技成果转化效率的政策建议。 展开更多
关键词 涉农企业 科技成果转化效率 lightgbm算法 网络DEA 机器学习
原文传递
基于LightGBM的天然气管道周围滑坡灾害预测方法 被引量:10
6
作者 张博 向旭 +3 位作者 贾俊龙 张学洪 李春奇 彭君 《吉林大学学报(理学版)》 CAS 北大核心 2023年第2期338-346,共9页
针对天然气管道周围滑坡灾害预测中的数据缺失和特征数量少的问题,采用基于LightGBM框架实现的梯度提升决策树算法,通过插值法补齐缺失数据,利用历史特征数据生成近期特征和远期特征,得到影响斜坡演变过程各因素的重要性排序及算法最优... 针对天然气管道周围滑坡灾害预测中的数据缺失和特征数量少的问题,采用基于LightGBM框架实现的梯度提升决策树算法,通过插值法补齐缺失数据,利用历史特征数据生成近期特征和远期特征,得到影响斜坡演变过程各因素的重要性排序及算法最优参数集合,实现对天然气管道周围滑坡灾害的有效预测.结果表明,在对天然气管道周围滑坡灾害进行预测中,该方法相比XGBoost模型具有更高的准确率,同时处理速度也更快,证明了LightGBM算法在滑坡灾害预测方面应用的可行性和有效性. 展开更多
关键词 lightgbm框架 滑坡 预警预报 机器学习 人工智能
下载PDF
福建省空气负氧离子分布特征及气象预测模型 被引量:9
7
作者 张春桂 《应用气象学报》 CSCD 北大核心 2023年第2期193-205,共13页
负氧离子是评价空气新鲜和清洁程度的重要指标。利用2018—2021年福建省负氧离子观测站数据分析负氧离子浓度的时空变化特征,并采用多元线性回归方法、多元逻辑回归方法和LightGBM机器学习方法建立负氧离子浓度预测模型。结果表明:福建... 负氧离子是评价空气新鲜和清洁程度的重要指标。利用2018—2021年福建省负氧离子观测站数据分析负氧离子浓度的时空变化特征,并采用多元线性回归方法、多元逻辑回归方法和LightGBM机器学习方法建立负氧离子浓度预测模型。结果表明:福建省负氧离子资源十分丰富,中海拔区(350~550 m)年平均负氧离子浓度最高,低海拔区次之,高海拔区最小。负氧离子浓度日变化特征呈一峰一谷型,04:00—06:00(北京时,下同)达到峰值,12:00—13:00达到谷值;中海拔区负氧离子浓度季节变化较大,季节平均浓度从大到小依次为春季、夏季、冬季、秋季,而高、低海拔区季节变化相对较小。福建省不同海拔地区负氧离子浓度与湿度、降水和能见度均呈显著正相关,负氧离子浓度与气温、风速和气压显著相关,但不同海拔地区的相关性有所不同。机器学习方法对不同海拔地区负氧离子浓度数值的拟合效果比多元线性回归方法有明显提升,对负氧离子浓度等级拟合的准确率比多元逻辑回归方法提高7%~12%,且在绝大部分等级上的准确率均高于多元逻辑回归方法。 展开更多
关键词 空气负氧离子 气象因子 lightgbm机器学习 时空变化特征 预测模型
下载PDF
考虑线网结构的LightGBM轨道交通短时客流预测模型 被引量:9
8
作者 韩皓 徐圣安 赵蒙 《铁道运输与经济》 北大核心 2021年第10期109-117,共9页
考虑空间维度特征对利用监督学习预测轨道交通短时客流量的影响,提出结合复杂网络与机器学习理论挖掘车站层面的客流分布规律。通过对原始数据分析,实现对线网结构特征、时间维度特征及数据集的构建,建立基于LightGBM算法的轨道交通短... 考虑空间维度特征对利用监督学习预测轨道交通短时客流量的影响,提出结合复杂网络与机器学习理论挖掘车站层面的客流分布规律。通过对原始数据分析,实现对线网结构特征、时间维度特征及数据集的构建,建立基于LightGBM算法的轨道交通短时客流预测模型,并对模型参数进行标定,采用模型评估和特征重要性分析等方法,对模型结果进行分析,对比LightGBM预测模型与XGBoost、随机森林、CatBoost和MLP模型的预测效果。结果表明:考虑线网结构下的LightGBM模型在评估指标MAE,MAPE上表现最优,MAPE最小为13.65%,训练速度较其他模型最多提升至25倍,表现出较强的预测性能。 展开更多
关键词 复杂网络 机器学习 lightgbm 轨道交通 客流预测
下载PDF
Predicting complexation performance between cyclodextrins and guest molecules by integrated machine learning and molecular modeling techniques 被引量:7
9
作者 Qianqian Zhao Zhuyifan Ye +1 位作者 Yan Su Defang Ouyang 《Acta Pharmaceutica Sinica B》 SCIE CSCD 2019年第6期1241-1252,共12页
Most pharmaceutical formulation developments are complex and ideal formulations are generally obtained after extensive experimentation.Machine learning is increasingly advancing many aspects in modern society and has ... Most pharmaceutical formulation developments are complex and ideal formulations are generally obtained after extensive experimentation.Machine learning is increasingly advancing many aspects in modern society and has achieved significant success in multiple subjects.Current research demonstrated that machine learning can be adopted to build up high-accurate predictive models in drugs/cyclodextrins(CDs)systems.Molecular descriptors of compounds and experimental conditions were employed as inputs,while complexation free energy as outputs.Results showed that the light gradient boosting machine provided significantly improved predictive performance over random forest and deep learning.The mean absolute error was 1.38 kJ/mol and squared correlation coefficient was0.86.The evaluation of relative importance of molecular descriptors further demonstrated the key factors affecting molecular interactions in drugs/CD systems.In the specific ketoprofen-CD systems,machine learning model showed better predictive performance than molecular modeling calculation,while molecular simulation could provide structural,dynamic and energetic information.The integration of machine learning and molecular simulation could produce synergistic effect for interpreting and predicting pharmaceutical formulations.In conclusion,the developed predictive models were able to quickly and accurately predict the solubilizing capacity of CD systems.Current research has taken an important step toward the application of machine learning in pharmaceutical formulation design. 展开更多
关键词 machine learning Deep learning lightgbm Random FOREST CYCLODEXTRIN BINDING free energy Molecular modeling KETOPROFEN
原文传递
基于融合机器学习算法的网络入侵检测与定位技术 被引量:7
10
作者 刘欢 肖蔚 赵长明 《现代电子技术》 2023年第12期182-186,共5页
针对传统的网络入侵检测系统中存在的漏报、误报率较高的问题,文中提出一种基于融合机器学习算法的网络入侵检测与定位技术。该技术方案的核心算法由PCA、DCNN以及LightGBM组成,针对网络流量数据维度高的特点,使用PCA进行主动降维,并通... 针对传统的网络入侵检测系统中存在的漏报、误报率较高的问题,文中提出一种基于融合机器学习算法的网络入侵检测与定位技术。该技术方案的核心算法由PCA、DCNN以及LightGBM组成,针对网络流量数据维度高的特点,使用PCA进行主动降维,并通过DCNN模型对降维后的数据加以训练。针对分类模型LightGBM存在边缘数据检测精度较低的问题,利用损失函数对其进行权重改进,从而提高算法的准确率和执行效率。实验与测试结果表明,所提方法的多项指标均优于基础算法LightGBM,可实现对网络入侵的有效检测与定位。与GAN、LSTM、SVM、RF以及CNN算法的横向对比实验结果表明,所提算法对5类数据的分类准确率分别为99.1%、98.5%、93.3%、88.9%和84.9%,均优于对比算法,验证了其综合性能的优越性。 展开更多
关键词 网络入侵检测 机器学习算法 主成分分析法 深度卷积神经网络 lightgbm模型 数据降维
下载PDF
基于树模型的北京市PM_(2.5)预测效果对比分析 被引量:8
11
作者 李志生 梁锡冠 +2 位作者 金宇凯 张华刚 欧耀春 《环境工程》 CAS CSCD 北大核心 2021年第6期106-113,共8页
在城市空气质量预测中,ρ(PM_(2.5))会受到气象条件和时间周期的影响。选取北京市全市为实验区域,对多种污染物浓度特征、时间特征及天气特征等进行分析,采用2019年33个空气质量监测站逐小时数据开展PM_(2.5)预测实验,建立了基于特征的L... 在城市空气质量预测中,ρ(PM_(2.5))会受到气象条件和时间周期的影响。选取北京市全市为实验区域,对多种污染物浓度特征、时间特征及天气特征等进行分析,采用2019年33个空气质量监测站逐小时数据开展PM_(2.5)预测实验,建立了基于特征的LightGBM (light gradient boosting machine) PM_(2.5)质量浓度预测模型,分别与随机森林模型(RF)、梯度提升树模型(GBDT)、 XGBoost模型3个PM_(2.5)浓度预测模型进行对比。结果表明:在PM_(2.5)浓度预测精度方面,LightGBM模型最高,XGBoost模型次之,RF模型最差。LightGBM模型的PM_(2.5)污染浓度预测准确率高于其他模型,R2为0.9614,且具有训练快、内存少等优点。LightGBM模型的5个评估指标均优于其他模型,说明其在PM_(2.5)逐时预测上具有很好的稳定性和应用前景。 展开更多
关键词 周期特征 机器学习 PM_(2.5)影响因素 lightgbm PM_(2.5)预测
原文传递
街景图像与机器学习相结合的道路环境安全感知评价与影响因素分析 被引量:6
12
作者 李心雨 闫浩文 +1 位作者 王卓 王炳瑄 《地球信息科学学报》 CSCD 北大核心 2023年第4期852-865,共14页
准确识别影响环境安全感知的视觉因素,对于改善城市交通环境与提升行人出行安全具有重要支撑作用。然而,既有研究难以对复杂场景下的环境安全感知进行大规模定量化研究。因此,本文利用图像语义分割和目标检测技术从街景图像中提取视觉要... 准确识别影响环境安全感知的视觉因素,对于改善城市交通环境与提升行人出行安全具有重要支撑作用。然而,既有研究难以对复杂场景下的环境安全感知进行大规模定量化研究。因此,本文利用图像语义分割和目标检测技术从街景图像中提取视觉要素,通过人工评分结合深度学习的方式构建道路安全感知数据集;再基于轻量梯度提升机和SHAP解释框架,识别出影响环境安全感知的视觉因素;最后,选取道路环境特殊的峡谷性城市兰州市安宁区高校聚集地为例进行实证研究。结果表明:①高校及商业街的安全感知评分较高,城市道路的普遍偏低;②天空、人行道、道路和树木的图像占比值是对环境安全感知影响最大的四类要素,其中,天空的图像占比值为线性关系,人行道和树木的图像占比值近似对数函数,道路的图像占比值则类似二次函数;③视觉要素占比和个数存在交互影响作用,合理的要素分布有助于形成良好的空间视线,以及营造合适的行为活动空间,从而提升环境安全感知。 展开更多
关键词 街景图像 机器学习 环境感知 图像语义分割 目标检测 lightgbm SHAP
原文传递
基于SSA-LightGBM的交通流量调查数据趋势预测 被引量:7
13
作者 徐磊 孙朝云 +1 位作者 李伟 杨荣新 《计算机系统应用》 2021年第1期243-249,共7页
为了解决传统模型和机器学习模型对周期时间序列预测效果欠佳的问题,本文以韩城高速公路交通流量调查数据为数据集,提出了SSA-LightGBM交通流量调查数据预测模型.对韩城高速数据进行当量计算,然后对当量数据进行奇异谱分解得到周期项和... 为了解决传统模型和机器学习模型对周期时间序列预测效果欠佳的问题,本文以韩城高速公路交通流量调查数据为数据集,提出了SSA-LightGBM交通流量调查数据预测模型.对韩城高速数据进行当量计算,然后对当量数据进行奇异谱分解得到周期项和随机项,对周期项进行信号重建,利用LightGBM预测随机项,最后将预测随机项与周期延拓信号进行叠加得到最终的高速当量预测数据.同时与XGBoost和LightGBM预测结果作对比,SSALightGBM预测结果与真实值最为贴近,且MAE、RMSE和R2均优于XGBoost和LightGBM模型.该结果对我国高速公路交通调查数据未来的变化趋势预测研究具有很好的指导意义,可以为我国高速公路的整修和养护提供很好的参考价值. 展开更多
关键词 奇异谱分析 lightgbm模型 机器学习 高速交通量调查数据 预测
下载PDF
基于LightGBM算法的光伏并网系统孤岛检测及其集成的可解释研究 被引量:5
14
作者 朱春霖 余成波 《电力自动化设备》 EI CSCD 北大核心 2023年第7期80-86,150,共8页
针对智能孤岛检测方法欠缺对数据集划分过程中标签分布不均问题的考虑,以及该领域尚未对复杂智能孤岛检测模型的决策进行可解释性分析,提出了一种基于轻梯度提升机(LightGBM)算法的孤岛检测模型。采用分层抽样的K折交叉验证检测模型的... 针对智能孤岛检测方法欠缺对数据集划分过程中标签分布不均问题的考虑,以及该领域尚未对复杂智能孤岛检测模型的决策进行可解释性分析,提出了一种基于轻梯度提升机(LightGBM)算法的孤岛检测模型。采用分层抽样的K折交叉验证检测模型的分类性能,解决数据标签分布不均的问题;提出基于决策树的Shapley值加性解释方法为主干,融合累计局部效应图和局部代理模型的集成可解释分析框架,从全局性和局部性角度对光伏并网系统的孤岛状态检测进行归因分析。算例仿真结果表明,所提模型能在传统检测方法的检测盲区中实现精确且快速的动态孤岛检测,且在电压波动、系统故障等情况下均未发生误判。基于集成的归因分析方法解决了单一可解释方法的欠合理性问题,揭示了模型输入电气特征自变量与孤岛检测响应因变量之间的关系,提高了模型的可信度。 展开更多
关键词 光伏并网系统 孤岛检测 机器学习 lightgbm算法 SHAPLEY值 可解释性
下载PDF
基于LightGBM的船舶航速预测模型 被引量:5
15
作者 朱晓晨 尹奇志 +2 位作者 赵福芹 钱巍文 赵奎奎 《大连海事大学学报》 CAS CSCD 北大核心 2023年第1期56-65,共10页
针对现有基于机器学习算法的船舶航速预测模型无法兼顾计算精度高、泛化能力强及计算速度快的问题,提出基于LightGBM的船舶航速预测模型,并以一艘安装有能效监测系统的内河船舶为研究对象,运用LightGBM算法建立以实时风速、风向、水深... 针对现有基于机器学习算法的船舶航速预测模型无法兼顾计算精度高、泛化能力强及计算速度快的问题,提出基于LightGBM的船舶航速预测模型,并以一艘安装有能效监测系统的内河船舶为研究对象,运用LightGBM算法建立以实时风速、风向、水深、水流速度、尾轴转速、轴功率和主机油耗为输入的船舶航速预测模型,并同时与RR、SVR、DT、BPNN、RF、GBDT和XGBoost七种机器学习算法的航速预测结果进行比较。结果表明:基于LightGBM建立的船舶航速预测模型的精度、泛化能力、运算速度均排名第二,综合性能最好,可在保证较高预测精度和较强泛化能力前提下,实现对船舶航速的快速预测。 展开更多
关键词 船舶 航速预测 机器学习 回归分析 lightgbm
原文传递
基于Stacking模型融合的用户购买行为预测研究 被引量:6
16
作者 张建彬 霍佳震 《上海管理科学》 2021年第1期12-19,共8页
在大数据时代背景下,如何利用大量的销售数据精准预测顾客未来需求,成为企业制定客户管理和库存管理决策的一个重要问题。目前关于用户购买行为预测的研究中很少能够预测用户具体的购买时间。基于已有的销售数据,提出了基于机器学习和St... 在大数据时代背景下,如何利用大量的销售数据精准预测顾客未来需求,成为企业制定客户管理和库存管理决策的一个重要问题。目前关于用户购买行为预测的研究中很少能够预测用户具体的购买时间。基于已有的销售数据,提出了基于机器学习和Stacking集成的综合预测模型预测用户的购买行为,即未来是否购买及其购买时间。将模型应用在一家大型连锁零售企业的需求预测中,并对方法的有效性进行评估。结果表明,基于Stacking集成的融合模型对预测用户未来是否购买具有最佳性能,准确率达85%,AUC值达到0.928;LightGBM集成算法在预测用户购买时间时具有最优性能,相比于融合模型提升了5.5%的预测性能;融合模型+LightGBM算法的组合相比于均使用融合模型提升了9.4%的预测性能。 展开更多
关键词 组合预测 机器学习 购买行为预测 lightgbm算法 Stacking集成
下载PDF
基于梯度提升的优化集成机器学习算法对滑坡易发性评价:以雅鲁藏布江与尼洋河两岸为例 被引量:2
17
作者 林琴 郭永刚 +2 位作者 吴升杰 臧烨祺 王国闻 《西北地质》 CSCD 北大核心 2024年第1期12-22,共11页
雅鲁藏布江与尼洋河两岸地质构造活跃,山体滑坡时常发生,滑坡易发性评价能有效的减少因灾害发生所造成的对人类生命和财产的伤害。笔者基于基尼系数的加权随机森林、XGBoost和LightGBM算法在滑坡易发性中的性能。选取188个滑坡样本和7... 雅鲁藏布江与尼洋河两岸地质构造活跃,山体滑坡时常发生,滑坡易发性评价能有效的减少因灾害发生所造成的对人类生命和财产的伤害。笔者基于基尼系数的加权随机森林、XGBoost和LightGBM算法在滑坡易发性中的性能。选取188个滑坡样本和7个影响因素,应用五折交叉验证法训练模型,训练过程中同时考虑特征选择算法、运用贝叶斯方法优化超参数后,采用precision、recall、F1、Accuracy指标对各个级别的预测结果进行分析。结果表明:在高程为32~1544 m与2722~3752 m、坡度为30°~40°、距断裂带、河流与道路200 m以内的区域最容易发生滑坡;滑坡极高与高易发性分布为12.14%和12.41%,低和极低易发性占比分别为26.47%与29.55%,区内一半以上的地区不容易发生滑坡灾害;LightGBM模型在所有模型中表现最好,AUC值为0.8432,准确度为0.8531,F1分数为0.8345;墨脱县的达木乡、帮辛乡,林芝县的丹娘、里龙、扎西饶登乡,朗县的陇村,工布江达的江达乡位于极高易发区,发生滑坡概率极大,在这些地区应采取相应的地质灾害防治措施。 展开更多
关键词 梯度提升 XGBoost lightgbm 机器学习 滑坡易发性
下载PDF
基于机器学习的风电场风速多模式集合预报 被引量:2
18
作者 高盛 许沛华 陈正洪 《南方能源建设》 2024年第1期85-95,共11页
[目的]随着大量风电场的兴建,组合研究不同的机器学习算法和气象预报模式已成为研究焦点。[方法]文章以湖北省风能资源的空间分布特征为基础,通过选取代表站点结合实验数据分析对结果进行深入探讨。[结果]在湖北省,已建和在建的风电场... [目的]随着大量风电场的兴建,组合研究不同的机器学习算法和气象预报模式已成为研究焦点。[方法]文章以湖北省风能资源的空间分布特征为基础,通过选取代表站点结合实验数据分析对结果进行深入探讨。[结果]在湖北省,已建和在建的风电场主要集中在“三带一区”的区域,具体包括:位于湖北省中部,从荆门至荆州的南北向风带;位于鄂北,从枣阳至英山的东西向风带;部分湖岛和沿湖地带;以及鄂西南和鄂东南的部分高山地区。该研究采用4种不同的数值预报产品,包括CMA-WSP、CMA-GD、WHMM和EC,与实测风速对比深入探究这些数值模式的适用范围。[结论]通过分析基于机器学习的5种集合预报方法及均值法在湖北省各地区的表现确定了适合的算法和预报模式组合,为提高集合预报的准确性提供了参考。 展开更多
关键词 风功率预测 机器学习算法 随机森林 lightgbm ADABOOST GRU LSTM 集合预报
下载PDF
杭州地铁客流特征分析与客流预测 被引量:6
19
作者 张素洁 谢小园 《价值工程》 2019年第19期65-67,共3页
通过对杭州地铁2019年1月1日到2019年1月25日的地铁刷卡数据进行分析,根据进出站高峰小时系数和站点位置将80个站点分为居住、工作、交通场站和混合类型四类。不同类型的车站早高峰晚高峰进出站高峰小时系数均不相同。对不同地铁线路的... 通过对杭州地铁2019年1月1日到2019年1月25日的地铁刷卡数据进行分析,根据进出站高峰小时系数和站点位置将80个站点分为居住、工作、交通场站和混合类型四类。不同类型的车站早高峰晚高峰进出站高峰小时系数均不相同。对不同地铁线路的换乘量进行分析发现3号线换乘量比例最高,占其出站人数的77.7%。使用机器学习方法(随机森林和lightgbm)对不同站点每小时的进出站人数进行预测,平均相对误差均值为9.0%。表现出较强的可预测性。 展开更多
关键词 客流预测 机器学习 随机森林 lightgbm
下载PDF
基于机器学习的股价崩盘风险预测研究 被引量:1
20
作者 黄鹤 汤瑛琦 +1 位作者 刘延冰 张明媚 《管理会计研究》 2024年第1期21-38,共18页
本文充分结合资本市场中的有效信息,从惯性、估值与成长、交易摩擦、公司基本面、投资、盈利六个维度构造上市公司股票特征集,再利用随机森林、GBDT、XGBoost和LightGBM算法建立四种股价崩盘风险预测模型,比较考察了不同模型的预测效果... 本文充分结合资本市场中的有效信息,从惯性、估值与成长、交易摩擦、公司基本面、投资、盈利六个维度构造上市公司股票特征集,再利用随机森林、GBDT、XGBoost和LightGBM算法建立四种股价崩盘风险预测模型,比较考察了不同模型的预测效果以及关键影响因素。研究发现,相比单一算法模型以及其他集成算法模型,LightGBM算法模型的预测精度和效率更高。在LightGBM算法模型中,影响股价崩盘风险的关键特征包括惯性、交易摩擦、估值以及公司基本面特征。该研究结果对于上市公司及其他利益相关者动态监控股价具有实际的应用价值。 展开更多
关键词 股价崩盘风险 机器学习 lightgbm
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部