期刊文献+
共找到287篇文章
< 1 2 15 >
每页显示 20 50 100
基于Spark和梯度提升树模型的短期负荷预测 被引量:39
1
作者 许贤泽 刘静 +1 位作者 施元 谭盛煌 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第5期84-89,共6页
利用Spark平台对电力用户侧的大数据进行分析,提出基于梯度提升树的并行负荷预测方法.首先对历史负荷和天气数据集进行并行化分割处理,并采用特征提取与转换方法获取到预测模型所需的特征向量;然后合理设定Spark集群节点数以及调节Hadoo... 利用Spark平台对电力用户侧的大数据进行分析,提出基于梯度提升树的并行负荷预测方法.首先对历史负荷和天气数据集进行并行化分割处理,并采用特征提取与转换方法获取到预测模型所需的特征向量;然后合理设定Spark集群节点数以及调节Hadoop分布式文件系统(HDFS)分块大小;最后将参数调优后的梯度提升树模型部署到Spark分布式平台上进行训练与预测,并将该模型预测结果与其他预测模型进行精度比较.研究结果表明:通过合理划分HDFS中存储块的大小能有效提高集群对于大数据处理的效率,分布式梯度提升树算法在快速性与准确性上均有比较大的优势,能够满足电力负荷预测的要求. 展开更多
关键词 负荷预测 分布式计算 大数据 梯度提升树 Spark平台
原文传递
城市轨道交通出行的时空特征及影响因素非线性机制——基于梯度提升决策树的成都实证 被引量:26
2
作者 崔叙 喻冰洁 +3 位作者 杨林川 梁源 张凌菲 方翰 《经济地理》 CSSCI CSCD 北大核心 2021年第7期61-72,共12页
以成都市为例,基于地铁刷卡、POI、建成环境等多源大数据,运用GIS、Python、Spark等进行数据处理,分析156个站点客流量、出行时间的空间分异特征,并通过梯度提升决策树(GBDT),解析站域设施数量、建成环境、经济属性等15个因素对客流量... 以成都市为例,基于地铁刷卡、POI、建成环境等多源大数据,运用GIS、Python、Spark等进行数据处理,分析156个站点客流量、出行时间的空间分异特征,并通过梯度提升决策树(GBDT),解析站域设施数量、建成环境、经济属性等15个因素对客流量与出行时间的非线性影响机制。研究发现:①成都市轨道交通客流量具有中间高—两边低的倒U型分布特点,每站日均客流量为1.6万人次;②出行时间随距CBD距离增加逐渐增大,每站乘客平均出行时间为32 min,出行时间的概率密度呈Gamma分布特点;③路网密度、容积率、办公设施、交通设施等对客流量具有非线性正向影响,而房价、距CBD距离与客流量则分别为“凸”形与“凹”形的非线性关系;④距CBD距离、购物数量、办公数量等与出行时间非线性正相关,而交通设施、房价等与其负相关。最后,提出考虑“流量”与“时间”阈值效应的建成环境优化、构建“出行+生活”的轨道通勤圈等规划策略。 展开更多
关键词 城市轨道交通 客流量 出行时间 梯度提升决策树 轨道通勤圈 路网密度 房价
原文传递
基于梯度提升树算法的夏玉米叶面积指数反演 被引量:24
3
作者 张宏鸣 刘雯 +3 位作者 韩文霆 刘全中 宋荣杰 侯贵河 《农业机械学报》 EI CAS CSCD 北大核心 2019年第5期251-259,共9页
为了快速、准确、大范围获取大田夏玉米的叶面积指数(Leaf area index,LAI),基于实地采集的夏玉米LAI和株高,结合同时期的无人机多光谱影像,选择与夏玉米LAI相关性较强的8种植被指数以及株高作为反演LAI的输入变量,采用梯度提升树(Gradi... 为了快速、准确、大范围获取大田夏玉米的叶面积指数(Leaf area index,LAI),基于实地采集的夏玉米LAI和株高,结合同时期的无人机多光谱影像,选择与夏玉米LAI相关性较强的8种植被指数以及株高作为反演LAI的输入变量,采用梯度提升树(Gradient boosting decision tree,GBDT)算法建立植被指数及株高与叶面积指数之间的预测模型,并与支持向量机(Support vector machine,SVM)和随机森林(Random forest,RF)算法建立的模型进行预测精度对比。结果表明,GBDT算法在3个样本组中的LAI预测值与实测值R^2分别为0. 571 0、0. 755 8、0. 644 1,均高于SVM算法(0. 547 2、0. 679 1、0. 616 8)和RF算法(0. 550 5、0. 697 3、0. 629 5);对应的RMSE分别为0. 002 7、0. 001 5、0. 001 6,均低于SVM算法(0. 211 7、0. 152 3、0. 159 7)和RF算法(0. 244 7、0. 214 7、0. 208 0)。该研究为快速准确的大田夏玉米LAI遥感监测提供了技术和方法。 展开更多
关键词 夏玉米 叶面积指数 多光谱 梯度提升树 植被指数
下载PDF
基于BR和GBDT的电力信息通信客服系统多标签文本分类 被引量:20
4
作者 俞学豪 赵子岩 +3 位作者 马应龙 郑蓉蓉 郗子月 马超 《电力系统自动化》 EI CSCD 北大核心 2021年第11期144-151,共8页
现有电力信息通信(ICT)客服系统主要依靠客服坐席员经验,根据电力ICT系统用户报修信息进行故障类型分类判别,存在在线处理及时性较差、准确性不足的问题。针对上述问题,提出了一种基于集成学习的电力ICT客服系统文本数据的多标签文本分... 现有电力信息通信(ICT)客服系统主要依靠客服坐席员经验,根据电力ICT系统用户报修信息进行故障类型分类判别,存在在线处理及时性较差、准确性不足的问题。针对上述问题,提出了一种基于集成学习的电力ICT客服系统文本数据的多标签文本分类方法,实现对电力ICT系统的复杂故障类型进行自动化、高准确率分类识别。首先,针对电力ICT系统故障类型识别准确率偏低且低效的问题,提出了基于二元相关性(BR)和梯度提升决策树(GBDT)集成学习的多标签分类方法,将BR和GBDT有机结合实现自动化、高准确率的故障多标签分类。其次,针对电力ICT客服文本数据的多标签分类训练集难以获取的问题,提出一种面向电力ICT客服文本数据的多标签训练集自动化构建方法,实现了高效的电力ICT客服文本多标签分类。实验表明,BR-GBDT方法可以高效处理电力ICT系统复杂故障类型的多标签分类任务,分类性能也优于BR+逻辑回归(LR)和多标签k最近邻(ML-kNN)等典型的集成学习多标签分类方法。 展开更多
关键词 电力信息通信(ICT)客服 文本挖掘 多标签分类 集成学习 梯度提升决策树
下载PDF
基于梯度提升算法的岩性识别方法 被引量:19
5
作者 王恒 姜亚楠 +3 位作者 张欣 仲鸿儒 陈庆轩 高世臣 《吉林大学学报(地球科学版)》 CAS CSCD 北大核心 2021年第3期940-950,共11页
传统的岩性识别方法如岩屑录井、钻井取心及测井资料解释等技术,对录井质量的依赖程度较高,识别精度与效率低,泛化能力差。随着计算机技术的迅速发展,将测井资料与计算机技术相结合开展岩性研究已成为岩性识别的有效手段。本文提出了一... 传统的岩性识别方法如岩屑录井、钻井取心及测井资料解释等技术,对录井质量的依赖程度较高,识别精度与效率低,泛化能力差。随着计算机技术的迅速发展,将测井资料与计算机技术相结合开展岩性研究已成为岩性识别的有效手段。本文提出了一种基于梯度提升算法XGBoost和LightGBM的岩性识别方法。以苏里格气田苏东41-33区块下碳酸盐岩储层为例进行测试验证,采用该方法结合测井资料中的声波时差、自然伽马、光电吸收截面指数、密度、深侧向电阻率和补偿中子等6种参数进行岩性识别,并与KNN(K近邻分类器)、朴素贝叶斯和支持向量机等传统算法进行对比,结果表明,3种传统算法的岩性识别准确率分别为78.45%、74.43%和78.72%,基于梯度提升算法XGBoost和LightGBM的识别准确率分别达到了98.90%和98.72%,远高于传统算法。 展开更多
关键词 岩性识别 梯度提升算法 碳酸盐岩 决策树
下载PDF
基于梯度推进决策树的日维度交通指数预测模型 被引量:17
6
作者 翁剑成 付宇 +3 位作者 林鹏飞 王晶晶 毛力增 李东岳 《交通运输系统工程与信息》 EI CSCD 北大核心 2019年第2期80-85,93,共7页
城市交通运行监测和预测是掌握交通运行变化特点,制定缓解交通拥堵策略的重要工作,其结果能为公众提供有效的路况信息,亦为政策措施的制定和效果评估提供重要支撑.有别于传统的短时交通预测,本文提出的预测模型不是针对相邻时段的运行... 城市交通运行监测和预测是掌握交通运行变化特点,制定缓解交通拥堵策略的重要工作,其结果能为公众提供有效的路况信息,亦为政策措施的制定和效果评估提供重要支撑.有别于传统的短时交通预测,本文提出的预测模型不是针对相邻时段的运行状态预测,而是更长跨度上,针对日级别高峰时段交通运行状态的预测.构建了包含时间周期、特殊天气、节假日、限行、大型活动等因素的多维度影响因素集;以长期历史交通指数构建数据训练集,提出了基于梯度推进决策树的日维度路网状况预测模型.应用最优模型进行验证,结果表明,模型预测精度可达90%以上,与其他4种回归模型的对比分析也显示,本文所提出的模型在各项评分中均表现最优,说明其更适合于大样本、多因素的回归分析.本文所提出的日维度预测模型对提升城市路网运行质量、缓解交通拥堵具有重要的应用价值. 展开更多
关键词 城市交通 日维度指数预测 梯度提升决策树 路网交通指数 精度验证
下载PDF
计及用电模式的居民负荷梯度提升树分类识别方法 被引量:17
7
作者 王守相 刘天宇 《电力系统及其自动化学报》 CSCD 北大核心 2017年第9期27-33,共7页
居民负荷分类与识别是负荷监测与需求侧管理的研究基础。为了实现居民负荷用电模式的提取和识别,本文对负荷公共数据集运用主成分分析降维并聚类,提出了一种计及典型用电模式的梯度提升树负荷分类识别方法。首先对负荷公共数据集重采样... 居民负荷分类与识别是负荷监测与需求侧管理的研究基础。为了实现居民负荷用电模式的提取和识别,本文对负荷公共数据集运用主成分分析降维并聚类,提出了一种计及典型用电模式的梯度提升树负荷分类识别方法。首先对负荷公共数据集重采样并获得各类负荷能耗特征样本,归一化后通过主成分分析法降维得到特征的主成分。再通过改进K均值聚类法获得各类负荷的典型用电模式,训练梯度提升树并进行超参数优化,对测试集负荷类型进行识别。在公共数据集与实测数据上测试发现,该方法对于居民负荷分类识别有良好效果,能够实现对负荷的分类识别。 展开更多
关键词 公共数据集 负荷用电模式 改进K均值聚类 梯度提升树
下载PDF
集成模糊层级划分的LightGBM食品安全风险预警模型:以肉制品为例 被引量:16
8
作者 高亚男 王文倩 王建新 《食品科学》 EI CAS CSCD 北大核心 2021年第1期197-207,共11页
在食品安全风险管理中,风险点精确定位能从源头解决食品安全问题,对食品安全风险评估和预警具有关键意义。近年来,食品行业信息化的发展使得原料生产、加工、仓储运输、抽检等环节积累了大量数据,并亟待开发利用。而现存的风险预警方法... 在食品安全风险管理中,风险点精确定位能从源头解决食品安全问题,对食品安全风险评估和预警具有关键意义。近年来,食品行业信息化的发展使得原料生产、加工、仓储运输、抽检等环节积累了大量数据,并亟待开发利用。而现存的风险预警方法存在风险细粒度难以衡量、数据利用率低、人工成本高等问题。因此,本研究首先对食品安全相关数据进行归纳分类并描述数据特征,作为后续处理的基础。为了充分利用食品安全数据海量、高维的特点,本研究使用先验风险概率与模糊层级划分相结合的方法对不同类型的属性计算模糊综合风险值,作为预测模型标签值。由LightGBM和专家干预策略结合产生的预测模型可对风险值进行预测和校正。基于此,依托肉制品和水产品数据的实验详细阐述了方法的使用流程,并进一步验证了方法优越性和规律合理性。研究中产出的风险分析结果,包括风险值和属性重要程度分布等可以为决策者提供有价值的决策依据。 展开更多
关键词 食品安全 风险预警 模糊层级划分 梯度提升树 LightGBM
下载PDF
基于梯度提升决策树的露天矿边坡多源信息融合与稳定性预测 被引量:14
9
作者 张凌凡 陈忠辉 +3 位作者 周天白 年庚乾 王建明 周子涵 《煤炭学报》 EI CAS CSCD 北大核心 2020年第S01期173-180,共8页
准确预测边坡稳定性对于减少滑坡次数和降低边坡维护成本至关重要。岩质边坡作为一种典型的岩体工程,在灾害的孕育和发展过程中,工程岩体内部会产生新的裂隙,或旧裂隙发展。随着岩体内部裂隙的发展,岩体物理参数不断发生变化,因此通过... 准确预测边坡稳定性对于减少滑坡次数和降低边坡维护成本至关重要。岩质边坡作为一种典型的岩体工程,在灾害的孕育和发展过程中,工程岩体内部会产生新的裂隙,或旧裂隙发展。随着岩体内部裂隙的发展,岩体物理参数不断发生变化,因此通过监测边坡岩体的物理参数变化对岩质边坡稳定性进行预判已成为一种重要的预测手段。而传统的单一监测信息虽然能够直观地反映滑坡趋势,但其存在局部性和滞后性,并不能完整反映边坡所处的状态。基于涵盖了边坡内部和表面的微震、应力和位移等3种异构信息,提出一种利用多源监测信息融合技术对边坡进行稳定性预测分析的方法:针对大孤山露天矿边坡的实际地质条件,通过有限元强度折减法得到边坡不同状态下监测信息的变化规律,并利用梯度提升决策树(GBDT)模型对监测信息进行融合,建立了边坡稳定性预测的非线性模型,并与不同融合算法进行对比,得到如下结论:(1)将梯度提升决策树和有限元强度折减法相结合,可以实现边坡的位移、应力和微震等异构信息的融合,并以大孤山铁矿西北帮边坡实际监测数据验证了所提方法的有效性;(2)与其他融合算法进行比较表明,GBDT模型在预测精度和模型解释能力方面具有优越的性能,可以很好地识别复杂的非线性关系,适用于露天矿边坡安全系数的预测;(3)基于GBDT算法,可以计算不同监测信息的变化对边坡安全系数的影响,研究表明,坡顶的位移变化和边坡内部微震数对于边坡的稳定性预测占主导作用。 展开更多
关键词 岩质边坡 安全系数 多源异构信息融合 强度折减法 梯度提升决策树
下载PDF
建成环境对城市停车需求影响的非线性模型 被引量:14
10
作者 陈坚 刘柯良 +1 位作者 邸晶 彭涛 《交通运输系统工程与信息》 EI CSCD 北大核心 2021年第4期197-203,共7页
为精细化把握城市建设项目在微观空间尺度下的停车需求规律,从空间视角探究停车需求与建成环境之间的关系。通过高峰小时建筑物单位面积的停车生成数表征停车需求,以土地利用混合度、路网密度、公交服务水平等9个因子描述建成环境,分别... 为精细化把握城市建设项目在微观空间尺度下的停车需求规律,从空间视角探究停车需求与建成环境之间的关系。通过高峰小时建筑物单位面积的停车生成数表征停车需求,以土地利用混合度、路网密度、公交服务水平等9个因子描述建成环境,分别构建建成环境对停车需求影响的普通最小二乘(Ordinary Least Squares,OLS)模型与梯度提升迭代决策树(Gradient Boosting Decision Tree,GBDT)模型。以保定市主城区停车调查数据中的商业类配建停车场为对象,基于停车调查数据、兴趣点数据(Point of Interst,POI)、道路网络数据等多源异构数据进行模型实证分析。结果表明,考虑非线性效应的GBDT模型比OLS模型具有更好的拟合度。从影响贡献度来看,配建指标(18.92%)与区位(15.23%)是影响停车需求的最重要建成环境因素,交叉口密度(5.19%)贡献度最小;在非线性关系方面,建成环境因子与停车需求均具有非线性关系与阈值效应,除交叉口密度及人口密度与停车需求呈现U型关系,其余因素与停车需求的关系整体上保持正相关或负相关。 展开更多
关键词 城市交通 建成环境 停车需求 梯度提升迭代决策树 非线性关系
下载PDF
基于梯度提升决策树的电力短期负荷预测模型 被引量:13
11
作者 毕云帆 张健 +2 位作者 胥晓晖 孙文慧 张智晟 《青岛大学学报(工程技术版)》 CAS 2018年第3期70-75,共6页
为提高短期负荷预测的预测精度,本文基于梯度提升决策树,对电力系统短期负荷预测模型进行研究。梯度提升决策树是通过将梯度提升机和决策树相结合,用大量的历史负荷和气象等数据进行训练,在损失函数负梯度的方向上生成新的决策树,不断... 为提高短期负荷预测的预测精度,本文基于梯度提升决策树,对电力系统短期负荷预测模型进行研究。梯度提升决策树是通过将梯度提升机和决策树相结合,用大量的历史负荷和气象等数据进行训练,在损失函数负梯度的方向上生成新的决策树,不断优化预测结果。以某地区电力负荷数据为例,对比传统的BP-NN和RBF-NN预测模型。研究结果表明,与其它两个模型相比,基于梯度提升决策树的预测模型对于工作日负荷的预测误差分别降低了1.56%和1.73%,对于休息日负荷的预测误差分别降低了1.60%和1.53%,预测精度得到明显提高。而且该模型不仅可以克服易陷入局部极小值问题,还有效地减小了多因素之间关系互嵌、信息冗余对预测精度的不良影响,验证了该模型研究的合理性和有效性。 展开更多
关键词 梯度提升决策树 决策树 短期负荷预测 电力系统
下载PDF
基于梯度提升决策树的电力电子电路故障诊断 被引量:13
12
作者 陈宏 邓芳明 +1 位作者 吴翔 付智辉 《测控技术》 CSCD 2017年第5期9-12,20,共5页
针对电力电子电路的常见故障类型,提出一种利用主元分析(PCA)提取电路状态的故障信息特征和基于梯度提升决策树(GBDT)分类的电力电子电路故障诊断方法。首先讨论利用PCA进行特征提取的步骤以及GBDT的分类原理;然后研究了基于PCA特征提... 针对电力电子电路的常见故障类型,提出一种利用主元分析(PCA)提取电路状态的故障信息特征和基于梯度提升决策树(GBDT)分类的电力电子电路故障诊断方法。首先讨论利用PCA进行特征提取的步骤以及GBDT的分类原理;然后研究了基于PCA特征提取以及GBDT分类的电力电子电路故障诊断流程;最后利用三相桥式整流电路进行了建模、仿真、验证,实验结果表明,采用该方法进行电力电子电路故障诊断相比其他方法在低维空间具有更高的诊断准确率和更佳的样本泛化能力。 展开更多
关键词 电力电子电路 故障诊断 PCA 梯度提升决策树
下载PDF
面向高维特征和多分类的分布式梯度提升树 被引量:13
13
作者 江佳伟 符芳诚 +1 位作者 邵蓥侠 崔斌 《软件学报》 EI CSCD 北大核心 2019年第3期784-798,共15页
梯度提升树算法由于其高准确率和可解释性,被广泛地应用于分类、回归、排序等各类问题.随着数据规模的爆炸式增长,分布式梯度提升树算法成为研究热点.虽然目前已有一系列分布式梯度提升树算法的实现,但是它们在高维特征和多分类任务上... 梯度提升树算法由于其高准确率和可解释性,被广泛地应用于分类、回归、排序等各类问题.随着数据规模的爆炸式增长,分布式梯度提升树算法成为研究热点.虽然目前已有一系列分布式梯度提升树算法的实现,但是它们在高维特征和多分类任务上性能较差,原因是它们采用的数据并行策略需要传输梯度直方图,而高维特征和多分类情况下梯度直方图的传输成为性能瓶颈.针对这个问题,研究更加适合高维特征和多分类的梯度提升树的并行策略,具有重要的意义和价值.首先比较了数据并行与特征并行策略,从理论上证明特征并行更加适合高维和多分类场景.根据理论分析的结果,提出了一种特征并行的分布式梯度提升树算法FP-GBDT.FP-GBDT设计了一种高效的分布式数据集转置算法,将原本按行切分的数据集转换为按列切分的数据表征;在建立梯度直方图时,FP-GBDT使用一种稀疏感知的方法来加快梯度直方图的建立;在分裂树节点时,FP-GBDT设计了一种比特图压缩的方法来传输数据样本的位置信息,从而减少通信开销.通过详尽的实验,对比了不同并行策略下分布式梯度提升树算法的性能,首先验证了FP-GBDT提出的多种优化方法的有效性;然后比较了FP-GBDT与XGBoost的性能,在多个数据集上验证了FP-GBDT在高维特征和多分类场景下的有效性,取得了最高6倍的性能提升. 展开更多
关键词 梯度提升树 数据并行 特征并行 系统实现 算法比较
下载PDF
梯度提升树算法在陕北风电场短期风电功率预测中的应用 被引量:12
14
作者 孙川永 彭友兵 +4 位作者 刘志亮 郝赢玺 吴怡 东琦 郑永恒 《电网与清洁能源》 北大核心 2022年第4期124-128,134,共6页
为了对地形和气候条件复杂的陕北风电场短期风电功率进行准确预测,通过将(weather research and forecasting,WRF)模式输出结果和同期实测风电功率资料相结合,利用梯度提升树算法进行预报气象场和实测风电功率之间的统计关系分析,从而... 为了对地形和气候条件复杂的陕北风电场短期风电功率进行准确预测,通过将(weather research and forecasting,WRF)模式输出结果和同期实测风电功率资料相结合,利用梯度提升树算法进行预报气象场和实测风电功率之间的统计关系分析,从而建立了一套陕北风电场短期风电功率预测模型。以陕北靖边某风电场为例,预测结果表明:所提模型年平均预测准确率伟15.7%;月平均归一化均方根误差在20%以下。模型对风电场风电功率预测精度较好。 展开更多
关键词 梯度提升树算法 风电功率 WRF
下载PDF
集成土壤-环境关系与机器学习的干旱区土壤属性数字制图 被引量:13
15
作者 张振华 丁建丽 +4 位作者 王敬哲 葛翔宇 王瑾杰 田美玲 赵启东 《中国农业科学》 CAS CSCD 北大核心 2020年第3期563-573,共11页
【目的】土壤属性的空间分布是影响农业生产力、土地管理和生态安全的重要因素。通过土壤环境耦合关系,在机器学习算法框架下,定量预测出干旱区土壤酸碱度(pH)、土壤盐分含量(Soil Salt Content,SSC)与土壤有机质(Soil Organic Matter, ... 【目的】土壤属性的空间分布是影响农业生产力、土地管理和生态安全的重要因素。通过土壤环境耦合关系,在机器学习算法框架下,定量预测出干旱区土壤酸碱度(pH)、土壤盐分含量(Soil Salt Content,SSC)与土壤有机质(Soil Organic Matter, SOM)3种土壤属性的空间分布,为干旱区农业生产和生态安全提供科学依据。【方法】在渭干河-库车河绿洲干旱区于2017年7月设计采集典型表层(0-20 cm)土壤样品82个,依据土壤-环境之间的关系,集成DEM数据和Landsat 8数据提取出32种环境协变量,利用栅格重采样将提取出的32种变量重采样为90 m空间分辨率并转换为Grid格式参与建模。借助梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型依次对3类土壤属性的32种环境协变量进行重要性排序,并通过均方根误差(Root Mean SquareError,RMSE)界定出协变量重要性阈值点,从而筛选出参与3类土壤属性制图的环境协变量。进而运用随机森林(Random Forest, RF)、Bagging和Cubist 3种非线性模型建模,并引入多元线性回归模型(Multiple Linear Regression,MLR)进行对比分析,选出最优模型并绘制出90 m分辨率新疆渭干河-库车河绿洲干旱区pH、SSC与SOM 3种土壤属性图。【结果】梯度提升决策树能有效筛选出重要协变量,高程(Elevation)、剖面曲率(Profile Curvature)、差值植被指数(Difference Vegetation Index)、扩展增强型植被指数(Extended Normalized Difference Vegetation Index)、调整土壤亮度植被指数(Modified Soil Adjusted Vegetation Index)、盐分指数S1(Salinity Index S1)以及盐分指数S6 (Salinity Index S6) 7类环境变量均参与3类土壤属性建模,其中SSC遴选出参与建模协变量15种,pH和SOM则均为17种,且遥感指标在预测土壤属性图中起到强大的作用。机器学习3种算法的结果均优于MLR。通过3种非线性模型对比发现,随机森林在3种土壤属性中均表现最佳。在随机森林预测� 展开更多
关键词 土壤属性 环境协变量 数字土壤制图 机器学习 梯度提升决策树模型 随机森林模型 Bagging模型 Cubist模型
下载PDF
建成环境对居民通勤方式选择的影响——以武汉市城中村为例 被引量:12
16
作者 仝照民 安睿 刘耀林 《地理科学进展》 CSSCI CSCD 北大核心 2021年第12期2048-2060,共13页
城中村作为带着农民特色和阶级混杂重塑的空间,为弱势劳动群体融入城市化体系、实现反资本而不反市场的城镇化进程提供了保障。探讨建成环境对居民通勤方式选择的影响机制,开展城中村建成环境改造,对于解决弱势群体通勤和就业困难意义... 城中村作为带着农民特色和阶级混杂重塑的空间,为弱势劳动群体融入城市化体系、实现反资本而不反市场的城镇化进程提供了保障。探讨建成环境对居民通勤方式选择的影响机制,开展城中村建成环境改造,对于解决弱势群体通勤和就业困难意义重大。论文基于武汉市2018年LBS(Location Based Services)数据,以公共交通通勤方式选择作为二元分类因变量,采用梯度提升决策树(gradient boosting decision tree,GBDT)分析建成环境与城中村居民通勤方式选择的非线性关系与阈值效应,结果显示:普遍长距离通勤的城中村居民对公共交通系统依赖性强,建成环境的非线性影响和阈值效应明显,弥补了传统线性模型在可解释性上的不足;其中公交站可达性预测贡献度最大(19.89%),阈值分别在300 m和1000 m左右,在城中村改造时应尽量满足直线距离300 m公交站点可达,保证1000 m内存在公交线路,其余变量也有相似的可解释性。研究得到的建成环境影响的优先层次和最有效的空间属性范围将为提升城中村居民就业和通勤公平,实现区域包容、协调的城镇化提供参考。 展开更多
关键词 城中村 通勤方式选择 梯度提升决策树 非线性 阈值效应
原文传递
基于梯度提升决策树的多尺度建成环境对小汽车拥有的影响 被引量:11
17
作者 尹超英 邵春福 +2 位作者 黄兆国 王晓全 王晟由 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第3期572-577,共6页
为量化不同空间尺度建成环境对居民小汽车拥有行为的影响,构建了可捕捉自变量影响程度的梯度提升迭代决策树模型。同时,考虑了城市层和社区层两个尺度建成环境特征对小汽车拥有行为的影响,并以中国劳动力动态调查的全国抽样数据为例开... 为量化不同空间尺度建成环境对居民小汽车拥有行为的影响,构建了可捕捉自变量影响程度的梯度提升迭代决策树模型。同时,考虑了城市层和社区层两个尺度建成环境特征对小汽车拥有行为的影响,并以中国劳动力动态调查的全国抽样数据为例开展了实证研究。结果表明:3个层面变量中,个体层社会经济属性是影响小汽车拥有行为的最重要因素,影响程度为53.24%,而社区层建成环境特征影响程度(30.45%)高于城市层建成环境特征(16.31%);对于各自变量而言,家庭收入是影响居民小汽车拥有行为的最重要因素(31.66%),且两个层面的建成环境特征对小汽车拥有行为的影响程度均高于1.5%。因此,为减少居民小汽车拥有量的增长,有必要同时从城市层和社区层两个层面优化城市建成环境。 展开更多
关键词 交通运输系统工程 建成环境 小汽车拥有 空间尺度 梯度提升迭代决策树
原文传递
老年人地铁出行时空特征及与建成环境非线性关系——以武汉市为例 被引量:8
18
作者 杨红 申犁帆 +2 位作者 胡议文 张远航 彭建东 《地理科学进展》 CSCD 北大核心 2023年第3期491-504,共14页
人口老龄化的加剧对城市交通提出了新的挑战,提供适老化的轨道交通服务是应对人口老龄化的有效措施。现有研究强调了建成环境对居民地铁出行行为的影响,但老年人特殊的生理特征使其更易受建成环境的影响,现有研究结论是否适用于老年群... 人口老龄化的加剧对城市交通提出了新的挑战,提供适老化的轨道交通服务是应对人口老龄化的有效措施。现有研究强调了建成环境对居民地铁出行行为的影响,但老年人特殊的生理特征使其更易受建成环境的影响,现有研究结论是否适用于老年群体尚不清楚。论文以武汉市为例,基于轨道交通刷卡数据等多源大数据,利用机器学习中的梯度提升决策树模型,探索站域建成环境对老年人工作日及周末轨道交通出行行为的影响。研究发现:(1)老年人地铁出行距离从工作日到周末呈现增长趋势,但老年人出行频率周末低于工作日;(2)老年人出行时长集中在45 min以内,跨江出行较少,目的地集中于同区滨江公共服务设施完善的区域,且出行时刻与城市高峰呈现出明显的错峰出行特征;(3)“建筑容积率”与“购物中心数量”是正向影响老年人轨道交通客流量最重要的变量,在工作日与周末呈现类似的趋势;(4)所有建成环境变量对老年人地铁客流展现出显著的非线性效应,当建筑容积率达到2.0、购物中心数为18个时,对老年人地铁客流吸引力最大;(5)与其他人群研究结论不同的是,“公交站点密度”与“土地利用混合度”对老年人轨道交通客流量的影响并不显著。研究结果可以更好地理解老年人地铁出行时空特征及建成环境的影响,对于应对人口老龄化具有十分积极的作用。 展开更多
关键词 老年人出行行为 建成环境 城市轨道交通 地铁客流 梯度提升决策树 武汉市
原文传递
建成环境与青少年步行通学的非线性关系——基于极限梯度提升模型的研究 被引量:11
19
作者 刘吉祥 肖龙珠 +2 位作者 周江评 郭源园 杨林川 《地理科学进展》 CSSCI CSCD 北大核心 2022年第2期251-263,共13页
步行不仅是一种原始、便捷的交通方式,同时也是体力活动的重要组成部分,对于提升公共健康、改善交通拥堵和减轻污染排放等均有重要的积极意义。然而,包括青少年在内的城市居民步行比例持续下降,体力活动水平日益降低。青少年正处于身心... 步行不仅是一种原始、便捷的交通方式,同时也是体力活动的重要组成部分,对于提升公共健康、改善交通拥堵和减轻污染排放等均有重要的积极意义。然而,包括青少年在内的城市居民步行比例持续下降,体力活动水平日益降低。青少年正处于身心发育的关键时期,体力活动的缺乏将导致肥胖等慢性非传染病,为其将来发展埋下巨大的健康隐患。如何通过对建成环境进行干预,提高青少年步行通学比例,从而提高其体力活动水平,引起了不少学者的关注,取得了较为丰硕的研究成果。然而,既有研究存在以下不足:第一,大部分已有研究以西方城市为案例,很少研究关注中国城市;第二,绝大部分既有研究基于线性或广义线性的假设考察建成环境对步行通学的影响,很少研究关注两者之间的非线性关系。鉴于此,论文以厦门岛为案例,基于极限梯度提升模型,考察青少年家和学校建成环境对其步行通学的影响。研究发现:(1)通学距离是影响青少年步行通学最重要的因素,其相对贡献接近4成(39.99%);(2)建成环境(以5Ds模型表征)作用显著,家、校建成环境相对贡献合计达36.28%,超过社会经济属性(23.73%),离市中心的距离和道路交叉口密度等变量具有重要作用;(3)全部建成环境变量和主要社会经济属性变量均与青少年步行上学存在非线性关系,且存在明显的阈值效应。研究为城市决策者关于提高青少年步行通学倾向提供了丰富的政策启示。 展开更多
关键词 建成环境 步行通学 非线性 梯度提升决策树 机器学习 厦门岛
原文传递
两类集成学习算法在中长期径流预报中的应用 被引量:11
20
作者 许斌 杨凤根 郦于杰 《水力发电》 北大核心 2020年第4期21-24,34,共5页
将前期130项遥相关气候指数作为预报因子,利用分类回归树算法(CART)作为基学习器,引入基于Bagging算法的随机森林模型(RF)与基于Boosting算法的梯度提升树模型(GBDT)的两类集成学习算法作为强学习预报模型,实现对丹江口水库未来1个月、... 将前期130项遥相关气候指数作为预报因子,利用分类回归树算法(CART)作为基学习器,引入基于Bagging算法的随机森林模型(RF)与基于Boosting算法的梯度提升树模型(GBDT)的两类集成学习算法作为强学习预报模型,实现对丹江口水库未来1个月、1季度及1年3类径流序列的滚动预报,并通过相对误差绝对值的平均值(MAPE)、Nash效率系数(NSE)、相对均方根误差(RRMSE)、合格率(QR)等指标进行对比分析。研究结果表明,两类模型在验证期模拟精度相似,结果相仿,误差分布较均匀,可进一步用于集合径流预报;随着预报对象量级的增加,径流序列的不稳定性与极值序列分布的不均匀性得以降低,预报的准确度、可靠度以及稳定度得到提高。 展开更多
关键词 中长期径流预报 机器学习 集成学习 分类回归树 随机森林 梯度提升树
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部