期刊文献+
共找到6,093篇文章
< 1 2 250 >
每页显示 20 50 100
随机森林模型在分类与回归分析中的应用 被引量:350
1
作者 李欣海 《应用昆虫学报》 CAS CSCD 北大核心 2013年第4期1190-1197,共8页
随机森林(random forest)模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法。它通过对大量分类树的汇总提高了模型的预测精度,是取代神经网络等传统机器学习方法的新的模型。随机森林的运算速度很快,在处理大数据时表现优异... 随机森林(random forest)模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法。它通过对大量分类树的汇总提高了模型的预测精度,是取代神经网络等传统机器学习方法的新的模型。随机森林的运算速度很快,在处理大数据时表现优异。随机森林不需要顾虑一般回归分析面临的多元共线性的问题,不用做变量选择。现有的随机森林软件包给出了所有变量的重要性。另外,随机森林便于计算变量的非线性作用,而且可以体现变量间的交互作用(interaction)。它对离群值也不敏感。本文通过3个案例,分别介绍了随机森林在昆虫种类的判别分析、有无数据的分析(取代逻辑斯蒂回归)和回归分析上的应用。案例的数据格式和R语言代码可为研究随机森林在分类与回归分析中的应用提供参考。 展开更多
关键词 随机森林 分类树 判别分析 回归 机器学习
原文传递
基于随机森林的特征选择算法 被引量:247
2
作者 姚登举 杨静 詹晓娟 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2014年第1期137-141,共5页
提出了一种基于随机森林的封装式特征选择算法RFFS,以随机森林算法为基本工具,以分类精度作为准则函数,采用序列后向选择和广义序列后向选择方法进行特征选择。在UCI数据集上的对比实验结果表明,RFFS算法在分类性能和特征子集选择两方... 提出了一种基于随机森林的封装式特征选择算法RFFS,以随机森林算法为基本工具,以分类精度作为准则函数,采用序列后向选择和广义序列后向选择方法进行特征选择。在UCI数据集上的对比实验结果表明,RFFS算法在分类性能和特征子集选择两方面具有较好的性能。 展开更多
关键词 人工智能 随机森林 特征选择 封装式
下载PDF
基于灰色投影改进随机森林算法的电力系统短期负荷预测 被引量:178
3
作者 吴潇雨 和敬涵 +1 位作者 张沛 胡骏 《电力系统自动化》 EI CSCD 北大核心 2015年第12期50-55,共6页
针对短期负荷预测领域传统的机器学习算法(如人工神经网络、支持向量机等)存在的诸如泛化性能不强、参数和模型结构确定困难等问题,将随机森林回归算法引入短期负荷预测领域。同时应用投影原理改进了传统的灰色关联相似日选取算法,提出... 针对短期负荷预测领域传统的机器学习算法(如人工神经网络、支持向量机等)存在的诸如泛化性能不强、参数和模型结构确定困难等问题,将随机森林回归算法引入短期负荷预测领域。同时应用投影原理改进了传统的灰色关联相似日选取算法,提出了一种基于灰色投影改进随机森林算法的电力系统短期负荷预测组合方法。基于灰色投影的相似日选取方法,采用灰色关联度判断矩阵表征历史样本与待预测日影响因素间的关联关系,并用熵权法确立影响因素的权重对判断矩阵加权,最后利用各个样本关联度投影值排序得到相似日集合。采用随机森林算法建立预测模型,利用灰色投影筛选出的相似日样本集合训练模型,最后输入预测日特征向量(天气预报数值、日类型等)完成预测。以浙江电网某县级市的负荷数据作为实际算例,并将上述方法与支持向量机方法以及未作灰色投影改进的随机森林算法进行对比。实验结果表明,新方法具有较高的预测精度和鲁棒性。 展开更多
关键词 短期负荷预测 相似日 灰色投影法 随机森林 Bagging抽样方法 袋外估计
下载PDF
随机森林算法基本思想及其在生态学中的应用--以云南松分布模拟为例 被引量:140
4
作者 张雷 王琳琳 +3 位作者 张旭东 刘世荣 孙鹏森 王同立 《生态学报》 CAS CSCD 北大核心 2014年第3期650-659,共10页
通常来讲,生态学者对于解释生态关系、描述格局和过程、进行空间或时间预测比较感兴趣。这些工作可以通过模拟输出值(响应)与一些特征值(即解释变量)的关系来实现。然而,生态数据模拟遇到了挑战,这是因为响应变量和预测变量可能是连续... 通常来讲,生态学者对于解释生态关系、描述格局和过程、进行空间或时间预测比较感兴趣。这些工作可以通过模拟输出值(响应)与一些特征值(即解释变量)的关系来实现。然而,生态数据模拟遇到了挑战,这是因为响应变量和预测变量可能是连续变量或离散变量。需要解释的生态关系通常是非线性的,并且解释变量之间具有复杂的相互作用关系。响应变量和解释变量存在缺失值并不是不常有的现象,奇异值也经常出现在生态数据中。此外,生态学者通常希望生态模型即要易于建立又易要于解释。通常是利用多种统计方法来分析处理各种各样情景中出现的独特的生态问题,这些模型包括(多元)逻辑回归、线性模型、生存模型、方差分析等等。随机森林是一个可以处理所有这些问题的有效方法。随机森林可以用来做分类、聚类、回归和生存分析、评估变量的重要性、检测数据中的奇异值、对缺失数据进行插补等。鉴于随机森林本身在算法上的优势,将就随机森林在生态学中的应用进行总结,对建模过程进行概述,并以云南松分布模拟研究为例,对其主要功能特点进行案例展示。通过对随机森林的一般术语、概念和建模思想进行介绍,有利于读者掌握本方法的应用本质,可以预见随机森林在生态学研究中将得到更多的应用和发展。 展开更多
关键词 随机森林 分类回归树 变量重要性 多维数据 物种分布模拟
下载PDF
随机森林算法研究综述 被引量:124
5
作者 吕红燕 冯倩 《河北省科学院学报》 CAS 2019年第3期37-41,共5页
随机森林算法是一种基于决策树的集成学习算法,具有很高的预测准确率,对异常值和噪声具有很好的容忍度,而且不容易出现过拟合,在医学等领域具有广泛的应用。首先介绍了随机森林算法的原理和性质,然后综述了近几年来随机森林算法的改进... 随机森林算法是一种基于决策树的集成学习算法,具有很高的预测准确率,对异常值和噪声具有很好的容忍度,而且不容易出现过拟合,在医学等领域具有广泛的应用。首先介绍了随机森林算法的原理和性质,然后综述了近几年来随机森林算法的改进研究及应用领域,最后对随机森林算法研究做出了总结。 展开更多
关键词 随机森林 集成学习 机器学习 决策树
下载PDF
Sentinel-2影像多特征优选的黄河三角洲湿地信息提取 被引量:104
6
作者 张磊 宫兆宁 +2 位作者 王启为 金点点 汪星 《遥感学报》 EI CSCD 北大核心 2019年第2期313-326,共14页
以北方典型河口湿地—黄河三角洲湿地为研究区,采用在特征选择和分类提取等方面具有明显优势的随机森林算法,对研究区内的湿地信息进行提取。首先基于多时相、光谱信息丰富的Sentinel-2数据生成4类不同的特征变量,包括光谱特征、植被指... 以北方典型河口湿地—黄河三角洲湿地为研究区,采用在特征选择和分类提取等方面具有明显优势的随机森林算法,对研究区内的湿地信息进行提取。首先基于多时相、光谱信息丰富的Sentinel-2数据生成4类不同的特征变量,包括光谱特征、植被指数和水体指数、红边指数、纹理特征;再根据以上特征构建6种不同的提取方案,对黄河三角洲湿地信息进行提取并验证不同方案的提取精度,旨在选择最佳方案改善湿地信息提取的效果。结果表明:(1)有效地使用多种特征变量是提高湿地信息提取的关键,就不同特征对湿地信息提取的贡献率而言,红边指数>植被指数和水体指数>光谱特征>纹理特征;(2)基于随机森林算法优选的特征变量提取效果最佳,总体精度高达90.93%,Kappa系数为0.90,表明随机森林算法可以有效地进行特征选择,在特征变量数据挖掘的同时,仍能保证湿地信息提取的精度,提高运行效率。本研究为湿地信息提取在数据源选择、特征选择和方法选择方面提供了一种新思路、方法和技术手段。 展开更多
关键词 河口湿地 信息提取 Sentinel-2 随机森林 特征选择 红边指数 多时相数据
原文传递
结合深度学习和随机森林的电力设备图像识别 被引量:100
7
作者 李军锋 王钦若 李敏 《高电压技术》 EI CAS CSCD 北大核心 2017年第11期3705-3711,共7页
为了解决电力系统海量非结构化图像数据智能化分析和识别这一问题,提出了一种结合深度学习和随机森林的电力系统关键电力设备图像识别方法。在特征提取方面,通过卷积神经网络提取了电力设备图像的特征;在识别算法方面,借鉴传统机器学习... 为了解决电力系统海量非结构化图像数据智能化分析和识别这一问题,提出了一种结合深度学习和随机森林的电力系统关键电力设备图像识别方法。在特征提取方面,通过卷积神经网络提取了电力设备图像的特征;在识别算法方面,借鉴传统机器学习方法的优势,提出了结合深度学习的随机森林分类方法。使用8 500幅电力设备图像对该方法进行了测试。研究结果表明:对于绝缘子、变压器、断路器、输电线电杆和输电线铁塔这5种电力设备,该方法的平均识别准确率达到了89.6%,比常规卷积神经网络分类器和传统随机森林分类器的平均识别准确率分别高出了6.8%和12.6%。该方法为海量非结构化电力设备图像智能化分析提供了一种新的解决办法。 展开更多
关键词 电力设备 图像识别 智能分析 深度学习 随机森林 卷积神经网络
下载PDF
基于随机森林的洪灾风险评价模型及其应用 被引量:96
8
作者 赖成光 陈晓宏 +2 位作者 赵仕威 王兆礼 吴旭树 《水利学报》 EI CSCD 北大核心 2015年第1期58-66,共9页
依据流域灾害系统理论,在综合考虑致灾因子、孕灾环境和承灾体的基础上选取10个评价指标,构建了基于随机森林(RF)智能算法的洪灾风险评价模型,借助GIS技术以100 m×100 m栅格为计算单元,对东江流域进行了评价。结果表明:该模型设置... 依据流域灾害系统理论,在综合考虑致灾因子、孕灾环境和承灾体的基础上选取10个评价指标,构建了基于随机森林(RF)智能算法的洪灾风险评价模型,借助GIS技术以100 m×100 m栅格为计算单元,对东江流域进行了评价。结果表明:该模型设置参数少,且无需设定指标权重和分级标准,实现过程较简单;RF模型拥有指标重要性评估功能,方便分析各评价指标对洪灾风险的贡献度;模型的评判精度、分级结果均比支持向量机(SVM)的结果更好,数据挖掘能力更强;与GIS技术结合,便于分析洪灾风险的空间格局及内在规律,具有较好的适用性,为流域洪灾风险评价提供了新的思路。 展开更多
关键词 洪灾风险 随机森林 支持向量机 东江流域
原文传递
基于优化随机森林模型的滑坡易发性评价 被引量:94
9
作者 刘坚 李树林 陈涛 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2018年第7期1085-1091,共7页
以三峡库区沙镇溪镇-泄滩乡为研究区,探索基于最短描述长度原则的信息增益法对滑坡连续型因子进行离散的效果,计算皮尔森系数去除高相关因子。利用信息量法预测的极低、低易发区随机抽取非滑坡样本点。通过迭代计算袋外误差估计确定较... 以三峡库区沙镇溪镇-泄滩乡为研究区,探索基于最短描述长度原则的信息增益法对滑坡连续型因子进行离散的效果,计算皮尔森系数去除高相关因子。利用信息量法预测的极低、低易发区随机抽取非滑坡样本点。通过迭代计算袋外误差估计确定较优的随机特征及其数目,将优化后的随机森林对研究区滑坡进行易发性评价,并与逻辑回归等方法进行比较。绘制各算法预测结果的接收灵敏度曲线,其中优化后的随机森林预测结果的曲线下面积较高,达91.8%,表明优化随机森林模型在滑坡易发性评价中具有较高的预测能力。 展开更多
关键词 三峡库区 滑坡 离散化 随机森林 优化 易发性评价
原文传递
基于改进网格搜索算法的随机森林参数优化 被引量:87
10
作者 温博文 董文瀚 +1 位作者 解武杰 马骏 《计算机工程与应用》 CSCD 北大核心 2018年第10期154-157,共4页
随机森林是一种有效的集成学习算法,被广泛应用于模式识别中。为了得到更高的预测精度,需要对参数进行优化。提出了一种基于袋外数据估计的分类误差,利用改进的网格搜索算法对随机森林算法中的决策树数量和候选分裂属性数进行参数优化... 随机森林是一种有效的集成学习算法,被广泛应用于模式识别中。为了得到更高的预测精度,需要对参数进行优化。提出了一种基于袋外数据估计的分类误差,利用改进的网格搜索算法对随机森林算法中的决策树数量和候选分裂属性数进行参数优化的随机森林算法。仿真结果表明,利用该方法优化得到的参数都能够使随机森林的分类效果得到一定程度的提高。 展开更多
关键词 随机森林 袋外估计 网格搜索 参数优化
下载PDF
基于网络搜索数据的房地产价格预测 被引量:75
11
作者 董倩 孙娜娜 李伟 《统计研究》 CSSCI 北大核心 2014年第10期81-88,共8页
本文以北京、上海、天津、重庆等16个大中城市的二手房价格和新房价格为研究对象,以来自我国最大搜索引擎的百度搜索指数为数据基础,使用6种计量模型分别对16个城市的二手房价格和新房价格进行了拟合和预测,得到预测二手房和新房价格变... 本文以北京、上海、天津、重庆等16个大中城市的二手房价格和新房价格为研究对象,以来自我国最大搜索引擎的百度搜索指数为数据基础,使用6种计量模型分别对16个城市的二手房价格和新房价格进行了拟合和预测,得到预测二手房和新房价格变动情况的最优模型。结果显示:网络搜索数据不但能够较好地预测房价指数,而且能够分析经济主体行为的趋势与规律,有一定的时效性。预测的月度房地产价格能够比官方数据发布提前约两周时间。 展开更多
关键词 网络搜索数据 房地产价格预测 交叉验证 支持向量机 随机森林
下载PDF
基于随机森林的滑坡空间易发性评价:以三峡库区湖北段为例 被引量:74
12
作者 吴润泽 胡旭东 +2 位作者 梅红波 贺金勇 杨建英 《地球科学》 EI CAS CSCD 北大核心 2021年第1期321-330,共10页
滑坡空间易发性分析有助于开展滑坡防灾减灾工作,训练有效的滑坡预测模型在其中扮演重要角色.以三峡库区湖北段为研究区,选取高程、坡度、斜坡结构、土地利用类型、岩土体类型、断裂距离、路网距离、河网距离、以及归一化植被指数这9个... 滑坡空间易发性分析有助于开展滑坡防灾减灾工作,训练有效的滑坡预测模型在其中扮演重要角色.以三峡库区湖北段为研究区,选取高程、坡度、斜坡结构、土地利用类型、岩土体类型、断裂距离、路网距离、河网距离、以及归一化植被指数这9个影响因子建立滑坡空间数据库,采用集成学习中的随机森林算法进行滑坡易发性评价.结果显示,随机森林抽样训练的方式有利于确定较优的训练参数,保证随机森林在不过拟合的情况下取得满意的拟合能力和泛化能力.随机森林绘制的滑坡易发性分级图显示出合理的空间分布,其中73.35%的滑坡分布在较高和极高级别区域.而巴东县北部、秭归县中部以及夷陵区南部等区域显示出较高的易发性级别.性能评估及易发性统计结果均表明随机森林是一种出色的算法,在滑坡空间预测领域具有较好的适用性. 展开更多
关键词 滑坡 易发性 随机森林 三峡库区
原文传递
基于GF-1 WFV数据的玉米与大豆种植面积提取方法 被引量:73
13
作者 黄健熙 侯矞焯 +2 位作者 苏伟 刘峻明 朱德海 《农业工程学报》 EI CAS CSCD 北大核心 2017年第7期164-170,共7页
准确掌握农作物的空间种植分布情况,对于国家宏观指导农业生产、制定农业政策有重要意义。针对黑龙江省玉米与大豆生育期接近、光谱特征相似,较难区分的问题,以多时相16 m空间分辨率高分一号(GF-1)卫星宽覆盖(wide field of view,WFV)... 准确掌握农作物的空间种植分布情况,对于国家宏观指导农业生产、制定农业政策有重要意义。针对黑龙江省玉米与大豆生育期接近、光谱特征相似,较难区分的问题,以多时相16 m空间分辨率高分一号(GF-1)卫星宽覆盖(wide field of view,WFV)影像为数据源,选择归一化植被指数(normalized difference vegetation index,NDVI)、增强植被指数(enhanced vegetation index,EVI)、宽动态植被指数(wide dynamic range vegetation index,WDRVI)、归一化水指数(normalized difference water index,NDWI)4个特征,结合实地调查样本点,采用随机森林分类算法,提取黑龙江省黑河市嫩江县玉米与大豆种植面积。研究表明,区分玉米与大豆的最佳时段为9月下旬至10月上旬,即大豆已收获而玉米未收获的时段,在4个待选特征中,NDVI、NDWI与WDRVI指数组合表现最佳;随机森林算法与最大似然算法、支持向量机算法相比,分类精度更高,其总体分类精度为84.82%,Kappa系数为77.42%。玉米制图精度为91.49%,用户精度为93.48%;大豆制图精度为91.14%,用户精度为82.76%。该方法为大区域农作物的分类提供重要参考和借鉴价值。 展开更多
关键词 遥感 提取 分类 随机森林 大豆 玉米
下载PDF
基于Sentinel-2A影像特征优选的随机森林土地覆盖分类 被引量:67
14
作者 何云 黄翀 +4 位作者 李贺 刘庆生 刘高焕 周振超 张晨晨 《资源科学》 CSSCI CSCD 北大核心 2019年第5期992-1001,共10页
中南半岛地处热带、亚热带地区,由于水热条件适宜,植被生长旺盛,土地利用强度高,地表覆盖类型的光谱特征时空变异复杂,使用传统的基于光谱特征的遥感分类精度难以保证。Sentinel-2A卫星遥感数据具有较丰富的光谱波段和较高的空间分辨率... 中南半岛地处热带、亚热带地区,由于水热条件适宜,植被生长旺盛,土地利用强度高,地表覆盖类型的光谱特征时空变异复杂,使用传统的基于光谱特征的遥感分类精度难以保证。Sentinel-2A卫星遥感数据具有较丰富的光谱波段和较高的空间分辨率,为土地覆盖遥感分类提供了多维特征空间。但多维特征参与分类容易造成信息冗余,从而导致分类速度和精度降低。因此,如何充分利用Sentinel-2A数据丰富的光谱和空间信息,并通过高维特征空间降维进行特征优选对于提高分类精度具有重要意义。本文以中南半岛典型地区土地覆盖分类为例,利用Sentinel-2A多波段光谱特征,归一化植被指数(NDVI)、比值植被指数(RVI)、差值植被指数(DVI)、归一化水体指数(NDWI)等指数特征以及对比度、相关性、能量、均值、熵等纹理特征,在随机森林模型框架下,采用平均不纯度减少方法对不同特征在土地覆盖分类中的重要程度进行识别;利用袋外(OOB)误差方法,对重要特征组合进行了优选;利用优选特征进行随机森林土地覆盖分类,并与原始随机森林分类结果进行对比。结果表明:Sentinel-2A影像的光谱特征和纹理特征在土地覆盖分类中具有较为重要的作用,光谱特征中短波红外、可见光、植被红边波段重要性较大,纹理特征中均值、能量法重要性较高。选择重要性列前9位的特征参与分类时,OOB精度达到最高;继续增加特征会使模型复杂度过高,容易发生过拟合而使得分类精度不增反降。通过特征优选高效利用了Sentinel-2A丰富的光谱和纹理信息,其总体分类精度达87.53%,Kappa系数达0.8461,优于原始随机森林方法,一定程度上提高了热带亚热带地区复杂土地覆盖分类精度。 展开更多
关键词 Sentinel-2A 特征优选 随机森林 土地覆盖分类 袋外(OOB)误差方法 中南半岛 泰国穆河流域
原文传递
基于随机森林模型的西藏人口分布格局及影响因素 被引量:66
15
作者 王超 阚瑷珂 +3 位作者 曾业隆 李国庆 王民 次仁 《地理学报》 EI CSSCI CSCD 北大核心 2019年第4期664-680,共17页
在乡镇尺度下厘清人口分布格局及其影响因素与区域差异,对在生态脆弱区制定可持续发展政策具有重大指导意义。基于2010年西藏自治区的乡镇尺度人口普查数据,提取人口密度和空间因子,利用空间统计方法分析了人口分布的疏密特征和集聚特征... 在乡镇尺度下厘清人口分布格局及其影响因素与区域差异,对在生态脆弱区制定可持续发展政策具有重大指导意义。基于2010年西藏自治区的乡镇尺度人口普查数据,提取人口密度和空间因子,利用空间统计方法分析了人口分布的疏密特征和集聚特征,对比运用多元线性回归方法和随机森林回归方法探索该地区人口分布的影响因素及其区域差异。结果表明:①西藏乡镇人口密度在空间上表现出极强的非均衡性,其总体趋势是东南高西北低,高密度区与大江大河及主要交通干线具有较强的空间耦合性;②大致以波绒乡(聂拉木县)—岗尼乡(安多县)为西藏的人口分界线,人口集聚的"核心—边缘"特征明显;③多元线性回归方法中,人造地表指数对人口分布的影响程度最大,随后依次为夜间灯光指数和路网密度;④利用随机森林方法进行的人口密度预测比多元线性回归方法精度高,可以用来对影响因子的重要性进行排序;排序在前六位的影响因子由高到低依次为夜间灯光指数、人造地表指数、路网密度、工业总产值、GDP和多年平均气温,它们与人口密度均呈正相关关系;地形地貌要素中以海拔和坡度的贡献率最大且与人口密度均呈负相关关系;⑤西藏人口分布格局的影响因素及其相互作用呈现出明显的区域差异特征,河谷是西藏地区人口的集聚区,主要分布在拉萨河谷、年楚河谷以及三江河谷;⑥通过随机森林回归分析,可以利用概念模型来表达人口分布影响因素,将主导因素概括为土地利用结构、道路通达度及城镇化水平。 展开更多
关键词 人口分布 影响因素 乡镇尺度 随机森林 概念模型
原文传递
基于随机森林的文本分类模型研究 被引量:58
16
作者 张华伟 王明文 甘丽新 《山东大学学报(理学版)》 CAS CSCD 北大核心 2006年第3期5-9,共5页
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reute... 随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reuter21578数据集上的实验表明,分类效果比较好,性能比较稳定,将其同C4.5,KNN,SM0,SVM 4种典型的文本分类器进行了比较,结果显示它的分类性能胜于C4.5,同KNN,SMO和SVM方法相当. 展开更多
关键词 文本分类 随机森林 决策树 泛化误差
下载PDF
基于随机森林模型的中国PM2.5浓度影响因素分析 被引量:58
17
作者 夏晓圣 陈菁菁 +1 位作者 王佳佳 程先富 《环境科学》 EI CAS CSCD 北大核心 2020年第5期2057-2065,共9页
选取气溶胶光学厚度、海拔、年降水量、年均气温、年均风速、人口密度、GDP密度和NDVI作为影响因子,基于随机森林模型、特征重要性排序和偏依赖图技术,研究中国PM2.5浓度空间分布的影响因素及其区域差异.结果表明:①与多元回归、广义可... 选取气溶胶光学厚度、海拔、年降水量、年均气温、年均风速、人口密度、GDP密度和NDVI作为影响因子,基于随机森林模型、特征重要性排序和偏依赖图技术,研究中国PM2.5浓度空间分布的影响因素及其区域差异.结果表明:①与多元回归、广义可加模型和BP神经网络相比,随机森林模型估算的PM2.5浓度精度最高,可用于PM2.5污染的影响因素研究.②PM2.5浓度随气溶胶光学厚度、人口密度和GDP密度的增加呈先上升后平稳的趋势,随降水、风速和NDVI的增加呈先下降后平稳的趋势,随海拔和气温的增加呈下降→上升→下降的趋势.③气溶胶光学厚度对PM2.5浓度空间分布的影响最大,可解释37.96%的PM2.5浓度空间分异;年降水量对PM2.5浓度空间分布的影响最小,解释率仅为5.75%.④影响因子与PM2.5浓度的关系存在空间异质性,同一影响因子对不同地理分区的PM2.5浓度的影响程度有所不同.气溶胶光学厚度对华南地区PM2.5浓度的空间分布影响最大,对东北地区影响最小. 展开更多
关键词 PM2.5 影响因素 区域差异 随机森林 中国
原文传递
随机森林中树的数量 被引量:58
18
作者 刘敏 郎荣玲 曹永斌 《计算机工程与应用》 CSCD 北大核心 2015年第5期126-131,共6页
随机森林是一种集成分类器,对影响随机森林性能的参数进行了分析,结果表明随机森林中树的数量对随机森林的性能影响至关重要。对树的数量的确定方法以及随机森林性能指标的评价方法进行了研究与总结。以分类精度为评价方法,利用UCI数据... 随机森林是一种集成分类器,对影响随机森林性能的参数进行了分析,结果表明随机森林中树的数量对随机森林的性能影响至关重要。对树的数量的确定方法以及随机森林性能指标的评价方法进行了研究与总结。以分类精度为评价方法,利用UCI数据集对随机森林中决策树的数量与数据集的关系进行了实验分析,实验结果表明对于多数数据集,当树的数量为100时,就可以使分类精度达到要求。将随机森林和分类性能优越的支持向量机在精度方面进行了对比,实验结果表明随机森林的分类性能可以与支持向量机相媲美。 展开更多
关键词 随机森林 支持向量机 分类精度
下载PDF
利用随机森林回归的现货市场出清价格预测方法 被引量:53
19
作者 魏勤 陈仕军 +2 位作者 黄炜斌 马光文 陶春华 《中国电机工程学报》 EI CSCD 北大核心 2021年第4期1360-1367,共8页
为得到一种实用性较强且具有较高精度的电力现货市场出清价格的预测方法,该文尝试将随机森林回归应用到现货市场出清价格预测。首先通过随机森林回归的特征重要度分析功能对历史出清价和负荷输入进行特征筛选,然后建立基于随机森林回归... 为得到一种实用性较强且具有较高精度的电力现货市场出清价格的预测方法,该文尝试将随机森林回归应用到现货市场出清价格预测。首先通过随机森林回归的特征重要度分析功能对历史出清价和负荷输入进行特征筛选,然后建立基于随机森林回归的市场出清价预测模型,以网格搜索和交叉验证的方法确定模型参数,最后与基于决策回归树、支持向量机回归和人工神经网络的方法在北欧现货市场公开数据的基础上进行对比试验。试验结果表明该文设计预测方法相较其他方法的平均预测精度至少提高了25%,且预测效果较为稳定,同时输入特征筛选方法的应用能够进一步提高各个模型的预测精度。 展开更多
关键词 电力现货市场 市场出清价 随机森林 特征筛选 网格搜索 交叉验证
下载PDF
基于随机森林算法的用电负荷预测研究 被引量:53
20
作者 李婉华 陈宏 +3 位作者 郭昆 郭松荣 韩嘉民 陈羽中 《计算机工程与应用》 CSCD 北大核心 2016年第23期236-243,共8页
为了解决当下用电负荷预测精度不高,难以很好模拟实际用电负荷的分布情况而不能对未来的负荷数据进行合理预测的问题,实现了基于随机森林的分类模型、回归模型以及结合Weka的时间序列模型,对某省份的负荷数据进行预测,通过对不同模型的... 为了解决当下用电负荷预测精度不高,难以很好模拟实际用电负荷的分布情况而不能对未来的负荷数据进行合理预测的问题,实现了基于随机森林的分类模型、回归模型以及结合Weka的时间序列模型,对某省份的负荷数据进行预测,通过对不同模型的大量的实验及评估,发现这三个模型皆能合理地预测未来的用电负荷数据。此外,在同一评估指标下随机森林算法结合WEKA中的时间序列模型的方法能够较好地预测未来时刻的负荷数据。 展开更多
关键词 用电负荷预测 随机森林 分类 回归 时间序列
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部