期刊文献+
共找到252篇文章
< 1 2 13 >
每页显示 20 50 100
基于随机森林的变压器多源局部放电诊断 被引量:37
1
作者 程养春 张振亮 《中国电机工程学报》 EI CSCD 北大核心 2018年第17期5246-5256,共11页
目前变压器多源局部放电诊断的方法主要是先对采集的放电脉冲进行分离,再对分离的脉冲群进行局部放电诊断。然而,应用于脉冲分离的聚类算法的聚类个数确定问题制约着该方法的实用性,且该方法对信号采集器的采样率有很高的要求。针对上... 目前变压器多源局部放电诊断的方法主要是先对采集的放电脉冲进行分离,再对分离的脉冲群进行局部放电诊断。然而,应用于脉冲分离的聚类算法的聚类个数确定问题制约着该方法的实用性,且该方法对信号采集器的采样率有很高的要求。针对上述缺陷,在实验室条件下模拟匝间模型、油楔模型和针板模型3种放电模型,将多个单源放电数据与噪声融合,生成多源放电数据,用于研究多源放电诊断方法。局部放电模式识别领域中常用的分类器算法包括神经网络、支持向量机(support vector machine,SVM)和K邻近(K-nearest neighbor,KNN)等。随机森林(random forest,RF)算法具有无需特征选择、不易过度拟合的优点,但在局部放电模式识别领域中应用较少。利用神经网络、SVM、KNN以及RF算法对多源放电中有、无某种放电模式的数据进行学习,从而跳过脉冲分离环节。结果表明:在一定幅值范围的白噪声干扰下,RF算法在各模式的识别准确率均优于其它算法。利用实际噪声干扰下的多源局部放电数据对各算法进行验证,结果表明RF算法仍可对有、无匝间以及有、无油楔进行有效识别,但各分类器对有、无针板放电的识别效果均不理想。利用RF算法得到的3个识别模型可实现多源局部放电模式识别。 展开更多
关键词 多源局部放电 变压器 模式识别 随机森林
下载PDF
基于数值预报和随机森林算法的强对流天气分类预报技术 被引量:36
2
作者 李文娟 赵放 +2 位作者 郦敏杰 陈列 彭霞云 《气象》 CSCD 北大核心 2018年第12期1555-1564,共10页
随机森林算法是当前得到较为广泛应用的机器学习方法之一,有着很高的预测精度,训练结果稳定,泛化能力强,解决多分类问题有明显优势。本文将随机森林算法应用于强对流的潜势预测和分类,分短时强降水、雷暴大风、冰雹和无强对流四种类别,... 随机森林算法是当前得到较为广泛应用的机器学习方法之一,有着很高的预测精度,训练结果稳定,泛化能力强,解决多分类问题有明显优势。本文将随机森林算法应用于强对流的潜势预测和分类,分短时强降水、雷暴大风、冰雹和无强对流四种类别,基于2005—2016年NCEP 1°×1°再分析资料计算的对流指数和物理量,开展强对流天气的分类训练、0~12 h预报和检验,经2015—2016年独立测试样本检验表明,针对强对流发生站点的点对点检验,整体误判率为21. 9%,85次强对流过程基本无漏报,模型尤其适用于较大范围强对流天气。随机森林算法筛选的因子物理意义较为明确,和主观预报经验基本相符,模型准确率高,可用于日常业务。 展开更多
关键词 强对流分类 对流指数 物理量 随机森林
下载PDF
基于模糊C均值聚类和随机森林的短时交通状态预测方法 被引量:30
3
作者 陈忠辉 凌献尧 +2 位作者 冯心欣 郑海峰 徐艺文 《电子与信息学报》 EI CSCD 北大核心 2018年第8期1879-1886,共8页
交通拥堵长期以来是城市面临的主要问题之一,解决交通拥堵瓶颈刻不容缓。准确的短时交通状态预测有利于市民预知交通出行信息,及时采取措施避免陷入拥堵困境。该文提出一种基于模糊C均值聚类(FCM)和随机森林的短时交通状态预测方法。首... 交通拥堵长期以来是城市面临的主要问题之一,解决交通拥堵瓶颈刻不容缓。准确的短时交通状态预测有利于市民预知交通出行信息,及时采取措施避免陷入拥堵困境。该文提出一种基于模糊C均值聚类(FCM)和随机森林的短时交通状态预测方法。首先,利用一种新颖的融合时空信息的自适应多核支持向量机(AMSVM)来预测短时交通流参数,包括流量、速度和占有率。其次,基于FCM算法分析历史交通流,获取历史交通状态信息。最后,利用随机森林算法分析所预测的短时交通流参数,得到最终预测的短时交通状态。该方法在融合时空信息的同时采用随机森林算法应用于短时交通状态预测这一全新的研究领域。实验结果表明,FCM对历史交通状态的评估方式适用于不同的高速路和城市道路场景。其次,随机森林比其它常见的机器学习方法具有更高的预测精度,从而提供实时可靠的短时交通出行信息。 展开更多
关键词 短时交通状态预测 随机森林 模糊C均值聚类 自适应多核支持向量机
下载PDF
RF-AHP-云模型下岩爆烈度分级预测模型 被引量:26
4
作者 田睿 孟海东 +2 位作者 陈世江 王创业 石磊 《中国安全科学学报》 CAS CSCD 北大核心 2020年第7期166-172,共7页
为准确可靠地预测岩爆灾害,将随机森林(RF)与层次分析法(AHP)结合,在RF分析指标重要性的基础上优化AHP法,构建RF-AHP指标权重计算方法;结合云模型理论,建立基于RFAHP-云模型的岩爆烈度分级预测模型;通过文献调研法,建立包含301组岩爆工... 为准确可靠地预测岩爆灾害,将随机森林(RF)与层次分析法(AHP)结合,在RF分析指标重要性的基础上优化AHP法,构建RF-AHP指标权重计算方法;结合云模型理论,建立基于RFAHP-云模型的岩爆烈度分级预测模型;通过文献调研法,建立包含301组岩爆工程实例的数据库作为岩爆烈度分级预测的样本数据,并分析25组预测样本的岩爆预测结果。结果表明:所提模型预测准确率达88%以上,可判定预测样本的岩爆烈度等级;经验证,作为预测模型核心的RF-AHP指标权重计算方法具备一定的合理性。 展开更多
关键词 随机森林(rf) 层次分析法(AHP) 云模型 岩爆烈度 预测模型
下载PDF
矿井突水水源识别预测研究——以新庄孜矿为例 被引量:25
5
作者 温廷新 张波 邵良杉 《中国安全科学学报》 CAS CSCD 北大核心 2014年第2期100-106,共7页
矿井突水水源识别是煤矿预防突水事故发生的关键工作,为快速、有效判别矿井突水水源,选取Ca2+,Mg2+,K++Na+,HCO-3,SO2-4,Cl-和总硬度7种主要判别指标。利用Logistic回归分析模型,对7种判别指标的重要程度进行回归分析,提取最主要的判别... 矿井突水水源识别是煤矿预防突水事故发生的关键工作,为快速、有效判别矿井突水水源,选取Ca2+,Mg2+,K++Na+,HCO-3,SO2-4,Cl-和总硬度7种主要判别指标。利用Logistic回归分析模型,对7种判别指标的重要程度进行回归分析,提取最主要的判别指标作为水源识别的影响因素,建立基于Logistic分析的矿井突水水源识别的随机森林(RF)模型。将煤矿实测的33组数据作为训练数据,进行预测模型训练,另外选用12组数据作为测试数据,利用该模型进行预测,并与Fisher判别方法和神经网络方法进行对比。结果表明:利用Logistic回归分析法能有效地提取影响矿井突水水源识别的因素,去除冗余影响因素,可有效地预测矿井突水水源类型,使矿井突水水源预测模型错误率降低至1/12。 展开更多
关键词 矿井突水 水源识别 预测 Logistic回y-3分析 随机森林(rf)
下载PDF
电力负荷预测算法比较-随机森林与支持向量机 被引量:22
6
作者 霍娟 孙晓伟 张明杰 《电力系统及其自动化学报》 CSCD 北大核心 2019年第7期129-134,共6页
随机森林和支持向量机在电力负荷预测中的比较条件常被忽略,预测精度孰优孰劣存在争议。本文对支持向量机和随机森林的原理进行了研究,充分分析了预测对象和预测条件,从算法自身参数、数据集特点和气候特征3个因素进行比较。通过对预测... 随机森林和支持向量机在电力负荷预测中的比较条件常被忽略,预测精度孰优孰劣存在争议。本文对支持向量机和随机森林的原理进行了研究,充分分析了预测对象和预测条件,从算法自身参数、数据集特点和气候特征3个因素进行比较。通过对预测条件的改变,用统计学比较分析两者的表现。结果表明支持向量机受自身参数影响较大;对具有共同变化趋势和相似模式特征的数据集,两种算法预测精度都较其他数据集显著提高;在本文使用的气候特征中,温度和露点对负荷预测的影响更大;在相同数据集和气候特征条件下,统计分析表明两种算法调整自身参数后的最优预测结果整体上没有显著差异。 展开更多
关键词 电力负荷预测 支持向量机 随机森林 参数 数据集 气候特征
下载PDF
基于ABC-SVM和PSO-RF的光伏微电网日发电功率组合预测方法研究 被引量:22
7
作者 王小杨 罗多 +2 位作者 孙韵琳 李超 李进 《太阳能学报》 EI CAS CSCD 北大核心 2020年第3期177-183,共7页
综合考虑气象因素,使用ABC-SVM方法,对历史的气象数据和光伏出力数据进行训练,依据发电量情况将气象数据分为4类;之后在4类气象情况下各选取上万条数据,使用PSO-RF模型分别训练每组数据,得到4个带不同参数的模型;最后根据每天的气象情... 综合考虑气象因素,使用ABC-SVM方法,对历史的气象数据和光伏出力数据进行训练,依据发电量情况将气象数据分为4类;之后在4类气象情况下各选取上万条数据,使用PSO-RF模型分别训练每组数据,得到4个带不同参数的模型;最后根据每天的气象情况运行不同的模型。验证本组合方法之后发现,通过气象分类后得到的模型,可大幅提高光伏发电量预测的效果。 展开更多
关键词 光伏发电量预测 支持向量机 粒子群优化 人工蜂群 随机森林 微电网
下载PDF
基于信息增益特征选择的网络异常检测模型 被引量:22
8
作者 刘汝隽 贾斌 辛阳 《计算机应用》 CSCD 北大核心 2016年第A02期49-53,共5页
针对网络异常检测中数据的高维特征会影响检测率和实时检测效率等问题,提出了一种基于信息增益特征选择的网络异常检测模型。首先,预处理器将网络流量数据规范化;其次,基于信息增益降维方法的特征选择器选取重要特征,降低数据集的维度;... 针对网络异常检测中数据的高维特征会影响检测率和实时检测效率等问题,提出了一种基于信息增益特征选择的网络异常检测模型。首先,预处理器将网络流量数据规范化;其次,基于信息增益降维方法的特征选择器选取重要特征,降低数据集的维度;最后,随机森林分类器经过训练和预测得到检测结果。实验中,该模型能够将随机森林分类器的检测率提高0.2%,将检测时间平均缩短19%;在检测率上优于K近邻算法,在误报率、阳性似然比和约登指数方面均优于K近邻和Ada Boost算法。实验结果表明,所提模型能够有效提高检测率,缩短检测时间。 展开更多
关键词 网络异常检测 信息增益 特征选择 分类 随机森林
下载PDF
基于Adaptive Lasso及RF算法的冰雪天气交通事故分析 被引量:21
9
作者 赵玮 徐良杰 +2 位作者 冉斌 汪济洲 张璇 《中国安全科学学报》 CAS CSCD 北大核心 2017年第2期98-103,共6页
为分析冰雪天气下高速公路交通事故频发致因,量化分析驾驶环境、驾驶员及车辆情况对事故的影响,根据Adaptive Lasso和随机森林(RF)混合算法建立预测模型。以10年约30万组冰雪环境下高速公路交通事故数据为例,训练改进预测模型验证其准... 为分析冰雪天气下高速公路交通事故频发致因,量化分析驾驶环境、驾驶员及车辆情况对事故的影响,根据Adaptive Lasso和随机森林(RF)混合算法建立预测模型。以10年约30万组冰雪环境下高速公路交通事故数据为例,训练改进预测模型验证其准确性。结果表明,混合算法的准确度和拟合程度都优于支持向量机(SVM)、分类回归树(CART)及RF等单独算法。交通事故与环境因素相关性最显著,坡路、弯道及交叉口处事故受冰雪环境影响较大;事故与驾驶员因素中部分因素显著相关,如驾驶员性别及安全带使用情况;本地驾驶员对驾驶能力及冰雪环境的估计错误更易导致交通事故。 展开更多
关键词 高速公路 交通事故 ADAPTIVE Lasso 随机森林(rf) 冰雪天气 大数据分析
下载PDF
基于随机森林算法的地表温度降尺度研究 被引量:20
10
作者 华俊玮 祝善友 张桂欣 《国土资源遥感》 CSCD 北大核心 2018年第1期78-86,共9页
地表温度(land surface temperature,LST)是地面能量平衡等模型中的重要参数之一。高时间分辨率的遥感LST可通过降尺度处理实现空间分辨率的提高,这对详细的LST时空分布监测具有重要意义。以北京市为研究区,选择Landsat8 OLI/TIRS数据,... 地表温度(land surface temperature,LST)是地面能量平衡等模型中的重要参数之一。高时间分辨率的遥感LST可通过降尺度处理实现空间分辨率的提高,这对详细的LST时空分布监测具有重要意义。以北京市为研究区,选择Landsat8 OLI/TIRS数据,通过改进的单窗(improved mono-window,IMW)算法反演LST作为验证数据,在计算归一化差值植被指数(normalized difference vegetation index,NDVI)和归一化差值建筑指数(normalized difference built-up index,NDBI)等多种遥感指数并模拟至1 000 m空间分辨率的基础上,联合空间分辨率为1 000 m的MODIS/LST产品,利用随机森林(random forest,RF)模型实现LST(100 m空间分辨率)降尺度,并与多因子回归方法和基于植被指数的LST锐化算法(TsHARP)2种常用降尺度方法进行对比。实验结果表明:以模拟Landsat/LST作为降尺度数据源,RF方法降尺度LST的均方根误差(root-mean-square,RMSE)为2.01 K,与多因子回归方法和TsHARP算法相比,精度分别提高了0.16 K和0.44 K;针对MODIS/LST降尺度时,RF方法的RMSE为2.29 K,与多因子回归方法和TsHARP算法相比,精度分别提高了0.42 K和0.50 K;针对不同地表类型,RF算法降尺度效果不同,其中高植被覆盖区表现最优,RMSE为1.81 K;城镇表面因其空间异质性,RMSE则达到了2.75 K。 展开更多
关键词 遥感 地表温度(LST) 降尺度 随机森林(rf)
下载PDF
基于机器学习的网页暗链检测方法 被引量:20
11
作者 周文怡 顾徐波 +1 位作者 施勇 薛质 《计算机工程》 CAS CSCD 北大核心 2018年第10期22-27,共6页
在大数据时代下,传统暗链检测技术无法在海量网页中快速准确地识别出遭遇"暗链攻击"的网站。为此,提出一种引入机器学习的方法研究网页的暗链检测。该方法结合暗链的域名、相关文本及隐藏结构3种特征,分别采用分类与回归树、... 在大数据时代下,传统暗链检测技术无法在海量网页中快速准确地识别出遭遇"暗链攻击"的网站。为此,提出一种引入机器学习的方法研究网页的暗链检测。该方法结合暗链的域名、相关文本及隐藏结构3种特征,分别采用分类与回归树、梯度提升决策树及随机森林3种算法来构建检测模型并对比其的性能。实验结果表明,该方法具有较高的准确性和可靠性,其中随机森林构建的检测模型分类准确率可以达到0. 984。 展开更多
关键词 暗链 特征提取 交叉验证 分类与回归树 随机森林 梯度提升决策树
下载PDF
2002—2018年滇池外海蓝藻水华暴发时空变化特征及其驱动因子 被引量:15
12
作者 李加龙 罗纯良 +10 位作者 吕恒 许佳峰 罗潋葱 潘珉 何锋 满小明 张如枫 龚发露 孙婷 陈岚 武桂竹 《生态学报》 CAS CSCD 北大核心 2023年第2期878-891,共14页
为弄清滇池外海蓝藻水华暴发时空变化规律及其影响因素,将滇池外海分为北、中、南3个区域,基于2002—2018年期间中分辨率成像光谱仪(MODIS)反演的水华面积,分析了上述3个区域蓝藻水华的时空变化特征。基于2007—2018年水文、气象和出入... 为弄清滇池外海蓝藻水华暴发时空变化规律及其影响因素,将滇池外海分为北、中、南3个区域,基于2002—2018年期间中分辨率成像光谱仪(MODIS)反演的水华面积,分析了上述3个区域蓝藻水华的时空变化特征。基于2007—2018年水文、气象和出入流数据,构建了外海三维水动力生态模型(AEM3D),并计算了各区域的水力滞留时间。通过冗余分析(RDA)、随机森林(RF)和斯皮尔曼相关分析方法,分析了影响以上区域蓝藻水华暴发的主要驱动因子。结果表明:2002—2018年期间,整个滇池外海区域年平均水华面积比(水华面积占该区域总面积比例)呈缓慢下降趋势,空间上由北向南依次递减,整个外海水华暴发面积最大主要发生在秋季。在外海北部区域,其东部水华较西部更为严重,而在中部和南部区域,呈现西部水华较东部更为严重的空间分布模式。通过对各影响因子的统计分析发现,风速、水温和日照时长是上述各区域中蓝藻水华暴发的主要决定性因素。水华暴发期间以西南风为主导风向,且上述区域的水华面积比随风速增加呈下降趋势。在外海各区域,水力滞留时间与水华暴发面积均呈显著正相关,空间上水力滞留时间由北向南逐渐增大,风速和风向是影响蓝藻水华空间分布规律和严重程度的主要因素。 展开更多
关键词 滇池 蓝藻水华 卫星遥感 AEM3D模型 冗余分析(RDA) 随机森林(rf)
下载PDF
激光诱导击穿光谱(LIBS)在煤质检测中的应用现状 被引量:18
13
作者 倪明辉 李燕 +2 位作者 易镇鑫 朱顺官 朱晨光 《中国无机分析化学》 CAS 北大核心 2022年第4期80-88,共9页
我国当前主要能源仍是煤炭资源,煤质快速检测有利于其清洁高效利用。激光诱导击穿光谱(Laser-Induced Breakdown Spectroscopy,LIBS)作为一种快速光谱检测技术,具有样品需求量小、制样简便、可多元素同时测量等优点,其在煤质快速检测中... 我国当前主要能源仍是煤炭资源,煤质快速检测有利于其清洁高效利用。激光诱导击穿光谱(Laser-Induced Breakdown Spectroscopy,LIBS)作为一种快速光谱检测技术,具有样品需求量小、制样简便、可多元素同时测量等优点,其在煤质快速检测中的应用潜力已得到广泛认可。因此,综述了激光诱导击穿光谱仪器(实验室台式、在线式和便携式)的研发现状、激光诱导击穿光谱对煤质样品中金属元素、非金属元素和工业指标的检测现状、煤质分析性能提升方法,以及激光诱导击穿光谱定量分析模型研究等方面的研究进展和近几年LIBS技术在煤质检测中的应用现状并提出了未来展望。 展开更多
关键词 激光诱导击穿光谱 煤质分析 预测模型 支持向量机回归 随机森林
下载PDF
基于RBF核的多分类SVM滑塌易发性评价模型 被引量:17
14
作者 丁茜 赵晓东 +2 位作者 吴鑫俊 张泰丽 徐振涛 《中国安全科学学报》 CAS CSCD 北大核心 2022年第3期194-200,共7页
为合理有效地评价地质灾害易发性,依托浙江省温州市飞云江流域地质灾害调查数据,通过有监督的支持向量机(SVM)机器学习模型,建立基于径向基函数(RBF)核的多分类SVM滑塌易发性评价模型。在地理信息系统(GIS)中选取9类特征数据,作为模型... 为合理有效地评价地质灾害易发性,依托浙江省温州市飞云江流域地质灾害调查数据,通过有监督的支持向量机(SVM)机器学习模型,建立基于径向基函数(RBF)核的多分类SVM滑塌易发性评价模型。在地理信息系统(GIS)中选取9类特征数据,作为模型训练输入值,采用随机森林(RF)算法分析各指标权重,以高斯函数为RBF核函数,将SVM的输入特征数据映射到高维空间中并加以识别;同时提出高斯核函数超参数C和γ的优化方法,解决SVM模型中超参数不能优化求解的问题;训练后,极易发生类的受试者特征曲线(ROC)的曲线下面积(AUC)达0.97,宏观多分类ROC曲线下AUC值为0.87。训练得到的评价模型既保证了重要分类的精度,又避免过拟合的情况。 展开更多
关键词 滑塌 易发性评价 支持向量机(SVM) 径向基函数(RBF) 随机森林(rf)
下载PDF
高分二号数据的城市生态用地分类方法探讨 被引量:18
15
作者 王芳 杨武年 +1 位作者 邓晓宇 任金铜 《测绘科学》 CSCD 北大核心 2018年第3期71-76,共6页
针对传统分类法分类精度低、速度慢等问题,同时也为了探索国产卫星高分二号遥感数据在城市生态用地分类中的方法及效果,及时获取其生态用地信息,该文以四川省内江市隆昌县城区为研究范围,提出了一种辅以影像光谱特征和纹理特征信息的随... 针对传统分类法分类精度低、速度慢等问题,同时也为了探索国产卫星高分二号遥感数据在城市生态用地分类中的方法及效果,及时获取其生态用地信息,该文以四川省内江市隆昌县城区为研究范围,提出了一种辅以影像光谱特征和纹理特征信息的随机森林分类方法。该方法提取城市生态用地信息,并将其分类结果与传统的支持向量机分类、最大似然分类进行对比,结果表明,新方法具有更高的分类精度和更快的分类速度,更适合高分辨率、多特征参数、大面积的高分二号遥感影像城市生态用地分类。 展开更多
关键词 高分二号 随机森林 生态用地 分类方法
原文传递
基于DenseNet和随机森林的电力用户窃电检测 被引量:18
16
作者 蔡嘉辉 王琨 +2 位作者 董康 姚宇航 张雨峰 《计算机应用》 CSCD 北大核心 2021年第S01期75-80,共6页
窃电作为配电网络非技术损耗的主要因素之一,不仅严重扰乱供电秩序,还会危害电网安全,造成供电企业甚至国家的重大损失。为了更高效地检测窃电情况,提出了一种新型的密集卷积神经网络和随机森林(DenseNet-RF)模型,基于该模型实现了电力... 窃电作为配电网络非技术损耗的主要因素之一,不仅严重扰乱供电秩序,还会危害电网安全,造成供电企业甚至国家的重大损失。为了更高效地检测窃电情况,提出了一种新型的密集卷积神经网络和随机森林(DenseNet-RF)模型,基于该模型实现了电力用户窃电行为的检测。首先,分析了密集卷积神经网络(DenseNet)的结构;其次,将密集卷积神经网络(DenseNet)对大规模的智能电表数据集进行自动特征提取;然后,根据获得的特征再使用随机森林(RF)训练分类器,以检测用户是否窃电。在建立融合模型时,采用网格搜索算法确定最优参数。最后,进行实验验证,实验结果表明,所提出的检测模型优于宽而深的卷积神经网络(WDNet)、DenseNet、极限学习机(ELM)等模型的分类准确性,其模型准确率为96.76%,同时具有良好的泛化能力。 展开更多
关键词 窃电检测 密集神经网络 随机森林 智能电表
下载PDF
基于随机森林算法的大功率质子交换膜燃料电池系统故障分类方法 被引量:17
17
作者 余嘉熹 李奇 +2 位作者 陈维荣 刘嘉蔚 李锦程 《中国电机工程学报》 EI CSCD 北大核心 2020年第17期5591-5598,共8页
针对大功率质子交换膜燃料电池(protonexchange membranefuelcell,PEMFC)系统故障分类识别的问题,提出基于随机森林算法的燃料电池系统的故障分类方法。该方法基于Bootstrap法重采样,产生多个样本子集,通过决策树算法中的CART算法构造... 针对大功率质子交换膜燃料电池(protonexchange membranefuelcell,PEMFC)系统故障分类识别的问题,提出基于随机森林算法的燃料电池系统的故障分类方法。该方法基于Bootstrap法重采样,产生多个样本子集,通过决策树算法中的CART算法构造多个分类器模型,然后通过测试集对每个分类器进行测试得到分类结果,最后投票选出最优的分类结果作为预测类别。通过实例分析,对比支持向量机和K最邻近算法的分类结果,所提方法可有效识别有轨电车实际运行过程中5种故障状态,分类准确率可达94.4%,能明显提高故障分类正确率,对进一步实现大功率PEMFC系统在线故障诊断研究具有重要意义。 展开更多
关键词 随机森林算法 质子交换膜燃料电池 故障分类 决策树 支持向量机
下载PDF
基于随机森林和欠采样集成的垃圾网页检测 被引量:17
18
作者 卢晓勇 陈木生 《计算机应用》 CSCD 北大核心 2016年第3期731-734,共4页
为解决垃圾网页检测过程中的不平衡分类和"维数灾难"问题,提出一种基于随机森林(RF)和欠采样集成的二元分类器算法。首先使用欠采样技术将训练样本集大类抽样成多个子样本集,再将其分别与小类样本集合并构成多个平衡的子训练... 为解决垃圾网页检测过程中的不平衡分类和"维数灾难"问题,提出一种基于随机森林(RF)和欠采样集成的二元分类器算法。首先使用欠采样技术将训练样本集大类抽样成多个子样本集,再将其分别与小类样本集合并构成多个平衡的子训练样本集;然后基于各个子训练样本集训练出多个随机森林分类器;最后用多个随机森林分类器对测试样本集进行分类,采用投票法确定测试样本的最终所属类别。在WEBSPAM UK-2006数据集上的实验表明,该集成分类器算法应用于垃圾网页检测比随机森林算法及其Bagging和Adaboost集成分类器算法效果更好,准确率、F1测度、ROC曲线下面积(AUC)等指标提高至少14%,13%和11%。与Web spam challenge 2007优胜团队的竞赛结果相比,该集成分类器算法在F1测度上提高至少1%,在AUC上达到最优结果。 展开更多
关键词 垃圾网页检测 随机森林 欠采样 集成分类器 机器学习
下载PDF
基于随机森林的沥青路面性能预测 被引量:16
19
作者 张金喜 郭旺达 +2 位作者 宋波 禚永昌 张阳光 《北京工业大学学报》 CAS CSCD 北大核心 2021年第11期1256-1263,共8页
为弥补路面性能预测问题中传统预测方法效率差、预测精度低等缺陷,针对普通公路沥青路面状况指数(pavement condition index,PCI)的预测问题,利用北京市9个县区包括路面性能指标、路面结构、交通参数及气象资料在内的1249组观测值,提出... 为弥补路面性能预测问题中传统预测方法效率差、预测精度低等缺陷,针对普通公路沥青路面状况指数(pavement condition index,PCI)的预测问题,利用北京市9个县区包括路面性能指标、路面结构、交通参数及气象资料在内的1249组观测值,提出了一种基于随机森林算法的PCI预测模型,并与神经网络、支持向量机模型预测结果进行对比.研究结果表明:通过对比分析不同模型的3个定量评价指标(均方根误差、平均绝对误差和决定系数)以及可视化散点图,证明采用随机森林算法的PCI预测模型的鲁棒性、准确性要优于神经网络和支持向量机模型,验证了该模型的有效性和优越性,可以为后续公路养护预算申请和决策方案制定提供科学依据,对于提高公路养护的经济效益具有重要意义. 展开更多
关键词 道路工程 沥青路面 路面性能预测 路面状况指数(PCI) 机器学习 随机森林(rf)
下载PDF
一种模型决策森林算法 被引量:15
20
作者 尹儒 门昌骞 王文剑 《计算机科学与探索》 CSCD 北大核心 2020年第1期108-116,共9页
随机森林(RF)具有抗噪能力强,预测准确率高,能够处理高维数据等优点,因此在机器学习领域得到了广泛的应用。模型决策树(MDT)是一种加速的决策树算法,虽然能够提高决策树算法的训练效率,但是随着非纯伪叶结点规模的增大,模型决策树的精... 随机森林(RF)具有抗噪能力强,预测准确率高,能够处理高维数据等优点,因此在机器学习领域得到了广泛的应用。模型决策树(MDT)是一种加速的决策树算法,虽然能够提高决策树算法的训练效率,但是随着非纯伪叶结点规模的增大,模型决策树的精度也在下降。针对上述问题,提出了一种模型决策森林算法(MDF)以提高模型决策树的分类精度。MDF算法将MDT作为基分类器,利用随机森林的思想,生成多棵模型决策树。算法首先通过旋转矩阵得到不同的样本子集,然后在这些样本子集上训练出多棵不同的模型决策树,再将这些树通过投票的方式进行集成,最后根据得到的模型决策森林给出分类结果。在标准数据集上的实验结果表明,提出的模型决策森林在分类精度上明显优于模型决策树算法,并且MDF在树的数量较少时也能取到不错的精度,避免了因树的数量增加时间复杂度增高的问题。 展开更多
关键词 基尼指数 模型决策森林(MDF) 模型决策树(MDT) 随机森林(rf)
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部