期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于RFE-BXGBoost的轴承套圈沟道表面缺陷识别方法 被引量:1
1
作者 徐凯 张会妨 《机电工程》 CAS 北大核心 2023年第11期1691-1699,共9页
轴承套圈是轴承部件的重要组成部分,其表面缺陷影响轴承的服役期限。为了解决轴承沟道表面缺陷难以被准确识别的问题,提出了一种基于特征递归消除的贝叶斯极度梯度提升树(RFE-BXGBoost)的轴承套圈沟道表面缺陷识别模型(方法)。首先,基... 轴承套圈是轴承部件的重要组成部分,其表面缺陷影响轴承的服役期限。为了解决轴承沟道表面缺陷难以被准确识别的问题,提出了一种基于特征递归消除的贝叶斯极度梯度提升树(RFE-BXGBoost)的轴承套圈沟道表面缺陷识别模型(方法)。首先,基于特征衍生的思想,对轴承沟道的时域、频域等特征进行了提取,使用了极度梯度提升树(XGBoost)作为基于特征递归消除(RFE)的基学习器,对影响轴承沟道表面缺陷最佳特征子集进行了选择,并过滤了冗余特征;然后,利用基于贝叶斯优化的XGBoost模型组成弱分类器,为了降低模型预测结果的方差,使用有放回随机抽样法,对基分类器进行了选取;最后,根据抽样结果,利用投票法获得了最终的表面缺陷识别结果,并使用轴承套圈沟道实测数据集进行了模型预测性能的测试。实验结果表明:基于RFE-BXGBoost的表面缺陷识别模型的识别准确率为0.90,F1-score为0.879,优于仅使用自适应提升法(Adaboost)、随机森林、梯度提升树的表面缺陷识别结果。研究结果表明:该表面缺陷识别模型对复杂零部件和系统的表面缺陷识别有一定的效果。 展开更多
关键词 滚动轴承 特征递归消除 极度梯度提升树 轴承套圈沟道 有放回随机抽样 集成模型
下载PDF
基于极限树特征递归消除和LightGBM的异常检测模型 被引量:3
2
作者 何红艳 黄国言 +1 位作者 张炳 贾大苗 《信息网络安全》 CSCD 北大核心 2022年第1期64-71,共8页
入侵检测数据维数大、数据样本不均衡、数据集分散性大的问题严重影响分类性能,为了解决该问题,文章提出基于极限随机树的特征递归消除(Extra Trees-Recursive Feature Elimination,ET-RFE)和LightGBM(LGBM)的入侵检测方法。首先对网络... 入侵检测数据维数大、数据样本不均衡、数据集分散性大的问题严重影响分类性能,为了解决该问题,文章提出基于极限随机树的特征递归消除(Extra Trees-Recursive Feature Elimination,ET-RFE)和LightGBM(LGBM)的入侵检测方法。首先对网络数据进行独热编码重构,在数据级层面均衡少量样本的攻击类别;其次,使用基于ET-RFE对流量特征进行降维处理,寻找含有信息量最大的最优特征子集;最后,将得到的最优特征子集作为LGBM输入数据集进行分类训练,并利用贝叶斯算法对LGBM参数进行优化。实验采用真实的网络流量数据集UNSW-NB15,通过与随机森林(RF)、XGboost算法和GALR-DT算法比较可得,文章所提方法能够有效提高检测率,并对小样本攻击类型实现有效的召回率。 展开更多
关键词 类不平衡 入侵检测 LightGBM 特征递归消除
下载PDF
基于RFE+CatBoost模型的异常用电检测方法研究 被引量:3
3
作者 冉哲 李英娜 刘爱莲 《电视技术》 2021年第8期121-126,132,共7页
针对传统电力检测领域中异常用电检测模型需要调节大量超参数导致异常用电检测效率低下,以及模型选取特征不能充分反映实际用电情况导致分类精度不高的问题,提出一种基于RFE+CatBoost模型的异常用电检测方法。较传统的异常用电检测方法... 针对传统电力检测领域中异常用电检测模型需要调节大量超参数导致异常用电检测效率低下,以及模型选取特征不能充分反映实际用电情况导致分类精度不高的问题,提出一种基于RFE+CatBoost模型的异常用电检测方法。较传统的异常用电检测方法而言,CatBoost算法降低了模型检测对于超参数的依赖。以用户用电数据作为研究对象,结合RFE算法分析用户在用电表现上的不同特征,采用分类预测算法对异常用电行为进行进一步研究,最后通过云南某地用户用电数据集进行验证,与其他用电异常检测模型进行对比,实验证明所提模型具有很好的检测能力,对于提升企业用电异常检测效率、指导用户更好地用电具有重要意义。 展开更多
关键词 异常用电检测 特征递归消除 分类预测算法
下载PDF
上市公司财务危机预警研究
4
作者 张志敏 《合作经济与科技》 2020年第20期148-151,共4页
本文以A股上市公司作为研究对象,运用python中的sklearn模块,以随机森林算法对上市公司财务危机预警指标进行选取,并与依据显著性相关性选取出的指标进行对比,找出两者在指标选取上存在的差异,并依据选取的财务指标分别建立随机森林模型... 本文以A股上市公司作为研究对象,运用python中的sklearn模块,以随机森林算法对上市公司财务危机预警指标进行选取,并与依据显著性相关性选取出的指标进行对比,找出两者在指标选取上存在的差异,并依据选取的财务指标分别建立随机森林模型;与此同时,还分别构建Logistic回归模型、SVM支持向量机模型、决策树模型,并进行展开比较。分析表明:充分利用随机森林展开上市公司财务危机预警研究比传统的方式更准确,更能够精确预判上市公司财务危机。 展开更多
关键词 特征递归消除 随机森林 LOGISTIC回归 财务危机预警
下载PDF
基于多种特征选择策略的入侵检测模型研究 被引量:9
5
作者 何红艳 黄国言 +1 位作者 张炳 陈瑜 《信息安全研究》 2021年第3期225-232,共8页
入侵检测是防止主机和网络攻击的有效方法.入侵检测系统的使用弥补了传统防火墙技术、签名认证技术、访问控制技术在安全保护方面的不足.但是,由于入侵检测数据样本特征之间存在互冗余性,干扰了攻击检测的准确性和效率.特征选择方法能... 入侵检测是防止主机和网络攻击的有效方法.入侵检测系统的使用弥补了传统防火墙技术、签名认证技术、访问控制技术在安全保护方面的不足.但是,由于入侵检测数据样本特征之间存在互冗余性,干扰了攻击检测的准确性和效率.特征选择方法能有效降低数据特征的维度和消除冗余特征,选出最优特征子集并提高网络流量异常检测的准确率.基于此,首先使用Kmeans聚类算法在真实流量数据集UNSW-NB15提取典型数据,生成具有典型数据特征的数据集作为特征提取的数据集,随后在该数据集上分别使用了9种不同策略的入侵检测模型进行了网络入侵检测实验.实验结果表明,该方法能够进行有效检测和分类,正常流量、恶意流量二分类精度为88.27%,高于其他机器学习算法.并且在进行多类分类研究时样本数据少的攻击类型的检测率均有提高.验证了该方法的有效性,易于使用. 展开更多
关键词 入侵检测 特征选择 UNSW-NB15 特征递归消除(RFE) 逻辑回归(LR)
下载PDF
基于随机森林-特征递归消除模型的可解释性缓丘岭谷地貌滑坡易发性评价 被引量:4
6
作者 孙德亮 陈丹璐 +3 位作者 密长林 陈星宇 密士文 李晓琴 《地质力学学报》 CSCD 北大核心 2023年第2期202-219,共18页
研究旨在基于随机森林-特征递归消除模型,通过SHAP算法(SHapley Additive exPlanation,SHAP)与部分依赖图(Partial Dependence Plot,PDP)对缓丘岭谷地貌区域进行滑坡易发性评价与内部机制解释,以期为地质灾害防治研究提供参考。利用优... 研究旨在基于随机森林-特征递归消除模型,通过SHAP算法(SHapley Additive exPlanation,SHAP)与部分依赖图(Partial Dependence Plot,PDP)对缓丘岭谷地貌区域进行滑坡易发性评价与内部机制解释,以期为地质灾害防治研究提供参考。利用优化随机森林算法对典型缓丘岭谷地区滑坡易发性进行研究,建立缓丘岭谷滑坡易发性评价模型;利用特征递归消除算法剔除噪声因子,选取地形地貌、地质构造、环境条件、人类活动5个类型16个因子构建重庆合川区滑坡致灾因子数据库;结合合川区754个历史滑坡点,利用随机森林算法对因子重要性进行排序,并根据专家经验法对研究区的滑坡易发性进行划分,将研究区的滑坡易发性分为极低、低、中、高、极高5个等级;应用部分依赖图对合川区滑坡发生影响大的因子进行解释和SHAP算法对个体滑坡进行局部解释。结果表明:与原模型相比,随机森林-特征递归消除模型测试集AUC值提高了0.019,证明了特征递归消除算法的有效性;训练集以及测试集的AUC值分别为0.769、0.755,具有较高的预测精度;缓丘缓坡地区在起伏较大地区滑坡密度较大,历史滑坡多集中于高易发地区;滑坡的空间分布具有不均匀性与复杂性,各致灾因子对滑坡发生的影响有着明显的区域特征与空间异质性,在缓坡丘陵地区多年平均降雨、高程、岩性3个因子对滑坡发生的影响最大;由SHAP算法对合川白塔坪上山公路滑坡事件进行解释,岩性与高程对滑坡起抑制作用,起伏度、坡度、归一化植被指数(NDVI)与POI核密度促进滑坡发生。综上所述,基于随机森林-特征递归消除模型在缓丘岭谷区滑坡易发性评价中具有较高的准确性,通过部分依赖图与SHAP算法对全局滑坡与个体滑坡发生的内在机理进行解释分析,有利于构建与完善不同地貌环境下滑坡易发性评价因子体系并探究滑坡内部决策机理,� 展开更多
关键词 滑坡易发性区划 随机森林算法 缓丘岭谷区 特征递归消除算法 部分依赖图 SHAP算法
下载PDF
基于改进随机森林算法的上市公司信用风险实证分析
7
作者 王晓筱 王永茂 《统计学与应用》 2022年第1期150-156,共7页
近年来随着金融市场的不断发展,贷前识别风险企业、有效进行信贷风险控制越来越重要。本文主要研究企业信用风险评估的问题,通过合理的模型选择及模型优化,提升模型识别问题企业的能力。本文首先基于实际情况选择了合理的模型评估指标体... 近年来随着金融市场的不断发展,贷前识别风险企业、有效进行信贷风险控制越来越重要。本文主要研究企业信用风险评估的问题,通过合理的模型选择及模型优化,提升模型识别问题企业的能力。本文首先基于实际情况选择了合理的模型评估指标体系,通过优化后的随机森林算法,将特征选取与模型训练过程相结合,利用该模型以我国上市公司数据为例,进行了实证检验,并横向对比常见评估模型的数据表现,实验结果表明模型有较好的预测效果。 展开更多
关键词 信用风险评估 随机森林 特征递归消除
下载PDF
多源遥感数据和随机森林模型驱动的人口空间化研究——以南京为例
8
作者 肖金榜 赵蕤楠 薛朝辉 《现代测绘》 2022年第S01期1-7,共7页
传统人口数据调查依赖人工统计,时间周期长,空间分辨率较低.因此,充分挖掘多源遥感数据提供的互补信息,研究机器学习模型驱动的人口精细空间化研究具有重要意义.采用特征递归消除法对不同特征组合进行分析,筛选出兴趣点数据、土地利用... 传统人口数据调查依赖人工统计,时间周期长,空间分辨率较低.因此,充分挖掘多源遥感数据提供的互补信息,研究机器学习模型驱动的人口精细空间化研究具有重要意义.采用特征递归消除法对不同特征组合进行分析,筛选出兴趣点数据、土地利用数据面积占比、欧氏距离处理后土地利用数据、夜间灯光DN值和道路网密度值组合特征,借助随机森林模型进行人口空间化.结果表明,提出的人口空间化模型在街道尺度上的平均绝对误差为5338,均方根误差为10362,高于GPW、中国公里格网人口数据集精度,而与WorldPop和GHSL数据集精度相当,验证了多源遥感数据和机器学习模型驱动人口空间化研究的可行性. 展开更多
关键词 人口空间化 多源遥感数据 特征递归消除 随机森林模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部