期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
不平衡数据集下基于自适应加权Bagging-GBDT算法的磁盘故障预测模型 被引量:8
1
作者 李新鹏 高欣 +6 位作者 何杨 阎博 孙汉旭 李军良 徐建航 刘震宇 庞博 《微电子学与计算机》 北大核心 2020年第3期14-19,共6页
针对磁盘数据集中正负样本数目严重不平衡导致基于机器学习的分类算法易出现故障预测准确率低的问题,本文提出一种基于自适应加权Bagging-GBDT算法的磁盘故障预测模型.首先,提出基于聚类的分层欠采样方法对健康磁盘样本进行多次抽样,解... 针对磁盘数据集中正负样本数目严重不平衡导致基于机器学习的分类算法易出现故障预测准确率低的问题,本文提出一种基于自适应加权Bagging-GBDT算法的磁盘故障预测模型.首先,提出基于聚类的分层欠采样方法对健康磁盘样本进行多次抽样,解决随机欠采样方法易丢弃潜在有用样本的问题;其次,将每次采样后样本与全部故障磁盘样本组合得到多个样本子集,通过训练这些子集建立多个预测精度较高的GBDT子分类模型;最后,根据待测点邻域样本类别自适应确定各子模型权重,据此通过加权硬投票集成最终的磁盘故障预测模型.在8组KEEL不平衡数据集上实验结果表明,与现有典型不平衡学习算法相比,少数类的召回率平均提升了9.46%;同时在磁盘公开数据集和某调度系统磁盘数据上对比验证了该方法在故障预测率上的先进性. 展开更多
关键词 磁盘故障预测 不平衡数据集 分层欠采样 Bagging-GBDT 自适应加权
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部