期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
不平衡数据集下基于自适应加权Bagging-GBDT算法的磁盘故障预测模型
被引量:
8
1
作者
李新鹏
高欣
+6 位作者
何杨
阎博
孙汉旭
李军良
徐建航
刘震宇
庞博
《微电子学与计算机》
北大核心
2020年第3期14-19,共6页
针对磁盘数据集中正负样本数目严重不平衡导致基于机器学习的分类算法易出现故障预测准确率低的问题,本文提出一种基于自适应加权Bagging-GBDT算法的磁盘故障预测模型.首先,提出基于聚类的分层欠采样方法对健康磁盘样本进行多次抽样,解...
针对磁盘数据集中正负样本数目严重不平衡导致基于机器学习的分类算法易出现故障预测准确率低的问题,本文提出一种基于自适应加权Bagging-GBDT算法的磁盘故障预测模型.首先,提出基于聚类的分层欠采样方法对健康磁盘样本进行多次抽样,解决随机欠采样方法易丢弃潜在有用样本的问题;其次,将每次采样后样本与全部故障磁盘样本组合得到多个样本子集,通过训练这些子集建立多个预测精度较高的GBDT子分类模型;最后,根据待测点邻域样本类别自适应确定各子模型权重,据此通过加权硬投票集成最终的磁盘故障预测模型.在8组KEEL不平衡数据集上实验结果表明,与现有典型不平衡学习算法相比,少数类的召回率平均提升了9.46%;同时在磁盘公开数据集和某调度系统磁盘数据上对比验证了该方法在故障预测率上的先进性.
展开更多
关键词
磁盘故障预测
不平衡数据集
分层欠采样
Bagging-GBDT
自适应加权
下载PDF
职称材料
题名
不平衡数据集下基于自适应加权Bagging-GBDT算法的磁盘故障预测模型
被引量:
8
1
作者
李新鹏
高欣
何杨
阎博
孙汉旭
李军良
徐建航
刘震宇
庞博
机构
国家电网有限公司
北京邮电大学自动化学院
国网冀北电力有限公司
南瑞集团(国网电力科学研究院)有限公司
国网冀北电力有限公司承德供电公司
出处
《微电子学与计算机》
北大核心
2020年第3期14-19,共6页
基金
国家电网公司总部科技项目-调度控制系统测试验证与一体化运维关键技术研究与应用(DZ71-18-010)。
文摘
针对磁盘数据集中正负样本数目严重不平衡导致基于机器学习的分类算法易出现故障预测准确率低的问题,本文提出一种基于自适应加权Bagging-GBDT算法的磁盘故障预测模型.首先,提出基于聚类的分层欠采样方法对健康磁盘样本进行多次抽样,解决随机欠采样方法易丢弃潜在有用样本的问题;其次,将每次采样后样本与全部故障磁盘样本组合得到多个样本子集,通过训练这些子集建立多个预测精度较高的GBDT子分类模型;最后,根据待测点邻域样本类别自适应确定各子模型权重,据此通过加权硬投票集成最终的磁盘故障预测模型.在8组KEEL不平衡数据集上实验结果表明,与现有典型不平衡学习算法相比,少数类的召回率平均提升了9.46%;同时在磁盘公开数据集和某调度系统磁盘数据上对比验证了该方法在故障预测率上的先进性.
关键词
磁盘故障预测
不平衡数据集
分层欠采样
Bagging-GBDT
自适应加权
Keywords
prediction
of
disk
failure
imbalanced
dataset
hierarchical
under-sampling
Bagging-GBDT
adaptive
weighted
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
不平衡数据集下基于自适应加权Bagging-GBDT算法的磁盘故障预测模型
李新鹏
高欣
何杨
阎博
孙汉旭
李军良
徐建航
刘震宇
庞博
《微电子学与计算机》
北大核心
2020
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部