摘要
本文利用集成学习技术预测软件缺陷在近年获得到了广泛的关注。实际应用中,有缺陷的软件样本大大少于无缺陷的软件样本,造成样本的高度不平衡。不平衡数据分类问题是数据挖掘与机器学习领域的研究热点与难点。为了有效解决软件缺陷预测问题,本文提出了SMOTETomek采样与集成学习算法XGBoost相结合的分类模型。十个美国国家航空航天局(NASA)的软件缺陷数据集实验结果验证了该分类模型的优越性。
出处
《网络安全技术与应用》
2021年第5期59-60,共2页
Network Security Technology & Application