摘要
在金融风控领域,不均衡数据集建模是一个常见的问题。文章提出将EasyEnsemble算法应用于金融风控不均衡数据集建模中,以弥补一般欠采样可能损失部分重要分类信息的缺陷。文章所记录的实验是基于Kaggle公开的信用卡客户违约数据集以及真实的金融风控业务场景进行的,实验结果表明,在金融风控不均衡数据集中,相较于XGBoost算法和SMOTE过采样后XGBoost算法,XGBoost-EasyEnsemble算法可以显著提升模型的召回率。
作者
张青周
高龙
胡颖迪
申晓雪
Zhang Qingzhou;Gao Long;Hu Yingdi;Shen Xiaoxue
出处
《金融科技时代》
2023年第1期41-46,共6页
FinTech Time