摘要
随着全球经济下行压力加大,国内债务规模的上升,越来越多的企业面临着信用风险。研究企业的违约风险,对于识别高风险违约企业,提高企业自身信誉度具有重要意义。本文通过分析43766笔上市企业数据,对企业的违约风险进行了评价。首先通过方差过滤法初步筛选得到178个候选评价指标,然后使用随机森林法进一步筛选得到了20个对企业违约影响显著的指标。本文分别建立了XGboost、LightGBM、Catboost和随机森林四个模型,使用贝叶斯调参的方法对模型参数进行优化。接下来,使用Blending的方法对前面四个模型进行融合,得到最终模型的AUC值=0.97,模型整体预测效果较好。最终模型的F1值=0.62,较之融合前的单个模型,违约企业的预测效果得到了提升。
出处
《统计与管理》
2021年第2期62-68,共7页
Statistics and Management
基金
国家级大学生创新创业计划项目“基于统计学习的信用评估决策系统的设计与实现”(201910069028)。