基于RF-SMOTE-XGboost下的银行用户个人信用风险评估模型被引量：7

Bank users′private credit risk assessment model based on RF⁃MOTE⁃XGboost

下载PDF

导出

摘要大数据时代下,用户信用数据中的高维稀疏特征与样本不平衡现象日益显著。为处理高维特征,文中采用随机森林(RF)从Filter和Wrapper角度进行特征提取,并用SMOTE算法对训练集样本做采样处理。模型训练阶段使用粒子群优化算法对XGboost模型做分类精度提高。最后,采用一开源银行数据集提供的数据进行实例验证。结果表明,相较于一般的GBDT模型和网格搜索法,所建立的模型在评估时具有更好的精度与收敛性。 In the era of big data,the imbalanced phenomenon between high⁃dimensional sparse features and samples in user credit data is increasingly obvious.In order to deal with high⁃dimensional features,RF(random forest)is used in this paper to extract the features by Filter and Wrapper methodes,and SMOTE algorithm is used to perform sampling processing of the training set samples.In the model training stage,particle swarm optimization algorithm is used to improve the classification accuracy of XGboost model.The data provided by Xiamen International Bank is used for example verification.The results show that,in comparison with the common GBDT model and grid search method,the model established in this paper has better accuracy and convergence in evaluation direction.

作者张雷王家琪费职友罗帅隋京岐 ZHANG Lei;WANG Jiaqi;FEI Zhiyou;LUO Shuai;SUI Jingqi(School of Mathematics and Statistics,Chongqing Jiaotong University,Chongqing 400074,China;School of Economics and Management,Chongqing Jiaotong University,Chongqing 400074,China;School of Information Science and Engineering,Chongqing Jiaotong University,Chongqing 400074,China)

机构地区重庆交通大学数学与统计学院重庆交通大学经济与管理学院重庆交通大学信息科学与工程学院

出处《现代电子技术》北大核心 2020年第16期76-81,共6页 Modern Electronics Technique

基金国家自然科学基金项目(11401061) 国家自然科学基金项目(11501065) 重庆市教委项目(KJ1600504,KJ1600512)。

关键词信用风险评估 SMOTE算法特征提取采样处理 XGboost 实例验证 credit risk assessmen SMOTE algorithm feature extraction sampling processing XGboost example verification

分类号 TN915.08-34 [电子电信—通信与信息系统] TP391.9 [电子电信—信息与通信工程]

引文网络
相关文献

参考文献11

1王名豪,梁雪春.基于CPSO-XGboost的个人信用评估[J].计算机工程与设计,2019,40(7):1891-1895. 被引量：16
2李众,王海瑞,朱建府,燕志星,李卓漫,王广雪,刘毅凡.基于蜻蜓算法优化支持向量机的滚动轴承故障诊断[J].化工自动化及仪表,2019,46(11):910-916. 被引量：9
3林子,黄薏辰,张扬,刘诚,杨俊清.基于支持向量机相关性分析的波浪能发电电力负荷预测[J].南昌大学学报（理科版）,2019,43(5):504-510. 被引量：4
4吴金旺,顾洲一.基于非平衡样本的商业银行客户信用风险评估——以A银行为例[J].金融理论与实践,2018(7):51-57. 被引量：11
5白鹏飞,安琪,Nicolaas Fransde ROOIJ,李楠,周国富.基于多模型融合的互联网信贷个人信用评估方法[J].华南师范大学学报（自然科学版）,2017,49(6):119-123. 被引量：13
6于彤,李海东.基于BP神经网络的客户信用风险评价[J].现代电子技术,2014,37(10):8-11. 被引量：4
7莫赞,张灿凤,魏伟,游德创,张舒.基于Bagging集成的个人信用风险评估方法研究[J].系统工程,2019,37(1):143-151. 被引量：13
8刘定祥,乔少杰,张永清,韩楠,魏军林,张榕珂,黄萍.不平衡分类的数据采样方法综述[J].重庆理工大学学报（自然科学）,2019,33(7):102-112. 被引量：28
9王重仁,韩冬梅.基于卷积神经网络的互联网金融信用风险预测研究[J].微型机与应用,2017,36(24):44-46. 被引量：14
10肖文兵,费奇.基于支持向量机的个人信用评估模型及最优参数选择研究[J].系统工程理论与实践,2006,26(10):73-79. 被引量：47

二级参考文献89

1潘峰,程浩忠,杨镜非,张澄,潘震东.基于支持向量机的电力系统短期负荷预测[J].电网技术,2004,28(21):39-42. 被引量：51
2李志辉,李萌.我国商业银行信用风险识别模型及其实证研究[J].经济科学,2005(5):61-71. 被引量：33
3张前进.基于支持向量机回归的电力负荷预测研究[J].航空计算技术,2006,36(4):105-107. 被引量：10
4Henley W E. Statistical Aspects of Credit Scoring[ M]. Dissertation. The Open University, Milton Keynes, Uk 1995. 被引量：1
5Henley W E, Hand D J. K-nearest neighbor classifier for assessing consumer credit risk[J]. Statistician, 1996, 44:77 -95. 被引量：1
6Desai V S, Crook J N, & Overstreet G A. A comparison of neural networks and linear scoring models in the credit union environment[J]. European Journal of Operational Research, 1996, 18 : 15 - 26. 被引量：1
7David West. Neural network credit scoring models[ J]. Computers Operation Research, 2000,27:1131 - 1152. 被引量：1
8Jensen H L. Using neural networks for credit scoring[J]. 1992,18(1):15 - 16. 被引量：1
9Piramuthu S. Financial credit-risk evaluation with neural and neurofuzzy systems [ J ]. European Journal of Operational Research,1999,112(2) :310 - 321. 被引量：1
10Rashmi Malhotra, Malhotra D K. Evaluating consumer loans using neural networks [ J]. The International Journal of Management Science ,2003,31 : 83 - 96. 被引量：1

共引文献151

1李欣,俞卫琴.基于改进GS-XGBoost的个人信用评估[J].计算机系统应用,2020,29(11):145-150. 被引量：8
2何儒汉,苏裕益,向俐双,刘军平.基于梯度提升决策树的卷烟零售户信用评分模型研究[J].计算机应用研究,2020,37(S01):108-110. 被引量：3
3高子寒,宋燕.基于边界增强和去噪的自适应双权重过采样方法研究[J].智能计算机与应用,2022,12(1):58-64.
4左文明,黎绍发,易聪.基于SVM的B2C商务网站服务质量评价模型[J].商场现代化,2007(09Z):176-177. 被引量：4
5姚尚锋.基于主分量分析和BP神经网络的个人信用评估模型[J].数学的实践与认识,2007,37(21):21-24. 被引量：2
6王波,刘勇奎,郝艳友.基于粗集和SVM的客户抵押贷款违约评估[J].计算机工程与应用,2008,44(9):229-231. 被引量：4
7陈珊珊.基于粗糙集和支持向量机的商业银行信用风险评估模型[J].价值工程,2008,27(5):1-4. 被引量：3
8王小明.关于一类广义可加违约概率模型的探讨[J].系统工程理论与实践,2008,28(6):52-58. 被引量：4
9孙瑾,许青松,陈燕燕.基于遗传算法和支持向量机的银行个人信用评估[J].统计与决策,2008,24(12):126-128. 被引量：6
10沈乐平,黄维民,饶天贵.基于支持向量机的上市公司违规预警模型研究[J].中大管理研究,2008,3(2):125-135. 被引量：2

同被引文献45

1綦方中,俞婷婷,朱国荣.一种基于RFE特征选择的PSO-SVR用电需求预测模型[J].计算机应用研究,2020,37(S01):105-107. 被引量：10
2陈学彬,武靖,徐明东.我国信用债个体违约风险测度与防范——基于LSTM深度学习模型[J].复旦学报（社会科学版）,2021(3):159-173. 被引量：13
3凌健,林成德.拆分特征选择及其在企业信用评估中应用[J].福建工程学院学报,2006,4(4):436-439. 被引量：2
4程昌品,陈强.基于信息增益比的决策树用于毕业生就业预测[J].计算机仿真,2010,27(2):299-302. 被引量：15
5方匡南,章贵军,张惠颖.基于Lasso-logistic模型的个人信用风险预警方法[J].数量经济技术经济研究,2014,31(2):125-136. 被引量：112
6王刚,王珏,杨善林.电子商务中基于非均衡数据分类和词性分析的意见挖掘研究[J].情报学报,2014,33(3):313-325. 被引量：10
7冯振涛,冯梦嫒.基于AHP的信用卡评分模型研究[J].金融理论与实践,2016(1):74-77. 被引量：7
8逯宇铎,金艳玲.基于Lasso-logistic模型的供应链金融信用风险实证研究[J].管理现代化,2016,36(2):98-100. 被引量：22
9孙新,欧阳童,严西敏,尚煜茗,郭文浩.基于训练集裁剪的加权K近邻文本分类算法[J].情报工程,2016,2(6):8-16. 被引量：7
10柳培忠,洪铭,黄德天,骆炎民,王守觉.基于ADASYN与AdaBoostSVM相结合的不平衡分类算法[J].北京工业大学学报,2017,43(3):368-375. 被引量：10

引证文献7

1毛子林,刘姜.基于机器学习方法的信用风险评估综述[J].经济研究导刊,2021(23):117-119. 被引量：3
2高娜,牛国良,吕勇.互联网视域下基于AHP的个人信用评分模型研究[J].现代商业,2021(23):113-115. 被引量：1
3仇实,高影繁,姚长青,刘志辉,李佳星.一种面向非均衡样本的企业金融风险预测方法[J].中国科技资源导刊,2021,53(5):11-17. 被引量：1
4许婉,刘胜题.我国房地产行业信用风险预测的实证研究——基于Stacking融合模型[J].上海经济,2023(3):50-67.
5熊露露,年梅,张俊.非平衡数据集下的高职学生就业预测模型[J].计算机与数字工程,2023,51(3):675-678.
6苗月,吴陈.基于RF-FL-LightGBM算法的信用风险评估模型研究[J].计算机与数字工程,2024,52(3):808-813.
7王晓筱,王永茂.基于改进随机森林算法的上市公司信用风险实证分析[J].统计学与应用,2022,11(1):150-156.

二级引证文献5

1李佳成,任姿霖,王攀.基于银行个人信用评分组合模型的建设银行MS分行的个人信用评分系统的应用研究[J].四川工商学院学术新视野,2022,7(1):126-130.
2樊晓唯,蒋林岑,刘向东.基于LightGBM算法的简易险潜在客户挖掘应用[J].电脑知识与技术,2022,18(17):17-18.
3吴永影.基于模糊随机方法的小微企业会计风险预测方法[J].贵阳学院学报（自然科学版）,2023,18(4):10-14.
4张俊丽,郭双颜,任翠萍,马倩.基于逻辑回归的个人信用评分卡模型研究[J].现代信息科技,2024,8(5):12-16. 被引量：1
5王晓筱,王永茂.基于改进随机森林算法的上市公司信用风险实证分析[J].统计学与应用,2022,11(1):150-156.

1符传福,陈钦柱,姚冬,陈林聪.电网设备综合评估方法研究[J].自动化技术与应用,2020,39(7):157-159. 被引量：2
2班林芳,杜敏.联网直销银行助力农村地区经济发展可行性研究[J].北方金融,2020(8):112-112.
3何群,赵婧怡,江国乾,贾晨凌,谢平.基于电流信号稀疏滤波特征融合的齿轮箱故障诊断方法[J].电网技术,2020,44(5):1964-1971. 被引量：11
4张晓宇,王华忠.基于改进Border-SMOTE的不平衡数据工业控制系统入侵检测[J].信息网络安全,2020(7):70-76. 被引量：8
5黄硕,胡勇,巩彩兰,郑付强.基于稀疏编码的红外显著区域超分重建算法[J].红外与毫米波学报,2020,39(3):388-395. 被引量：4
6赵仁成,林子棠,余卫军,雷林,刘峥,徐英,郭艳芳,彭绩.2017—2019年深圳市宝安区40~74岁常住居民五癌风险流行状况分析[J].实用肿瘤学杂志,2020,34(4):315-320. 被引量：5
7辛继召,雷思敏.工行4.35%、招行3.78%……银行猛降个人信用消费贷款利率[J].投资与理财,2020(7):66-67.
8王力,赵丽,齐志平,李远,李阳.基于压缩感知的高频雷达目标到达角估计[J].航天电子对抗,2020,36(2):25-28. 被引量：1
9刘玲,郑建国.一种基于随机森林的组合分类算法设计与应用[J].电子设计工程,2020,28(16):54-57. 被引量：5
10樊佳恒,王洪梅,王法广,李世银,李宗艳,刘玉英.基于带通采样的抗混叠滤波器设计[J].计算机工程与设计,2020,41(7):1841-1845. 被引量：1

现代电子技术

2020年第16期

浏览历史

内容加载中请稍等...

基于RF-SMOTE-XGboost下的银行用户个人信用风险评估模型被引量：7

参考文献11

二级参考文献89

共引文献151

同被引文献45

引证文献7

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于RF-SMOTE-XGboost下的银行用户个人信用风险评估模型 被引量：7

参考文献11

二级参考文献89

共引文献151

同被引文献45

引证文献7

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于RF-SMOTE-XGboost下的银行用户个人信用风险评估模型被引量：7