期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
CTGANBoost:基于CTGAN与Boosting的信贷欺诈检测研究
1
作者 卓佩妍 张瑶娜 +2 位作者 刘炜 刘自金 宋友 《计算机科学》 CSCD 北大核心 2024年第S01期607-613,共7页
在金融行业中,信贷欺诈检测是一项重要的工作,能够为银行和消金机构减少大量的经济损失。然而,信贷数据中存在类别不平衡和正负样本特征重叠的问题,导致少数类识别灵敏度低且不同类别数据区分度低。针对这些问题,提出一种面向信贷欺诈... 在金融行业中,信贷欺诈检测是一项重要的工作,能够为银行和消金机构减少大量的经济损失。然而,信贷数据中存在类别不平衡和正负样本特征重叠的问题,导致少数类识别灵敏度低且不同类别数据区分度低。针对这些问题,提出一种面向信贷欺诈检测的CTGANBoost方法。首先,在AdaBoost(Adaptive Boosting)方法的每一轮Boosting迭代中,引入基于类别标签信息约束的CTGAN(Conditional Tabular Generative Adversarial Network)方法学习特征分布,进行少数类数据增强工作;其次,基于CTGAN合成的增强数据集,设计了权重归一化方法,确保在样本加权过程中保持原始数据集的分布特征和相对权重。在3个开源数据集上的实验结果表明,CTGANBoost方法的表现均优于其他主流的信贷欺诈检测方法,AUC值提升了0.5%~2.0%,F1值提升了0.6%~1.8%,验证了CTGANBoost方法的有效性和泛化能力。 展开更多
关键词 信贷欺诈 数据类别平衡 集成学习 生成对抗网络 自适应增强
下载PDF
一种面向不平衡数据的心脏病风险预测可解释性框架
2
作者 周展 刘彬 +4 位作者 郑立瑞 谭建聪 邹北骥 彭清华 肖晓霞 《湖南中医药大学学报》 CAS 2023年第6期1078-1085,共8页
目的研究疾病预测模型存在的类别不平衡性与不可解释性难题。方法结合极限梯度提升(eXtreme gradient boosting,XGBoost)、混合采样和Shapley加法解释(shapley additive exPlanations,SHAP)分析,提出一种面向不平衡数据的心脏病风险预... 目的研究疾病预测模型存在的类别不平衡性与不可解释性难题。方法结合极限梯度提升(eXtreme gradient boosting,XGBoost)、混合采样和Shapley加法解释(shapley additive exPlanations,SHAP)分析,提出一种面向不平衡数据的心脏病风险预测可解释性框架ICRPI。结果该框架下的风险预测模型平衡准确度为0.94250,AUC为0.98603,模型可视化分析获得高龄、高体质量指数(body mass index,BMI)值、患有糖尿病等9个心脏病危险因素,并得出高龄的糖尿病患者、高BMI值且诊断为糖尿病或临界糖尿病患者、高BMI值且缺乏体力活动群体为患心脏病高危群体,临界糖尿病人群参与体力活动可降低患心脏病风险。结论ICRPI框架适用于真实临床不平衡数据分析,且能明确给出致病风险因素及其相关性,可有效提高临床诊断准确率的同时为医生提供致病因素分析,智能辅助医生临床诊疗。 展开更多
关键词 数据类别平衡 心脏病风险预测 XGBoost SHAP 可解释性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部