期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
CTGANBoost:基于CTGAN与Boosting的信贷欺诈检测研究
1
作者
卓佩妍
张瑶娜
+2 位作者
刘炜
刘自金
宋友
《计算机科学》
CSCD
北大核心
2024年第S01期607-613,共7页
在金融行业中,信贷欺诈检测是一项重要的工作,能够为银行和消金机构减少大量的经济损失。然而,信贷数据中存在类别不平衡和正负样本特征重叠的问题,导致少数类识别灵敏度低且不同类别数据区分度低。针对这些问题,提出一种面向信贷欺诈...
在金融行业中,信贷欺诈检测是一项重要的工作,能够为银行和消金机构减少大量的经济损失。然而,信贷数据中存在类别不平衡和正负样本特征重叠的问题,导致少数类识别灵敏度低且不同类别数据区分度低。针对这些问题,提出一种面向信贷欺诈检测的CTGANBoost方法。首先,在AdaBoost(Adaptive Boosting)方法的每一轮Boosting迭代中,引入基于类别标签信息约束的CTGAN(Conditional Tabular Generative Adversarial Network)方法学习特征分布,进行少数类数据增强工作;其次,基于CTGAN合成的增强数据集,设计了权重归一化方法,确保在样本加权过程中保持原始数据集的分布特征和相对权重。在3个开源数据集上的实验结果表明,CTGANBoost方法的表现均优于其他主流的信贷欺诈检测方法,AUC值提升了0.5%~2.0%,F1值提升了0.6%~1.8%,验证了CTGANBoost方法的有效性和泛化能力。
展开更多
关键词
信贷欺诈
数据
类别
不
平衡
集成学习
生成对抗网络
自适应增强
下载PDF
职称材料
一种面向不平衡数据的心脏病风险预测可解释性框架
2
作者
周展
刘彬
+4 位作者
郑立瑞
谭建聪
邹北骥
彭清华
肖晓霞
《湖南中医药大学学报》
CAS
2023年第6期1078-1085,共8页
目的研究疾病预测模型存在的类别不平衡性与不可解释性难题。方法结合极限梯度提升(eXtreme gradient boosting,XGBoost)、混合采样和Shapley加法解释(shapley additive exPlanations,SHAP)分析,提出一种面向不平衡数据的心脏病风险预...
目的研究疾病预测模型存在的类别不平衡性与不可解释性难题。方法结合极限梯度提升(eXtreme gradient boosting,XGBoost)、混合采样和Shapley加法解释(shapley additive exPlanations,SHAP)分析,提出一种面向不平衡数据的心脏病风险预测可解释性框架ICRPI。结果该框架下的风险预测模型平衡准确度为0.94250,AUC为0.98603,模型可视化分析获得高龄、高体质量指数(body mass index,BMI)值、患有糖尿病等9个心脏病危险因素,并得出高龄的糖尿病患者、高BMI值且诊断为糖尿病或临界糖尿病患者、高BMI值且缺乏体力活动群体为患心脏病高危群体,临界糖尿病人群参与体力活动可降低患心脏病风险。结论ICRPI框架适用于真实临床不平衡数据分析,且能明确给出致病风险因素及其相关性,可有效提高临床诊断准确率的同时为医生提供致病因素分析,智能辅助医生临床诊疗。
展开更多
关键词
数据
类别
不
平衡
心脏病风险预测
XGBoost
SHAP
可解释性
下载PDF
职称材料
题名
CTGANBoost:基于CTGAN与Boosting的信贷欺诈检测研究
1
作者
卓佩妍
张瑶娜
刘炜
刘自金
宋友
机构
北京航空航天大学软件学院
出处
《计算机科学》
CSCD
北大核心
2024年第S01期607-613,共7页
基金
河北省重点研发计划(21310101D)。
文摘
在金融行业中,信贷欺诈检测是一项重要的工作,能够为银行和消金机构减少大量的经济损失。然而,信贷数据中存在类别不平衡和正负样本特征重叠的问题,导致少数类识别灵敏度低且不同类别数据区分度低。针对这些问题,提出一种面向信贷欺诈检测的CTGANBoost方法。首先,在AdaBoost(Adaptive Boosting)方法的每一轮Boosting迭代中,引入基于类别标签信息约束的CTGAN(Conditional Tabular Generative Adversarial Network)方法学习特征分布,进行少数类数据增强工作;其次,基于CTGAN合成的增强数据集,设计了权重归一化方法,确保在样本加权过程中保持原始数据集的分布特征和相对权重。在3个开源数据集上的实验结果表明,CTGANBoost方法的表现均优于其他主流的信贷欺诈检测方法,AUC值提升了0.5%~2.0%,F1值提升了0.6%~1.8%,验证了CTGANBoost方法的有效性和泛化能力。
关键词
信贷欺诈
数据
类别
不
平衡
集成学习
生成对抗网络
自适应增强
Keywords
Credit fraud
Imbalance data
Ensemble learning
Generative adversarial network
AdaBoost
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种面向不平衡数据的心脏病风险预测可解释性框架
2
作者
周展
刘彬
郑立瑞
谭建聪
邹北骥
彭清华
肖晓霞
机构
湖南中医药大学信息科学与工程学院
中南大学计算机学院
湖南中医药大学中医学院
出处
《湖南中医药大学学报》
CAS
2023年第6期1078-1085,共8页
基金
科技部十三五重点研发计划项目(2017YFC1703300)
科技创新2030“新一代人工智能”重大项目课题(2018AAA0102102)
2022年湖南中医药大学研究生创新课题立项基金项目(2022CX123)。
文摘
目的研究疾病预测模型存在的类别不平衡性与不可解释性难题。方法结合极限梯度提升(eXtreme gradient boosting,XGBoost)、混合采样和Shapley加法解释(shapley additive exPlanations,SHAP)分析,提出一种面向不平衡数据的心脏病风险预测可解释性框架ICRPI。结果该框架下的风险预测模型平衡准确度为0.94250,AUC为0.98603,模型可视化分析获得高龄、高体质量指数(body mass index,BMI)值、患有糖尿病等9个心脏病危险因素,并得出高龄的糖尿病患者、高BMI值且诊断为糖尿病或临界糖尿病患者、高BMI值且缺乏体力活动群体为患心脏病高危群体,临界糖尿病人群参与体力活动可降低患心脏病风险。结论ICRPI框架适用于真实临床不平衡数据分析,且能明确给出致病风险因素及其相关性,可有效提高临床诊断准确率的同时为医生提供致病因素分析,智能辅助医生临床诊疗。
关键词
数据
类别
不
平衡
心脏病风险预测
XGBoost
SHAP
可解释性
Keywords
imbalanced data
predicting heart disease risk factors
XGBoost
SHAP
interpretability
分类号
R2 [医药卫生—中医学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
CTGANBoost:基于CTGAN与Boosting的信贷欺诈检测研究
卓佩妍
张瑶娜
刘炜
刘自金
宋友
《计算机科学》
CSCD
北大核心
2024
0
下载PDF
职称材料
2
一种面向不平衡数据的心脏病风险预测可解释性框架
周展
刘彬
郑立瑞
谭建聪
邹北骥
彭清华
肖晓霞
《湖南中医药大学学报》
CAS
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部