期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于可解释性机器学习模型的轻型缺血性卒中复发预测研究
1
作者 莫秋红 丁晓波 +2 位作者 李靓 张岩波 李伟荣 《中国卒中杂志》 北大核心 2024年第8期924-930,共7页
目的利用可解释的机器学习模型,探讨轻型缺血性卒中(minor ischemic stroke,MIS)2年内复发相关危险因素。方法回顾性收集2020年7—12月山西省心血管病医院神经内科MIS患者一般资料、实验室结果、影像学等资料,单因素分析进行复发危险因... 目的利用可解释的机器学习模型,探讨轻型缺血性卒中(minor ischemic stroke,MIS)2年内复发相关危险因素。方法回顾性收集2020年7—12月山西省心血管病医院神经内科MIS患者一般资料、实验室结果、影像学等资料,单因素分析进行复发危险因素变量筛选,合成少数过采样技术-标称连续处理数据不平衡,数据集按8∶2的比例分为训练集与测试集,网格搜索10折交叉验证构建轻量梯度提升机(light gradient boosting machine,LightGBM)、支持向量机(support vector machine,SVM)模型,并与逻辑回归(logistic regression,LR)模型进行比较,基于ROC的AUC、校准曲线分别评价模型的区分度与校准度,性能最好的模型通过Shapley加性解释(Shapley additive explanation,SHAP)模型对预测结果进行解读。结果本研究共纳入520例MIS患者,2年内复发93例(17.9%),测试集中LightGBM、SVM、LR预测患者2年内复发的AUC分别为0.935(95%CI 0.896~0.973)、0.833(95%CI 0.770~0.896)、0.764(95%CI 0.691~0.835),准确度分别为0.890、0.773、0.693,布里尔分数分别为0.105、0.167、0.200。结果显示LightGBM模型性能最优,基于SHAP的LightGBM可解释模型重要性前5的是舒张压、年龄、糖尿病、LDL-C、吸烟。结论本研究建立的LightGBM模型预测效果良好,可为MIS患者2年内复发的预测提供借鉴。通过SHAP可解释性帮助临床医师更好地理解预测模型结果背后的原因,对MIS患者做出更个性化与合理化的临床决策。 展开更多
关键词 轻型缺血卒中 复发 轻量梯度提升机 shapley解释
下载PDF
基于随机森林法的山核桃林地土壤速效养分含量空间分布特征研究
2
作者 凌晓丹 王罗其 +3 位作者 赵科理 傅伟军 叶正钱 丁立忠 《生态学报》 CAS CSCD 北大核心 2024年第2期662-675,共14页
土壤氮磷钾是土壤肥力管理的重要元素,是植物生长的必要养分元素。对土壤氮磷钾的空间分布进行特征解译,可为精准管理临安山核桃产区林地土壤肥力,促进山核桃林产业可持续发展提供理论依据。研究以临安山核桃主产区为研究区域,利用随机... 土壤氮磷钾是土壤肥力管理的重要元素,是植物生长的必要养分元素。对土壤氮磷钾的空间分布进行特征解译,可为精准管理临安山核桃产区林地土壤肥力,促进山核桃林产业可持续发展提供理论依据。研究以临安山核桃主产区为研究区域,利用随机森林(RF)、普通克里格(OK)和Shapley加性解释(SHAP)方法,结合地形因子、气候因子、土壤因子、遥感因子等环境变量,对山核桃林地土壤碱解氮(AN)、有效磷(AP)、速效钾(AK)的空间分布特征进行分析。研究结果表明:相比于OK模型,基于环境协变量所构建的RF模型对AN、AP和AK含量空间分布预测表现最佳,R^(2)分别为0.68、0.60和0.64,均方根误差(RMSE)分别为20.005、10.287和22.426,平均绝对误差(MAE)分别为15.425、7.709和21.628。RF模型SHAP分析显示,AN和AK含量分布主要受土壤有机质(SOM)的影响,并且SOM与AN和AK存在正相关性;AP主要受pH的影响,其次为色调指数,AP与pH和色调指数均具有负相关性;AK和AP同时受到海拔和坡向的影响。两种模型预测的氮磷钾空间分布趋势总体相似,不同速效养分存在明显的空间异质性。碱解氮高值区域主要分布于研究区东部;有效磷高值区域主要分布于研究区西部,但分散度高;速效钾高值区域则主要分布于研究区中部。总体而言,基于随机森林模型可以高精度模拟山核桃林地土壤氮磷钾含量空间分布特征,并依据主要环境协变量对土壤氮磷钾的影响关系,提出相应改良措施。在有效磷含量低值区域可以施用石灰来缓解土壤酸化,同时补追磷肥;碱解氮含量高值区域可以合理减少氮肥施用;速效钾含量低值区域合理施加钾肥;对于海拔较高及迎风坡多降雨的区域,可以构建林下高效水土保持植被,减轻水土流失;在林地施用有机肥料,改善土壤理化性质,增加土壤养分含量。 展开更多
关键词 山核桃林地 随机森林 shapley解释 速效养分
下载PDF
基于机器学习构建急性心力衰竭患者易损期死亡或再入院风险预测模型
3
作者 曾竟 何小龙 +5 位作者 胡华娟 罗晓宇 郭志念 陈运龙 王敏 王江 《陆军军医大学学报》 CAS CSCD 北大核心 2024年第7期738-745,共8页
目的应用不同机器学习算法构建急性心力衰竭(acute heart failure,AHF)患者易损期死亡或再入院的风险预测模型,并筛选出最优模型。方法选取2019年10月至2021年7月于陆军军医大学第二附属医院心血管内科住院治疗的651例AHF患者为研究对象... 目的应用不同机器学习算法构建急性心力衰竭(acute heart failure,AHF)患者易损期死亡或再入院的风险预测模型,并筛选出最优模型。方法选取2019年10月至2021年7月于陆军军医大学第二附属医院心血管内科住院治疗的651例AHF患者为研究对象,收集入院生命体征、合并症和实验室检查结果等临床资料。复合终点事件定义为AHF患者出院后3个月内发生全因死亡或心衰加重再入院。采用简单随机抽样法将研究对象按8∶2拆分为训练集(521例)和测试集(130例),基于逻辑回归(logistic regression,LR)、随机森林(random forest,RF)、决策树(decision tree,DT)、轻量梯度提升(light gradient boosting machine,LGBM)、极端梯度提升(extreme gradient boosting,XGBoost)和神经网络(neural network,NN)6种机器学习算法分别构建预测模型。采用受试者工作特征曲线(receiver operating characteristic,ROC)和临床决策曲线(decision curve analysis,DCA)对模型的预测性能和临床获益进行评价,使用Shapley加性解释(Shapley additive explanation,SHAP)算法评估不同临床特征对模型的影响。结果651例AHF患者中发生复合终点事件203例(31.2%)。ROC曲线分析显示,LR、RF、DT、LGBM、XGBoost和NN模型的曲线下面积(area under curve,AUC)依次为0.707、0.756、0.616、0.677、0.768、0.681,XGBoost模型的AUC最高,DCA曲线中XGBoost模型的临床决策净获益也更大,整体预测效能最佳。SHAP算法分析得出,影响XGBoost模型输出结果的重要临床特征分别为血清尿酸、D-二聚体、平均动脉压、B型利钠肽、左房前后径、体质量指数和NYHA分级。结论XGBoost模型预测急性心力衰竭患者易损期死亡或再入院风险效果最佳。 展开更多
关键词 心力衰竭 易损期 机器学习 预测模型 shapley解释算法
下载PDF
急性心肌梗死合并肾功能不全患者主要不良心脑血管事件风险预测模型构建
4
作者 韩福生 田雪 +1 位作者 米玉红 何华 《中国医药》 2024年第7期975-979,共5页
目的应用不同机器学习算法构建急性心肌梗死(AMI)合并肾功能不全患者主要不良心脑血管事件(MACCE)的风险预测模型。方法选取2014年1月至2019年8月于首都医科大学附属北京安贞医院住院治疗的740例AMI合并肾功能不全患者为研究对象,收集... 目的应用不同机器学习算法构建急性心肌梗死(AMI)合并肾功能不全患者主要不良心脑血管事件(MACCE)的风险预测模型。方法选取2014年1月至2019年8月于首都医科大学附属北京安贞医院住院治疗的740例AMI合并肾功能不全患者为研究对象,收集患者一般特征、生命体征、合并症和实验室检查结果等临床资料。采用简单随机抽样法按80%∶20%将研究对象分为训练集(592例)和测试集(148例),采用逻辑回归、随机森林、极限梯度提升(XGBoost)、支持向量机和深度神经网络5种机器学习算法分别构建MACCE的预测模型。采用受试者工作特征曲线下面积(AUC)评估模型的可靠性,选择最优模型。使用Shapley加性解释算法评估特征影响并进行特征选择构建最终模型。结果740例AMI合并肾功能不全患者中有473例(63.9%)发生MACCE。XGBoost模型的AUC最大(AUC=0.862)。在根据特征重要性等级对特征进行减少后,建立了具有5个特征的可解释的最终XGBoost模型。最终的模型可以在内部验证中准确预测MACCE发生(AUC=0.955),其中影响XGBoost模型重要临床特征分别为血尿酸、白蛋白、糖化血清白蛋白,体重和血小板计数。结论基于机器学习算法的5种模型中XGBoost模型预测AMI合并肾功能不全患者发生MACCE效果最佳。 展开更多
关键词 心肌梗死 肾功能不全 机器学习 主要不良心脑血管事件 shapley解释算法
下载PDF
基于机器学习的公交驾驶员事故风险识别及影响因素研究 被引量:2
5
作者 朱彤 秦丹 +2 位作者 魏雯 任杰 冯移冬 《中国安全科学学报》 CAS CSCD 北大核心 2023年第2期23-30,共8页
为从公交驾驶员群体中识别出易发生事故的风险公交驾驶员,结合某市公交公司营运安全管理系统数据库、百度应用程序接口(API)及网络爬取技术,并应用K近邻算法补充缺失值,获取42条线路及1893名驾驶员的数据;基于驾驶员、车辆、线路特征、... 为从公交驾驶员群体中识别出易发生事故的风险公交驾驶员,结合某市公交公司营运安全管理系统数据库、百度应用程序接口(API)及网络爬取技术,并应用K近邻算法补充缺失值,获取42条线路及1893名驾驶员的数据;基于驾驶员、车辆、线路特征、违规行为、事故、管理等基本特征变量构造派生变量;采用包括递归特征消除、有惩罚项的逻辑回归、随机森林的集成方法选择特征;采用极致梯度提升(XGBoost)等6种机器方法分别建立分类模型,并采用贝叶斯方法优化超参数。结果表明:在构建的6个分类模型中,XGBoost方法构建的模型其受试者工作特征(ROC)曲线下的面积(AUC)评估结果最佳;运用贝叶斯方法优化模型,可以在一定程度上提升ROC的AUC指标;对于风险公交驾驶员预测准确率达到98.66%,运营单位还可以根据自身情况权衡虚报率与命中率代价。此外,车辆服役时间、违规次数等特征对于事故风险具有明显的非线性影响。 展开更多
关键词 风险公交驾驶员 机器学习 事故风险 极致梯度提升(XGBoost) shapley解释(SHAP)值
下载PDF
装配式混凝土T梁桥荷载横向分布系数预测
6
作者 郭洁 赵安 张悦杉 《公路交通科技》 CAS CSCD 北大核心 2023年第S02期122-128,共7页
荷载横向分布系数是桥梁横向传力性能的重要指标,传统计算方法多采用单一变量的简化数学公式,基于此提出了一种基于可解释性机器学习的荷载横向分布系数预测方法。首先建立了基于有限元模拟的荷载横向分布系数计算方法,分析了跨径、宽... 荷载横向分布系数是桥梁横向传力性能的重要指标,传统计算方法多采用单一变量的简化数学公式,基于此提出了一种基于可解释性机器学习的荷载横向分布系数预测方法。首先建立了基于有限元模拟的荷载横向分布系数计算方法,分析了跨径、宽跨比、单板宽/板间距、悬臂长、悬臂惯性矩、主梁抗弯惯性矩和抗扭惯性矩7维输入参数影响;然后采用支持向量机器学习方法对装配式混凝土T梁桥荷载横向分布系数进行预测,利用遗传算法对支持向量机超参数进行优化;最后,采用Shapley加性解释器分析了多维参数对预测结果的敏感性。结果表明,所提改进支持向量机模型能够实现装配式混凝土T梁桥荷载横向分布系数预测,且具有较高的预测精度。跨径和宽跨比参数对双车道和三车道荷载横向分布系数预测最为重要。 展开更多
关键词 桥梁工程 横向分布系数预测 机器学习 装配式混凝土T梁桥 支持向量机 shapley解释
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部