目的建立儿童预防接种行为评分卡模型以识别流失接种对象。方法将甘肃省免疫规划信息系统中2019-2020年出生儿童数据集按7∶3比例随机分为训练集和测试集;通过疫苗接种的时间-频率-花费(Recency frequency monetary,RFM)模型识别流失儿...目的建立儿童预防接种行为评分卡模型以识别流失接种对象。方法将甘肃省免疫规划信息系统中2019-2020年出生儿童数据集按7∶3比例随机分为训练集和测试集;通过疫苗接种的时间-频率-花费(Recency frequency monetary,RFM)模型识别流失儿童,采用相关性检验和信息值筛选模型变量,采用决策树方法对变量分组;对证据权重(Weight of evidence,WOE)转换后的训练集使用Logistic回归进行拟合,然后将模型转换为行为评分卡;绘制两个数据集的柯尔莫哥洛夫-斯米尔诺夫(Kolmogorov-Smirnov,KS)、受试者工作特征(Receiver operating characteristic,ROC)和群体稳定性指标(Population stability index,PSI)曲线,评估模型拟合效果。结果甘肃省2019-2020年出生儿童共626653名,RFM模型识别出43465名(6.94%)流失儿童。构建的行为评分卡模型包括13个变量,模型基础分为479分;训练集和测试集的模型KS值分别为0.6064、0.6063,均>0.60;ROC曲线下面积(Area under ROC curve,AUC)分别为0.8718、0.8714,均>0.87;模型PSI值为0.0001。结论本研究建立的预防接种行为评分卡模型识别流失接种对象的效果和稳定性好;可在免疫规划信息管理系统中集成应用。展开更多
文摘目的建立儿童预防接种行为评分卡模型以识别流失接种对象。方法将甘肃省免疫规划信息系统中2019-2020年出生儿童数据集按7∶3比例随机分为训练集和测试集;通过疫苗接种的时间-频率-花费(Recency frequency monetary,RFM)模型识别流失儿童,采用相关性检验和信息值筛选模型变量,采用决策树方法对变量分组;对证据权重(Weight of evidence,WOE)转换后的训练集使用Logistic回归进行拟合,然后将模型转换为行为评分卡;绘制两个数据集的柯尔莫哥洛夫-斯米尔诺夫(Kolmogorov-Smirnov,KS)、受试者工作特征(Receiver operating characteristic,ROC)和群体稳定性指标(Population stability index,PSI)曲线,评估模型拟合效果。结果甘肃省2019-2020年出生儿童共626653名,RFM模型识别出43465名(6.94%)流失儿童。构建的行为评分卡模型包括13个变量,模型基础分为479分;训练集和测试集的模型KS值分别为0.6064、0.6063,均>0.60;ROC曲线下面积(Area under ROC curve,AUC)分别为0.8718、0.8714,均>0.87;模型PSI值为0.0001。结论本研究建立的预防接种行为评分卡模型识别流失接种对象的效果和稳定性好;可在免疫规划信息管理系统中集成应用。