文摘目的探讨Lasso Logistic回归模型在乳腺癌高风险人群筛查利用相关因素研究中的应用。方法基于健康风险评估模型筛选乳腺癌高风险人群,利用Lasso Logistic回归模型进行变量选择,通过交叉验证选择模型中的最优调和参数λ,再建立传统Logistic回归模型分析筛查利用情况的影响因素。结果经健康风险评估模型筛选后,共纳入771名乳腺癌高风险人群,乳腺癌筛查利用率为72.1%。交叉验证选择的最优λ为0.044,经Lasso Logistic回归模型进行变量筛选后纳入的自变量为年龄、文化程度、既往乳腺疾病史和乳房自检行为,赤池信息准则(akaike information criterion,AIC)和贝叶斯信息准则(bayesian information criterion,BIC)分别为762.44和785.68,均低于传统Logistic回归模型(762.73,804.55)。结论 Lasso Logistic回归模型可用于乳腺癌高风险人群筛查利用情况相关因素研究。年龄、文化程度、既往乳腺疾病史和乳房自检行为影响乳腺癌高风险人群的筛查利用情况。
文摘为实现对瓦斯浓度(体积分数)的准确预测,基于海量煤矿瓦斯监测数据和多元分布滞后模型(MDL)建立了多变量瓦斯浓度时间序列预测模型.基于惩罚最小二乘法和自回归的思想,提出了新的变量选择和定阶方法——Adjust Group最小绝对值压缩与选择(LASSO)方法.该方法以岭估计及局部二次近似迭代算法实现了预测模型的构建,通过有效选取具有解释性的自变量子集,提高模型的解释性,采用广义交叉检验准则(GCV)确定惩罚参数,并通过分组惩罚来实现变量筛选与滞后变量的定阶.结果表明:Adjust Group LASSO方法预测得到的残差平方和为0.433 0,具有较高的精度,能够较好的预测工作面瓦斯浓度的动态变化,与LASSO、最小角回归算法(LARS)以及其他瓦斯预测常用方法相比,大大提高了预测的准确性.