-
题名基于惩罚逻辑回归的乳腺癌预测
被引量:6
- 1
-
-
作者
胡雪梅
谢英
蒋慧凤
-
机构
重庆工商大学数学与统计学院
重庆工商大学经济社会应用统计重庆市重点实验室
重庆工商大学长江上游经济研究中心
-
出处
《数据采集与处理》
CSCD
北大核心
2021年第6期1237-1249,共13页
-
基金
重庆市第五批高等学校优秀人才支持计划(68021900601)资助项目
重庆市科委基础研究与前沿探索一般项目(cstc.2018jcyjA2073)资助项目
+4 种基金
重庆市统计学研究生导师团队(yds183002)资助项目
重庆市教委科学技术研究计划重大项目(KJZDM202100801)资助项目
重庆市社会科学规划项目(2019WT59)资助项目
社会经济应用统计重庆市重点实验室平台开放项目(KFJJ2018066)资助项目
重庆工商大学数理统计团队(ZDPTTD201906)资助项目。
-
文摘
本文采用惩罚逻辑回归方法,利用威斯康星大学的乳腺癌数据对乳腺肿瘤进行预测。首先选取与乳腺癌相关的10个指标作为自变量,接着采用逻辑回归、LASSO惩罚逻辑回归、L_(2)惩罚逻辑回归和弹性网惩罚逻辑回归作为分类器,利用75%的数据集作为训练集建立模型,最后利用25%的测试集、混淆矩阵和ROC曲线评估不同模型的预测精度。结果表明,LASSO惩罚逻辑回归的预测表现最好,预测精度达到97.18%;弹性网惩罚逻辑回归的预测表现随着α的增大发生变化,特别当α=0.9时,预测精度达到97.18%,与LASSO惩罚逻辑回归的预测表现一样好;L_(2)惩罚逻辑回归的预测表现排第3,逻辑回归表现最差。因此,在乳腺肿瘤诊断中可借助LASSO惩罚逻辑回归和弹性网惩罚逻辑回归提高诊断精度。
-
关键词
乳腺癌
逻辑回归
lASSO惩罚逻辑回归
l_(2)惩罚逻辑回归
弹性网惩罚逻辑回归
-
Keywords
breast cancer
logistic regression
the lASSO penalized logistic regression
the l2 penalized logistic regression
the elastic net penalized logistic regression
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
R737.9
[自动化与计算机技术—控制科学与工程]
-
-
题名机器学习方法研究肝癌预测问题
被引量:1
- 2
-
-
作者
胡雪梅
李佳丽
蒋慧凤
-
机构
重庆工商大学数学与统计学院
经济社会应用统计重庆市重点实验室
长江上游经济研究中心
-
出处
《系统科学与数学》
CSCD
北大核心
2022年第2期417-433,共17页
-
基金
重庆市第五批高等学校优秀人才支持计划《基于分类方法预测股价的趋势运动》
重庆市科委基础研究与前沿探索一般项目(cstc.2018jcyjA2073)
+4 种基金
重庆市“统计学”研究生导师团队(yds183002)
重庆市社会科学规划项目(2019WT59)
社会经济应用统计重庆市重点实验室平台开放项目(KFJJ2018066)
重庆市教委科学技术研究计划重大项目(KJZD-M202100801)
重庆工商大学数理统计团队(ZDPTTD201906)资助课题。
-
文摘
肝癌在所有癌症中病死率高居第二名.由于机器学习方法能改进疾病预测精度,因此文章将利用它们研究肝癌前期诊断问题,提高肝癌的预测精度.首先选取影响肝癌的10个指标作为预测变量,将579位肝癌患者分为两组:随机抽取492位患者构成训练样本,剩余87位患者构成测试样本.接着利用训练样本建立6个分类器:逻辑回归、L_(2)惩罚逻辑回归、支持向量机(Support Vector Machine,SVM)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)、人工神经网络(Artificial Neural Network,ANN)和极限梯度提升算法(eXtreme Gradient Boosting,XGBoost),其中逻辑回归和L_(2)惩罚逻辑回归采用NewtonRaphson算法得到模型参数的迭代加权最小二乘估计,计算患者肿瘤细胞为恶性和良性的概率估计,确定最佳阈值预测肿瘤性状.最后用测试样本计算混淆矩阵、灵敏度和特异度,绘制ROC曲线评价预测精度.结果表明L_(2)惩罚逻辑回归预测精度最高,SVM预测精度排第二,XGBoost预测精度排第三,逻辑回归预测精度排第四,GBDT预测精度排第五,ANN和随机森林预测精度最差.
-
关键词
l_(2)惩罚逻辑回归
支持向量机
梯度提升树算法
人工神经网络
极限梯度提升算法
-
Keywords
l_(2)penalized logistic regression
support vector machine
gradient boosting decision tree
artificial neural network
eXtreme gradient boosting
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
R735.7
[自动化与计算机技术—控制科学与工程]
-