摘要
糖尿病是一种无法根治的慢性疾病,早发现、早干预、早治疗能够延缓病情进展,提高患者的治疗效率。构建基于决策树、逻辑回归、XGBoost等六种机器学习分类算法的预测模型,实现糖尿病风险预测。该模型以皮马印第安人糖尿病数据集为研究对象,通过数据预处理、数据特征分析构建有效数据集,采用网格搜索方法进行交叉验证寻找算法的最佳参数组合,构建超参数及基于超参数的分类模型,并对模型的预测性能进行评价。实验结果表明,该模型拥有良好的糖尿病风险预测性能。
Diabetes is an incurable chronic disease.Early detection,early intervention,and early treatment can delay the progression of the disease and improve the treatment efficiency of patients.A prediction model based on six Machine Learning classification algorithms,such as Decision Tree,Logical Regression and XGBoost,is constructed to predict the risk of diabetes.The model takes the Pima Indian diabetes dataset as the research object,builds an effective dataset through data pre-processing and data feature analysis,uses grid search method to cross verify and find the optimal parameter combination of the algorithm,builds a super parameter and a classification model based on super parameters,and evaluates the prediction performance of the model.The experimental results show that the model has good risk prediction performance for diabetes.
作者
凌雄娟
王俊杰
LING Xiongjuan;WANG Junjie(Foshan Polytechnic,Foshan 528137,China)
出处
《现代信息科技》
2024年第14期59-63,68,共6页
Modern Information Technology
基金
广东省普通高校创新团队项目(2022KCXTD060)
佛山市教育局2021年高校教师特色创新研究项目(2021DZXX02)
佛山职业技术学院2023年质量工程项目(2023SZTD-004)。
关键词
糖尿病预测
分类算法
网格搜索
模型评价
diabetes prediction
classification algorithm
grid search
model evaluation