期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
改进Stacking算法在妊娠期糖尿病预测中的应用 被引量:2
1
作者 冯鑫磊 俞凯 袁贞明 《杭州师范大学学报(自然科学版)》 CAS 2023年第2期126-134,共9页
本研究提出基于妊娠早期体检、基因信息,结合集成学习的妊娠期糖尿病预测分类方法.设计了基于Stacking框架的改进模型ACS-Stacking.ACS-Stacking模型将基分类器输出的类别概率值作为基层输出结果,元层使用GBDT模型学习组合基层输出的类... 本研究提出基于妊娠早期体检、基因信息,结合集成学习的妊娠期糖尿病预测分类方法.设计了基于Stacking框架的改进模型ACS-Stacking.ACS-Stacking模型将基分类器输出的类别概率值作为基层输出结果,元层使用GBDT模型学习组合基层输出的类别概率结果,拓展了算法的层次结构.在基分类器层与元分类器层之间加入基分类器筛选层,通过CFS算法估计不同分类器集合中个体分类器准确性与多样性的权衡值,筛选出最佳基分类器集合,实现基分类器的自适应选择.研究结果表明,该模型F1值较单一模型提高约9%,较Stacking模型提高约7%,具有较好的预测准确性和稳定性. 展开更多
关键词 妊娠期糖尿病 基于相关性特征选择 基分类器筛选 元分类器
下载PDF
特征选择方法中三种度量的比较研究 被引量:9
2
作者 宋智超 康健 +1 位作者 孙广路 何勇军 《哈尔滨理工大学学报》 CAS 北大核心 2018年第1期111-116,共6页
不同类型数据中特征与类别以及特征与特征之间存在一定的线性和非线性相关性。针对基于不同度量的特征选择方法在不同类型数据集上选取的特征存在明显差别的问题,本文选择线性相关系数、对称不确定性和互信息三种常用的线性或非线性度量... 不同类型数据中特征与类别以及特征与特征之间存在一定的线性和非线性相关性。针对基于不同度量的特征选择方法在不同类型数据集上选取的特征存在明显差别的问题,本文选择线性相关系数、对称不确定性和互信息三种常用的线性或非线性度量,将它们应用于基于相关性的快速特征选择方法中,对它们在基因微阵列和图像数据上的特征选择效果进行实验验证和比较。实验结果表明,基于相关性的快速特征选择方法使用线性相关系数在基因数据集上选取的特征集往往具有较好分类准确率,使用互信息在图像数据集上选取的特征集的分类效果较好,使用对称不确定性在两种类型数据上选取特征的分类效果较为稳定。 展开更多
关键词 特征选择 线相关系数 对称不确定 互信息 基于相关性快速特征选择方法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部