期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
集成学习方法研究 被引量:17
1
作者 周钢 郭福亮 《计算技术与自动化》 2018年第4期148-153,共6页
集成学习是当前数据挖掘、机器学习中提升预测精度的重要方法。在介绍集成学习概念、评价标准的基础上,将集成学习划分为基分类器的构建和集成两个阶段,从偏差-方差分解角度,分析集成学习的预测精度主要是通过控制集成模型复杂度和各基... 集成学习是当前数据挖掘、机器学习中提升预测精度的重要方法。在介绍集成学习概念、评价标准的基础上,将集成学习划分为基分类器的构建和集成两个阶段,从偏差-方差分解角度,分析集成学习的预测精度主要是通过控制集成模型复杂度和各基分类器差异度实现,研究讨论了集成学习的模型构建阶段的经典算法Bagging、Boosting等,同时分析研究了分类结果集成的普通投票和Stacking方法。 展开更多
关键词 集成学习 偏差-方差分解 BAGGING BOOSTING STACKING
下载PDF
集成学习中预测精度的影响因素分析 被引量:4
2
作者 郭福亮 周钢 《兵工自动化》 2019年第1期78-83,共6页
集成学习被认为是当前数据挖掘、机器学习中提升预测精度的重要方法。在分析集成学习基本概念的基础上,将集成学习模型设计划分为分类器构建、分类器集成和分类结果整合3个阶段,并从分类器误差控制、集成泛化能力提升和应用误差容忍具... 集成学习被认为是当前数据挖掘、机器学习中提升预测精度的重要方法。在分析集成学习基本概念的基础上,将集成学习模型设计划分为分类器构建、分类器集成和分类结果整合3个阶段,并从分类器误差控制、集成泛化能力提升和应用误差容忍具体对提升集成学习预测精度进行研究探讨,通过实例分析研究3个阶段预测精度的影响因素和提升方法。结果表明,该研究对控制集成学习预测误差、提升预测精度和构建合理高效集成学习模型具有较为重要的指导意义。 展开更多
关键词 集成学习 预测精度 偏差-方差分解 BAGGING算法 ADABOOST算法 怀卡托智能分析环境
下载PDF
带有变量选择过程的分类模型误差分析 被引量:2
3
作者 赵宇 黄思明 《数学的实践与认识》 CSCD 北大核心 2010年第17期200-209,共10页
偏倚一方差分析方法是在模型选择过程中权衡模型对现有样本解释程度和未知样本估计准确度的分析方法,目的是使选定的模型检验误差尽量小.在分类或回归过程中进行有效的变量筛选可以获得更准确的模型表达,但也会因此带来一定误差.提出&qu... 偏倚一方差分析方法是在模型选择过程中权衡模型对现有样本解释程度和未知样本估计准确度的分析方法,目的是使选定的模型检验误差尽量小.在分类或回归过程中进行有效的变量筛选可以获得更准确的模型表达,但也会因此带来一定误差.提出"选择误差"的概念,用于刻画带有变量选择的分类问题中由于变量的某种选择方法所引起的误差.将分类问题的误差分解为偏倚—方差—选择误差进行研究,考察偏倚、方差和选择误差对分类问题的总误差所产生的影响. 展开更多
关键词 分类模型 误差分析 偏倚-方差分解 变量选择
原文传递
元学习算法选择机制及关联对性能的影响 被引量:1
4
作者 杨利英 张军英 覃征 《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第2期278-280,290,共4页
提出一种元学习定义,从偏差/方差分解角度对元学习中学习算法的选取机制进行研究,得出了元级选用错误率低且偏差小的学习算法、基级学习算法按照错误率及方差从低到高排列的结论。鉴于标准数据集不能充分评估关联对元学习性能的影响,设... 提出一种元学习定义,从偏差/方差分解角度对元学习中学习算法的选取机制进行研究,得出了元级选用错误率低且偏差小的学习算法、基级学习算法按照错误率及方差从低到高排列的结论。鉴于标准数据集不能充分评估关联对元学习性能的影响,设计了一种模拟算法以产生模拟数据集。在UCI标准数据集和模拟数据集上的实验表明,同常用的多数投票等组合方法相比,基于算法选择机制的元学习表现出优良的性能,且分类器之间的负关联有助于性能的改进。 展开更多
关键词 偏差/方差分解 关联 元学习 多分类器系统
下载PDF
An Empirical Study of Downstream Analysis Effects of Model Pre-Processing Choices
5
作者 Jessica M. Rudd Herman “Gene” Ray 《Open Journal of Statistics》 2020年第5期735-809,共75页
This study uses <span style="font-family:Verdana;">an empirical</span><span style="font-family:Verdana;"> analysis to quantify the downstream analysis effects of data pre-processi... This study uses <span style="font-family:Verdana;">an empirical</span><span style="font-family:Verdana;"> analysis to quantify the downstream analysis effects of data pre-processing choices. Bootstrap data simulation is used to measure the bias-variance decomposition of an empirical risk function, mean square error (MSE). Results of the risk function decomposition are used to measure the effects of model development choices on </span><span style="font-family:Verdana;">model</span><span style="font-family:Verdana;"> bias, variance, and irreducible error. Measurements of bias and variance are then applied as diagnostic procedures for model pre-processing and development. Best performing model-normalization-data structure combinations were found to illustrate the downstream analysis effects of these model development choices. </span><span style="font-family:Verdana;">In addition</span><span style="font-family:Verdana;">s</span><span style="font-family:Verdana;">, results found from simulations were verified and expanded to include additional data characteristics (imbalanced, sparse) by testing on benchmark datasets available from the UCI Machine Learning Library. Normalization results on benchmark data were consistent with those found using simulations, while also illustrating that more complex and/or non-linear models provide better performance on datasets with additional complexities. Finally, applying the findings from simulation experiments to previously tested applications led to equivalent or improved results with less model development overhead and processing time.</span> 展开更多
关键词 Empirical Analysis bias-variance decomposition Mean Squared Error Downstream Analysis Effects Empirical Risk
下载PDF
基于非单一类型的组合模型在回归分析中的应用
6
作者 彭斯俊 朱四如 《数学杂志》 CSCD 北大核心 2009年第4期535-538,共4页
本文研究的是非单一类型的组合模型应用于回归预测的问题.利用不同类型的子模型来构建组合模型,最大程度上减小了子模型间的相关性,得到了具有更好泛化能力的组合模型这一结果,在预测分析中具有重要的指导意义.
关键词 组合模型 偏置/方差分解 k-近邻模型 感知径向基函数
下载PDF
面向高速数据流的偏倚抽样集合分类器 被引量:2
7
作者 张健沛 杨显飞 杨静 《北京邮电大学学报》 EI CAS CSCD 北大核心 2010年第4期44-48,共5页
针对高速数据流的流速超过集合分类器的处理能力,集合分类器无法训练全部最近到达的数据以更新分类器模型的问题,提出一种偏倚抽样集合分类器算法.通过偏差方差分解方法分析集合分类器的期望错误,利用计算待抽样数据的期望错误贡献度,... 针对高速数据流的流速超过集合分类器的处理能力,集合分类器无法训练全部最近到达的数据以更新分类器模型的问题,提出一种偏倚抽样集合分类器算法.通过偏差方差分解方法分析集合分类器的期望错误,利用计算待抽样数据的期望错误贡献度,实现数据的偏倚抽样,有效缩减了集合分类器的训练更新时间.与随机抽样集合分类器方法进行了比较.理论分析和实验结果表明,在抽样比例相同的条件下,该方法可以有效提高集合分类器的分类准确率. 展开更多
关键词 数据流 集合分类器 偏倚抽样 偏差方差分解
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部