-
题名基于贡献增益的森林剪枝
被引量:1
- 1
-
-
作者
郭华平
范明
-
机构
郑州大学信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2013年第11期236-241,共6页
-
基金
国家自然科学基金项目(偏好学习的若干关键技术研究
60901078)资助
-
文摘
基于决策树的组合分类器可以看作一个森林。提出了一种森林剪枝算法来对森林进行剪枝,以简化组合分类器的结构,并提高其分类准确率。传统的决策树剪枝只考虑剪枝对单棵决策树的影响,而森林剪枝则把所有决策树看作一个整体,更加关注剪枝对组合分类器的性能影响。为了确定森林的哪些分枝可以被剪枝,提出一种称作贡献增益的度量。子树的贡献增益不仅与它所在的决策树的分类准确率有关,而且也与诸决策树的差异性有关,因此它较好地度量了一个结点扩展为一棵子树对组合分类器分类准确率的提高程度。借助于贡献增益,设计了一种基于结点贡献增益的森林剪枝算法FTCG。实验表明,无论森林是基于某种算法(如bagging)构建的还是某种组合分类器选择算法(如EPIC[1])的结果,无论每棵决策树是未剪枝的还是剪枝后的,FTCG都能进一步降低每棵决策树的规模,并且在大部分数据集上显著提高了剪枝后的组合分类器的分类准确率。
-
关键词
森林剪枝
组合选择
贡献增益
-
Keywords
Forest thinning, Ensemble selection, Contribution gain
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-