基于随机森林的多阶段集成学习方法被引量：1

The multistage ensemble learning method based on random forest

下载PDF

导出

摘要集成学习主要分为串行和并行学习方法.并行学习的优势在于分类器的并行学习和融合,对分类问题通常采用的融合策略为投票法或堆叠学习法,它们的代表分别为随机森林和堆叠泛化Stacking.为了进一步提高Stacking的分类性能,在经典Stacking算法原理的基础上,提出基于随机森林的多阶段集成学习方法,以随机森林作为基层的基学习算法,以投票法和学习法同时作为融合方法,来降低泛化误差.在UCI数据集上的实验结果表明,提出的模型在Accuracy和1F指标上,相比Bagging,随机森林和Stacking等分类器在分类性能上有很大的提升. Ensemble learning mainly includes serial and parallel learning method,the advantages of parallel learning are parallel execution and integration of classifiers.For classification task,the combination strategy have the voting scheme and the stack method,the representation of voting is random forest,while the representation of learning method is stacking.In order to further improve the classification performance of stacking,the multistage ensemble based on random forest is proposed,which is based on the basic principle of the classical stacked generalization.Random forest is the base learner for base-level,both the voting and learning methods are used as methods of integration to reduce the generalization error.The experiments on UCI data sets shows that the proposed algorithm in has a great improvement in classification performance in the Accuracy,F1,compared with Bagging,random forest and Stacking.

作者徐慧丽 XU Hui-li(School of Mathematics,South China University of Technology,Guangzhou 510640,China)

机构地区华南理工大学数学学院

出处《高师理科学刊》 2018年第2期25-28,53,共5页 Journal of Science of Teachers＇College and University

关键词 STACKING 随机森林多数投票 stacking random forest majority voting

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1韦艳艳,李陶深.一种基于投票的Stacking方法[J].计算机工程,2006,32(7):199-201. 被引量：4
2邓生雄,雒江涛,刘勇,王小平,杨军超.集成随机森林的分类模型[J].计算机应用研究,2015,32(6):1621-1624. 被引量：20
3姚沛津..基于朴素贝叶斯的集成算法研究[D].华南理工大学,2013:
4李巧..模型融合算法的研究及应用[D].湖北大学,2016:
5李珩,朱靖波,姚天顺.基于Stacking算法的组合分类器及其应用于中文组块分析[J].计算机研究与发展,2005,42(5):844-848. 被引量：18

二级参考文献43

1闫友彪,陈元琰.机器学习的主要策略综述[J].计算机应用研究,2004,21(7):4-10. 被引量：57
2S. P. Abney. Principle Based Parsing: Computation and Psycholinguistics. Dordrecht: Kluwer Academic Publishers, 1991. 被引量：1
3A. Ratnaparkhi. Maximum entropy models for natural language ambiguity resolution: [ Ph. D. dissertation ] . Pennsylvania:University of Pennsylvania, 1998. 被引量：1
4H. van Halteren, J. Zavrel, W. Daelemans. Improving data driven word class tagging by system combination. In: Proc. the 17th COLING and the 36th Annual Meeting of ACL. San Francisco: Morgan Kaufmann Publishers, 1998. 491～497. 被引量：1
5R. Florian, A. Ittycheriah, H. Jing, et al. Named entity recognition through classifier combination. In: CoNLL-2003. San Francisco: Morgan Kaufmann Publishers, 2003. 168～ 171. 被引量：1
6L.S. Larkey, W. B. Croft. Combining classifiers in text categorization. In: Proc. SIGIR-96. New York: ACM Press,1996. 289～297. 被引量：1
7R.E. Schapire, Y. Singer. Boostexter: A boosting-based system for text categorization. Machine Learning, 2000, 39 (2-3): 135～168. 被引量：1
8J. Gama. Combining classification algorithms: [ Ph. D.dissertation]. Proto: Universidade do Porto, 2000. 被引量：1
9L. Brieman. Bagging predictors. Machine Learning, 1996, 24(2): 123～140. 被引量：1
10Y. Freund, R. E. Schapire. Experiments with a new boosting algorithm. In: Proc. the 13th Int'l Conf. Machine Learning. San Francisco: Morgan Kaufmann Publishers, 1996. 148～156. 被引量：1

共引文献39

1钟韬,刘刚,黄蕾,白雪,杨执钧,乔丹.基于决策树的非入侵式负荷分解算法的研究[J].计算机应用研究,2020,37(S01):163-165. 被引量：3
2别致,周俊生,陈家骏.基于SVM-Adaboost的中文组块分析[J].计算机工程与应用,2008,44(21):171-173. 被引量：1
3黄德根,于静.分布式策略与CRFs相结合识别汉语组块[J].中文信息学报,2009,23(1):16-22. 被引量：6
4琚春华,邹江波,张芮,魏建良.基于MapReduce技术的并行集成分类算法[J].电信科学,2012,28(7):40-47. 被引量：4
5李业刚,黄河燕.汉语组块分析研究综述[J].中文信息学报,2013,27(3):1-8. 被引量：12
6曾子明,万品玉.融合演化特征的公共安全事件微博情感分析[J].情报科学,2018,36(12):3-8. 被引量：19
7赵杨,袁析妮,陈亚文,武立强.基于机器学习混合算法的APP广告转化率预测研究[J].数据分析与知识发现,2018,2(11):2-9. 被引量：3
8谭娟,王胜春.集成随机森林的交通拥堵检测模型[J].计算机测量与控制,2016,24(4):230-233. 被引量：1
9包莹莹,王华君,徐燕华,徐平平.基于稀疏编码和随机森林的多帧图像超分辨率算法[J].电子设计工程,2017,25(8):158-162. 被引量：6
10李巧,周双娥,杨晶.模型融合在用户续购行为分析中的应用[J].小型微型计算机系统,2017,38(10):2231-2235. 被引量：2

同被引文献19

1罗艳辉,吕永贵,李彬.基于ARMA的混合卷烟销售预测模型[J].计算机应用研究,2009,26(7):2664-2668. 被引量：13
2吴奇,严洪森,王斌.基于鲁棒小波ν-支持向量机的产品销售预测模型[J].自动化学报,2009,35(7):1027-1032. 被引量：7
3闫博,周在金,李国和,齐佳.基于ARMA和BP_AdaBoost的组合销售预测模型研究[J].计算机与现代化,2015(2):14-18. 被引量：5
4孔祥魁.基于组合优化理论的体育彩票销售量预测模型[J].现代电子技术,2017,40(1):108-110. 被引量：2
5成云,成孝刚,谈苗苗,周凯,李海波.基于ARIMA和小波神经网络组合模型的交通流预测[J].计算机技术与发展,2017,27(1):169-172. 被引量：24
6汪群峰,方志耕,李波,张娜.基于组合方法的机场航油销售量预测研究——以新疆为例[J].数学的实践与认识,2017,47(10):137-144. 被引量：2
7王奕森,夏树涛.集成学习之随机森林算法综述[J].信息通信技术,2018,12(1):49-55. 被引量：187
8常晓花,熊翱.基于Adaboost的随机森林算法在医疗销售预测中的应用[J].计算机系统应用,2018,27(2):202-206. 被引量：4
9葛娜,孙连英,赵平,万莹.基于ARIMA时间序列模型的销售量预测分析[J].北京联合大学学报,2018,32(4):27-33. 被引量：21
10邢尹,刘立龙.基于随机森林的语音情感特征选择与分类[J].计算机与数字工程,2019,47(3):539-542. 被引量：2

引证文献1

1袁远,郭天添.ARIMA-RF组合模型的销售预测研究[J].软件导刊,2021,20(9):33-38. 被引量：5

二级引证文献5

1邵必林,饶媛,何欣.基于SARIMA-SVM组合模型的地铁客流量预测研究[J].软件导刊,2022,21(11):24-30. 被引量：5
2赵鑫,毋涛,宋田,甘霖.基于组合模型的服装定制面辅料预测方法[J].计算机技术与发展,2023,33(1):214-220.
3蔡明,孙杰,杨维发,鲍清,李培德.基于自适应遗传算法的随机森林模型参数优化方法[J].智能计算机与应用,2022,12(12):175-179. 被引量：2
4张颖.基于大数据的云数据中心智能运维系统[J].软件导刊,2024,23(11):153-157.
5刘丽佳,李晓雪,王海滨,赵林红.考虑节假日的ARIMA模型在酸奶销量预测中的应用[J].计算机科学与应用,2023,13(12):2172-2179. 被引量：2

1顾正龙.特朗普能把美使馆迁往耶路撒冷?[J].军事文摘,2018,0(2):32-35.
2李晓明,顾钰培,张俊涛.一种滑动窗口的GPS轨迹点地图匹配算法[J].西安工业大学学报,2017,37(6):459-462. 被引量：1
3樊燕青.关于信息技术与幼儿教育的融合探讨[J].好家长,2017,0(34):71-71.
4张效尉,王伟,秦东霞.基于集成学习的微博用户转发行为预测[J].河南师范大学学报（自然科学版）,2018,46(2):111-116. 被引量：2
5李德利,张曦煌.基于并行学习的多层极限学习机[J].计算机应用研究,2018,35(2):459-461. 被引量：7
6杨瑞君,赵楠,凡耀峰,侯梅芳.基于随机森林模型的城市空气质量评价[J].计算机工程与设计,2017,38(11):3151-3156. 被引量：17
7何银娇.论“班班通”在农村小学语文教学中的应用[J].小学生（教学实践）,2017,0(12):39-40.
8杨国华,刘春艳.轨道交通项目BIM+GIS云平台建设研究[J].土木建筑工程信息技术,2017,9(2):103-106. 被引量：16
9王燕凤,冯海林,杜晓晨,方益明.一种对年轮图像双边滤波增强的树龄测量方法[J].林业工程学报,2017,2(5):109-114. 被引量：12
10罗裕隽.基于机器学习的舆情倾向性分析研究[J].信息技术与网络安全,2018,37(1):48-51. 被引量：3

高师理科学刊

2018年第2期

浏览历史

内容加载中请稍等...

基于随机森林的多阶段集成学习方法被引量：1

参考文献5

二级参考文献43

共引文献39

同被引文献19

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于随机森林的多阶段集成学习方法 被引量：1

参考文献5

二级参考文献43

共引文献39

同被引文献19

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于随机森林的多阶段集成学习方法被引量：1