云计算平台上基于选择性集成的增量学习研究

Selective Ensemble-based Incremental Learning on Cloud Computing Platform

下载PDF

导出

摘要增量学习是处理数据流的有效方式。文中针对已有增量分类算法只是作用于小规模数据集或者在集中式环境下进行的不足,提出了一种基于Hadoop云计算平台的增量分类模型,以解决大规模数据集的增量分类。该增量分类模型主要基于选择性集成学习思想,设计相应Map函数对不同时刻的增量样本块进行学习,以及设计Re-duce函数对不同时刻的分类器进行选择性集成以实现云计算平台上的增量学习。仿真实验表明该方法具有更好的性能,且能较好地解决数据流中的概念漂移问题。 Incremental learning is an effective way for data stream processing.To alleviate some issues about the current incremental learning algorithms,such as only for small-scale data sets or in a centralized environment,an incremental classification algorithm on Hadoop cloud computing platform is proposed to deal with large-scale data sets.Based on the idea of selective ensemble learning,Map function is designed to obtain base classifiers on incremental data blocks at different times,meanwhile,Reduce function is constructed to integrate different classifiers based on selective ensemble learning.The simulation results indicate that the proposed method can achieve higher performance than other ones and deal with concept drift problem in data stream.

作者李曼李云

机构地区南京邮电大学计算机学院南京邮电大学计算机技术研究所

出处《南京邮电大学学报（自然科学版）》北大核心 2012年第5期146-152,158,共8页 Journal of Nanjing University of Posts and Telecommunications：Natural Science Edition

基金国家自然科学基金(61073114) 南京邮电大学攀登计划(NY210010)资助项目

关键词增量分类 HADOOP 云计算概念漂移 incremental classification Hadoop cloud computing concept drift

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1吴建鑫,周志华,沈学华,陈兆乾.一种选择性神经网络集成构造方法[J].计算机研究与发展,2000,37(9):1039-1044. 被引量：27
2周志华,陈世福.神经网络集成[J].计算机学报,2002,25(1):1-8. 被引量：247
3王珏,石纯一.机器学习研究[J].广西师范大学学报（自然科学版）,2003,21(2):1-15. 被引量：78
4罗四维,温津伟.神经场整体性和增殖性研究与分析[J].计算机研究与发展,2003,40(5):668-674. 被引量：10

二级参考文献67

1陈省身陈维桓.微分几何讲义[M].北京：北京大学出版社,1980.. 被引量：1
2WienerN.控制论(中译本)[M].北京：科学出版社,1962.. 被引量：1
3Jacobs, Jordan. Adaptive mixtures of local experts. Neural Computation, 1991, 2(3) : 79-87. 被引量：1
4R E Sehapire. The strength of weak learnability. Machine Learning, 1990, 5(2): 197-227. 被引量：1
5S Amari. Information geometry. Contemporary Mathematics,1977, 20(3): 81-95. 被引量：1
6S Amari. Information geometry of EM and EM algorithm for neural networks. Neural Networks, 1995, 8(9): 1379-1408. 被引量：1
7S Amari, K Kurata, H Nagaoka. Information geometry of Boltzmann machines. IEEE Trans on Neural Networks, 1992, 3(2) : 260-271. 被引量：1
8S Amari. Dualistic geometry of the manifold of higher-order neurons. Neural Networks, 1991, 4(4): 443-451. 被引量：1
9S Amari. Differential geometrical methods in statistics. Springer Lecture Notes in Statistics, Vol 28, New York: Springer-Verlag,1985. 被引量：1
10L K Hansen, P Salamon. Neural network ensembles. IEEE TPAM, 1990, 12(10): 993-1001. 被引量：1

共引文献346

1杜扬帆,伍孝飞,乔百友.基于XGBoost-PredRNN++的海表面温度预测[J].计算机系统应用,2022,31(10):236-244. 被引量：1
2刘俊.Photoshop在印制电路制造中的应用[J].印制电路信息,2002(11):26-27.
3郑学伟,景秀丽.神经网络下的数据分析研究[J].电大理工,2009(4):30-32.
4李朝奎,王利东,李吟,周新邵.土壤重金属污染评价方法研究进展[J].矿产与地质,2011,25(2):172-176. 被引量：43
5王飞,周鹏程,王雷,徐本连.一种面向新型入侵的获取和分类方法[J].计算机科学,2012,39(S3):45-50.
6安金霞,朱纪洪,袁夏明.基于神经网络知识库的多神经网络集成方法[J].中南大学学报（自然科学版）,2009,40(S1):1-9. 被引量：1
7陈万忠,孙保峰,高韧杰,雷俊.基于NNE技术的手臂运动模式识别算法研究[J].吉林大学学报（工学版）,2013,43(S1):69-73. 被引量：1
8孙建涛,郭崇慧,陆玉昌,石纯一.多项式核支持向量机文本分类器泛化性能分析[J].计算机研究与发展,2004,41(8):1321-1326. 被引量：16
9闫友彪,陈元琰.机器学习的主要策略综述[J].计算机应用研究,2004,21(7):4-10. 被引量：57
10黄华,罗四维,李爱军,刘蕴辉.实现人工神经网络知识增殖能力的一种方法[J].计算机研究与发展,2004,41(7):1062-1067. 被引量：4

1李曼.云计算平台上的增量分类研究[J].微型机与应用,2011,30(18):65-68. 被引量：1
2蒋望东,陆小艺,林士敏.处理缺失数据的朴素贝叶斯分类增量算法[J].科学技术与工程,2008,8(14):3812-3815. 被引量：2
3王伟.基于最小距离的多中心向量的增量分类算法[J].电脑知识与技术,2015,0(2):70-73.
4余承依.基于贝叶斯增量分类的邮件过滤研究[J].科学技术与工程,2009,9(9):2356-2361. 被引量：1
5曾安平.一种增量式的半监督文本分类算法[J].宜宾学院学报,2011,11(6):71-74.
6温菊屏,林冬梅.图稀疏化:加速图聚类的有效方法[J].计算机工程与设计,2013,34(11):3934-3938. 被引量：3
7谢羿.基于BFS结果集的可达性保持图并行计算[J].中国新技术新产品,2016(11):35-36. 被引量：1
8单凯,高仲合,李凤银.云计算环境下的P2P流量识别[J].计算机工程与应用,2015,51(19):88-92. 被引量：1
9李凯,黄厚宽.一种提高神经网络集成差异性的学习方法[J].电子学报,2005,33(8):1387-1390. 被引量：9
10吴科主,江雨燕,周传华.一种多层次选择性集成学习算法[J].计算机应用与软件,2011,28(1):16-18. 被引量：1

南京邮电大学学报（自然科学版）

2012年第5期

浏览历史

内容加载中请稍等...

云计算平台上基于选择性集成的增量学习研究

参考文献4

二级参考文献67

共引文献346

相关作者

相关机构

相关主题

浏览历史