带有微分项改进的自适应梯度下降优化算法被引量：2

Adaptive gradient descent optimization algorithm with improved differential term

下载PDF

导出

摘要梯度下降算法作为卷积神经网络训练常用优化算法,其性能的优劣直接影响网络训练收敛性.本文主要分析了目前梯度优化算法中存在超调而影响收敛性问题以及学习率自适应性问题,提出了一种带微分项的自适应梯度优化算法,旨在改善网络优化过程收敛性的同时提高收敛速率.首先,针对优化过程存在较大超调量的问题,通过对迭代算法的重整合以及结合传统控制学原理引入微分项等方式来克服权重更新滞后于实际梯度改变的问题;然后,引入自适应机制来应对因学习率的不适应性导致的收敛率差和收敛速率慢等问题;紧接着,基于柯西-施瓦茨和杨氏不等式等证明了新算法的最差性能上界(悔界)为■(√T).最后,通过在包括MNIST数据集以及CIFAR-10基准数据集上的仿真实验来验证新算法的有效性,结果表明新算法引入的微分项和自适应机制的联合模式能够有效地改善梯度下降算算法的收敛性能,从而实现算法性能的明显改善. Gradient descent algorithms are common optimization algorithms for neural networks training,whose performance directly affects the convergence of the network training.This article mainly analyzes the problem of overshoots,which affects the convergence of the gradient optimization algorithm,and the problem of self adaptability of learning rate.An adaptive gradient optimization algorithm with differential term is proposed,which aims to improve the convergence rate of network optimization process as well as the convergence rate.Firstly,aiming at the problem of large overshoots in the optimization process,this article re-integrates the iterative algorithms by introducing the differential term combined with the traditional control theory,the shortcoming that the weight update lags behind the actual gradient change is overcome;Secondly,this article introduces an adaptive mechanism to improve the poor and slow convergence rate which are due to the unsuitable learning rate.Thirdly,this article proves that the regret bound■(√T)is achieved by using the Cauchy-Schwarz and Young’s inequalities.Finally,the effectiveness of the proposed method are verified by experimental tests on MNIST and CIFAR-10 benchmark datasets.The results show that the convergence performance of gradient descent methods can be improved significantly by introducing the differential term and adaptive mechanism,which can realize the significant improvement of optimization algorithms.

作者葛泉波张建朝杨秦敏李宏 GE Quan-bo;ZHANG Jian-chao;YANG Qin-min;LI Hong(School of Automation,Nanjing University of Information Science&Technology,Nanjing Jiangsu 210044,China;School of Automation,Hangzhou Dianzi University,Hangzhou Zhejiang 310018,China;School of Control Science and Engineering,Zhejiang University,Hangzhou Zhejiang 310063,China;Chinese Flight Test Establishment,Xi’an Shaanxi 710089,China)

机构地区南京信息工程大学自动化学院杭州电子科技大学自动化学院浙江大学控制科学与工程学院中国飞行试验研究院

出处《控制理论与应用》 EI CAS CSCD 北大核心 2022年第4期623-632,共10页 Control Theory & Applications

基金中国航空科学基金项目(2019460T5001)资助。

关键词卷积神经网络梯度下降算法微分项权重更新自适应学习率悔界 convolutional neural networks gradient descent algorithm differential term weight update adaptive learning rate regret bound

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1周晓君,高媛,李超杰,阳春华.基于多目标优化多任务学习的端到端车牌识别方法[J].控制理论与应用,2021,38(5):676-688. 被引量：13
2邹月娴,余嘉胜,陈泽晗,陈锦,王毅.图像分类卷积神经网络的特征选择模型压缩方法（英文）[J].控制理论与应用,2017,34(6):746-752. 被引量：8
3魏海坤,李奇,宋文忠.梯度算法下RBF网的参数变化动态[J].控制理论与应用,2007,24(3):356-360. 被引量：13
4史加荣,王丹,尚凡华,张鹤于.随机梯度下降算法研究进展[J].自动化学报,2021,47(9):2103-2119. 被引量：71
5张晋晶..基于随机梯度下降的神经网络权重优化算法[D].西南大学,2018:
6潘程艳..带动量的BP神经网络在线梯度学习算法的收敛性[D].华东理工大学,2020:

二级参考文献18

1魏海坤,宋文忠,李奇.非线性系统RBF网在线建模的资源优化网络方法[J].自动化学报,2005,31(6):970-974. 被引量：6
2HAYKIN S.Neural Networks:A Comprehensive Foundation[M].New York,NY:Prentice Hall,1997. 被引量：1
3KARAYIANNIS N,RANDOLPH-GIPS M.On the construction and training of reformulated radial basis function neural networks[J].IEEE Trans Neural Networks,2003,14(4):835-846. 被引量：1
4PLATT J.A resource-allocating network for function interpolation[J].Neural Computation,1991,3(2):213-225. 被引量：1
5YINGWEI L,SUNDARARAJAN N,SARATCHANDRAN P.A sequential learning scheme for function approximation and using minimal radial basis neural networks[J].Neural Computation,1997,9(2):1-18. 被引量：1
6MICCHELLI C.Interpolation of scattered data:distance matrices and conditionally positive definite functions[J].Constructive Approximation,1986,2(1):11-22. 被引量：1
7WEI H,AMARI S.Online learning dynamics of radial basis function neural networks near the singularity[C]//Proc of Int Joint Conf on Neural Networks.New York,USA:IEEE Press,2006:4770-4776. 被引量：1
8AMARI S,PARK H,OZEKI T.Singularities affect dynamics of learning in neuromanifolds[J].Neural Computation,2006,18(5):1007-1065. 被引量：1
9叶洪涛,罗飞,许玉格.解决多目标优化问题的差分进化算法研究进展(英文)[J].控制理论与应用,2013,30(7):922-928. 被引量：17
10魏海坤,徐嗣鑫,宋文忠.神经网络的泛化理论和泛化方法[J].自动化学报,2001,27(6):806-815. 被引量：97

共引文献101

1朱小勇,陈胜.基于ResNet-ViT的海战多目标态势感知[J].信息与控制,2023,52(5):638-647.
2郑明文.基于Kohonen网络和OLS算法的RBFNN中心选择方法[J].微型电脑应用,2008,24(9):10-13.
3王亚静,刘福才,张艳欣,董媛媛.一种改进的动态聚类非线性系统辨识算法[J].控制工程,2010,17(S2):85-88.
4郑明文.改进的OLS算法选择RBFNN中心的方法[J].计算机工程与应用,2009,45(25):52-54. 被引量：1
5胡斌,宫宁生,郇洪江.改进的RBF学习算法及其相似性应用[J].计算机工程与设计,2009,30(18):4287-4289. 被引量：5
6王旭东,宋茂忠.无监督Eidos表相盒中脑状态人工神经元网络模型参数优化选取[J].控制理论与应用,2010,27(3):373-376. 被引量：1
7徐富强,刘相国.基于优化的RBF神经网络的变量筛选方法[J].计算机系统应用,2012,21(3):206-208. 被引量：26
8黄建招,谢建,高钦和,李良.SA-HHGA优化RBF神经网络的方法及应用[J].计算机工程与应用,2013,49(17):209-212. 被引量：1
9郭伟立,魏海坤,赵军圣,张侃健.多层感知器模型互反奇异性区域学习动态的理论分析[J].控制理论与应用,2014,31(2):140-147. 被引量：1
10蒋红梅,李战明,唐伟强,任庆昌.变风量空调系统的优化控制研究[J].暖通空调,2016,46(3):84-88. 被引量：15

同被引文献6

1安全,王翔宇,李亮.智能混合动力汽车经济性自适应巡航控制策略研究[J].北京理工大学学报,2018,38(A01):133-136. 被引量：4
2曾小华,崔臣,宋大凤,李广含,董兵兵,刘持林.行星混联混合动力汽车节油因素分析[J].北京理工大学学报,2019,39(7):699-705. 被引量：5
3汪佳佳,蔡英凤,陈龙,汪少华,施德华,朱镇.基于随机通信时滞补偿的混合动力汽车协调控制研究[J].北京理工大学学报,2020,40(12):1332-1339. 被引量：3
4江波,屈若锟,李彦冬,李诚龙.基于深度学习的无人机航拍目标检测研究综述[J].航空学报,2021,42(4):131-145. 被引量：71
5李红光,于若男,丁文锐.基于深度学习的小目标检测研究进展[J].航空学报,2021,42(7):100-118. 被引量：43
6李柯泉,陈燕,刘佳晨,牟向伟.基于深度学习的目标检测算法综述[J].计算机工程,2022,48(7):1-12. 被引量：80

引证文献2

1宋玉存,葛泉波,朱军龙,陆振宇.基于梯度差自适应学习率优化的改进YOLOX目标检测算法[J].航空学报,2023,44(14):210-226. 被引量：2
2刘波澜,李奔,万鹏,范文浩,唐静娴.考虑热管理约束的柴电混动系统能量再分配策略[J].北京理工大学学报,2024,44(5):476-483.

二级引证文献2

1胡瑶,王远军.一种双输入稀疏连接的肝细胞癌和肝内胆管细胞癌分类网络[J].小型微型计算机系统,2024,45(5):1129-1135.
2孙涵,田野,孙春凤.基于改进YOLOv8s的密集多人脸检测[J].软件,2024,45(4):142-146.

1王昕.梯度下降及优化算法研究综述[J].电脑知识与技术,2022,18(8):71-73. 被引量：6
2宋美佳,贾鹤鸣,林志兴,卢仁盛,刘庆鑫.自适应学习率梯度下降的优化算法[J].三明学院学报,2021,38(6):36-44. 被引量：5
3Edward Omey,陆柱家(译),陆昱(校).关于Xiang的与Cauchy-Schwarz不等式有关的观察[J].数学译林,2021,40(1):91-92.
4罗长银,王君宇,陈学斌,马春地,张淑芬.改进的联邦加权平均算法[J].计算机应用,2022,42(4):1131-1136. 被引量：4
5尹淑文,汪硕,黄韬.时间敏感网络中基于网络演算的队列分析与优化[J].中兴通讯技术,2022,28(1):21-28. 被引量：2
6权婉珍,罗哲,杨小冈,韩心中,席建祥.间歇通信条件下多无人机保性能编队追踪控制[J].系统工程与电子技术,2021,43(11):3288-3294. 被引量：3
7钱正成,陈睿,陆叶,李传起,周省邦,谢乙田,孔一卜.基于动量梯度下降优化算法的色散均衡器设计[J].光通信技术,2022,46(2):85-90.
8郑毅,胡祥培.基于时间光滑正则化的序列诊疗数据融合方法[J].管理科学,2021,34(4):61-70. 被引量：4
9阎美军.软化器控水气擦洗方法与试验论证[J].中国设备工程,2022(9):47-50.
10齐培培,徐璨.产融结合提升制造业企业技术创新作用机制研究——基于制度环境视角[J].企业科技与发展,2022(2):22-24. 被引量：1

控制理论与应用

2022年第4期

浏览历史

内容加载中请稍等...

带有微分项改进的自适应梯度下降优化算法被引量：2

参考文献6

二级参考文献18

共引文献101

同被引文献6

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

带有微分项改进的自适应梯度下降优化算法 被引量：2

参考文献6

二级参考文献18

共引文献101

同被引文献6

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

带有微分项改进的自适应梯度下降优化算法被引量：2