带自适应学习率的加速随机方差缩减梯度法被引量：1

ACCELERATED STOCHASTIC VARIANCE REDUCTION GRADIENT METHOD WITH ADAPTIVE LEARNING RATE

导出

摘要由于随机方差缩减梯度(SVRG)法在求解经验风险最小化(ERM)问题时表现优异,近年来受到了广泛关注.与SVRG方法中使用固定的学习率不同,结合初始化偏差矫正技术,提出使用自适应方法来动态计算SVRG方法及其加速版本FSVRG方法的学习率,分别称为AdaSVRG方法和AdaFSVRG方法.收敛性分析表明,AdaSVRG方法和AdaFSVRG方法在强凸假设下均具有线性收敛速率.在标准数据集上的数值实验表明,在求解ERM问题时,AdaSVRG和AdaFSVRG需要更少的迭代次数就可以达到相同水平的优化间隙. Due to its excellent performance in solving the ERM problem,SVRG has attracted extensive attention in recent years.Different from using fixed learning rate in SVRG,combined with the initialization deviation correction technology,the adaptive methods are proposed to dynamically calculate the learning rates of SVRG and its accelerated version FSVRG,which are called AdaSVRG and AdaFSVRG respectively.The convergence analysis shows that both AdaSVRG and AdaFSVRG have linear convergence rate under strong convex hypothesis.Numerical experiments on standard datasets show that AdaSVRG and AdaFSVRG require fewer iterations to achieve the same level of optimality gap when solving the ERM problem.

作者陈国茗于腾腾刘新为 Chen Guoming;Yu Tengteng;Liu Xinwei(School of Science,Hebei University of Technology,Tianjin 30040l,China;School of Artificial Intelligence,Hebei University of Technology,Tianjin 300401,China)

机构地区河北工业大学理学院河北工业大学人工智能与数据科学学院

出处《数值计算与计算机应用》 2021年第3期215-225,共11页 Journal on Numerical Methods and Computer Applications

关键词随机梯度法方差缩减自适应学习率初始化偏差矫正动量加速. stochastic gradient method variance reduction adaptive learning rate initialization bias correction momentum acceleration

分类号 O224 [理学—运筹学与控制论]

引文网络
相关文献

参考文献1

1史加荣,王丹,尚凡华,张鹤于.随机梯度下降算法研究进展[J].自动化学报,2021,47(9):2103-2119. 被引量：71

二级参考文献7

1陈振宏,兰艳艳,郭嘉丰,程学旗.基于差异合并的分布式随机梯度下降算法[J].计算机学报,2015,38(10):2054-2063. 被引量：19
2朱小辉,陶卿,邵言剑,储德军.一种减小方差求解非光滑问题的随机优化算法[J].软件学报,2015,26(11):2752-2761. 被引量：5
3焦李成,杨淑媛,刘芳,王士刚,冯志玺.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716. 被引量：364
4李飞,高晓光,万开方.基于权值动量的RBM加速学习算法研究[J].自动化学报,2017,43(7):1142-1159. 被引量：11
5亢良伊,王建飞,刘杰,叶丹.可扩展机器学习的并行与分布式优化算法综述[J].软件学报,2018,29(1):109-130. 被引量：28
6林懿伦,戴星原,李力,王晓,王飞跃.人工智能研究的新前线：生成式对抗网络[J].自动化学报,2018,44(5):775-792. 被引量：83
7谢佩,游科友,洪奕光,谢立华.网络化分布式凸优化算法研究进展[J].控制理论与应用,2018,35(7):918-927. 被引量：21

共引文献70

1朱小勇,陈胜.基于ResNet-ViT的海战多目标态势感知[J].信息与控制,2023,52(5):638-647.
2胡欣然,雷良海,寇晓晨.地方政府债券发行期限影响因素--基于投资者信息不对称视角[J].系统工程,2020,38(2):122-132. 被引量：4
3周瑞敏,王瑞尧,司文杰,李志军.带有改进自适应动量因子的四容水箱DRNN控制系统设计[J].工业控制计算机,2021,34(1):19-22.
4史加荣,刘晨.基于双核范数鲁棒矩阵分解的遮挡图像恢复[J].山东科技大学学报（自然科学版）,2021,40(4):86-93. 被引量：1
5杨悦,谢辛,何蕾,胡敏.连分式插值结合卷积神经网络的超分辨率重建[J].合肥工业大学学报（自然科学版）,2021,44(8):1146-1152. 被引量：4
6李蝶.基于Polyak步长的方差缩减算法[J].科技资讯,2021,19(16):174-177. 被引量：1
7谢小磊,杨毅.求解非凸优化问题的一类带动量步的随机方差缩减算法[J].科技创新导报,2021,18(17):78-81.
8周旭,鲁墨武,姜春英,叶长龙,王世超,孙万胤.改进的PSO-BP算法在工业机器人末端位姿误差补偿中的应用[J].信息与控制,2021,50(4):505-512. 被引量：13
9齐永强,李文鹏,郑跃军,李慧,王成见.地下水机器学习方法研究--水位监测数据驱动的区域补排边界识别[J].水文地质工程地质,2022,49(1):1-11. 被引量：2
10张聪,张恒,张立坤,赵彤,邓桂英.基于深度残差神经网络的博彩网页识别算法设计[J].电子技术应用,2022,48(2):15-18. 被引量：2

同被引文献7

1张中华,丁华福.基于混沌神经网络的股票分析及其预测[J].计算机技术与发展,2009,19(3):185-188. 被引量：9
2乔俊飞,樊瑞元,韩红桂,阮晓钢.机器人动态神经网络导航算法的研究和实现[J].控制理论与应用,2010,27(1):111-115. 被引量：6
3王新迎,韩敏.多元混沌时间序列的多核极端学习机建模预测[J].物理学报,2015,64(7):129-135. 被引量：19
4邓帅.基于改进贝叶斯优化算法的CNN超参数优化方法[J].计算机应用研究,2019,36(7):1984-1987. 被引量：34
5邵恩泽,吴正勇,王灿.一种改进的神经网络模型结构优化方法[J].工业控制计算机,2020,33(4):11-12. 被引量：3
6甘文娟,陈永红,韩静,王亚飞.基于正交参数优化的LSTM结构变形预测模型[J].计算机系统应用,2020,29(9):212-218. 被引量：7
7黄伟建,李永涛,黄远.基于混合神经网络和注意力机制的混沌时间序列预测[J].物理学报,2021,70(1):229-237. 被引量：28

引证文献1

1黄颖,顾长贵,杨会杰.神经网络超参数优化的删除垃圾神经元策略[J].物理学报,2022,71(16):77-85. 被引量：2

二级引证文献2

1田霖浩,杨俊,郭昊琰.基于Wavelet-CNN的电磁炮过靶信号识别方法[J].计算机测量与控制,2023,31(4):161-166.
2石翔,张暄培,郭磊.基于VMD-SO-BP的超短期风电功率预测[J].红水河,2023,42(3):50-54.

1谢小磊,杨毅.求解非凸优化问题的一类带动量步的随机方差缩减算法[J].科技创新导报,2021,18(17):78-81.
2柯捷,张余明,慕德俊,张佳庚,马文涛.基于变中心互相关熵的比例自适应滤波算法研究[J].计算机应用研究,2021,38(2):465-469. 被引量：1
3李蝶.基于Polyak步长的方差缩减算法[J].科技资讯,2021,19(16):174-177. 被引量：1
4田小鹏,柴和天.基于拉格朗日分解的电动汽车充电路径优化[J].兰州交通大学学报,2020,39(3):33-38. 被引量：2
5宋杰,朱勇,许冰.批量减数更新方差缩减梯度下降算法BSUG[J].计算机工程与应用,2020,56(22):117-123. 被引量：6
6周晓君,于腾腾.求解SVM的稀疏随机方差缩减梯度法[J].计算机应用研究,2020,37(S02):95-97. 被引量：3
7李滨,敬启超.改进的卷积神经网络在树种识别中的应用[J].森林工程,2021,37(5):75-81. 被引量：13
8袁琼,杨志伟,付芳芳.时空分数阶扩散方程的扩展混合有限元方法[J].数值计算与计算机应用,2021,42(3):276-288.
9郝达慧,王池社,陈敏.基于深度学习的复杂场景下车牌定位与识别[J].现代计算机,2021,27(24):119-123. 被引量：3
10梁升一,李世华.基于GPIO的机械臂外力矩估计问题研究[J].工业控制计算机,2021,34(9):84-86.

数值计算与计算机应用

2021年第3期

浏览历史

内容加载中请稍等...

带自适应学习率的加速随机方差缩减梯度法被引量：1

参考文献1

二级参考文献7

共引文献70

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

带自适应学习率的加速随机方差缩减梯度法 被引量：1

参考文献1

二级参考文献7

共引文献70

同被引文献7

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

带自适应学习率的加速随机方差缩减梯度法被引量：1