期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
Heavy-Ball型动量方法的最优个体收敛速率 被引量:10
1
作者 程禹嘉 陶蔚 +1 位作者 刘宇翔 陶卿 《计算机研究与发展》 EI CSCD 北大核心 2019年第8期1686-1694,共9页
动量方法作为一种加速技巧被广泛用于提高一阶梯度优化算法的收敛速率.目前,大多数文献所讨论的动量方法仅限于Nesterov提出的加速方法,而对Polyak提出的Heavy-ball型动量方法的研究却较少.特别,在目标函数非光滑的情形下,Nesterov加速... 动量方法作为一种加速技巧被广泛用于提高一阶梯度优化算法的收敛速率.目前,大多数文献所讨论的动量方法仅限于Nesterov提出的加速方法,而对Polyak提出的Heavy-ball型动量方法的研究却较少.特别,在目标函数非光滑的情形下,Nesterov加速方法具有最优的个体收敛性,并在稀疏优化问题的求解中具有很好的效果.但对于Heavy-ball型动量方法,目前仅仅获得了平均输出形式的最优收敛速率,个体收敛是否具有最优性仍然未知.对于非光滑优化问题,通过巧妙地设置步长,证明了Heavy-ball型动量方法具有最优的个体收敛速率,从而说明了Heavy-ball型动量方法可以将投影次梯度方法的个体收敛速率加速至最优.作为应用,考虑了l1范数约束的hinge损失函数优化问题.通过与同类的优化算法相比,实验验证了该理论分析的正确性以及所提算法在保持稀疏性方面的良好性能. 展开更多
关键词 一阶梯度方法 动量方法 个体收敛速率 Heavy-ball方法 稀疏性
下载PDF
非光滑凸情形Adam 型算法的最优个体收敛速率 被引量:5
2
作者 黄鉴之 丁成诚 +1 位作者 陶蔚 陶卿 《智能系统学报》 CSCD 北大核心 2020年第6期1140-1146,共7页
Adam是目前深度神经网络训练中广泛采用的一种优化算法框架,同时使用了自适应步长和动量技巧,克服了SGD的一些固有缺陷。但即使对于凸优化问题,目前Adam也只是在线学习框架下给出了和梯度下降法一样的regret界,动量的加速特性并没有得... Adam是目前深度神经网络训练中广泛采用的一种优化算法框架,同时使用了自适应步长和动量技巧,克服了SGD的一些固有缺陷。但即使对于凸优化问题,目前Adam也只是在线学习框架下给出了和梯度下降法一样的regret界,动量的加速特性并没有得到体现。这里针对非光滑凸优化问题,通过巧妙选取动量和步长参数,证明了Adam的改进型具有最优的个体收敛速率,从而说明了Adam同时具有自适应和加速的优点。通过求解l_(1)范数约束下的hinge损失问题,实验验证了理论分析的正确性和在算法保持稀疏性方面的良好性能。 展开更多
关键词 机器学习 AdaGrad算法 RMSProp算法 动量方法 Adam算法 AMSGrad算法 个体收敛速率 稀疏性
下载PDF
非光滑强凸情形Adam型算法的最优收敛速率 被引量:2
3
作者 陇盛 陶蔚 +1 位作者 张泽东 陶卿 《电子学报》 EI CAS CSCD 北大核心 2022年第9期2049-2059,共11页
对于非光滑强凸问题,在线梯度下降(Online Gradient Decent,OGD)取适当步长参数可以得到对数阶后悔界.然而,这并不能使一阶随机优化算法达到最优收敛速率.为解决这一问题,研究者通常采取两种方案:其一是改进算法本身,另一种是修改算法... 对于非光滑强凸问题,在线梯度下降(Online Gradient Decent,OGD)取适当步长参数可以得到对数阶后悔界.然而,这并不能使一阶随机优化算法达到最优收敛速率.为解决这一问题,研究者通常采取两种方案:其一是改进算法本身,另一种是修改算法输出方式.典型的Adam(Adaptive moment estimation)型算法SAdam(Strongly convex Adaptive moment esti⁃mation)采用了改进算法的方式,并添加了自适应步长策略和动量技巧,虽然得到更好的数据依赖的后悔界,但在随机情形仍然达不到最优.针对这个问题,本文改用加权平均的算法输出方式,并且重新设计与以往算法同阶的步长超参数,提出了一种名为WSAdam(Weighted average Strongly convex Adaptive moment estimation)的Adam型算法.证明了WSAdam达到了非光滑强凸问题的最优收敛速率.经过Reddi问题的测试和在非光滑强凸函数优化中的实验,验证了所提方法的有效性. 展开更多
关键词 非光滑 强凸优化 自适应步长 动量方法 Adam型算法 加权平均 收敛速率
下载PDF
饱和多孔弹性杆热传导的广义多辛方法及其数值实现 被引量:2
4
作者 刘雪梅 邓子辰 胡伟鹏 《西北工业大学学报》 EI CAS CSCD 北大核心 2015年第2期265-270,共6页
首先根据多孔介质理论,利用饱和多孔介质的能量方程和本构关系,推导出饱和多孔弹性杆局部热平衡的热传导方程;继而引入正交变量,将热传导方程导入Hamilton系统,得到饱和多孔弹性杆热传导方程的广义多辛形式和多种局部守恒律形式;接着采... 首先根据多孔介质理论,利用饱和多孔介质的能量方程和本构关系,推导出饱和多孔弹性杆局部热平衡的热传导方程;继而引入正交变量,将热传导方程导入Hamilton系统,得到饱和多孔弹性杆热传导方程的广义多辛形式和多种局部守恒律形式;接着采用中点离散方法对热传导方程的广义多辛形式进行数值离散;最后利用计算机数值实现了饱和多孔弹性杆的热传导过程,并且讨论了参数取值的不同对热传导过程的影响,同时在数值模拟过程中记录了广义多辛格式的局部动量误差。研究结果表明,构造的广义多辛方法能够很好地模拟系统的热传导过程和耗散效应,同时也可长时间保持系统的固有几何性质。 展开更多
关键词 多孔介质 广义多辛 耗散 热传导
下载PDF
一种三参数统一化动量方法及其最优收敛速率 被引量:1
5
作者 丁成诚 陶蔚 陶卿 《计算机研究与发展》 EI CSCD 北大核心 2020年第8期1571-1580,共10页
动量方法由于能够改善SGD(stochastic gradient descent)的收敛性能而倍受机器学习研究者的关注.随着其在深度学习的成功应用,动量方法出现了众多形式的变体.特别地,产生了SUM(stochastic unified momentum)和QHM(quasi-hyperbolic mome... 动量方法由于能够改善SGD(stochastic gradient descent)的收敛性能而倍受机器学习研究者的关注.随着其在深度学习的成功应用,动量方法出现了众多形式的变体.特别地,产生了SUM(stochastic unified momentum)和QHM(quasi-hyperbolic momentum)两种统一框架.但是,即使是对非光滑凸优化问题,其最优平均收敛性的获得仍然存在着固定迭代步数和无约束等不合理限制.为此,提出了一种更一般的含三参数的统一化动量方法TPUM(triple-parameters unified momentum),能够同时包含SUM和QHM;其次,针对约束的非光滑凸优化问题,在采取时变步长的条件下,证明了所提出的TPUM具有最优的平均收敛速率,并将其推广到随机情况,从而保证了添加动量不会影响标准梯度下降法的收敛性能以及动量方法对机器学习问题的可应用性.典型的L1范数约束hinge损失函数优化问题实验验证了理论分析的正确性. 展开更多
关键词 机器学习 优化算法 非光滑条件 动量方法 平均收敛速率
下载PDF
利用超表面的涡旋光束产生进展(特邀) 被引量:4
6
作者 吕浩然 白毅华 +2 位作者 叶紫微 董淼 杨元杰 《红外与激光工程》 EI CSCD 北大核心 2021年第9期54-69,共16页
涡旋光束因为携带轨道角动量,在光通信、粒子操纵及量子信息等领域都具有重要的应用前景。目前有很多方法可用于产生涡旋光束,如利用螺旋相位板、模式转换、空间光调制器等。然而,传统的方法需要搭建体积相对较大的光学系统,限制了其在... 涡旋光束因为携带轨道角动量,在光通信、粒子操纵及量子信息等领域都具有重要的应用前景。目前有很多方法可用于产生涡旋光束,如利用螺旋相位板、模式转换、空间光调制器等。然而,传统的方法需要搭建体积相对较大的光学系统,限制了其在集成光学等领域中的应用。不同于传统方法中通过传输效应来获得相位变化,超表面可以通过纳米结构使入射光产生相位突变,在纳米尺度上独立控制动态或几何相位以产生涡旋。超表面具有强大光控制能力的同时,还具有体积小、易于集成等特点,因此成为了产生涡旋光的理想方法。文中在介绍产生涡旋光束基本原理的基础上,回顾了近年来利用超表面产生涡旋光束的研究进展。首先介绍了利用动力学相位、Pancharatnam-Berry (P-B)相位以及混合相位产生光学涡旋的方法。随后,对利用全息与编码超表面产生涡旋及通过多路复用产生多个涡旋等不同方法进行了综述。最后,对基于超表面产生涡旋的一些亟待解决的问题和应用前景作了简单总结与讨论。 展开更多
关键词 光学涡旋 轨道角动量 超表面 产生方法
下载PDF
双致动盘多流管修正模型在直叶片垂直轴风力机气动计算中的应用 被引量:2
7
作者 韩毅 淡勇 +1 位作者 J.Sitaraman 卢泽行 《机械科学与技术》 CSCD 北大核心 2014年第11期1748-1752,共5页
系统地阐述了叶素-动量理论在直叶片垂直轴风力机单流管、多流管、双致动盘-多流管气动模型中的应用方法。并根据水平轴风力机叶素动量模型的推导思路,将风轮叶片的切向速度诱导因子引入垂直轴风力机的经典双致动盘-多流管气动模型中加... 系统地阐述了叶素-动量理论在直叶片垂直轴风力机单流管、多流管、双致动盘-多流管气动模型中的应用方法。并根据水平轴风力机叶素动量模型的推导思路,将风轮叶片的切向速度诱导因子引入垂直轴风力机的经典双致动盘-多流管气动模型中加以修正,建立了相应的气动计算模型并用程序仿真实现。与美国Sandia国家实验室的数据进行了对比分析,其气动载荷计算结果与相应实验与模拟结果符合较好,验证了该修正模型的实用与可行性。 展开更多
关键词 垂直轴风力机 叶素动量法 双致动盘多流管模型 速度诱导因子
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部