期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
神经网络架构轻量化搜索的飞行器控制律自学习方法
1
作者 王昭磊 王露荻 +3 位作者 路坤锋 禹春梅 李晓敏 林平 《宇航学报》 EI CAS CSCD 北大核心 2024年第5期762-769,共8页
针对在运用Soft actor-critic(SAC)强化学习算法实现复杂的飞行器控制律自学习过程中,超参数设定高度依赖于人工经验进而造成设计难度大的问题,提出一种基于神经网络架构轻量化搜索策略的飞行器控制律自学习方法。该方法在将神经网络架... 针对在运用Soft actor-critic(SAC)强化学习算法实现复杂的飞行器控制律自学习过程中,超参数设定高度依赖于人工经验进而造成设计难度大的问题,提出一种基于神经网络架构轻量化搜索策略的飞行器控制律自学习方法。该方法在将神经网络架构设计问题转化为图拓扑生成问题的基础上,结合LSTM循环神经网络的图拓扑生成算法、基于权重共享的深度强化学习参数轻量化训练与评估机制,以及基于策略梯度的图拓扑生成器参数学习算法,给出了一种面向深度强化学习的轻量化自动搜索框架,实现了SAC训练算法中神经网络架构超参数的自动优化,进而完成了控制律的自学习。以三维空间返回着陆控制为例,验证了所提方法的有效性和实用性。 展开更多
关键词 飞行器 控制自学习 自动机器学习 网络架构搜索 SAC强化学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部