期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进DQN方法的滑翔制导炮弹弹道规划
1
作者 谢蕃葳 王旭刚 《弹道学报》 CSCD 北大核心 2023年第4期53-60,共8页
深度强化学习的快速发展为弹道规划提供了一种新的选择,它采用与环境交互的形式寻求最优弹道规划深的度神经网络,但在与环境交互的过程中存在着强随机性,这会导致强化学习训练过程中出现训练效果差、学习效率低下等问题。针对这一问题,... 深度强化学习的快速发展为弹道规划提供了一种新的选择,它采用与环境交互的形式寻求最优弹道规划深的度神经网络,但在与环境交互的过程中存在着强随机性,这会导致强化学习训练过程中出现训练效果差、学习效率低下等问题。针对这一问题,本文提出了基于改进深度Q网络(Improved Deep Q-Network,IM-DQN)的深度强化学习弹道规划方法。该方法在传统深度Q网络(Deep Q-Network,DQN)算法的基础上添加了优秀经验保存和探索限制率的组合策略去引导训练方向,阻止训练网络大规模崩塌现象发生。对滑翔制导炮弹模型进行三自由度建模并将弹道规划问题转化为马尔可夫决策过程,确定状态空间、状态转移方式、奖励函数以及相关算法参数进行训练。分别在无约束和有约束条件下,将此方法训练得到的航程结果分别与最大升阻比方法以及基于最优控制理论的高斯伪谱法(Gaussian Pseudospectral Method,GPM)进行横向性能对比。仿真结果表明:IM-DQN方法训练过程相较于DQN方法更加稳定,在寻求航程最优性问题上,IM-DQN方法得到的最大航程值优于上述两种参照方法,研究结果可以为今后的强化学习弹道规划提供参考。 展开更多
关键词 滑翔制导炮弹 弹道规划 深度强化学习 优秀经验保存 探索限制策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部