-
题名行星软着陆GPS有模型强化学习制导方法
被引量:2
- 1
-
-
作者
张阳康
孙晨
泮斌峰
-
机构
西北工业大学航天学院
航天飞行动力学技术国家级重点实验室
-
出处
《飞控与探测》
2021年第5期34-43,共10页
-
基金
装备预研实验室基金(6142210200312)。
-
文摘
由于距离地球较远、测控延时误差较大、飞行环境十分复杂且难以提前预测,行星软着陆的自主制导技术目前面临着水平位置估计困难、导航参考信息匮乏、复杂地形着陆困难等挑战。针对行星软着陆存在的困难和挑战,提出了基于引导策略搜索算法的有模型强化学习制导方法,实现了着陆器在初始状态受到扰动时无需重新规划,仍能在满足约束条件的情况下降落在指定位置。该方法首先将迭代线性二次调节器作为控制器,产生初始轨迹;其次,利用多层神经网络拟合制导策略;最后,利用控制器监督策略学习,进而收敛,产生可行策略。针对行星表面软着陆的仿真验证结果显示,该算法仅通过几次循环,即可实现初始状态变化的快速软着陆。该方法一方面表明了基于有模型强化学习的数据的高效利用率,另一方面也证明了强化学习方法在深空探测领域中具有广阔的应用前景。
-
关键词
迭代线性二次调节器
引导策略搜索
有模型强化学习
行星软着陆
-
Keywords
iterative Linear Quadratic Regulator(iLQR)
Guided Policy Search(GPS)
model-based reinforcement learning
planetary soft landing
-
分类号
TN911.73
[电子电信—通信与信息系统]
TP391.9
[电子电信—信息与通信工程]
-