-
题名融合LSTM的深度强化学习视觉导航
被引量:7
- 1
-
-
作者
袁浩
刘紫燕
梁静
梁水波
孙昊堃
-
机构
贵州大学大数据与信息工程学院
-
出处
《无线电工程》
北大核心
2022年第1期161-167,共7页
-
基金
贵州省科学技术基金资助项目(黔科合基础[2016]1054)
贵州省联合资金资助项目(黔科合LH字[2017]7226号)
+1 种基金
贵州大学2017年度学术新苗培养及创新探索专项基金资助项目(黔科合平台人才[2017]5788)
贵州省科技计划项目(黔科合SY字[2011]3111)。
-
文摘
针对目标驱动的视觉导航系统中由于导航的场景变化而导致智能体导航性能大大减弱的问题,提出了一种基于长短时记忆网络(Long Short-Term Memory, LSTM)的深度强化学习(Deep Reinforcement Learning, DRL)视觉导航模型。该模型通过输入当前状态和目标状态的RGB图像来实现视觉导航,在改进原有目标驱动视觉导航模型的基础上,基于历史状态信息,结合LSTM和通用后继表征(Universal Successor Representations, USR)对未来动作决策。在AI2-THOR仿真环境下进行实验,实验结果表明,所提出的模型训练智能体导航性能优异,与其他几种模型相比,平均路径长度减少约6%,平均碰撞率减少40%,模型收敛速度较快。
-
关键词
视觉导航
深度强化学习
长短时记忆网络
目标驱动
通用后继表征
-
Keywords
visual navigation
deep reinforcement learning
LSTM
target driven
USR
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-