期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于上下文感知的强化学习AUV控制器研究
1
作者
徐春晖
徐德胜
+1 位作者
周
仕
昊
杨士霖
《舰船科学技术》
北大核心
2024年第11期108-114,共7页
为了提升基于强化学习的自主水下航行器(Autonomous Underwater vehicle,AUV)控制器在复杂海况中对环境干扰的鲁棒性,设计一种利用上下文信息进行环境感知的强化学习控制器。结合水下机器人运动学及动力学方程对深度跟踪任务进行建模,...
为了提升基于强化学习的自主水下航行器(Autonomous Underwater vehicle,AUV)控制器在复杂海况中对环境干扰的鲁棒性,设计一种利用上下文信息进行环境感知的强化学习控制器。结合水下机器人运动学及动力学方程对深度跟踪任务进行建模,构建了基于PPO-clip算法的深度控制器,并在算法中融入了上下文变量和域随机化方法。在仿真环境中分别进行海流干扰、暗涌干扰以及两者共同干扰环境的深度跟踪任务,仿真结果表明,本文提出的方法对强化学习控制器的抗干扰能力有明显的提升,在多种环境干扰下更精准地完成深度跟踪任务。
展开更多
关键词
AUV
深度控制
强化学习
上下文感知
下载PDF
职称材料
题名
基于上下文感知的强化学习AUV控制器研究
1
作者
徐春晖
徐德胜
周
仕
昊
杨士霖
机构
中国科学院沈阳自动化研究所机器人学国家重点实验室
中国科学院机器人与智能制造创新研究院
辽宁省水下机器人重点实验室
中国科学院大学
出处
《舰船科学技术》
北大核心
2024年第11期108-114,共7页
文摘
为了提升基于强化学习的自主水下航行器(Autonomous Underwater vehicle,AUV)控制器在复杂海况中对环境干扰的鲁棒性,设计一种利用上下文信息进行环境感知的强化学习控制器。结合水下机器人运动学及动力学方程对深度跟踪任务进行建模,构建了基于PPO-clip算法的深度控制器,并在算法中融入了上下文变量和域随机化方法。在仿真环境中分别进行海流干扰、暗涌干扰以及两者共同干扰环境的深度跟踪任务,仿真结果表明,本文提出的方法对强化学习控制器的抗干扰能力有明显的提升,在多种环境干扰下更精准地完成深度跟踪任务。
关键词
AUV
深度控制
强化学习
上下文感知
Keywords
AUV
depth control
reinforcement learning
context-aware
分类号
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于上下文感知的强化学习AUV控制器研究
徐春晖
徐德胜
周
仕
昊
杨士霖
《舰船科学技术》
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部