期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多智能体强化学习的空间机械臂轨迹规划
被引量:
17
1
作者
赵毓
管公顺
+2 位作者
郭继峰
于晓强
颜鹏
《航空学报》
EI
CAS
CSCD
北大核心
2021年第1期259-269,共11页
针对某型六自由度(DOF)空间漂浮机械臂对运动目标捕捉场景,开展了基于深度强化学习的在线轨迹规划方法研究。首先给出了机械臂DH(Denavit-Hartenberg)模型,考虑组合体力学耦合特性建立了多刚体运动学和动力学模型。然后提出了一种改进...
针对某型六自由度(DOF)空间漂浮机械臂对运动目标捕捉场景,开展了基于深度强化学习的在线轨迹规划方法研究。首先给出了机械臂DH(Denavit-Hartenberg)模型,考虑组合体力学耦合特性建立了多刚体运动学和动力学模型。然后提出了一种改进深度确定性策略梯度算法,以各关节为决策智能体建立了多智能体自学习系统。而后建立了“线下集中学习,线上分布执行”的空间机械臂对匀速直线运动目标捕捉训练系统,构建以目标相对距离和总操作时间为参数的奖励函数。最后通过数学仿真验证,实现了机械臂对各向匀速运动目标的快速捕捉,平均完成耗时5.4s。与传统基于随机采样的规划算法对比,本文提出的自主决策运动规划方法求解速度和鲁棒性更优。
展开更多
关键词
机械臂
轨迹规划
多智能体
策略梯度
在轨
捕捉
原文传递
题名
基于多智能体强化学习的空间机械臂轨迹规划
被引量:
17
1
作者
赵毓
管公顺
郭继峰
于晓强
颜鹏
机构
哈尔滨工业大学航天学院
出处
《航空学报》
EI
CAS
CSCD
北大核心
2021年第1期259-269,共11页
基金
国家自然科学基金(61973101)
航空科学基金(20180577005)。
文摘
针对某型六自由度(DOF)空间漂浮机械臂对运动目标捕捉场景,开展了基于深度强化学习的在线轨迹规划方法研究。首先给出了机械臂DH(Denavit-Hartenberg)模型,考虑组合体力学耦合特性建立了多刚体运动学和动力学模型。然后提出了一种改进深度确定性策略梯度算法,以各关节为决策智能体建立了多智能体自学习系统。而后建立了“线下集中学习,线上分布执行”的空间机械臂对匀速直线运动目标捕捉训练系统,构建以目标相对距离和总操作时间为参数的奖励函数。最后通过数学仿真验证,实现了机械臂对各向匀速运动目标的快速捕捉,平均完成耗时5.4s。与传统基于随机采样的规划算法对比,本文提出的自主决策运动规划方法求解速度和鲁棒性更优。
关键词
机械臂
轨迹规划
多智能体
策略梯度
在轨
捕捉
Keywords
manipulators
trajectory planning
multi-agent
policy gradient
on orbit capture
分类号
V447 [航空宇航科学与技术—飞行器设计]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于多智能体强化学习的空间机械臂轨迹规划
赵毓
管公顺
郭继峰
于晓强
颜鹏
《航空学报》
EI
CAS
CSCD
北大核心
2021
17
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部