期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于生成对抗网络与模型泛化的机器人推抓技能学习方法
被引量:
3
1
作者
吴培良
刘瑞军
+2 位作者
李瑶
陈雯柏
高国伟
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2022年第5期244-253,共10页
杂乱环境中机器人推动与抓取技能自主学习问题被学者广泛研究,实现二者之间的协同是提升抓取效率的关键,本文提出一种基于生成对抗网络与模型泛化的深度强化学习算法GARL-DQN。首先,将生成对抗网络嵌入到传统DQN中,训练推动与抓取之间...
杂乱环境中机器人推动与抓取技能自主学习问题被学者广泛研究,实现二者之间的协同是提升抓取效率的关键,本文提出一种基于生成对抗网络与模型泛化的深度强化学习算法GARL-DQN。首先,将生成对抗网络嵌入到传统DQN中,训练推动与抓取之间的协同进化;其次,将MDP中部分参数基于目标对象公式化,借鉴事后经验回放机制(HER)提高经验池样本利用率;然后,针对图像状态引入随机(卷积)神经网络来提高算法的泛化能力;最后,设计了12个测试场景,在抓取成功率与平均运动次数指标上与其他4种方法进行对比,在规则物块场景中两个指标分别为91.5%和3.406;在日常工具场景中两个指标分别为85.2%和8.6,验证了GARL-DQN算法在解决机器人推抓协同及模型泛化问题上的有效性。
展开更多
关键词
推抓技能学习
生成对抗网络
DQN
模型泛化
下载PDF
职称材料
一种基于功用性图的目标推抓技能自监督学习方法
被引量:
1
2
作者
吴培良
刘瑞军
+3 位作者
毛秉毅
史浩洋
陈雯柏
高国伟
《机器人》
EI
CSCD
北大核心
2022年第4期385-398,共14页
提出了一种基于功用性图的目标推抓技能自监督学习方法。首先,给出了杂乱环境下面向目标推抓任务的机器人技能自监督学习问题描述,将工作空间中机器人推抓操作的决策过程定义为一个全新的马尔可夫决策过程(MDP),分别训练视觉机制模块与...
提出了一种基于功用性图的目标推抓技能自监督学习方法。首先,给出了杂乱环境下面向目标推抓任务的机器人技能自监督学习问题描述,将工作空间中机器人推抓操作的决策过程定义为一个全新的马尔可夫决策过程(MDP),分别训练视觉机制模块与动作机制模块。其次,在视觉机制模块中融合自适应参数与分组拆分注意力模块设计了特征提取网络RGSA-Net,可由输入网络的原始状态图像生成功用性图,为目标推抓操作提供良好的前提。然后,在动作机制模块中搭建了基于演员-评论家(actor-critic)框架的深度强化学习自监督训练框架DQAC,机器人根据功用性图执行动作后利用该框架进行动作评判,更好地实现了推、抓之间的协同。最后,进行了实验对比与分析,验证了本文方法的有效性。
展开更多
关键词
推抓技能学习
功用性图
自监督学习
自适应参数
拆分注意力机制
原文传递
题名
一种基于生成对抗网络与模型泛化的机器人推抓技能学习方法
被引量:
3
1
作者
吴培良
刘瑞军
李瑶
陈雯柏
高国伟
机构
燕山大学信息科学与工程学院
河北省计算机虚拟技术与系统集成重点实验室
北京信息科技大学自动化学院
出处
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2022年第5期244-253,共10页
基金
国家重点研发计划(2018YFB1308300)
国家自然科学基金区域联合基金(U20A20167)
+1 种基金
北京市自然科学基金(4202026)
河北省自然科学基金(F202103079)项目资助。
文摘
杂乱环境中机器人推动与抓取技能自主学习问题被学者广泛研究,实现二者之间的协同是提升抓取效率的关键,本文提出一种基于生成对抗网络与模型泛化的深度强化学习算法GARL-DQN。首先,将生成对抗网络嵌入到传统DQN中,训练推动与抓取之间的协同进化;其次,将MDP中部分参数基于目标对象公式化,借鉴事后经验回放机制(HER)提高经验池样本利用率;然后,针对图像状态引入随机(卷积)神经网络来提高算法的泛化能力;最后,设计了12个测试场景,在抓取成功率与平均运动次数指标上与其他4种方法进行对比,在规则物块场景中两个指标分别为91.5%和3.406;在日常工具场景中两个指标分别为85.2%和8.6,验证了GARL-DQN算法在解决机器人推抓协同及模型泛化问题上的有效性。
关键词
推抓技能学习
生成对抗网络
DQN
模型泛化
Keywords
pushing
and
grasping
skill
learning
generate
adversarial
network
DQN
model
generalization
分类号
TH701 [机械工程—仪器科学与技术]
TP242 [机械工程—精密仪器及机械]
下载PDF
职称材料
题名
一种基于功用性图的目标推抓技能自监督学习方法
被引量:
1
2
作者
吴培良
刘瑞军
毛秉毅
史浩洋
陈雯柏
高国伟
机构
燕山大学信息科学与工程学院
河北省计算机虚拟技术与系统集成重点实验室
北京信息科技大学自动化学院
出处
《机器人》
EI
CSCD
北大核心
2022年第4期385-398,共14页
基金
国家重点研发计划(2018YFB1308300)
国家自然科学基金区域联合基金(U20A20167)
+1 种基金
北京市自然科学基金(4202026)
河北省自然科学基金(F202103079).
文摘
提出了一种基于功用性图的目标推抓技能自监督学习方法。首先,给出了杂乱环境下面向目标推抓任务的机器人技能自监督学习问题描述,将工作空间中机器人推抓操作的决策过程定义为一个全新的马尔可夫决策过程(MDP),分别训练视觉机制模块与动作机制模块。其次,在视觉机制模块中融合自适应参数与分组拆分注意力模块设计了特征提取网络RGSA-Net,可由输入网络的原始状态图像生成功用性图,为目标推抓操作提供良好的前提。然后,在动作机制模块中搭建了基于演员-评论家(actor-critic)框架的深度强化学习自监督训练框架DQAC,机器人根据功用性图执行动作后利用该框架进行动作评判,更好地实现了推、抓之间的协同。最后,进行了实验对比与分析,验证了本文方法的有效性。
关键词
推抓技能学习
功用性图
自监督学习
自适应参数
拆分注意力机制
Keywords
pushing
-
grasping
skill
learning
affordance
map
self-supervised
learning
adaptive
parameter
split
attention
mechanism
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种基于生成对抗网络与模型泛化的机器人推抓技能学习方法
吴培良
刘瑞军
李瑶
陈雯柏
高国伟
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2022
3
下载PDF
职称材料
2
一种基于功用性图的目标推抓技能自监督学习方法
吴培良
刘瑞军
毛秉毅
史浩洋
陈雯柏
高国伟
《机器人》
EI
CSCD
北大核心
2022
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部