期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种基于生成对抗网络与模型泛化的机器人推抓技能学习方法 被引量:3
1
作者 吴培良 刘瑞军 +2 位作者 李瑶 陈雯柏 高国伟 《仪器仪表学报》 EI CAS CSCD 北大核心 2022年第5期244-253,共10页
杂乱环境中机器人推动与抓取技能自主学习问题被学者广泛研究,实现二者之间的协同是提升抓取效率的关键,本文提出一种基于生成对抗网络与模型泛化的深度强化学习算法GARL-DQN。首先,将生成对抗网络嵌入到传统DQN中,训练推动与抓取之间... 杂乱环境中机器人推动与抓取技能自主学习问题被学者广泛研究,实现二者之间的协同是提升抓取效率的关键,本文提出一种基于生成对抗网络与模型泛化的深度强化学习算法GARL-DQN。首先,将生成对抗网络嵌入到传统DQN中,训练推动与抓取之间的协同进化;其次,将MDP中部分参数基于目标对象公式化,借鉴事后经验回放机制(HER)提高经验池样本利用率;然后,针对图像状态引入随机(卷积)神经网络来提高算法的泛化能力;最后,设计了12个测试场景,在抓取成功率与平均运动次数指标上与其他4种方法进行对比,在规则物块场景中两个指标分别为91.5%和3.406;在日常工具场景中两个指标分别为85.2%和8.6,验证了GARL-DQN算法在解决机器人推抓协同及模型泛化问题上的有效性。 展开更多
关键词 推抓技能学习 生成对抗网络 DQN 模型泛化
下载PDF
一种基于功用性图的目标推抓技能自监督学习方法 被引量:1
2
作者 吴培良 刘瑞军 +3 位作者 毛秉毅 史浩洋 陈雯柏 高国伟 《机器人》 EI CSCD 北大核心 2022年第4期385-398,共14页
提出了一种基于功用性图的目标推抓技能自监督学习方法。首先,给出了杂乱环境下面向目标推抓任务的机器人技能自监督学习问题描述,将工作空间中机器人推抓操作的决策过程定义为一个全新的马尔可夫决策过程(MDP),分别训练视觉机制模块与... 提出了一种基于功用性图的目标推抓技能自监督学习方法。首先,给出了杂乱环境下面向目标推抓任务的机器人技能自监督学习问题描述,将工作空间中机器人推抓操作的决策过程定义为一个全新的马尔可夫决策过程(MDP),分别训练视觉机制模块与动作机制模块。其次,在视觉机制模块中融合自适应参数与分组拆分注意力模块设计了特征提取网络RGSA-Net,可由输入网络的原始状态图像生成功用性图,为目标推抓操作提供良好的前提。然后,在动作机制模块中搭建了基于演员-评论家(actor-critic)框架的深度强化学习自监督训练框架DQAC,机器人根据功用性图执行动作后利用该框架进行动作评判,更好地实现了推、抓之间的协同。最后,进行了实验对比与分析,验证了本文方法的有效性。 展开更多
关键词 推抓技能学习 功用性图 自监督学习 自适应参数 拆分注意力机制
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部