针对姿态任意、尺寸不一的物体以及抓取角度离散性问题,提出一种基于语义分割与旋转目标检测的单目位姿估计方法.阶段1:首先利用faster R-CNN (faster regions with convolutional neural networks features)进行抓取检测获取候选抓取框...针对姿态任意、尺寸不一的物体以及抓取角度离散性问题,提出一种基于语义分割与旋转目标检测的单目位姿估计方法.阶段1:首先利用faster R-CNN (faster regions with convolutional neural networks features)进行抓取检测获取候选抓取框;其次利用语义分割网络获取待抓取物体的轮廓信息;最后利用语义分割结果为每个待抓取物体筛选置信度最高的抓取框,同时完成角度粗估计.阶段2:利用旋转目标检测获取精细的抓取角度,以修正阶段1抓取框的偏转角.此外,考虑到抓取物具有多尺度的特点,提出一种多尺度特征融合模块,使金字塔的所有层共享相似的语义特征.针对智能算法求解逆运动学时出现迭代后期收敛速度慢的问题,利用牛顿法收敛速度快的优点,加快智能算法后期的收敛速度.基于V-REP仿真以及实际抓取检测实验表明,所提算法的抓取检测精度为98.4%,实际抓取成功率达到了88.3%,仿真抓取时的有害扭矩大小较修正前有所改善,能够满足机械臂抓取要求.展开更多
文摘针对姿态任意、尺寸不一的物体以及抓取角度离散性问题,提出一种基于语义分割与旋转目标检测的单目位姿估计方法.阶段1:首先利用faster R-CNN (faster regions with convolutional neural networks features)进行抓取检测获取候选抓取框;其次利用语义分割网络获取待抓取物体的轮廓信息;最后利用语义分割结果为每个待抓取物体筛选置信度最高的抓取框,同时完成角度粗估计.阶段2:利用旋转目标检测获取精细的抓取角度,以修正阶段1抓取框的偏转角.此外,考虑到抓取物具有多尺度的特点,提出一种多尺度特征融合模块,使金字塔的所有层共享相似的语义特征.针对智能算法求解逆运动学时出现迭代后期收敛速度慢的问题,利用牛顿法收敛速度快的优点,加快智能算法后期的收敛速度.基于V-REP仿真以及实际抓取检测实验表明,所提算法的抓取检测精度为98.4%,实际抓取成功率达到了88.3%,仿真抓取时的有害扭矩大小较修正前有所改善,能够满足机械臂抓取要求.