期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的固体放射性废物抓取方法研究 被引量:3
1
作者 周祺杰 刘满禄 +1 位作者 李新茂 张华 《计算机应用研究》 CSCD 北大核心 2020年第11期3363-3367,共5页
针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法。该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进... 针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法。该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进行交互并获得回报奖励,回报奖励由机械臂动作执行结果和放射性区域内放射性活度的高低构成,根据Q值的大小得到机械臂的最佳抓取位置。用V-REP软件对UR5机械臂建立仿真模型,在仿真环境中完成不同类型固体放射性废物抓取的训练与测试。仿真结果表明,固体废物在松散放置时该方法可使机械臂抓取成功率大于90%,在紧密放置时抓取成功率大于65%,机械臂不会受到废物堆叠的影响,并且会优先抓取放射性区域内具有高放射性活度的物体。 展开更多
关键词 固体放射性废物 深度强化学习 机械臂抓取 回报奖励
下载PDF
基于强化学习方法的RRT全局路径规划算法
2
作者 罗国攀 张国良 杨敏豪 《四川轻化工大学学报(自然科学版)》 CAS 2024年第2期57-63,共7页
针对强化学习运用于局部路径规划时目标方向不明确易陷入局部最优的情况以及快速探索随机树(RRT)算法规划路径复杂、冗余点多等问题,提出一种融合RRT算法与强化学习(RL)思想的全局路径规划算法。首先,通过RRT全局路径规划算法弱化、减... 针对强化学习运用于局部路径规划时目标方向不明确易陷入局部最优的情况以及快速探索随机树(RRT)算法规划路径复杂、冗余点多等问题,提出一种融合RRT算法与强化学习(RL)思想的全局路径规划算法。首先,通过RRT全局路径规划算法弱化、减少强化学习算法易于陷入局部最优的问题,并且在一定程度上可以减少规划迭代时间;其次,采用强化学习算法的最大回报奖励机制强化RRT算法在路径规划过程中选择子节点时的目的性,避免过多随机点。实验结果表明,所提算法有效弱化了局部最优所带来的绕远影响,路径长度缩短33.3,凹、凸地形有效节点占比分别提高36.0%和39.6%,侧面反映冗余点数量减少,验证了该算法的可行性。 展开更多
关键词 强化学习 快速探索随机树 回报奖励机制 全局路径规划
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部