-
题名基于深度强化学习的固体放射性废物抓取方法研究
被引量:3
- 1
-
-
作者
周祺杰
刘满禄
李新茂
张华
-
机构
西南科技大学信息工程学院
中国科学技术大学信息科学技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第11期3363-3367,共5页
-
基金
国家“十三五”核能开发项目(20161295)
西南科技大学研究生创新基金资助项目(19ycx0103)。
-
文摘
针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法。该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进行交互并获得回报奖励,回报奖励由机械臂动作执行结果和放射性区域内放射性活度的高低构成,根据Q值的大小得到机械臂的最佳抓取位置。用V-REP软件对UR5机械臂建立仿真模型,在仿真环境中完成不同类型固体放射性废物抓取的训练与测试。仿真结果表明,固体废物在松散放置时该方法可使机械臂抓取成功率大于90%,在紧密放置时抓取成功率大于65%,机械臂不会受到废物堆叠的影响,并且会优先抓取放射性区域内具有高放射性活度的物体。
-
关键词
固体放射性废物
深度强化学习
机械臂抓取
回报奖励
-
Keywords
solid radioactive waste
deep reinforcement learning
robotic grasping
reward
-
分类号
TP393.04
[自动化与计算机技术—计算机应用技术]
-
-
题名基于强化学习方法的RRT全局路径规划算法
- 2
-
-
作者
罗国攀
张国良
杨敏豪
-
机构
四川轻化工大学自动化与信息工程学院
人工智能四川省重点实验室
-
出处
《四川轻化工大学学报(自然科学版)》
CAS
2024年第2期57-63,共7页
-
基金
四川省应用基础研究项目(2019YJ00413)。
-
文摘
针对强化学习运用于局部路径规划时目标方向不明确易陷入局部最优的情况以及快速探索随机树(RRT)算法规划路径复杂、冗余点多等问题,提出一种融合RRT算法与强化学习(RL)思想的全局路径规划算法。首先,通过RRT全局路径规划算法弱化、减少强化学习算法易于陷入局部最优的问题,并且在一定程度上可以减少规划迭代时间;其次,采用强化学习算法的最大回报奖励机制强化RRT算法在路径规划过程中选择子节点时的目的性,避免过多随机点。实验结果表明,所提算法有效弱化了局部最优所带来的绕远影响,路径长度缩短33.3,凹、凸地形有效节点占比分别提高36.0%和39.6%,侧面反映冗余点数量减少,验证了该算法的可行性。
-
关键词
强化学习
快速探索随机树
回报奖励机制
全局路径规划
-
Keywords
reinforcement learning
rapidly-exploring random tree
reward mechanism
global path planning
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
-