基于深度强化学习的移动机器人动态路径规划算法被引量：4

Dynamic Path Planning Algorithm of Mobile Robot Based on Deep Reinforcement Learning

下载PDF

导出

摘要为了在复杂舞台环境下使用移动机器人实现物品搬运或者载人演出,提出了一种基于深度强化学习的动态路径规划算法;首先通过构建全局地图获取移动机器人周围的障碍物信息,将演员和舞台道具分别分类成动态障碍物和静态障碍物;然后建立局部地图,通过LSTM网络编码动态障碍物信息,使用社会注意力机制计算每个动态障碍物的重要性来实现更好的避障效果;通过构建新的奖励函数来实现对动静态障碍物的不同躲避动作;最后通过模仿学习和优先级经验回放技术来提高网络的收敛速度,从而实现在舞台复杂环境下的移动机器人的动态路径规划;实验结果表明,该网络的收敛速度明显提高,在不同障碍物环境下都能够表现出好的动态避障效果。 In order to realize that mobile robot carries goods or performs manned performances in complex stage environment, a dynamic path planning algorithm based on deep reinforcement learning is proposed. Firstly, the obstacle information around the mobile robot is obtained by constructing a global map, and the actors and stage props are classified into dynamic obstacles and static obstacles respectively. Then a local map is established to acquire the dynamic obstacle information through LSTM network, and the importance of each dynamic obstacle is calculated to achieve better obstacle avoidance effect through social attention mechanism. Different avoidance situations of dynamic and static obstacles are realized by constructing a new reward function. Finally, the simulation learning and priority experience playback technology are used to improve the convergence speed of the network, so as to realize the dynamic path planning of the mobile robot in the complex stage environment. The experimental results show that the convergence speed of the network is significantly improved, and it can show the good dynamic effect in different obstacle environments.

作者张柏鑫杨毅镔朱华中刘安东倪洪杰 ZHANG Baixin;YANG Yibin;ZHU Huazhong;LIU Andong;NI Hongjie(College of Information Engineering,Zhejiang University of Technology,Hangzhou 310012,China)

机构地区浙江工业大学信息工程学院

出处《计算机测量与控制》 2023年第1期153-159,166,共8页 Computer Measurement &Control

基金国家自然科学基金项目(61973275) 浙江省省属高校基本科研业务(RF-A2020004)。

关键词移动机器人 LSTM 深度强化学习动态路径规划实时避障 mobile robot LSTM deep reinforcement learning dynamic path planning real time obstacle avoidance

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献15

1刘榛,陈伟忠,王彦库,朱介勇.多功能小型文化服务综合体内通与监督系统的要求分析和系统构型[J].演艺科技,2021(6):50-55. 被引量：2
2谭辉.移动机器人控制方法综述[J].科技创新与应用,2021,11(20):125-127. 被引量：4
3崔奇,夏浩,滕游,刘安东.移动机器人自主导航系统及上位机软件设计与实现[J].计算机测量与控制,2022,30(1):141-146. 被引量：3
4王梓强,胡晓光,李晓筱,杜卓群.移动机器人全局路径规划算法综述[J].计算机科学,2021,48(10):19-29. 被引量：65
5鲍庆勇,李舜酩,沈峘,门秀花.自主移动机器人局部路径规划综述[J].传感器与微系统,2009,28(9):1-4. 被引量：54
6杨月全,韩飞,曹志强,谭民,金露.基于激光传感器的动态拟合避障控制与仿真[J].系统仿真学报,2013,25(4):704-708. 被引量：5
7朱坤财,徐郑攀,赵自奇,彭荣发,洪晓斌.基于航迹预测的水面无人艇动态避障方法[J].中国测试,2021,47(11):28-33. 被引量：6
8石志刚,梅松,邵毅帆,万如,宋志禹,谢铭露,李燕.基于人工势场法的移动机器人路径规划研究现状与展望[J].中国农机化学报,2021,42(12):182-188. 被引量：16
9王翔昌,吴训成,张伟伟,王鸿超.基于改进人工势场算法的自主车辆局部路径规划方法研究[J].计算机与数字工程,2022,50(3):554-558. 被引量：6
10税斌.基于ORCA碰撞避免的人群疏散模拟[J].现代计算机（中旬刊）,2016,0(1):73-75. 被引量：3

二级参考文献159

1危双丰,庞帆,刘振彬,师现杰.基于激光雷达的同时定位与地图构建方法综述[J].计算机应用研究,2020,37(2):327-332. 被引量：69
2闻朝中,李智.粒子群算法在配电网络无功补偿优化中的应用[J].武汉工业学院学报,2004,23(1):18-21. 被引量：39
3朱庆保,张玉兰.基于栅格法的机器人路径规划蚁群算法[J].机器人,2005,27(2):132-136. 被引量：122
4王煦法.遗传算法及其应用[J].小型微型计算机系统,1995,16(2):59-64. 被引量：37
5朱庆保.复杂环境下的机器人路径规划蚂蚁算法[J].自动化学报,2006,32(4):586-593. 被引量：46
6彭一准,原魁,刘俊承,邹伟.室内移动机器人的三层规划导航策略[J].电机与控制学报,2006,10(4):380-384. 被引量：3
7张建英,赵志萍,刘暾.基于人工势场法的机器人路径规划[J].哈尔滨工业大学学报,2006,38(8):1306-1309. 被引量：83
8黄炳强,曹广益.基于人工势场法的移动机器人路径规划研究[J].计算机工程与应用,2006,42(27):26-28. 被引量：38
9Stentz A. Optional and efficient path planning for partly known environment [ C ]//Proceedings of the IEEE International Conference on Robotics and Automation, 1994. 被引量：1
10Stentz A. The focused D * algorithm for real time replan-ning[C]// Proceedings of the International Joint Conference on Artificial Intelligence, 1995. 被引量：1

共引文献237

1李朝阳.基于遗传算法的航海路径规划优化研究[J].中国水运（下半月）,2023,23(8):41-43. 被引量：1
2迟旭,李花,费继友.基于改进A^(*)算法与动态窗口法融合的机器人随机避障方法研究[J].仪器仪表学报,2021,42(3):132-140. 被引量：73
3姜龙腾,迟瑞娟,熊泽鑫,马悦琦,班超,朱晓龙.基于优化人工势场法的插秧机绕障策略研究[J].农业机械学报,2022,53(S01):20-27. 被引量：4
4刘慧,张世义,段云鹏,贾卫东,沈跃.基于改进双向RRT^(*)的果园机器人运动规划算法[J].农业机械学报,2022,53(11):31-39. 被引量：9
5董蕊芳,王宇鹏,阚江明.基于改进ORB_SLAM2的机器人视觉导航方法[J].农业机械学报,2022,53(10):306-317. 被引量：7
6赵倩楠,黄宜庆.融合A^(*)蚁群和动态窗口法的机器人路径规划[J].电子测量与仪器学报,2023,37(2):28-38. 被引量：8
7许松,轩亮,孙剑韬,周怀东.融合行人运动信息的室内移动机器人动态避障方法[J].电子测量与仪器学报,2022,36(12):144-152.
8潘迁,李伟,张云群,丁毓峰.滚动窗口与蚁群算法结合的机器人路径规划[J].机械制造,2012,50(9):25-28.
9鲍庆勇,李舜酩,沈峘,尚伟燕.基于行为融合的移动机器人自主避障算法[J].传感器与微系统,2010,29(5):70-73. 被引量：4
10杜宇上.基于正态密度函数的滚动窗口路径规划方法[J].科学技术与工程,2010,10(15):3741-3744.

同被引文献28

1张殿富,刘福.基于人工势场法的路径规划方法研究及展望[J].计算机工程与科学,2013,35(6):88-95. 被引量：96
2蔡青松,吴强,杜康熙,谢自强,王肖锋.基于模糊避障算法的履带式搬运机器人的设计[J].计算机测量与控制,2018,26(9):62-66. 被引量：8
3张浩杰,苏治宝,苏波.基于深度Q网络学习的机器人端到端控制方法[J].仪器仪表学报,2018,39(10):36-43. 被引量：27
4李妍,甄成刚.基于深度Q网络的虚拟装配路径规划[J].计算机工程与设计,2019,40(7):2032-2038. 被引量：3
5张堃,李珂,时昊天,张振冲,刘泽坤.基于深度强化学习的UAV航路自主引导机动控制决策算法[J].系统工程与电子技术,2020,42(7):1567-1574. 被引量：12
6朱颖,李元鹏,张亚婉,黎伟健.基于改进人工势场法的搬运机器人路径规划[J].电子测量技术,2020,43(17):101-104. 被引量：13
7霍桂利,王晓亮.基于农业仓库物流搬运机器人控制算法分析与研究[J].中国工程机械学报,2021,19(1):56-60. 被引量：18
8胡文楠.基于内容图像检索的机器人障碍物检测方法[J].计算机工程与设计,2021,42(3):822-829. 被引量：5
9付泽民,吴力杰,乔涛涛,石博文,余奇.基于改进人工势场法的搬运机器人避障算法研究[J].机床与液压,2021,49(5):25-29. 被引量：23
10刘波,赵一冰,张南,安思健,张中琳,吴鑫波,张文远.机器视觉与工业机器人相结合的自动上料系统[J].锻压技术,2021,46(8):180-185. 被引量：12

引证文献4

1徐兴辉,唐大林,顾书豪,左家祺,王晓东,任同群.基于多智能体强化学习的微装配任务规划方法[J].计算机测量与控制,2023,31(8):217-223.
2余娜,晁阳,孙小春,卿笛.基于农业搬运机器人的障碍物视觉识别技术研究[J].南方农机,2024,55(2):145-146.
3姜佩贺,王敬,桑忠启,林立峰.改进A^(*)与DWA的室内服务机器人路径规划研究[J].计算机工程与应用,2024,60(15):327-335.
4耿飚,宋丽华,吴爱燕.一种改进的A*路径规划算法研究及其Qt实现[J].人工智能与机器人研究,2023,12(2):115-125.

1吕佳佳.舞蹈演员舞台表演能力的提升之道[J].花溪,2022(28):0040-0042.
2王安峰.戏曲舞台美术设计的独特性[J].东西南北,2022(17):116-118.
3阿山木汉·俄布勒依.基于舞台表现力的声乐表演探微[J].世纪之星—交流版,2022(19):37-39.
4顾正光.舞台监督对舞台艺术的作用分析[J].花溪,2022(28):0034-0036.
5家祺,小路(图).品质和功能都能满足 AURALiC ALTAIR G1.1一体机[J].视听前线,2022(11):27-30.
6宋江一,李丹,陈文博.融合Dijkstra和PID算法的室内移动机器人局部路径规划[J].安徽工业大学学报（自然科学版）,2023,40(1):59-64. 被引量：9
7王晨.舞台灯光对戏曲的影响[J].艺术家,2022(11):8-10.
8范力元,张浩哲,徐钊,吕明伟,胡劲文,赵春晖,刘晓斌.基于安全飞行走廊的无人机密集障碍规避算法[J].西北工业大学学报,2022,40(6):1288-1296. 被引量：2

计算机测量与控制

2023年第1期

浏览历史

内容加载中请稍等...

基于深度强化学习的移动机器人动态路径规划算法被引量：4

参考文献15

二级参考文献159

共引文献237

同被引文献28

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的移动机器人动态路径规划算法 被引量：4

参考文献15

二级参考文献159

共引文献237

同被引文献28

引证文献4

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的移动机器人动态路径规划算法被引量：4