基于改进Q学习算法的无人物流配送车路径规划被引量：2

Path Planning of Unmanned Delivery Vehicle Based on Improved Q-learning Algorithm

下载PDF

导出

摘要为解决传统的Q学习算法用于无人车路径规划时,存在规划效率低和收敛速度慢等问题,为此,提出一种基于改进Q学习算法的无人物流配送车路径规划算法。借鉴模拟退火算法的能量迭代原理,对贪婪因子ε进行调整,使其在训练过程中动态变化,以平衡探索与利用之间的关系,提高规划效率。将奖励机制中的奖励值由离散值变为连续值,并使其随着无人物流配送车与目标点的欧式距离减小而增大,让目标点牵引无人物流配送车移动以加快算法收敛速度。在两种不同的环境下对改进的Q学习算法进行仿真实验,结果表明:改进后的Q学习算法可以高效地规划出一条从起始点至目标点的路径,步数为34步,优于对比算法的路径质量。通过改变道路环境,验证了改进Q学习算法对不同环境的适应性,规划效率和收敛速度依然优于传统Q学习算法。 To solve the traditional Q-learning algorithm for unmanned vehicle path planning suffers from the problems of low planning efficiency and slow convergence speed,for this reason,a path planning algorithm for unmanned delivery vehicles based on the improved Q-learning algorithm is proposed.Learning from the energy iteration principle of the simulated annealing algorithm,adjusts the greedy factorεto make it change dynamically during the training process,so as to balance the relationship between exploration and utilization,and thus improve the planning efficiency.The reward value in the reward mechanism is changed from a discrete value to a continuous value,and it increases as the European distance between the unmanned delivery vehicle and the target point decreases,so that the target point can pull the unmanned delivery vehicle to move and accelerate the convergence speed of the algorithm.The improved Q-learning algorithm is simulated in two different environments,the simulation results show that the improved Q-learning algorithm can efficiently plan a path from the starting point to the target point with 34 steps,which is better path quality than comparison algorithms.The adaptability of the improved Q-learning algorithm to different environments is verified by changing the road environment,and the planning efficiency and convergence speed are still better than the traditional Q-learning algorithm.

作者王小康冀杰刘洋贺庆 Wang Xiaokang;Ji Jie;Liu Yang;He Qing(College of Engineering and Technology,Southwest University,Chongqing 400715,China)

机构地区西南大学工程技术学院

出处《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1211-1221,共11页 Journal of System Simulation

基金重庆市科学技术局农业农村领域重点研发计划(cstc2021jscx-gksbX0003) 重庆市教育委员会科学技术研究项目(KJZDM202201302) 重庆市博士后研究项目(2021XM3070)。

关键词 Q学习路径规划收敛速度规划效率路径质量 Q-learning path planning convergence speed planning efficiency path quality

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1Xin MA,Ya XU,Guo-qiang SUN,Li-xia DENG,Yi-bin LI.State-chain sequential feedback reinforcement learning for path planning of autonomous mobile robots[J].Journal of Zhejiang University-Science C(Computers and Electronics),2013,14(3):167-178. 被引量：4
2赵也践,王艳红,张俊,于洪霞,田中大.改进Q学习算法在作业车间调度问题中的应用[J].系统仿真学报,2022,34(6):1247-1258. 被引量：2
3张祥来,江尚容,罗芹.基于改进Q学习算法的“货到人”系统AGV路径规划[J].现代计算机,2022,28(2):62-66. 被引量：1
4杨秀霞,高恒杰,刘伟,张毅.基于阶段Q学习算法的机器人路径规划[J].兵器装备工程学报,2022,43(5):197-203. 被引量：5
5李远哲,胡纪滨.强化学习在无人车领域的应用与展望[J].信息与控制,2022,51(2):129-141. 被引量：6
6翟丽,张雪莹,张闲,王承平.基于势场法的无人车局部动态避障路径规划算法[J].北京理工大学学报,2022,42(7):696-705. 被引量：24
7刘珂,董洪昭,张丽梅,杜秋月.基于改进人工势场法的物流无人配送车路径规划[J].计算机应用研究,2022,39(11):3287-3291. 被引量：12
8黄凯文,赵煜,黄玲,周金伟.基于机械视觉的Arduino智能物流配送车[J].河南科技,2021,40(22):19-23. 被引量：3
9罗洁,王中训,潘康路,卢中原,刘言.基于改进人工势场法的无人车路径规划算法[J].电子设计工程,2022,30(17):90-94. 被引量：12
10张辉,张瑞亮,许小庆,范政武.基于关键节点的改进A^(*)无人车路径规划算法[J].汽车技术,2023(3):10-18. 被引量：12

二级参考文献124

1赵明,郑泽宇,么庆丰,潘怡君,刘智.基于改进人工势场法的移动机器人路径规划方法[J].计算机应用研究,2020,37(S02):66-68. 被引量：30
2赵真明,孟正大.基于加权A~*算法的服务型机器人路径规划[J].华中科技大学学报（自然科学版）,2008,36(S1):196-198. 被引量：32
3魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19
4Agirrebeitia, 3., Aviles, R., de Bustos, I.F., Ajuria, C., 2005. A new APF strategy for path planning in environments with obstacles. Mech. Maeh. Theory., 40(6):645-658. Idol: 10.1016/j.meehmaeht heory.2005.01.0061. 被引量：1
5Alexopoulos, C., Griffin, P.M., 1992. Path plmming for a. mobile robot. IEEE Trans. S'yst. Man CybeT"r,, 22(2): 318-322. [doi:10.1109/21.148404]. 被引量：1
6AI-Taharwa, I., Sheta, A., Al-Weshah, M., 2008. A mobile robot path planning using genetic algorithm in staticenvironment. J. Coztput. Sci., 4(4):341-344. 被引量：1
7Barraquand, J., Langlois, B., Latombe, J.C., 1992. Nu- merical potential field techniques for robot path plan- ning. IEEE Trans. Syst. Man Cybern., 22(2):224-241. [doi: 10.1109/21.148426]. 被引量：1
8Cao, Q., Huang, Y., Zhou, J., 2006. An Evolutionary Artificial Potential Field Algorithm for Dynamic Path Planning of Mobile Robot. Proc. IEEE/RSJ Int. Conf. on Intelligent Robots and Systems, p.3331-3336. [doi: 10.1109/IROS.2006.2825081. 被引量：1
9Castiilo, 0., Trujillo, L., Melin, P., 2007. Multiple objective genetic algorithms for path-planning optimization in autonomous mobile robots. Soft Conput., 11(3):269- 279. [doi: 10.1007/s00500-006-0068-4]. 被引量：1
10I)earden, R., Friedman, N., Russell, S., 1998. Bayesian Q-Learning. Proc. National Conf. on Artificial Intelli- gence, p.761-768. 被引量：1

共引文献71

1刘明,金日初.阶段性规划方法对长江干线航道整治进度的优化[J].中国水运（下半月）,2023(1):66-68.
2张军,许靖宜,于士坤.基于人工势场法的局部路径规划改进[J].绥化学院学报,2023,43(9):146-151.
3何世鹏,金世俊.结合蚁群算法和萤火虫算法的无人船路径规划[J].电子测量技术,2023,46(19):82-86. 被引量：1
4李研强,郑亚雯,张岱峰,李超,张超.基于DRF优化采样的无人车轨迹规划方法[J].电子测量技术,2023,46(5):105-112. 被引量：1
5闫丰亭,贾金原.DP-Q(λ):大规模Web3D场景中Multi-agent实时路径规划算法[J].系统仿真学报,2019,31(1):16-26. 被引量：2
6孙凤山,张威,葛琳琳.移动机器人在未知环境中避障的控制策略[J].辽宁石油化工大学学报,2016,36(4):69-72. 被引量：3
7王策,刘帅克,郭霆,赵茂静,王冰浩.基于OpenMV和Arduino的智能机械臂操控平台[J].科技创新导报,2022,19(2):71-76.
8李博,张曼玉,胡晓霞,吴超.基于STM32的巡航无人车的设计[J].电子设计工程,2022,30(11):64-68.
9吕文涛,徐晓宁,姚婷婷.基于机器视觉的实验室智能消毒机器人的设计[J].工业控制计算机,2022,35(11):65-66. 被引量：1
10陈思成,纪玉杰,路达.采样机器人路径规划研究[J].内燃机与配件,2022(22):96-98.

同被引文献43

1胡云鹏,彭祺擘,武新峰,倪庆,叶东明.面向MBSE的航天任务风险分析方法[J].网信军民融合,2022(7):23-29. 被引量：2
2周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：5
3董涛,刘付显,杜菲菲,李响.基于矩阵的作战任务建模及重组[J].工程数学学报,2013,30(5):633-641. 被引量：3
4王伟,刘付显.基于任务关系矩阵的作战任务分解优化[J].军事运筹与系统工程,2017,31(4):9-14. 被引量：10
5李龙跃,刘付显,赵慧珍.弹道导弹防御M/M/N排队系统建模与仿真[J].系统仿真学报,2018,30(4):1260-1271. 被引量：3
6汤红杰,王鼎,皇攀凌,周军.优化Dijkstra算法在工厂内物流AGV路径规划的研究[J].机械设计与制造,2018(A01):117-120. 被引量：34
7王春颖,刘平,秦洪政.移动机器人的智能路径规划算法综述[J].传感器与微系统,2018,37(8):5-8. 被引量：68
8吴红芳,任南,马梦园.基于FDSM模型的WBS任务耦合问题的研究[J].上海管理科学,2016,38(6):76-79. 被引量：2
9白辰甲,刘鹏,赵巍,唐降龙.基于TD-error自适应校正的深度Q学习主动采样方法[J].计算机研究与发展,2019,56(2):262-280. 被引量：10
10吴帅,周晓华,汪莉莉,姚行中.基于实际采样的导弹弹道建模与仿真[J].系统仿真学报,2019,31(4):811-817. 被引量：6

引证文献2

1卢锦澎,梁宏斌.基于深度Q网络的机器人路径规划研究综述[J].传感器与微系统,2024,43(6):1-5.
2龚雪,彭鹏菲,荣里,郑雅莲,姜俊.基于深度强化学习的任务分析方法[J].系统仿真学报,2024,36(7):1670-1681.

1朱波,谈笑昊,谈东奎,胡旭东.基于高精地图的物流配送车路径规划与跟踪控制[J].汽车工程学报,2024,14(2):193-204. 被引量：1
2张丽,李世情,艾恒涛,张涛,张宏伟.基于改进Q学习算法和组合模型的超短期电力负荷预测[J].电力系统保护与控制,2024,52(9):143-153.
3许晓辉,崔津华,张彬,李海虹.多传感器信息融合的机械臂避障系统设计[J].机械工程与自动化,2024(3):32-34.
4王蕴,林霄,楼芝兰,李军,孙卫强.面向边缘光算力网络的上行链路资源协同调度算法[J].光通信技术,2024,48(3):45-51.
5赵经纬,张蕴显,施崭,张琦,杨智,刘波,何达.基于深度学习神经网络技术的脊柱椎弓根螺钉自动规划研究[J].中国数字医学,2024,19(4):84-91.
6陈国梁,石晴,黄亚飞,曾昭汰.融合注意力机制LSTM网络的城市交叉口信号控制[J].重庆理工大学学报（自然科学）,2024,38(4):196-203.
7张宇华,赵磊.以人为本视域下城市公共服务设施规划研究[J].新乡学院学报,2024,41(4):62-64.
8初良勇,梁冬.基于DQN的自动化集装箱码头自动引导车多目标调度优化[J].哈尔滨工程大学学报,2024,45(5):996-1004.
9解华云,叶云峰,李桂芬,黄金艳,覃斯华,何毅,柳唐镜,李天艳,韦正光,洪日新.130份薄皮甜瓜种质材料果实性状的遗传多样性分析评价[J].中国瓜菜,2024,37(5):28-40.
10王琴,路庆昌,李建宇,王张鑫,张图.考虑需求的出租车收益路线推荐[J].浙江大学学报（工学版）,2024,58(6):1233-1242.

系统仿真学报

2024年第5期

浏览历史

内容加载中请稍等...

基于改进Q学习算法的无人物流配送车路径规划被引量：2

参考文献10

二级参考文献124

共引文献71

同被引文献43

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进Q学习算法的无人物流配送车路径规划 被引量：2

参考文献10

二级参考文献124

共引文献71

同被引文献43

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进Q学习算法的无人物流配送车路径规划被引量：2