基于强化学习的旅行商问题解构造方法被引量：4

Solution Construction Methods Based on Reinforcement Learningfor the Traveling Salesman Problem

下载PDF

导出

摘要基于迭代局部搜索(ILS)的启发式算法是目前最为先进的旅行商问题求解算法,在多数国际公开算例上保持着世界最优纪录。解构造方法是影响ILS性能的重要因素,为此,提出4种不同的解构造方法。解构造方法1为基准算法,其仅利用城市间的距离等静态结构信息来构造初始解,解构造方法2~解构造方法4则尝试利用搜索过程中积累的历史数据,通过强化学习挖掘有用信息,用于引导解的构造过程。在25个国际公开算例上的测试结果表明,基于历史信息的强化学习方法可有效优化构造解的质量,提升ILS整体性能。 Among the existing algorithms for TSP solution,the heuristic algorithm based on Iterated Local Search(ILS)performs the best,holding the world record on most of the public instances.The method for solution construction has a significant influence on the performance of ILS,and thus should be carefully designed.This paper proposes four different methods for solution construction,including a baseline algorithm that uses only static information such as the distances between cities to construct the initial solution,and three reinforcement-learning-based algorithms that attempt to utilize reinforcement learning to dig useful information from the historic information collected during the search for the construction of initial solutions.Experimental results on 25 public instances show that the reinforcement-learning-based methods using historic information can significantly improve the quality of the constructed solution as well as the performance of ILS.

作者王若愚陈勇全 WANG Ruoyu;CHEN Yongquan(Transmission Planning Section,Shenzhen Power Supply Co.,Ltd.,Shenzhen,Guangdong 518001,China;Institute of Robotics and Intelligent Manufacturing,The Chinese University of Hong Kong,Shenzhen,Guangdong 518172,China;Research Center on Unmanned Systems,Shenzhen Institute of Artificial Intelligence and Robotics for Society,Shenzhen,Guangdong 518129,China)

机构地区深圳供电局有限公司输电规划科香港中文大学(深圳)机器人与智能制造研究院深圳市人工智能与机器人研究院无人系统研究中心

出处《计算机工程》 CAS CSCD 北大核心 2020年第11期293-300,共8页 Computer Engineering

基金国家自然科学基金(U1613216) 深圳市基础研究项目(JCYJ20180508162406177) 住房和城乡建设部软科学研究项目(2018-K8-034)。

关键词旅行商问题迭代局部搜索解构造强化学习过滤网络 Traveling Salesman Problem(TSP) Iterated Local Search(ILS) solution construction reinforcement learning filter network

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1王飞鹏,谭旭杰.求解旅行商问题的近似骨架分段蚁群优化算法[J].计算机工程与设计,2019,40(4):1016-1021. 被引量：10
2钱真坤.基于离散粒子群优化算法的含权旅行商问题新解法[J].计算机应用与软件,2019,36(1):127-131. 被引量：8
3邹鹏,周智,陈国良,顾钧.求解TSP问题的多级归约算法[J].软件学报,2003,14(1):35-42. 被引量：60
4马晗,常安定,陈童,李江杰.基于文化混合优化算法的旅行商问题求解[J].计算机工程与科学,2019,41(7):1273-1278. 被引量：6
5张立毅,高杨,费腾,王玉婧.求解旅行商问题的搜寻者遗传算法[J].数学的实践与认识,2019,49(7):115-122. 被引量：11
6张子成,韩伟,毛波.基于模拟退火的自适应离散型布谷鸟算法求解旅行商问题[J].电子学报,2018,46(8):1849-1857. 被引量：28
7宗德才,王康康.一种混合局部搜索算法的遗传算法求解旅行商问题[J].计算机应用与软件,2015,32(3):266-270. 被引量：8

二级参考文献75

1姜昌华,胡幼华.一种求解旅行商问题的高效混合遗传算法[J].计算机工程与应用,2004,40(22):67-70. 被引量：22
2高尚,韩斌,吴小俊,杨静宇.求解旅行商问题的混合粒子群优化算法[J].控制与决策,2004,19(11):1286-1289. 被引量：73
3高海昌,冯博琴,朱利b.智能优化算法求解TSP问题[J].控制与决策,2006,21(3):241-247. 被引量：120
4陈乔礼,吴怀宇,刘亮.一种新的求解旅行商问题的混合遗传算法[J].武汉科技大学学报,2007,30(1):74-78. 被引量：2
5孙海雷,刘琼荪,胡上尉.TSP问题的顺序插入交叉算子[J].计算机工程与应用,2007,43(8):65-66. 被引量：8
6周鹏.求解TSP的启发式顺序交叉算子[J].计算机工程与设计,2007,28(8):1896-1897. 被引量：7
7潘震东,唐加福,韩毅.带货物权重的车辆路径问题及遗传算法[J].管理科学学报,2007,10(3):23-29. 被引量：29
8[1]Garey MR, Johnson DS. Computers and Intractability: a Guide to the Theory of NP-Completeness. San Francisco: W.H. Freeman, 1979. 被引量：1
9[2]Johnson DS, McGeoch LA. The traveling salesman problem: a case study in local optimization. In: Aarts EH, Lenstra JK, eds. Local Search in Combinatorial Optimization. New York: John Wiley and Sons, 1996. 被引量：1
10[3]Jünger M, Reinelt G, Rinaldi G. The traveling salesman problem. In: Ball M, Magnanti T, Monma CL, Nemhauser G, eds. Handbook on Operations Research and Management Science: Networks North-Holland. 1995. 225～330. 被引量：1

共引文献121

1谢聪.求解TSP问题的改进离散蝴蝶优化算法[J].数学的实践与认识,2020,0(1):173-182. 被引量：7
2吴剑杰.改进的人工鱼群算法求解TSP问题的研究[J].科技通报,2021,37(8):66-70. 被引量：5
3王震霆.求解TSP问题的蚁群算法改进探讨[J].大众科技,2004,6(4):63-65. 被引量：1
4潘亮,朱华勇,沈林成,常文森.利用几何结构求解欧氏平面TSP的改进遗传算法[J].国防科技大学学报,2004,26(5):109-114. 被引量：2
5凯文.打造数码印刷领域新航标[J].印刷技术,2005(10):86-87.
6江贺,周智,邹鹏,陈国良.求解TSP问题的并集搜索的新宏启发算法[J].中国科学技术大学学报,2005,35(3):367-375. 被引量：5
7王锦彪.狭义TSP几何解的演化逻辑与算法[J].计算机工程,2005,31(14):77-79. 被引量：6
8邹鹏,周智,陈国良,江贺,顾钧.求解QAP问题的近似骨架导向快速蚁群算法(英文)[J].软件学报,2005,16(10):1691-1698. 被引量：15
9江贺,周智,陈国良.TSP问题启发集的分析及应用[J].中国科学技术大学学报,2005,35(5):683-692. 被引量：4
10雷开友,邱玉辉,刘光远,贺一.基于禁忌表的定位算法求解TSP问题[J].计算机科学,2005,32(12):210-212.

同被引文献26

1赵智宇,朱立成,周利明,吕程序,李沐桐,董鑫.丘陵果园除草机器人底盘系统设计与试验[J].农业机械学报,2022,53(S01):48-57. 被引量：11
2王剑文,戴光明,谢柏桥,张全元.求解TSP问题算法综述[J].计算机工程与科学,2008,30(2):72-74. 被引量：65
3黄小毛,付正坤,丁幼春,王建勇,黎煊.矩形边界条件下农机作业方向平行路径的排序优化[J].华中农业大学学报,2014,33(4):130-136. 被引量：22
4刘博,崔远来,尹杰杰,刘方平,郑传举.基于DP-PSO算法的灌区农业水资源优化配置[J].节水灌溉,2016(8):117-121. 被引量：16
5赵映,肖宏儒,梅松,宋志禹,丁文芹,金月,韩余,夏先飞,杨光.我国果园机械化生产现状与发展策略[J].中国农业大学学报,2017,22(6):116-127. 被引量：123
6孙军艳,牛亚儒,苏宝,张媛媛.双区型仓库动态拣货策略的设计及路径优化研究[J].包装工程,2018,39(23):1-8. 被引量：13
7夏令儒,孙首群.多无人机协同任务规划[J].电子科技,2018,31(1):4-8. 被引量：11
8唐非,刘树安.机场地勤服务优化问题的双重变异单亲遗传算法[J].东北大学学报（自然科学版）,2018,39(10):1369-1374. 被引量：4
9王功亮,王好臣,李振雨,李家鹏.基于优化遗传算法的移动机器人路径规划[J].机床与液压,2019,47(3):37-40. 被引量：37
10张新艳,周雨晴.基于鱼骨型仓库的拣选路径问题优化[J].同济大学学报（自然科学版）,2019,47(11):1683-1690. 被引量：14

引证文献4

1时慧琨.一种基于K-means聚类及分组策略的TSP问题启发式算法[J].辽宁工业大学学报（自然科学版）,2021,41(2):75-78.
2吕武壕,林镇滔,廖文星,蒋昌金.一种关于旅行商问题适用范围的优化方法[J].计算机时代,2021(5):60-63. 被引量：1
3陈加俊,谭代伦.求解旅行商问题的探索—开发—跳跃策略单亲遗传算法[J].计算机应用研究,2023,40(5):1375-1380. 被引量：8
4王潇洒,刘丽星,杨欣,谢金燕,王旭,武家麟.改进遗传算法的果园割草机作业路径规划[J].重庆理工大学学报（自然科学）,2024,38(6):227-233.

二级引证文献9

1沈涤.指针网络改进遗传算法求解旅行商问题[J].计算机应用文摘,2022,38(1):89-91.
2徐义春,张颖慧,万书振,董方敏.矩形布局优化问题的局部搜索蜂群算法[J].计算机应用研究,2023,40(7):1998-2002.
3叶梓萌,张大斌.融合反向学习与Metropolis准则求解TSP的遗传算法[J].软件导刊,2023,22(8):104-110.
4李刚,智宏鑫.电力巡检机器人路径规划方法综述[J].电力科学与工程,2024,40(4):1-11. 被引量：1
5丁增良,陈珏,邱禧荷.一种应用于旅行商问题的莱维飞行转移规则蚁群优化算法[J].计算机应用研究,2024,41(5):1420-1427.
6谢金燕,刘丽星,杨欣,王潇洒,王旭,刘树腾.苹果园内无人割草机多机协同作业路径优化算法[J].华南农业大学学报,2024,45(4):578-587.
7李文峰,徐蕾,杨琳琳,刘文荣,潘坤,李超.基于改进蚁群算法的农业机器人多田块路径规划方法与试验[J].南京农业大学学报,2024,47(4):823-834.
8周琴,谭代伦.基于组合变异和分组优化的单亲遗传算法求解旅行商问题[J].六盘水师范学院学报,2024,36(3):45-54.
9李香薏,谭代伦.基于策略池-扩张机制的改进遗传算法求解旅行商问题[J].六盘水师范学院学报,2024,36(3):55-64.

1闫凤仙.叙事类文本有效阅读教学策略[J].吉林省教育学院学报,2020,36(10):42-45.
2张小晴.公路沥青路面施工技术与质量控制策略[J].建材发展导向,2020,18(5):255-255.
3张琳.基坑开挖对周边地铁隧道的影响分析[J].居舍,2020(2):191-191.
4焦宗浩,高绍姝,李克文.基于可变天气因素的MMAS改进算法[J].计算机工程与设计,2020,41(4):952-957. 被引量：2
5吕强.浅谈时速250公里动车组总体介绍[J].安防科技,2020(29):1-2.
6罗艳媚.基于改进蚁群算法求解双目标流水车间调度问题[J].桂林航天工业学院学报,2020,25(3):353-358. 被引量：1
7刘琨,赵露露,王辉.一种基于精英反向和纵横交叉的鲸鱼优化算法[J].小型微型计算机系统,2020,41(10):2092-2097. 被引量：19
8张梦琳,江沸菠,董莉,高颖.智能无人机轨迹与任务卸载联合优化[J].计算机工程与应用,2020,56(21):38-46. 被引量：6
9王骏超.基于SAC算法的机械臂控制方法与分析[J].赤峰学院学报（自然科学版）,2020,36(10):33-39. 被引量：3
10陈昱.基于积分强化学习的连续线性不确定系统最优控制分析[J].河南科技,2020,39(28):12-14.

计算机工程

2020年第11期

浏览历史

内容加载中请稍等...

基于强化学习的旅行商问题解构造方法被引量：4

参考文献7

二级参考文献75

共引文献121

同被引文献26

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于强化学习的旅行商问题解构造方法 被引量：4

参考文献7

二级参考文献75

共引文献121

同被引文献26

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于强化学习的旅行商问题解构造方法被引量：4