无人集群系统深度强化学习控制研究进展被引量：2

Deep reinforcement learning to control an unmanned swarm system

下载PDF

导出

摘要随着无人集群在物流运输、农业管理、军事行动等场景的试验和应用,其面临的作业环境和任务内容日趋复杂,亟需设计效率更高、泛化能力更强、适应性更好的控制算法.将人工智能引入到无人集群系统控制的研究中,能够大幅提升现有无人集群的能力,完成复杂的作业任务.深度强化学习具有深度学习和强化学习的优点,无人集群系统深度强化学习控制研究受到了国内外科研人员的广泛关注,涌现出许多标志性成果.本文将从原理、特点等方面阐述深度强化学习概念,深入分析深度强化学习的多种典型算法,并讨论无人机集群的各类控制需求,进而介绍深度强化学习在无人机集群控制领域的典型研究成果,最后针对该领域研究成果的落地转化总结了应用前景和面临的挑战. Recently,testing and using micro-unmanned vehicles,such as unmanned aerial vehicles(UAVs),in scenarios such assupply transportation,agricultural management,and military operations have become more common.It is no longer sufficient to controla single UAV to accomplish all missions.With the increasing complexities associated with operating and task requirements,anunmanned swarm requires a series of algorithms with higher efficiency,greater generalization ability,and better adaptability than theearlier algorithms.A combination of unmanned swarms with artificial intelligence is becoming a common solution to manage the aboverequirements.Deep reinforcement learning(DRL)is a machine learning method that combines deep learning(DL)and reinforcementlearning(RL);therefore,this method has the advantages of DL and RL.Using an RL method,an agent can learn from the environmentby trial and error and make decisions that autonomously obtain high scores.However,when the given environment is complex,thedecision function of the agent may be too difficult to implement and then the agent cannot make the correct decision.The DL method hasstrong fitting ability.A suitable deep neural network can simulate any linear or nonlinear function.If the DL method is used to simulate the decision function in RL,the hybrid method can solve the problem that an agent cannot solve and make a correct decision in acomplex environment.The combination of an unmanned swarm and a DRL method has been widely studied.This paper introduces theconcept of DRL from the perspective of principles and characteristics.This paper analyzes several typical DRL algorithms,discusses thevarious control requirements of a UAV swarm,and then focuses on the achievements of combining DRL and a UAV swarm control.Finally,this paper presents viewpoints on the application prospects and challenges related to landing and transformation in thecombination field.The concept of an unmanned swarm originated from the study of the behavior of biological groups.Several species ofbees,ants,bird

作者梁鸿涛王耀南华和安钟杭郑成宏曾俊豪梁嘉诚李政辰 LIANG Hongtao;WANG Yaonan;HUA Hean;ZHONG Hang;ZHENG Chenghong;ZENG Junhao;LIANG Jiacheng;LI Zhengchen(School of Electrical and Information Engineering,Hunan University,Changsha 410082,China;National Engineering Research Center of RVC,Hunan University,Changsha 410082,China;School of Robotics,Hunan University,Changsha 410082,China)

机构地区湖南大学电气与信息工程学院湖南大学机器人视觉感知与控制技术国家工程研究中心湖南大学机器人学院

出处《工程科学学报》 EI CSCD 北大核心 2024年第9期1521-1534,共14页 Chinese Journal of Engineering

基金湖南省自然科学基金重大项目(2021JC0004) 国家重点研发计划资助项目(2022YFB4701800,2021ZD0114503) 湖南省自然科学基金资助项目(2023JJ40165) 国家自然科学基金资助项目(62173132)。

关键词无人集群集群控制深度强化学习多智能体人工智能集群智能 unmanned swarm swarm control deep reinforcement learning multiagent artificial intelligence swarm intelligence

分类号 V279 [航空宇航科学与技术—飞行器设计] TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献15

1张丹凝,程岳,林清,余冠锋,肖刘炜.无人机集群作战关键技术及发展趋势[J].中国新通信,2022,24(4):56-58. 被引量：8
2沈博,武文亮,杨刚,周兴社.基于群体OODA的无人集群系统智能评价模型及方法[J].航空学报,2023,44(14):258-273. 被引量：3
3王林波,王蒙一,周思全,江涌,化永朝,董希旺.考虑未知输入的异构集群系统群体智能合围跟踪控制[J].中国科学：技术科学,2023,53(2):291-306. 被引量：6
4Guo-Yin Wang,Dong-Dong Cheng,De-You Xia,Hai-Huan Jiang.Swarm Intelligence Research:From Bio-inspired Single-population Swarm Intelligence to Human-machine Hybrid Swarm Intelligence[J].Machine Intelligence Research,2023,20(1):121-144. 被引量：2
5邹立岩,张明智,柏俊汝,武剑.无人机集群作战建模与仿真研究综述[J].战术导弹技术,2021(3):98-108. 被引量：26
6伊山,黄谦,杨鹏飞.智能无人集群体系作战仿真系统功能与架构设计[J].指挥控制与仿真,2020,42(5):65-69. 被引量：8
7王志宏,冷甦鹏,熊凯.面向无人机集群协同感知的多智能体资源分配策略[J].物联网学报,2023,7(1):18-26. 被引量：5
8赵林,张宇飞,姚明旿,郭彦涛.无人机集群协同技术发展与展望[J].无线电工程,2021,51(8):823-828. 被引量：22
9尹厚淳,崔禾磊,於志文,王亮,郭斌.面向协同感知的任务分配方法[J].软件导刊,2020,19(4):14-22. 被引量：1
10黄吉传,周德云.无人机协同作战效能评估指标体系设计与分析[J].西安工业大学学报,2020,40(1):38-44. 被引量：29

二级参考文献134

1王彤,李磊,蒋琪.“进攻性蜂群使能战术”项目推进无人蜂群能力发展分析[J].战术导弹技术,2020(1):33-38. 被引量：21
2Guibin SUN,Rui ZHOU,Kun XU,Zhi WENG,Yuhang ZHANG,Zhuoning DONG,Yingxun WANG.Cooperative formation control of multiple aerial vehicles based on guidance route in a complex task environment[J].Chinese Journal of Aeronautics,2020,33(2):701-720. 被引量：8
3Xiaohong WANG,Yuan ZHANG,Lizhi WANG,Dawei LU,Guoqi ZENG.Robustness evaluation method for unmanned aerial vehicle swarms based on complex network theory[J].Chinese Journal of Aeronautics,2020,33(1):352-364. 被引量：25
4戴健,许菲,陈琪锋.多无人机协同搜索区域划分与路径规划[J].航空学报,2020(S01):149-156. 被引量：33
5周思全,董希旺,李清东,任章.无人机-无人车异构时变编队控制与扰动抑制[J].航空学报,2020(S01):128-139. 被引量：15
6刘刚,叶广庆,汪民乐.基于层次灰色决策理论的侦察无人机系统效能评估[J].战术导弹技术,2005(2):44-47. 被引量：13
7周浦城,洪炳镕,王月海.动态环境下多机器人合作追捕研究[J].机器人,2005,27(4):289-295. 被引量：16
8陈建荣,郭齐胜.无人机系统的系统效能评估[J].火力与指挥控制,2008,33(5):45-47. 被引量：12
9李明.无人机系统发展中的若干问题[J].现代军事,2007(6):45-49. 被引量：3
10陈宗基,魏金钟,王英勋,周锐.无人机自主控制等级及其系统结构研究[J].航空学报,2011,32(6):1075-1083. 被引量：74

共引文献172

1徐佳,胡春鹤.分布式多经验池的无人机自主避碰方法[J].信息与控制,2023,52(4):432-443.
2苗昊春,刘重,王根.协同制导控制技术发展现状及展望[J].前瞻科技,2022(4):40-54. 被引量：2
3王振威,刘凯,郭健,刘晓鹏.一种基于领导-跟随策略的多无人机-多无人艇编队协同机制[J].航空学报,2023,44(S02):453-468. 被引量：1
4刘闯,鱼小军,张婷,朱豪坤.无人集群装备仿真试验关键技术现状及趋势[J].航空学报,2022,43(S01):21-33. 被引量：7
5曾永玲,黄斐,杨梅,吴允桢,张传硕.无人机携能传输研究动态[J].通信技术,2019,52(6):1299-1305.
6董强健,赵海涛,郑超轶,王海军.无人机自组网典型场景构建及路由协议性能分析[J].通信技术,2019,52(9):2149-2155. 被引量：10
7申燕凯,段海滨,邓亦敏,罗琪楠,魏晨.仿鸽群被动式惯性应急避障的无人机集群飞行验证[J].中国科学：信息科学,2019,49(10):1343-1352. 被引量：12
8杨庆,段海滨.仿鸿雁编队的无人机集群飞行验证[J].工程科学学报,2019,41(12):1599-1608. 被引量：14
9段海滨,申燕凯,赵彦杰,范彦铭,王寅,牛轶峰,魏晨,罗德林.2019年无人机热点回眸[J].科技导报,2020,38(1):170-187. 被引量：27
10王正任.人工智能在无人机领域的应用分析[J].科学技术创新,2020(15):56-57. 被引量：3

同被引文献23

1郝卫峰,叶茂,李斐,鄢建国,邵先远.基于嫦娥一号卫星获取的DEM研究月球车通信的可达性[J].宇航学报,2012,33(10):1453-1459. 被引量：7
2陈建新,邢琰,滕宝毅,毛晓艳,刘祥,贾永,张晋,王磊.嫦娥三号巡视器GNC及地面试验技术[J].中国科学：技术科学,2014,44(5):461-469. 被引量：11
3贾阳,张建利,李群智,申振荣,吴克,彭松,温博,张香燕,李清毅.嫦娥三号巡视器遥操作系统设计与实现[J].中国科学：技术科学,2014,44(5):470-482. 被引量：21
4LIU ZhaoQin,DI KaiChang,PENG Man,WAN WenHui,LIU Bin,LI LiChun,YU TianYi,WANG BaoFeng,ZHOU JianLiang,CHEN HongMin.High precision landing site mapping and rover localization for Chang'e-3 mission[J].Science China(Physics,Mechanics & Astronomy),2015,58(1):139-149. 被引量：21
5张晓丹,马菁改.一个广义三次样条光滑半监督支持向量机[J].工程科学学报,2015,37(3):385-389. 被引量：3
6Wen-Rui Wang,Xin Ren,Fen-Fei Wang,Jian-Jun Liu,Chun-Lai Li.Terrain reconstruction from Chang'e-3 PCAM images[J].Research in Astronomy and Astrophysics,2015,15(7):1057-1067. 被引量：2
7贾永楠,李擎.多机器人编队控制研究进展[J].工程科学学报,2018,40(8):893-900. 被引量：19
8卫恒,吕强,刘扬,林辉灿,梁冰.基于状态切换的分布式多机器人编队控制[J].兵工学报,2019,40(5):1103-1112. 被引量：4
9邢琰,刘祥,滕宝毅,毛晓艳.月球表面巡视探测自主局部避障规划[J].控制理论与应用,2019,36(12):2042-2046. 被引量：11
10太阳谷.美军联合全域作战探索路线浅析[J].军事文摘,2020(12):32-34. 被引量：4

引证文献2

1张浩杰,姜峰,刘传凯,张作宇,李擎.星球车自主路径规划方法[J].工程科学学报,2024,46(11):2063-2075.
2高志发,周宇,杨航,兰青,李宇哲,高慧,张振华.多域集群分布式智能协同自主控制技术研究现状与展望[J].兵工学报,2024,45(S02):9-16.

1翟世勋,孙彦文,南博,张凯歌.一种基于GAN的启发式虚拟管道生成方法[J].火力与指挥控制,2024,49(6):106-115.
2陈秋心,年欣.人肉搜索信息传播机制变迁研究(2001-2021)[J].复印报刊资料（新闻与传播）,2023(1):47-59.
3刘磊,陶宇,高岩.基于硬注意力机制下的鱼群涌现自动建模方法[J].上海理工大学学报,2024,46(3):347-356.
4傅东兴.数字化技术在现代农业领域的应用研究[J].现代农业研究,2024,30(7):124-128.
5陈莉.初中历史课堂深度学习路径初探——以七年级统编历史教材为例[J].中学教学参考,2024(18):17-19.
6王义华,宁浩宇,戴丰延,张雪坚,毕训.基于多维度文本特征的任务管理模型研究与设计[J].计算机应用文摘,2024,40(14):68-69.
7李欣,蔡光斌,吴彤,杨芊.一种基于应力矩阵的无人机集群队形变换控制方法[J].控制与决策,2024,39(7):2195-2204. 被引量：1

工程科学学报

2024年第9期

浏览历史

内容加载中请稍等...

无人集群系统深度强化学习控制研究进展被引量：2

参考文献15

二级参考文献134

共引文献172

同被引文献23

引证文献2

相关作者

相关机构

相关主题

浏览历史

无人集群系统深度强化学习控制研究进展 被引量：2

参考文献15

二级参考文献134

共引文献172

同被引文献23

引证文献2

相关作者

相关机构

相关主题

浏览历史

无人集群系统深度强化学习控制研究进展被引量：2