基于深度强化学习的无人机空中目标自主跟踪被引量：2

Autonomous Tracking of UAV Aerial Target Based on Deep Reinforcement Learning

下载PDF

导出

摘要针对空中对接任务中的目标自主跟踪问题,提出了一种基于深度强化学习的端到端的目标跟踪方法;该方法采用近端策略优化算法,Actor网络与Critic网络共享前两层的网络参数,将无人机所拍摄图像作为卷积神经网络的输入,通过策略网络控制多旋翼无人机电机转速,实现端到端的目标跟踪,同时采用shaping方法以加速智能体训练;通过物理引擎Pybullet搭建仿真环境并进行训练验证,仿真结果表明该方法能够达到设定的目标跟踪要求,且具有较好的鲁棒性。 Aiming at the problem of target autonomous tracking in the process of aerial docking,an end-to-end target autonomous tracking method based on deep reinforcement learning is proposed.In this method,the near end strategy optimization algorithm is adopted.The Actor network and Critic network share the network parameters of first two floors.The image captured by unmanned aerial vehicles(UAV)is used as the input of convolution neural network.The motor speed of rotor UAV is controlled by the strategy network to achieve the end-to-end autonomous target tracking.At the same time,the shaping method is used to accelerate the agent training.The simulation environment is built by the engine of the Pybullet,and the training verification is carried out.The experimental results show that the method can achieve the set target tracking requirements and has good robustness.

作者杨兴昊宋建梅佘浩平吴程杰杨钦宁付伟达 YANG Xinghao;SONG Jianmei;SHE Haoping;WU Chengjie;YANG Qinning;FU Weida(School of Aerospace Engineering,Beijing Institute of Technology,Beijing 100081,China;China Aero Institute of System Engineering,Beijing 100012,China;DFH Satellite Co.,Ltd.,Beijing 100094,China)

机构地区北京理工大学宇航学院中国航空系统工程研究所航天东方红卫星有限公司

出处《计算机测量与控制》 2022年第10期88-94,102,共8页 Computer Measurement &Control

关键词深度强化学习近端策略优化无人机目标跟踪端到端 deep reinforcement learning proximal policy optimization UAV target tracking end-to-end

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] V279.2 [自动化与计算机技术—控制科学与工程]

引文网络
相关文献

参考文献16

1Wang Xufeng,Kong Xingwei,Zhi Jianhui,Chen Yong,Dong Xinmin.Real-time drogue recognition and 3D locating for UAV autonomous aerial refueling based on monocular machine vision[J].Chinese Journal of Aeronautics,2015,28(6):1667-1675. 被引量：16
2纪超,王庆.基于双目视觉的自主空中加油算法研究与仿真[J].系统仿真学报,2013,25(6):1327-1331. 被引量：7
3单尧,孙永荣,黄斌,李旺灵.自主空中加油飞行对接演示平台设计与实现[J].电子测量技术,2016,39(12):176-179. 被引量：4
4刘爱超,佘浩平,杨钦宁,周思成.无人机空中对接中的视觉导航方法[J].导航定位与授时,2019,6(1):28-34. 被引量：7
5王宏伦,杜熠,盖文东.无人机自动空中加油精确对接控制[J].北京航空航天大学学报,2011,37(7):822-826. 被引量：18
6李大伟,王宏伦,盖文东.基于L_1自适应的自动空中加油对接段飞行控制技术[J].控制理论与应用,2014,31(6):717-724. 被引量：5
7黄永康,袁锁中,闫留浩.基于直接升力的空中加油对接飞行控制[J].兵工自动化,2021,40(5):62-67. 被引量：1
8朱虎,袁锁中,申倩.基于L1动态逆的自主空中加油对接控制[J].兵工自动化,2018,37(1):19-23. 被引量：2
9钱素娟,王水萍.基于辅助视觉飞机空中加油对接优化过程仿真[J].计算机仿真,2014,31(8):88-91. 被引量：1
10王宏伦,刘一恒,苏子康.无人机软管式自主空中加油精准对接控制[J].电光与控制,2020,27(9):1-8. 被引量：11

二级参考文献100

1朱家强,朱纪洪,郭锁凤,孙增圻.基于神经网络的鲁棒自适应逆飞行控制[J].控制理论与应用,2005,22(2):182-188. 被引量：21
2潘兵,谢惠民,续伯钦,戴福隆.数字图像相关中的亚像素位移定位算法进展[J].力学进展,2005,35(3):345-352. 被引量：87
3李怡勇,沈怀荣,高飞.发展高空长航时无人机初探[J].飞航导弹,2005(8):16-20. 被引量：12
4于俊清,彭丹霖.基于关键帧的视频摘要研究[J].计算机工程与设计,2005,26(10):2598-2601. 被引量：12
5Nalepka J P, Hinchman J L, Automated aerial refueling: extending the effectiveness of unmanned air vehicles [ R ]. AIAA 2005 -6005.2005. 被引量：1
6Venkataramanan S ,Dogan A ,Blake W. Vortex effect modeling in aircraft formation flight[ R]. AIAA 2003-5385,2003. 被引量：1
7Dogan A,Lewis T, Blake W. Wake-vortex induced wind with turbulence in aerial refueling-part A :flight data analysis[ R ]. AIAA 2008 -6696,2008. 被引量：1
8Ro K, Kamman J W. Modeling and simulation of hose-paradrogue aerial refueling systems [ J ]. Journal of Guidance, Control, and Dynamic,2010,33 ( 1 ) :53 - 63. 被引量：1
9Waishek J, Dogan A. Derivation of the dynamics equations of receiver aircraft in aerial refueling [ J ]. Journal of Guidance, Control,and Dynamics,2009,32(2) :585 -597. 被引量：1
10Tandale M D ,Bowers R ,Valasek J. Trajectory tracking controller for vision-based probe and drogue autonomous aerial refueling [ J]. Journal of Guidance, Control, and Dynamic, 2006,29 ( 4 ) : 846 - 857. 被引量：1

共引文献85

1蔡云鹏,王延祥,王大勇,任斌,王宏伦.加油软管释放过程中的动态特性研究[J].战术导弹技术,2022(6):54-62. 被引量：1
2汪雪林,杜丽学,陈德近,张夏清,许涛,陈亚新,余章卫.基于深度学习和双目视觉的汽车油箱外盖定位[J].计算机应用,2023,43(S01):281-287.
3王旭峰,董新民,孔星炜.机器视觉辅助的插头锥套式无人机自主空中加油仿真[J].科学技术与工程,2013,21(18):5245-5250. 被引量：7
4王旭峰,董新民,孔星炜,王龙,程建锋.视觉辅助的无人机自主空中加油建模与仿真[J].飞行力学,2013(4):331-335. 被引量：8
5王海涛,董新民,窦和锋,薛建平.软管锥套式空中加油系统建模与特性分析[J].北京航空航天大学学报,2014,40(1):92-98. 被引量：20
6王宏伦,樊国玮,盖文东,梁宵.自主空中加油输油阶段无人机建模与控制[J].系统工程与电子技术,2014,36(5):952-957. 被引量：2
7李大伟,王宏伦,盖文东.基于L_1自适应的自动空中加油对接段飞行控制技术[J].控制理论与应用,2014,31(6):717-724. 被引量：5
8陆宇平,杨朝星,刘洋洋.空中加油系统的建模与控制技术综述[J].航空学报,2014,35(9):2375-2389. 被引量：48
9全权,魏子博,高俊,张瑞峰,蔡开元.软管式自主空中加油对接阶段中的建模与控制综述[J].航空学报,2014,35(9):2390-2410. 被引量：56
10于大海.高空无人机自动加油对接过程轨迹控制研究[J].计算机测量与控制,2015,23(2):460-462.

同被引文献20

1郭喆,陆明,王祥.基于无人机的离散结构自主建造技术初探[J].建筑技艺,2019,0(9):40-45. 被引量：3
2蒋林,李峻,马先重,聂文康,朱建阳,雷斌.一种改进骨架提取的Voronoi路径规划[J].机械工程学报,2020,56(13):138-148. 被引量：11
3董加鑫.基于深度强化学习的无人机区域覆盖路径规划研究[J].工业控制计算机,2021,34(5):80-82. 被引量：8
4刘景森,吉宏远,李煜.基于改进蝙蝠算法和三次样条插值的机器人路径规划[J].自动化学报,2021,47(7):1710-1719. 被引量：20
5张云飞.基于贝叶斯决策的无人机飞行路径自动规划方法[J].计算机测量与控制,2021,29(11):196-200. 被引量：4
6沈遂欣.基于深度强化学习的无人机目标跟踪研究[J].电子技术（上海）,2022,51(1):292-293. 被引量：2
7谢勇宏,孔月萍.基于改进粒子群算法的三维路径规划[J].计算机测量与控制,2022,30(3):179-182. 被引量：18
8李磊,汪贤锋,王骥.外军有人-无人机协同作战最新发展动向分析[J].战术导弹技术,2022(1):113-119. 被引量：8
9刘志飞,曹雷,赖俊,陈希亮.基于多智能体深度强化学习的无人机集群自主决策[J].信息技术与网络安全,2022,41(5):77-81. 被引量：3
10崔勇平,邢清华.从俄乌战争看无人机对野战防空的挑战和启示[J].航天电子对抗,2022,38(4):1-3. 被引量：9

引证文献2

1李延儒,左铁东,王婧.基于DQN深度强化学习的无人机智能航路规划方法研究[J].电子技术与软件工程,2022(18):5-8. 被引量：3
2于力涵,洪儒,吴宇伦,谢迎娟.基于IKGC-PSO算法的无人机三维路径规划系统[J].计算机测量与控制,2023,31(8):259-266. 被引量：3

二级引证文献6

1费陈,郑晗,赵亮.无人机集群控制技术研究[J].弹箭与制导学报,2023,43(3):45-55. 被引量：2
2向进,许莉,刘海容,何开晟,傅奕晖,陈浩,杨婷.复杂城市环境下无人机路径规划[J].信息技术与信息化,2024(5):195-198.
3梅泽伟,邵星灵,刘俊.基于强化学习的无人机安全避障与围捕制导[J].战术导弹技术,2024(2):93-105.
4李登治,王宁.无人机辅助智能交通系统中基于C-DQN的信息年龄最小化研究[J].测试技术学报,2024,38(4):371-377.
5陆毅.面向船舶的基于WPA-BP与虚拟现实的机舱安全监测[J].计算机测量与控制,2024,32(9):73-79.
6田昊旻,马祎航.基于改进反向传播算法的声音识别及健康检测技术[J].计算机测量与控制,2024,32(11):87-94.

1孙凯,于洋,冯迎宾.基于视觉的自主无人机目标跟踪着陆方法研究[J].沈阳理工大学学报,2022,41(5):21-28. 被引量：2
2Zhengshun Fei,Yanping Wang,Jinglong Wang,Kangling Liu,Bingqiang Huang,Ping Tan.A new noise network and gradient parallelisation‐based asynchronous advantage actor‐critic algorithm[J].IET Cyber-Systems and Robotics,2022,4(3):175-188.
3Wan Xuming.Young performers ignite passion for Han-style crosstalk[J].Changjiang Weekly,2022(34):11-11.
4陆燕,杨秋芬.基于Actor-Critic框架的渗透测试路径技术研究[J].科技资讯,2022,20(21):5-10.

计算机测量与控制

2022年第10期

浏览历史

内容加载中请稍等...

基于深度强化学习的无人机空中目标自主跟踪被引量：2

参考文献16

二级参考文献100

共引文献85

同被引文献20

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的无人机空中目标自主跟踪 被引量：2

参考文献16

二级参考文献100

共引文献85

同被引文献20

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的无人机空中目标自主跟踪被引量：2