-
题名多无人机系统在线强化学习最优安全跟踪控制
- 1
-
-
作者
弓镇宇
杨飞生
-
机构
西北工业大学
-
出处
《航空科学技术》
2024年第4期25-30,共6页
-
基金
国家自然科学基金(62073269)
航空科学基金(2020Z034053002)
+2 种基金
陕西省重点研发计划项目(2022GY-244)
重庆市自然科学基金(CSTB2022NSCQ-MSX0963)
广东省基础与应用基础研究基金(2023A1515011220)。
-
文摘
在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参与者,攻击者的目标是最大化设定的成本函数,而安全控制器的目标与之相反,求解博弈并获得最优安全控制策略依赖于求取Hamilton-Jacobi-Isaacs(HJI)方程的解。而HJI方程是耦合偏微分方程,难以直接求解,因此结合经验回放机制引入了有限时间收敛的在线强化学习算法,设计了单评价神经网络近似值函数并获得了最优安全控制策略。最终利用仿真验证了算法的有效性。
-
关键词
FDI攻击
多无人机
在线强化学习
优化控制
零和图博弈
-
Keywords
FDI attack
multi-UAVs
online reinforcement learning
optimal control
zero-sum graphical game
-
分类号
V249.1
[航空宇航科学与技术—飞行器设计]
-