-
题名多无人机系统在线强化学习最优安全跟踪控制
- 1
-
-
作者
弓镇宇
杨飞生
-
机构
西北工业大学
-
出处
《航空科学技术》
2024年第4期25-30,共6页
-
基金
国家自然科学基金(62073269)
航空科学基金(2020Z034053002)
+2 种基金
陕西省重点研发计划项目(2022GY-244)
重庆市自然科学基金(CSTB2022NSCQ-MSX0963)
广东省基础与应用基础研究基金(2023A1515011220)。
-
文摘
在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参与者,攻击者的目标是最大化设定的成本函数,而安全控制器的目标与之相反,求解博弈并获得最优安全控制策略依赖于求取Hamilton-Jacobi-Isaacs(HJI)方程的解。而HJI方程是耦合偏微分方程,难以直接求解,因此结合经验回放机制引入了有限时间收敛的在线强化学习算法,设计了单评价神经网络近似值函数并获得了最优安全控制策略。最终利用仿真验证了算法的有效性。
-
关键词
FDI攻击
多无人机
在线强化学习
优化控制
零和图博弈
-
Keywords
FDI attack
multi-UAVs
online reinforcement learning
optimal control
zero-sum graphical game
-
分类号
V249.1
[航空宇航科学与技术—飞行器设计]
-
-
题名图博弈下具有未知动态的供应链系统变更设计
- 2
-
-
作者
范佳慧
李庆奎
-
机构
北京信息科技大学自动化学院
-
出处
《北京信息科技大学学报(自然科学版)》
2022年第1期19-26,共8页
-
基金
国家重点研发计划资助项目(2020YFB1708200)。
-
文摘
为了研究具有未知动态的供应链系统变更一致性问题,将供应链系统建模为多智能体系统,针对多智能体系统图博弈问题,提出一种自适应最优分布式算法,该算法基于数值迭代启发式动态规划,无需系统动力学知识即可求解耦合的Hamilton-Jacobi-Isaacs(HJI)方程。此外,使用神经网络来识别每个子链的未知动态,证明了所提对策的闭环系统稳定性。仿真结果表明,该方法可以保证供应链变更系统的稳定性与一致性。
-
关键词
供应链系统
零和图博弈
系统辨识
启发式动态规划算法
-
Keywords
supply chain system
zero sum graph game
system identification
heuristic dynamic programming algorithm
-
分类号
TP13
[自动化与计算机技术—控制理论与控制工程]
-