期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
多无人机系统在线强化学习最优安全跟踪控制
1
作者 弓镇宇 杨飞生 《航空科学技术》 2024年第4期25-30,共6页
在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参... 在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参与者,攻击者的目标是最大化设定的成本函数,而安全控制器的目标与之相反,求解博弈并获得最优安全控制策略依赖于求取Hamilton-Jacobi-Isaacs(HJI)方程的解。而HJI方程是耦合偏微分方程,难以直接求解,因此结合经验回放机制引入了有限时间收敛的在线强化学习算法,设计了单评价神经网络近似值函数并获得了最优安全控制策略。最终利用仿真验证了算法的有效性。 展开更多
关键词 FDI攻击 多无人机 在线强化学习 优化控制 博弈
下载PDF
图博弈下具有未知动态的供应链系统变更设计
2
作者 范佳慧 李庆奎 《北京信息科技大学学报(自然科学版)》 2022年第1期19-26,共8页
为了研究具有未知动态的供应链系统变更一致性问题,将供应链系统建模为多智能体系统,针对多智能体系统图博弈问题,提出一种自适应最优分布式算法,该算法基于数值迭代启发式动态规划,无需系统动力学知识即可求解耦合的Hamilton-Jacobi-Is... 为了研究具有未知动态的供应链系统变更一致性问题,将供应链系统建模为多智能体系统,针对多智能体系统图博弈问题,提出一种自适应最优分布式算法,该算法基于数值迭代启发式动态规划,无需系统动力学知识即可求解耦合的Hamilton-Jacobi-Isaacs(HJI)方程。此外,使用神经网络来识别每个子链的未知动态,证明了所提对策的闭环系统稳定性。仿真结果表明,该方法可以保证供应链变更系统的稳定性与一致性。 展开更多
关键词 供应链系统 博弈 系统辨识 启发式动态规划算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部