-
题名多无人机系统在线强化学习最优安全跟踪控制
- 1
-
-
作者
弓镇宇
杨飞生
-
机构
西北工业大学
-
出处
《航空科学技术》
2024年第4期25-30,共6页
-
基金
国家自然科学基金(62073269)
航空科学基金(2020Z034053002)
+2 种基金
陕西省重点研发计划项目(2022GY-244)
重庆市自然科学基金(CSTB2022NSCQ-MSX0963)
广东省基础与应用基础研究基金(2023A1515011220)。
-
文摘
在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参与者,攻击者的目标是最大化设定的成本函数,而安全控制器的目标与之相反,求解博弈并获得最优安全控制策略依赖于求取Hamilton-Jacobi-Isaacs(HJI)方程的解。而HJI方程是耦合偏微分方程,难以直接求解,因此结合经验回放机制引入了有限时间收敛的在线强化学习算法,设计了单评价神经网络近似值函数并获得了最优安全控制策略。最终利用仿真验证了算法的有效性。
-
关键词
FDI攻击
多无人机
在线强化学习
优化控制
零和图博弈
-
Keywords
FDI attack
multi-UAVs
online reinforcement learning
optimal control
zero-sum graphical game
-
分类号
V249.1
[航空宇航科学与技术—飞行器设计]
-
-
题名基于ADRC的电导增量法对MPPT控制策略的研究
- 2
-
-
作者
马闯
厉虹
弓镇宇
-
机构
北京信息科技大学自动化学院
-
出处
《黑龙江电力》
CAS
2020年第1期1-5,16,共6页
-
基金
国家自然科学基金(项目编号:51607009).
-
文摘
电导增量法步长的设置会使最大功率追踪速度和系统运行稳定性之间存在矛盾。为此,设计了一种改进型的电导增量法,采用自抗扰控制算法对定步长电导增量法进行改进,利用电导变化率与最大功率点电导之间的关系,通过自抗扰算法调节步长。在Matlab/Simulink环境下,基于Boost升压电路搭建了最大功率点追踪系统的仿真模型。仿真实验结果表明,在光伏发电系统中,采用基于自抗扰算法的改进电导增量法进行最大功率点追踪时,不但响应速度快和超调量小,而且抗干扰能力出色,可减小系统稳定运行时的振荡问题。
-
关键词
电导增量法
自抗扰控制
变步长
最大功率点追踪
-
Keywords
incremental conductance method
active disturbance rejection control
variable step size
maximum power point tracking
-
分类号
TM914.4
[电气工程—电力电子与电力传动]
-
-
题名基于零和博弈方法的多智能体系统H∞一致性
- 3
-
-
作者
弓镇宇
李庆奎
-
机构
北京信息科技大学自动化学院
-
出处
《河南科学》
2020年第4期546-554,共9页
-
基金
国家自然科学基金项目资助(61573230)
北京信息科技大学促进高校内涵发展科研水平提高重点研究培育项目资助(5211910949)。
-
文摘
针对存在外部扰动情形下离散多智能体系统的H∞一致性问题,利用二人零和博弈方法,一致性协议和外部扰动分别被看作博弈双方参与者,通过寻找二人零和博弈的纳什均衡点,可以设计出针对最坏情形干扰时的最优一致性协议.而获得博弈问题的纳什均衡需要求解耦合Hamilton-Jacobi-Isaacs(HJI)方程,因此给出了解耦方法,并且使用强化学习中的双环策略迭代算法对解耦后的HJI方程进一步求解.最后给出的算例仿真结果验证了提出方法的有效性.
-
关键词
零和博弈
多智能体系统
H∞一致性
策略迭代
-
Keywords
zero-sum game
multiagent system
H∞consensus
policy iteration
-
分类号
TP13
[自动化与计算机技术—控制理论与控制工程]
-