-
题名基于知识辅助深度强化学习的巡飞弹组动态突防决策
- 1
-
-
作者
孙浩
黎海青
梁彦
马超雄
吴翰
-
机构
西北工业大学自动化学院
西安现代控制技术研究所
-
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2024年第9期3161-3176,共16页
-
基金
国家自然科学基金项目(61873205)。
-
文摘
巡飞弹组(Loitering Munition Group,LMG)突防控制决策是提高巡飞弹群组作战自主性与智能性的关键。针对存在截击拦截器和临机防空火力区的动态环境中弹组突防机动指令在线生成困难的问题,提出一种基于知识辅助强化学习方法的LMG突防控制决策算法。结合领域知识、规则知识改进状态空间和回报函数设计提高算法泛化能力与训练收敛速度。构建基于软动作-评价方法的LMG突防控制决策框架,以提高算法探索效率。利用专家经验和模仿学习方法改善多弹多威胁带来的解空间狭窄、算法初始高效训练经验匮乏的问题。实验结果表明,新算法能够在动态环境中实时生成有效的突防机动指令,相较于对比方法效果更好,验证了算法的有效性。
-
关键词
巡飞弹组
知识辅助深度强化学习
Soft
Actor-Critic算法
动态环境突防
控制决策
-
Keywords
loitering munition group
knowledge-assisted deep reinforcement learning
soft actor-critic algorithm
dynamic environment penetration
control decision
-
分类号
V279
[航空宇航科学与技术—飞行器设计]
-
-
题名不确定环境下巡飞弹群动态资源管理
- 2
-
-
作者
李兵
刘正敏
赵新路
-
机构
四川航天系统工程研究所
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2023年第8期2318-2324,共7页
-
基金
国家自然科学基金叶企荪基金(U2241214)
中国航天科技集团青年拔尖人才项目资助课题。
-
文摘
巡飞弹群是未来智能化作战样式的重要发展方向,能够实现全覆盖地毯式的封控压制和毁伤攻击,对任务科学合理的管理是作战任务实现的重要基础。本文首先对动态资源管理问题进行分析;其次建立了巡飞弹群的动态目标分配模型,并给出了主要的计算步骤;然后利用Hungarian算法可快速高效地求解平衡匹配优化问题的优势,对于巡飞弹和目标动态加入与退出的战场情况,利用增补变量的方式将非平衡匹配问题变为平衡匹配问题;最后,对典型任务场景进行了分析,验证了所提方法的有效性。
-
关键词
巡飞弹群
资源管理
增补变量
任务分配
-
Keywords
loitering munition group
resource management
supplementary variable
task assignment
-
分类号
N945.25
[自然科学总论—系统科学]
-