期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于知识辅助深度强化学习的巡飞弹组动态突防决策
1
作者 孙浩 黎海青 +2 位作者 梁彦 马超雄 吴翰 《兵工学报》 EI CAS CSCD 北大核心 2024年第9期3161-3176,共16页
巡飞弹组(Loitering Munition Group,LMG)突防控制决策是提高巡飞弹群组作战自主性与智能性的关键。针对存在截击拦截器和临机防空火力区的动态环境中弹组突防机动指令在线生成困难的问题,提出一种基于知识辅助强化学习方法的LMG突防控... 巡飞弹组(Loitering Munition Group,LMG)突防控制决策是提高巡飞弹群组作战自主性与智能性的关键。针对存在截击拦截器和临机防空火力区的动态环境中弹组突防机动指令在线生成困难的问题,提出一种基于知识辅助强化学习方法的LMG突防控制决策算法。结合领域知识、规则知识改进状态空间和回报函数设计提高算法泛化能力与训练收敛速度。构建基于软动作-评价方法的LMG突防控制决策框架,以提高算法探索效率。利用专家经验和模仿学习方法改善多弹多威胁带来的解空间狭窄、算法初始高效训练经验匮乏的问题。实验结果表明,新算法能够在动态环境中实时生成有效的突防机动指令,相较于对比方法效果更好,验证了算法的有效性。 展开更多
关键词 巡飞弹组 知识辅助深度强化学习 Soft Actor-Critic算法 动态环境突防 控制决策
下载PDF
不确定环境下巡飞弹群动态资源管理
2
作者 李兵 刘正敏 赵新路 《系统工程与电子技术》 EI CSCD 北大核心 2023年第8期2318-2324,共7页
巡飞弹群是未来智能化作战样式的重要发展方向,能够实现全覆盖地毯式的封控压制和毁伤攻击,对任务科学合理的管理是作战任务实现的重要基础。本文首先对动态资源管理问题进行分析;其次建立了巡飞弹群的动态目标分配模型,并给出了主要的... 巡飞弹群是未来智能化作战样式的重要发展方向,能够实现全覆盖地毯式的封控压制和毁伤攻击,对任务科学合理的管理是作战任务实现的重要基础。本文首先对动态资源管理问题进行分析;其次建立了巡飞弹群的动态目标分配模型,并给出了主要的计算步骤;然后利用Hungarian算法可快速高效地求解平衡匹配优化问题的优势,对于巡飞弹和目标动态加入与退出的战场情况,利用增补变量的方式将非平衡匹配问题变为平衡匹配问题;最后,对典型任务场景进行了分析,验证了所提方法的有效性。 展开更多
关键词 巡飞弹群 资源管理 增补变量 任务分配
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部