期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
知识数据协同的多对手智能空中博弈策略设计
1
作者 冯锦元 陈敏 +4 位作者 李俊影 陈加乐 蒲志强 陈敏杰 孙方义 《电子学报》 EI CAS CSCD 北大核心 2024年第11期3809-3822,共14页
人工智能技术的迅速发展赋予了空战自主对抗策略超越人类专家的潜力.现有智能空战对抗策略依据驱动方式主要包含两类:其中,基于知识规则的策略对应用场景和专家知识依赖性强,而以强化学习为代表的数据驱动的策略可解释性差、泛化性弱.... 人工智能技术的迅速发展赋予了空战自主对抗策略超越人类专家的潜力.现有智能空战对抗策略依据驱动方式主要包含两类:其中,基于知识规则的策略对应用场景和专家知识依赖性强,而以强化学习为代表的数据驱动的策略可解释性差、泛化性弱.本文以全国智能空中博弈大赛多机协同空战为背景,提出了一种知识数据协同的多对手的空中博弈策略设计方法.其中,知识驱动部分基于专家知识设计一种参数化、风格化的策略,以生成高质量离线数据及初始化策略;数据驱动部分基于图注意力网络对队友、对手的信息进行针对性表征,提升训练效率及收敛性能.进一步,以动态对手匹配机制进行多对手强化学习训练,进一步提升策略泛化性.该策略与大赛16强中的12支队伍对抗,达到70%以上的统计胜率,这些队伍均采用最新的知识或数据驱动方法,风格各异,同时具有较强的作战能力. 展开更多
关键词 强化学习 知识数据协同驱动 空中博弈 多对手 泛化性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部