-
题名知识驱动的智能博弈对抗行动序列规划方法
- 1
-
-
作者
陈希亮
曹雷
康凯
李晨溪
-
机构
陆军工程大学指挥控制工程学院
解放军
-
出处
《指挥与控制学报》
CSCD
北大核心
2024年第4期509-515,共7页
-
基金
国家自然科学基金(62273356)资助。
-
文摘
针对基于深度强化学习方法解决实际博弈对抗序列规划问题中存在的探索-利用矛盾、奖赏信号稀疏、数据利用率低、难以稳定收敛等问题,分析了基于知识的学习型智能生成模式,提出基于知识驱动的方法,从用规则教、从数据中学、用问题引导等方面构建了智能博弈对抗行动序列规划模型,为提升探索-利用效率、精准奖励函数、加速算法收敛提供了理论支撑。对基于强化学习的智能博弈对抗问题求解的难点问题进行了讨论,指出下一步深度强化学习算法走向实用的发展方向。
-
关键词
深度强化学习
博弈对抗
知识驱动
行动序列规划
-
Keywords
deep reinforcement learning
intelligent game confrontation
knowledge driven
course of action planning
-
分类号
G63
[文化科学—教育学]
-
-
题名多飞行器协同攻击的行动序列规划方法
被引量:3
- 2
-
-
作者
代祥
刘忠
乔士东
黄金才
杜伟
-
机构
国防科学技术大学信息系统工程重点实验室
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2012年第7期1406-1411,共6页
-
基金
国家自然科学基金(70701038
70771109
+1 种基金
71031007
91024006)资助课题
-
文摘
飞行器协同攻击行动序列规划中,地面目标威胁直接影响飞行器的目标分配和航迹规划,目前多飞行器协同攻击规划算法不考虑地面目标被摧毁而威胁消失的情况,不符合飞行器战术应用的实际情况。提出一种基于滚动时域方法的多飞行器协同攻击的行动序列规划方法,依据地面目标被摧毁之后的最新态势重新分配打击目标,仿真结果表明该方法符合飞行器战术应用的特点。
-
关键词
飞行器
行动序列规划
滚动时域优化
攻击性目标
-
Keywords
aerial vehicle
course of action programming
rolling horizon procedure
aggressive target
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名信息作战行动序列规划随机博弈模型及求解方法
被引量:3
- 3
-
-
作者
殷阶
王本胜
朱旭
-
机构
南京陆军指挥学院军队指挥系
-
出处
《指挥信息系统与技术》
2016年第2期7-12,共6页
-
文摘
信息作战关键在于生成作战行动序列。考虑到信息作战过程的不确定性和对抗性,以及信息作战行动与战场态势间的相互影响,利用随机博弈论分析了敌对双方对抗,从而建立了信息作战行动序列规划随机博弈模型,并给出了求解方法。算例结果表明,该模型可适应信息作战环境。
-
关键词
信息作战
作战行动序列规划
随机博弈
-
Keywords
information operation
operation sequence planning
stochastic game
-
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
-