-
题名稀疏奖励下基于强化学习的异构多智能体对抗
被引量:2
- 1
-
-
作者
王瑞星
董诗音
江飞龙
黄胜全
-
机构
哈尔滨工业大学深空探测基础研究中心
上海机电工程研究所
-
出处
《信息技术》
2021年第5期12-20,共9页
-
基金
中央军委装备发展部装备预研基金(JZX7Y20-190243001201)。
-
文摘
文中在多智能体对抗问题研究过程中,采用强化学习为研究方法,以完全中心化训练架构为基础,选用基于策略的强化学习算法,针对领域研究中广泛存在的稀疏奖励问题,采用基于任务局部的奖励工程设定方法,以人为经验知识为导引,加速训练过程,提升训练结果。最后以对抗问题中典型的攻防对抗为场景进行了仿真实验,验证了方法的有效性。
-
关键词
多智能体博弈
强化学习
稀疏奖励
基于任务局部的奖励工程设定
-
Keywords
multi-agent games
reinforcement learning
sparse reward
part-task-based reward project
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-