-
题名多智能体博弈学习研究进展
被引量:1
- 1
-
-
作者
罗俊仁
张万鹏
苏炯铭
袁唯淋
陈璟
-
机构
国防科技大学智能科学学院
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2024年第5期1628-1655,共28页
-
基金
国家自然科学基金(61806212)
湖南省研究生科研创新项目(CX20210011)资助课题。
-
文摘
随着深度学习和强化学习而来的人工智能新浪潮,为智能体从感知输入到行动决策输出提供了“端到端”解决方案。多智能体学习是研究智能博弈对抗的前沿课题,面临着对抗性环境、非平稳对手、不完全信息和不确定行动等诸多难题与挑战。本文从博弈论视角入手,首先给出了多智能体学习系统组成,进行了多智能体学习概述,简要介绍了各类多智能体学习研究方法。其次,围绕多智能体博弈学习框架,介绍了多智能体博弈基础模型及元博弈模型,均衡解概念和博弈动力学,学习目标多样、环境(对手)非平稳、均衡难解且易变等挑战。再次,全面梳理了多智能体博弈策略学习方法,离线博弈策略学习方法,在线博弈策略学习方法。最后,从智能体认知行为建模与协同、通用博弈策略学习方法和分布式博弈策略学习框架共3个方面探讨了多智能体学习的前沿研究方向。
-
关键词
博弈学习
多智能体学习
元博弈
在线无悔学习
-
Keywords
learning in games
multi-agent learning
meta-game
online no regret learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-