期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
竞争与合作视角下的多Agent强化学习研究进展
1
作者
田小禾
李伟
+3 位作者
许铮
刘天星
戚骁亚
甘中学
《计算机应用与软件》
北大核心
2024年第4期1-15,共15页
随着深度学习和强化学习研究取得长足的进展,多Agent强化学习已成为解决大规模复杂序贯决策问题的通用方法。为了推动该领域的发展,从竞争与合作的视角收集并总结近期相关的研究成果。该文介绍单Agent强化学习;分别介绍多Agent强化学习...
随着深度学习和强化学习研究取得长足的进展,多Agent强化学习已成为解决大规模复杂序贯决策问题的通用方法。为了推动该领域的发展,从竞争与合作的视角收集并总结近期相关的研究成果。该文介绍单Agent强化学习;分别介绍多Agent强化学习的基本理论框架——马尔可夫博弈以及扩展式博弈,并重点阐述了其在竞争、合作和混合三种场景下经典算法及其近期研究进展;讨论多Agent强化学习面临的核心挑战——环境的不稳定性,并通过一个例子对其解决思路进行总结与展望。
展开更多
关键词
深度学习
强化学习
多AGENT强化学习
环境
的
不稳定性
下载PDF
职称材料
题名
竞争与合作视角下的多Agent强化学习研究进展
1
作者
田小禾
李伟
许铮
刘天星
戚骁亚
甘中学
机构
复旦大学工程与应用技术研究院
上海智能机器人工程技术研究中心
智能机器人教育部工程研究中心
季华实验室
北京深度奇点科技有限公司
出处
《计算机应用与软件》
北大核心
2024年第4期1-15,共15页
基金
广东省季华实验室基金项目(X190021TB190)
上海市科学技术委员会项目(1951113200)。
文摘
随着深度学习和强化学习研究取得长足的进展,多Agent强化学习已成为解决大规模复杂序贯决策问题的通用方法。为了推动该领域的发展,从竞争与合作的视角收集并总结近期相关的研究成果。该文介绍单Agent强化学习;分别介绍多Agent强化学习的基本理论框架——马尔可夫博弈以及扩展式博弈,并重点阐述了其在竞争、合作和混合三种场景下经典算法及其近期研究进展;讨论多Agent强化学习面临的核心挑战——环境的不稳定性,并通过一个例子对其解决思路进行总结与展望。
关键词
深度学习
强化学习
多AGENT强化学习
环境
的
不稳定性
Keywords
Deep learning
Reinforcement learning
Multi-agent reinforcement learning
Non-stationary of the environment
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
竞争与合作视角下的多Agent强化学习研究进展
田小禾
李伟
许铮
刘天星
戚骁亚
甘中学
《计算机应用与软件》
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部