期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
智能博弈对抗方法:博弈论与强化学习综合视角对比分析
被引量:
12
1
作者
袁唯淋
罗俊仁
+3 位作者
陆丽娜
陈佳星
张万鹏
陈璟
《计算机科学》
CSCD
北大核心
2022年第8期191-204,共14页
智能博弈对抗是人工智能认知决策领域亟待解决的前沿热点问题。以反事实后悔最小化算法为代表的博弈论方法和以虚拟自博弈算法为代表的强化学习方法,依托大规模算力支撑,在求解智能博弈策略中脱颖而出,但对两种范式之间的关联缺乏深入...
智能博弈对抗是人工智能认知决策领域亟待解决的前沿热点问题。以反事实后悔最小化算法为代表的博弈论方法和以虚拟自博弈算法为代表的强化学习方法,依托大规模算力支撑,在求解智能博弈策略中脱颖而出,但对两种范式之间的关联缺乏深入发掘。文中针对智能博弈对抗问题,定义智能博弈对抗的内涵与外延,梳理智能博弈对抗的发展历程,总结其中的关键挑战。从博弈论和强化学习两种视角出发,介绍智能博弈对抗模型、算法。多角度对比分析博弈理论和强化学习的优势与局限,归纳总结博弈理论与强化学习统一视角下的智能博弈对抗方法和策略求解框架,旨在为两种范式的结合提供方向,推动智能博弈技术前向发展,为迈向通用人工智能蓄力。
展开更多
关键词
智能博弈对抗
反事实后悔值最小化
虚拟自博弈
纳什均衡
强化学习
下载PDF
职称材料
题名
智能博弈对抗方法:博弈论与强化学习综合视角对比分析
被引量:
12
1
作者
袁唯淋
罗俊仁
陆丽娜
陈佳星
张万鹏
陈璟
机构
国防科技大学智能科学学院
出处
《计算机科学》
CSCD
北大核心
2022年第8期191-204,共14页
基金
国家自然科学基金(61702528,61806212,62173336)。
文摘
智能博弈对抗是人工智能认知决策领域亟待解决的前沿热点问题。以反事实后悔最小化算法为代表的博弈论方法和以虚拟自博弈算法为代表的强化学习方法,依托大规模算力支撑,在求解智能博弈策略中脱颖而出,但对两种范式之间的关联缺乏深入发掘。文中针对智能博弈对抗问题,定义智能博弈对抗的内涵与外延,梳理智能博弈对抗的发展历程,总结其中的关键挑战。从博弈论和强化学习两种视角出发,介绍智能博弈对抗模型、算法。多角度对比分析博弈理论和强化学习的优势与局限,归纳总结博弈理论与强化学习统一视角下的智能博弈对抗方法和策略求解框架,旨在为两种范式的结合提供方向,推动智能博弈技术前向发展,为迈向通用人工智能蓄力。
关键词
智能博弈对抗
反事实后悔值最小化
虚拟自博弈
纳什均衡
强化学习
Keywords
adversarial
intelligent
game
Counterfactual
regret
minimization
Fictitious
self-play
Nash
equilibrium
Reinforcement
learning
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
智能博弈对抗方法:博弈论与强化学习综合视角对比分析
袁唯淋
罗俊仁
陆丽娜
陈佳星
张万鹏
陈璟
《计算机科学》
CSCD
北大核心
2022
12
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部