谷歌推出强化学习研究专用框架“多巴胺”

导出

摘要强化学习研究中涌现了许多重大技术进展,已经帮助智能体在游戏中发挥出超越人类的作用,如DQN、AlphaGo和AlphaGo Zero,以及近期连续击败业余玩家和前职业选手的DOTA2 AI OpenAI Five。近日,谷歌发布一个新的基于TensorFlow的强化学习框架＂多巴胺＂（Dopamine）。其目标是提供一个兼顾灵活、稳定、可重复性的强化学习实验框架,让不论资深还是新手研究人员都感受到＂多巴胺＂带来的放松和愉悦,从而帮助他们更多、更快、更好地开展有可能带来颠覆性发现的思辨、探索研究。

作者本刊讯

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第9期99-99,共1页 Data Analysis and Knowledge Discovery

关键词强化学习多巴胺框架谷歌技术进展可重复性研究人员智能体

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1TI8小绿本开售,奖金池首日突破560万美元[J].电子竞技,2018,0(10):15-15.
2人工智能失控了怎么办？OpenAI和Google的新课题[J].计算机应用文摘,2017,0(18):68-68.
3陆英.人工智能开发人员需要了解的各种安全问题[J].计算机与网络,2018,44(17):50-51.
4OpenAI击败DOTA2人类玩家[J].电子竞技,2018,0(12):17-17.
5张帆,胡明远,林珲.大数据背景下的虚拟地理认知实验方法[J].测绘学报,2018,47(8):1043-1050. 被引量：7
6查宇飞.浅析Dota2游戏核心数值的设定与版本改动[J].视听界（广播电视技术）,2018,0(4):120-125.
7宋伟.MOBA游戏尖兵：ROG玩家国度魔霸Ⅱ[J].微型计算机,2018,0(21):92-95.
8左子扬.iG的24小时一颗早该吞下的苦果[J].电子竞技,2018,0(16):32-35.
9张芷盈.电竞:当“玩物”不再“丧志”[J].中外玩具制造,2018,0(10):20-22. 被引量：3
10MATTHIAS PLAPPERT,MARCIN ANDRYCHOWICZ,ALEX RAY,BOB MCGREW,BOWEN BAKER,GLENN POWELL,JONAS SCHNEIDER,JOSH TOBIN,MACIEK CHOQEJ,PETER WELINDER,VIKASH KUMAR,WOJCIECH ZAREMBA.OpenAI发布训练实体机器人的最新模拟环境[J].机器人产业,2018(2):32-37. 被引量：1

数据分析与知识发现

2018年第9期

浏览历史

内容加载中请稍等...

谷歌推出强化学习研究专用框架“多巴胺”

相关作者

相关机构

相关主题

浏览历史