期刊文献+

谷歌推出强化学习研究专用框架“多巴胺”

原文传递
导出
摘要 强化学习研究中涌现了许多重大技术进展,已经帮助智能体在游戏中发挥出超越人类的作用,如DQN、AlphaGo和AlphaGo Zero,以及近期连续击败业余玩家和前职业选手的DOTA2 AI OpenAI Five。近日,谷歌发布一个新的基于TensorFlow的强化学习框架"多巴胺"(Dopamine)。其目标是提供一个兼顾灵活、稳定、可重复性的强化学习实验框架,让不论资深还是新手研究人员都感受到"多巴胺"带来的放松和愉悦,从而帮助他们更多、更快、更好地开展有可能带来颠覆性发现的思辨、探索研究。
作者 本刊讯
出处 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第9期99-99,共1页 Data Analysis and Knowledge Discovery
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部