摘要
强化学习研究中涌现了许多重大技术进展,已经帮助智能体在游戏中发挥出超越人类的作用,如DQN、AlphaGo和AlphaGo Zero,以及近期连续击败业余玩家和前职业选手的DOTA2 AI OpenAI Five。近日,谷歌发布一个新的基于TensorFlow的强化学习框架"多巴胺"(Dopamine)。其目标是提供一个兼顾灵活、稳定、可重复性的强化学习实验框架,让不论资深还是新手研究人员都感受到"多巴胺"带来的放松和愉悦,从而帮助他们更多、更快、更好地开展有可能带来颠覆性发现的思辨、探索研究。
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2018年第9期99-99,共1页
Data Analysis and Knowledge Discovery