期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Policy Gradient算法的研究与实现
1
作者 刘俊利 《现代计算机》 2019年第30期3-5,18,共4页
近年来,由于在多个领域高效率高质量的成功运用,强化学习在机器学习领域和人工智能领域引发极大的关注。越来越多的人开始意识到机器能够自主学习的巨大价值。策略梯度(Policy Gradient)算法是一种基于策略的(policybased)强化学习技术... 近年来,由于在多个领域高效率高质量的成功运用,强化学习在机器学习领域和人工智能领域引发极大的关注。越来越多的人开始意识到机器能够自主学习的巨大价值。策略梯度(Policy Gradient)算法是一种基于策略的(policybased)强化学习技术,是强化学习的经典算法之一。以policy-based方法开始,然后介绍Policy Gradient算法的具体内容,最终利用深度学习框架TensorFlow完成该算法的实现。 展开更多
关键词 TensorFlow 机器学习 强化学习 Policy-Based方法 POLICY gradient算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部