期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
马尔可夫决策问题的关键状态优先学习算法 被引量:1
1
作者 白尘 《中国管理信息化》 2016年第7期198-202,共5页
针对传统强化学习算法的维数灾难问题,首先提出了用于识别关键状态的"决策收益率"概念及其估算方法,然后借鉴学习范围扩展的思想,以经典Q-Learning学习算法为基础,提出了关键状态优先学习算法(Critical States Prioritized Le... 针对传统强化学习算法的维数灾难问题,首先提出了用于识别关键状态的"决策收益率"概念及其估算方法,然后借鉴学习范围扩展的思想,以经典Q-Learning学习算法为基础,提出了关键状态优先学习算法(Critical States Prioritized Learning,CSPL)。最后本文实现了机器人寻径实验,并比较了CSPL算法与Q-Learning算法的实验结果。 展开更多
关键词 马尔可夫决策 关键状态 决策收益率 关键状态优先学习算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部