期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于未知环境状态新定义及知识启发的机器人导航Q学习算法 被引量:1
1
作者 童小龙 姚明海 张灿淋 《计算机系统应用》 2014年第1期149-153,共5页
由于强大的自主学习能力,强化学习方法逐渐成为机器人导航问题的研究热点,但是复杂的未知环境对算法的运行效率和收敛速度提出了考验.提出一种新的机器人导航Q学习算法,首先用三个离散的变量来定义环境状态空间,然后分别设计了两部分奖... 由于强大的自主学习能力,强化学习方法逐渐成为机器人导航问题的研究热点,但是复杂的未知环境对算法的运行效率和收敛速度提出了考验.提出一种新的机器人导航Q学习算法,首先用三个离散的变量来定义环境状态空间,然后分别设计了两部分奖赏函数,结合对导航达到目标有利的知识来启发引导机器人的学习过程.实验在Simbad仿真平台上进行,结果表明本文提出的算法很好地完成了机器人在未知环境中的导航任务,收敛性能也有其优越性. 展开更多
关键词 强化学习 状态定义 知识启发 simbad平台
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部