期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于未知环境状态新定义及知识启发的机器人导航Q学习算法
被引量:
1
1
作者
童小龙
姚明海
张灿淋
《计算机系统应用》
2014年第1期149-153,共5页
由于强大的自主学习能力,强化学习方法逐渐成为机器人导航问题的研究热点,但是复杂的未知环境对算法的运行效率和收敛速度提出了考验.提出一种新的机器人导航Q学习算法,首先用三个离散的变量来定义环境状态空间,然后分别设计了两部分奖...
由于强大的自主学习能力,强化学习方法逐渐成为机器人导航问题的研究热点,但是复杂的未知环境对算法的运行效率和收敛速度提出了考验.提出一种新的机器人导航Q学习算法,首先用三个离散的变量来定义环境状态空间,然后分别设计了两部分奖赏函数,结合对导航达到目标有利的知识来启发引导机器人的学习过程.实验在Simbad仿真平台上进行,结果表明本文提出的算法很好地完成了机器人在未知环境中的导航任务,收敛性能也有其优越性.
展开更多
关键词
强化学习
状态定义
知识启发
simbad
平台
下载PDF
职称材料
题名
基于未知环境状态新定义及知识启发的机器人导航Q学习算法
被引量:
1
1
作者
童小龙
姚明海
张灿淋
机构
浙江工业大学信息工程学院
出处
《计算机系统应用》
2014年第1期149-153,共5页
基金
国家自然科学基金(61070113)
文摘
由于强大的自主学习能力,强化学习方法逐渐成为机器人导航问题的研究热点,但是复杂的未知环境对算法的运行效率和收敛速度提出了考验.提出一种新的机器人导航Q学习算法,首先用三个离散的变量来定义环境状态空间,然后分别设计了两部分奖赏函数,结合对导航达到目标有利的知识来启发引导机器人的学习过程.实验在Simbad仿真平台上进行,结果表明本文提出的算法很好地完成了机器人在未知环境中的导航任务,收敛性能也有其优越性.
关键词
强化学习
状态定义
知识启发
simbad
平台
Keywords
reinforcement learning
states definition
knowledge heuristic
simbad
platform
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于未知环境状态新定义及知识启发的机器人导航Q学习算法
童小龙
姚明海
张灿淋
《计算机系统应用》
2014
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部