期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于ART2的Q学习算法研究
被引量:
3
1
作者
姚明海
瞿心昱
+2 位作者
李佳鹤
顾勤龙
汤丽平
《控制与决策》
EI
CSCD
北大核心
2011年第2期227-232,共6页
为了解决Q学习应用于连续状态空间的智能系统所面临的"维数灾难"问题,提出一种基于ART2的Q学习算法.通过引入ART2神经网络,让Q学习Agent针对任务学习一个适当的增量式的状态空间模式聚类,使Agent无需任何先验知识,即可在未知...
为了解决Q学习应用于连续状态空间的智能系统所面临的"维数灾难"问题,提出一种基于ART2的Q学习算法.通过引入ART2神经网络,让Q学习Agent针对任务学习一个适当的增量式的状态空间模式聚类,使Agent无需任何先验知识,即可在未知环境中进行行为决策和状态空间模式聚类两层在线学习,通过与环境交互来不断改进控制策略,从而提高学习精度.仿真实验表明,使用ARTQL算法的移动机器人能通过与环境交互学习来不断提高导航性能.
展开更多
关键词
Q学习
ART2
增量式学习
两层在线学习
移动机器人导航
原文传递
题名
基于ART2的Q学习算法研究
被引量:
3
1
作者
姚明海
瞿心昱
李佳鹤
顾勤龙
汤丽平
机构
浙江工业大学信息工程学院
出处
《控制与决策》
EI
CSCD
北大核心
2011年第2期227-232,共6页
基金
国家自然科学基金项目(61070113)
浙江省自然科学基金项目(20080376)
文摘
为了解决Q学习应用于连续状态空间的智能系统所面临的"维数灾难"问题,提出一种基于ART2的Q学习算法.通过引入ART2神经网络,让Q学习Agent针对任务学习一个适当的增量式的状态空间模式聚类,使Agent无需任何先验知识,即可在未知环境中进行行为决策和状态空间模式聚类两层在线学习,通过与环境交互来不断改进控制策略,从而提高学习精度.仿真实验表明,使用ARTQL算法的移动机器人能通过与环境交互学习来不断提高导航性能.
关键词
Q学习
ART2
增量式学习
两层在线学习
移动机器人导航
Keywords
Q-
learning
ART
2
incremental
learning
two
-
tiers
online
learning
mobile
robot
navigation
分类号
TP273 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于ART2的Q学习算法研究
姚明海
瞿心昱
李佳鹤
顾勤龙
汤丽平
《控制与决策》
EI
CSCD
北大核心
2011
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部