期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于主智能体的群体学习算法GLBMA
被引量:
4
1
作者
程显毅
李淑琴
夏德深
《江苏大学学报(自然科学版)》
EI
CAS
北大核心
2005年第5期437-439,共3页
以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学习,改进了传统的群体强化学习算法。RoboCup仿真比赛试验表明,...
以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学习,改进了传统的群体强化学习算法。RoboCup仿真比赛试验表明,传统群体强化学习算法中的行为学习状态空间过大,连续状态空间的行为选择及多智能体合作求解等问题得到了解决.
展开更多
关键词
智能体
主智能体
强化学习
ROBOCUP
行为学习状态空间
下载PDF
职称材料
题名
基于主智能体的群体学习算法GLBMA
被引量:
4
1
作者
程显毅
李淑琴
夏德深
机构
南京理工大学计算机系
出处
《江苏大学学报(自然科学版)》
EI
CAS
北大核心
2005年第5期437-439,共3页
基金
江苏省教育厅自然科学基金资助项目(02KJD520004)
江苏省研究生创新基金资助项目(xm04-35))
文摘
以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学习,改进了传统的群体强化学习算法。RoboCup仿真比赛试验表明,传统群体强化学习算法中的行为学习状态空间过大,连续状态空间的行为选择及多智能体合作求解等问题得到了解决.
关键词
智能体
主智能体
强化学习
ROBOCUP
行为学习状态空间
Keywords
agent
main
agent
reinforcement
learning
RoboCup
behaviour
state
space
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于主智能体的群体学习算法GLBMA
程显毅
李淑琴
夏德深
《江苏大学学报(自然科学版)》
EI
CAS
北大核心
2005
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部