期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于主智能体的群体学习算法GLBMA 被引量:4
1
作者 程显毅 李淑琴 夏德深 《江苏大学学报(自然科学版)》 EI CAS 北大核心 2005年第5期437-439,共3页
以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学习,改进了传统的群体强化学习算法。RoboCup仿真比赛试验表明,... 以机器人足球比赛(RoboCup)为背景,基于主智能体和辅助智能体概念,提出了基于主智能体群体强化学习算法(GLBMA),该算法通过主智能体和辅智能体的角色切换来实现整个团队的学习,改进了传统的群体强化学习算法。RoboCup仿真比赛试验表明,传统群体强化学习算法中的行为学习状态空间过大,连续状态空间的行为选择及多智能体合作求解等问题得到了解决. 展开更多
关键词 智能体 主智能体 强化学习 ROBOCUP 行为学习状态空间
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部