摘要
提出了在动态环境中,多Agent的一种协作模型,适用于环境信息不完备的复杂情况.将Agent的独立强化学习与BDI模型结合起来,使多Agent系统不但拥有强化学习的高度反应性和自适应性,而且拥有BDI的推理能力,使只使用数值分析而忽略推理环节的强化学习结合了逻辑推理方法.使用了Borlzman选取随机动作,并且采用了新的奖励函数和表示方法,减少了学习空间,提高了学习速度.仿真结果表明所提方法可行,能够满足多Agent系统的要求.
In this paper,a new multi-agent cooperating model of dynamic enviroment is proposed,which is suitable for complex situation of incomplete enviroment information.By combination of independence reinforcement study and the belief-desire-intention(BDI) model,multi-agent system has not only highly reactivity but also reasoning faculty.The method reduces study space by a new reinforcement function and increases study speed by Borlzman function.The results of simulation experiment indicate the effectiveness of the...
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第S1期39-41,52,共4页
Journal of Huazhong University of Science and Technology(Natural Science Edition)
基金
国家高科技发展计划重点基金资助项目(2007AA041603)
关键词
机器人
多智能体系统
强化学习
协作
动态环境
robot
multi-agent system
reinforcement
cooperation
dynamic enviroment