模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个理想的实验平台,已经成为人工智能的研究热点。传统的Q学习已被有效地应用于处理RoboCup中传球策略问题,但是它仅能简单地离散化连续的状态、动作空间。提出将神经网...模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个理想的实验平台,已经成为人工智能的研究热点。传统的Q学习已被有效地应用于处理RoboCup中传球策略问题,但是它仅能简单地离散化连续的状态、动作空间。提出将神经网络应用于Q学习,系统只需学习部分状态-动作的Q值即可获得近似连续的Q值,就可以有效地提高泛化能力。然后将改进的Q学习应用于优化传球策略,最后在RobCup中实现测试了该算法,实验结果表明改进的Q学习在RoboCup传球策略中的应用,可以有效提高传球的成功率。展开更多
机器人足球赛Robocup(Robot World Cup)是国际上规模最大且影响最为广泛的机器人足球赛事。机器人足球比赛已经成为当前人工智能研究的热点之一,作为多Agent系统的一个理想的试验平台,它涉及到了多个技术领域。文章应用神经网络技术解决...机器人足球赛Robocup(Robot World Cup)是国际上规模最大且影响最为广泛的机器人足球赛事。机器人足球比赛已经成为当前人工智能研究的热点之一,作为多Agent系统的一个理想的试验平台,它涉及到了多个技术领域。文章应用神经网络技术解决Robocup仿真组比赛的进攻策略问题,对射门底层技术进行了有效优化。我们把这种策略与以往的基于逻辑准则的策略进行了比较。基于神经网络的优化射门策略在很多情况下会做出更好的决定。展开更多
文摘模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个理想的实验平台,已经成为人工智能的研究热点。传统的Q学习已被有效地应用于处理RoboCup中传球策略问题,但是它仅能简单地离散化连续的状态、动作空间。提出将神经网络应用于Q学习,系统只需学习部分状态-动作的Q值即可获得近似连续的Q值,就可以有效地提高泛化能力。然后将改进的Q学习应用于优化传球策略,最后在RobCup中实现测试了该算法,实验结果表明改进的Q学习在RoboCup传球策略中的应用,可以有效提高传球的成功率。
文摘机器人足球赛Robocup(Robot World Cup)是国际上规模最大且影响最为广泛的机器人足球赛事。机器人足球比赛已经成为当前人工智能研究的热点之一,作为多Agent系统的一个理想的试验平台,它涉及到了多个技术领域。文章应用神经网络技术解决Robocup仿真组比赛的进攻策略问题,对射门底层技术进行了有效优化。我们把这种策略与以往的基于逻辑准则的策略进行了比较。基于神经网络的优化射门策略在很多情况下会做出更好的决定。