期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向多智能体博弈的并行蒙特卡洛树搜索算法研究 被引量:3
1
作者 管延霞 刘逊韵 +2 位作者 刘运韬 谢旻 徐新海 《计算机工程与科学》 CSCD 北大核心 2022年第12期2128-2133,共6页
蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架... 蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架包含一个主进程和多个子进程,其中子进程用于探索,主进程根据子进程传递的胜率估值数据进行决策。结合多智能体博弈平台Pommerman进行实验验证,与传统的蒙特卡罗树搜索算法相比,并行蒙特卡罗树搜索算法有效提高了资源利用率、博弈胜率及决策效率。 展开更多
关键词 多智能体博弈 Pommerman 多进程 并行蒙特卡洛树搜索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部