检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

两方零和马尔科夫博弈策略梯度算法及收敛性分析: 1; 作者王卓李永强 +1 位作者冯宇冯远静《浙江大学学报（工学版）》 EI CAS CSCD 北大核心 2024年第3期480-491,共12页; 为了解决基于策略的强化学习方法在两方零和马尔科夫博弈中学习效率低下的问题,提出同时更新双方玩家策略的近似纳什均衡策略优化算法.将两方零和马尔科夫博弈问题描述为最大最小优化问题,针对参数化策略,给出马尔科夫博弈的策略梯度定... 展开更多; 关键词两方零和马尔科夫博弈强化学习策略优化额外梯度纳什均衡神经网络; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	两方零和马尔科夫博弈策略梯度算法及收敛性分析	王卓李永强冯宇冯远静	《浙江大学学报（工学版）》 EI CAS CSCD 北大核心	2024	0	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部