期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
非对称认知网络中分布式多用户频谱共享算法
1
作者 黄丽 方红斌 《中南民族大学学报(自然科学版)》 CAS 北大核心 2016年第3期111-116,共6页
为解决多用户冲突导致非对称认知网络吞吐量降低的问题,根据网络中用户信道收益矩阵的特点,提出了一种分布式多用户联合频谱共享方法.首先,基于Gale-Shapley理论实现认知用户和信道之间的"一对一"频谱分配,以避免认知用户之... 为解决多用户冲突导致非对称认知网络吞吐量降低的问题,根据网络中用户信道收益矩阵的特点,提出了一种分布式多用户联合频谱共享方法.首先,基于Gale-Shapley理论实现认知用户和信道之间的"一对一"频谱分配,以避免认知用户之间的竞争冲突;其次,在未知信道先验知识或者认知用户仅有部分信道感知能力时,通过顺序最优学习算法获取信道收益信息;同时设置接入定时器,实现分布式机会频谱共享.仿真结果表明:所提方法的平均网络吞吐量明显优于随机等分布式算法,且复杂度比最优算法大大降低,收敛速度较快,适于感知带宽受限和用户地理位置分散的非对称认知网络. 展开更多
关键词 非对称认知网络 分布式频谱共享 Gale-Shapley理论 联合学习算法
下载PDF
基于联合强化学习的RoboCup-2D传球策略
2
作者 常晓军 《计算机工程与应用》 CSCD 北大核心 2011年第23期212-216,219,共6页
在传统Q学习算法基础上引入多智能体系统,提出了多智能体联合Q学习算法。该算法是在同一评价函数下进行多智能体的学习,并且学习过程考虑了参与协作的所有智能体的学习结果。在RoboCup-2D足球仿真比赛中通过引入球场状态分解法减少了状... 在传统Q学习算法基础上引入多智能体系统,提出了多智能体联合Q学习算法。该算法是在同一评价函数下进行多智能体的学习,并且学习过程考虑了参与协作的所有智能体的学习结果。在RoboCup-2D足球仿真比赛中通过引入球场状态分解法减少了状态分量,采用联合学习得到的最优状态作为多智能体协作的最优动作组,有效解决了仿真中各智能体之间的传球策略及其协作问题,仿真和实验结果证明了算法的有效性和可靠性。 展开更多
关键词 多智能体系统 联合Q学习算法 RoboCup-2D 球场状态分解法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部