期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
非对称认知网络中分布式多用户频谱共享算法
1
作者
黄丽
方红斌
《中南民族大学学报(自然科学版)》
CAS
北大核心
2016年第3期111-116,共6页
为解决多用户冲突导致非对称认知网络吞吐量降低的问题,根据网络中用户信道收益矩阵的特点,提出了一种分布式多用户联合频谱共享方法.首先,基于Gale-Shapley理论实现认知用户和信道之间的"一对一"频谱分配,以避免认知用户之...
为解决多用户冲突导致非对称认知网络吞吐量降低的问题,根据网络中用户信道收益矩阵的特点,提出了一种分布式多用户联合频谱共享方法.首先,基于Gale-Shapley理论实现认知用户和信道之间的"一对一"频谱分配,以避免认知用户之间的竞争冲突;其次,在未知信道先验知识或者认知用户仅有部分信道感知能力时,通过顺序最优学习算法获取信道收益信息;同时设置接入定时器,实现分布式机会频谱共享.仿真结果表明:所提方法的平均网络吞吐量明显优于随机等分布式算法,且复杂度比最优算法大大降低,收敛速度较快,适于感知带宽受限和用户地理位置分散的非对称认知网络.
展开更多
关键词
非对称认知网络
分布式频谱共享
Gale-Shapley理论
联合
学习
算法
下载PDF
职称材料
基于联合强化学习的RoboCup-2D传球策略
2
作者
常晓军
《计算机工程与应用》
CSCD
北大核心
2011年第23期212-216,219,共6页
在传统Q学习算法基础上引入多智能体系统,提出了多智能体联合Q学习算法。该算法是在同一评价函数下进行多智能体的学习,并且学习过程考虑了参与协作的所有智能体的学习结果。在RoboCup-2D足球仿真比赛中通过引入球场状态分解法减少了状...
在传统Q学习算法基础上引入多智能体系统,提出了多智能体联合Q学习算法。该算法是在同一评价函数下进行多智能体的学习,并且学习过程考虑了参与协作的所有智能体的学习结果。在RoboCup-2D足球仿真比赛中通过引入球场状态分解法减少了状态分量,采用联合学习得到的最优状态作为多智能体协作的最优动作组,有效解决了仿真中各智能体之间的传球策略及其协作问题,仿真和实验结果证明了算法的有效性和可靠性。
展开更多
关键词
多智能体系统
联合
Q
学习
算法
RoboCup-2D
球场状态分解法
下载PDF
职称材料
题名
非对称认知网络中分布式多用户频谱共享算法
1
作者
黄丽
方红斌
机构
中南民族大学电子信息工程学院
华为技术有限公司武汉研究所
出处
《中南民族大学学报(自然科学版)》
CAS
北大核心
2016年第3期111-116,共6页
基金
湖北省自然科学基金资助项目(2015CFC870)
中央高校基本科研业务费专项基金资助项目(CZY14001)
智能无线通信湖北省重点实验室开放基金项目(20140623)
文摘
为解决多用户冲突导致非对称认知网络吞吐量降低的问题,根据网络中用户信道收益矩阵的特点,提出了一种分布式多用户联合频谱共享方法.首先,基于Gale-Shapley理论实现认知用户和信道之间的"一对一"频谱分配,以避免认知用户之间的竞争冲突;其次,在未知信道先验知识或者认知用户仅有部分信道感知能力时,通过顺序最优学习算法获取信道收益信息;同时设置接入定时器,实现分布式机会频谱共享.仿真结果表明:所提方法的平均网络吞吐量明显优于随机等分布式算法,且复杂度比最优算法大大降低,收敛速度较快,适于感知带宽受限和用户地理位置分散的非对称认知网络.
关键词
非对称认知网络
分布式频谱共享
Gale-Shapley理论
联合
学习
算法
Keywords
asymmetric cognitive radio network
distributed spectrum sharing
Gale-Shapley theory
joint learning algorithm
分类号
TN929.5 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于联合强化学习的RoboCup-2D传球策略
2
作者
常晓军
机构
西安理工大学自动化与信息工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2011年第23期212-216,219,共6页
文摘
在传统Q学习算法基础上引入多智能体系统,提出了多智能体联合Q学习算法。该算法是在同一评价函数下进行多智能体的学习,并且学习过程考虑了参与协作的所有智能体的学习结果。在RoboCup-2D足球仿真比赛中通过引入球场状态分解法减少了状态分量,采用联合学习得到的最优状态作为多智能体协作的最优动作组,有效解决了仿真中各智能体之间的传球策略及其协作问题,仿真和实验结果证明了算法的有效性和可靠性。
关键词
多智能体系统
联合
Q
学习
算法
RoboCup-2D
球场状态分解法
Keywords
multi-agent system
joint Q-learning algorithm
RoboCup-2D
state of decomposition stadium in football field
分类号
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
非对称认知网络中分布式多用户频谱共享算法
黄丽
方红斌
《中南民族大学学报(自然科学版)》
CAS
北大核心
2016
0
下载PDF
职称材料
2
基于联合强化学习的RoboCup-2D传球策略
常晓军
《计算机工程与应用》
CSCD
北大核心
2011
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部