-
题名基于多臂赌博机在线学习的频谱共享方法
被引量:2
- 1
-
-
作者
张娟
蒋和松
-
机构
西南科技大学信息工程学院特殊环境机器人技术四川省重点实验室
-
出处
《计算机工程与设计》
CSCD
北大核心
2014年第7期2515-2519,共5页
-
基金
国家自然科学基金项目(61379005)
国防基础科研计划基金项目(B3120110005
+1 种基金
B3120133002)
西南科技大学博士基金项目(12zx7127)
-
文摘
针对频谱共享中信道状态建模为完全知识马尔科夫时,应用受限的问题,提出了不同信道下基于信道感知的在线学习。根据授权用户是否存在于当前信道来选择激进发送或保守发送,由于保守发送时,信道状态是不可观测的,因此将信道模型建模为部分可观测马尔科夫决策过程。将信道未知情况下的最优传输策略建模为多臂赌博机模型。仿真结果表明,在信道不完全可知情况下的多臂赌博机在线学习算法能获得最优K步策略,并通过UCB-TUNED方法改善了最优传输的K步保守策略的收敛性。
-
关键词
频谱共享
多臂赌博机
在线学习
部分可观察的马尔科夫
最优传输
-
Keywords
spectrum sharing
multi-armed bandit
online learning
partially observable Markov decision process
optimal trans-mission
-
分类号
TN92
[电子电信—通信与信息系统]
-
-
题名认知无线电中实现最优传输的在线学习方法
- 2
-
-
作者
张娟
蒋和松
江虹
陈春梅
-
机构
西南科技大学特殊环境机器人技术四川省重点实验室
-
出处
《电视技术》
北大核心
2014年第15期193-197,226,共6页
-
基金
国家自然科学基金项目(61379005)
国防基础科研计划资助项目(B3120110005
+1 种基金
B3120133002)
西南科技大学博士基金项目(12zx7127)
-
文摘
在认知无线电中,对频谱共享的典型研究具有以下两方面的缺点:第一,目前的研究大都基于信道状态完全已知的马尔科夫建模,使得这类模型的应用受到很大的限制;第二,大部分研究都是基于信道感知的在线学习,没有考虑不同信道状态下的最优传输的在线学习。针对以上问题,提出了一种新的算法:将信道未知情况下的最优传输策略建模为多臂赌博机模型。仿真分析表明:在信道不完全可知情况下的多臂赌博机在线学习算法和单门限最优离线传输策略相比,同样能获得最优K步策略。同时,本文通过UCB-TUNED方法改善了最优传输的K步保守策略的收敛性。
-
关键词
频谱共享
多臂赌博机
在线学习
部分可观察的马尔科夫
-
Keywords
spectrum sharing
multi-armed bandit
online learning
partially observable markov decision process
-
分类号
TN92
[电子电信—通信与信息系统]
-