期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于快速强化学习的无线通信干扰规避策略
被引量:
4
1
作者
李芳
熊俊
+3 位作者
赵肖迪
赵海涛
魏急波
苏曼
《电子与信息学报》
EI
CSCD
北大核心
2022年第11期3842-3849,共8页
针对无线通信环境中存在未知且动态变化的干扰,该文联合考虑通信信道接入和发射功率控制提出了基于快速强化学习的未知干扰规避策略,以确保通信收发端的可靠通信。将干扰规避问题建模为马尔可夫决策过程,其优化目标为在保证通信质量的...
针对无线通信环境中存在未知且动态变化的干扰,该文联合考虑通信信道接入和发射功率控制提出了基于快速强化学习的未知干扰规避策略,以确保通信收发端的可靠通信。将干扰规避问题建模为马尔可夫决策过程,其优化目标为在保证通信质量的前提下同时降低系统发射功率和减少信道切换次数。随后,提出一种赢或学习快速策略爬山(WoLF-PHC)学习方法的干扰规避方案,从而实现快速规避干扰的目的。仿真结果表明,在不同干扰模式下,所提WoLF-PHC算法的抗干扰性能、收敛速度均优于传统的随机选择方法和Q学习算法。
展开更多
关键词
干扰规避
赢
或
学习
快速
策略
爬山
Q
学习
马尔可夫决策
下载PDF
职称材料
题名
基于快速强化学习的无线通信干扰规避策略
被引量:
4
1
作者
李芳
熊俊
赵肖迪
赵海涛
魏急波
苏曼
机构
国防科技大学电子科学学院
湖南大学电气与信息工程学院
北京跟踪与通信技术研究所
出处
《电子与信息学报》
EI
CSCD
北大核心
2022年第11期3842-3849,共8页
基金
国家自然科学基金(U19B2024,61601480)。
文摘
针对无线通信环境中存在未知且动态变化的干扰,该文联合考虑通信信道接入和发射功率控制提出了基于快速强化学习的未知干扰规避策略,以确保通信收发端的可靠通信。将干扰规避问题建模为马尔可夫决策过程,其优化目标为在保证通信质量的前提下同时降低系统发射功率和减少信道切换次数。随后,提出一种赢或学习快速策略爬山(WoLF-PHC)学习方法的干扰规避方案,从而实现快速规避干扰的目的。仿真结果表明,在不同干扰模式下,所提WoLF-PHC算法的抗干扰性能、收敛速度均优于传统的随机选择方法和Q学习算法。
关键词
干扰规避
赢
或
学习
快速
策略
爬山
Q
学习
马尔可夫决策
Keywords
Interference avoidance
Win or Learn Fast Policy Hill-Climbing(WoLF-PHC)
Q learning
Markov decision process
分类号
TN919.4 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于快速强化学习的无线通信干扰规避策略
李芳
熊俊
赵肖迪
赵海涛
魏急波
苏曼
《电子与信息学报》
EI
CSCD
北大核心
2022
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部