期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
时变环境下基于最大期望加权估计的干扰决策方法 被引量:2
1
作者 王军 叶立诚 +1 位作者 刘帅 韩冬梅 《现代雷达》 CSCD 北大核心 2021年第3期30-36,共7页
认知雷达对抗技术可使干扰系统具有自主学习能力来实现智能干扰决策。现有基于强化学习理论的干扰决策方法难以在实时性要求高、对抗时间受限、雷达策略快变的雷达对抗环境中获得高期望收益。文中基于多臂匪徒决策理论提出了一种时变环... 认知雷达对抗技术可使干扰系统具有自主学习能力来实现智能干扰决策。现有基于强化学习理论的干扰决策方法难以在实时性要求高、对抗时间受限、雷达策略快变的雷达对抗环境中获得高期望收益。文中基于多臂匪徒决策理论提出了一种时变环境下基于最大期望加权估计的在线干扰决策方法,通过最大期望加权方法提高了对收益最大臂估计正确率,通过学习时间漂移方法使得干扰决策具有对雷达时变环境的适应性。典型时变环境设置的数值仿真表明,该方法具有在时变环境中更高的决策收益和环境时变适应能力。 展开更多
关键词 认知雷达对抗 时变环境 干扰决策 多臂匪徒 最大期望加权
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部