期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
信息非完备下多航天器轨道博弈强化学习方法
1
作者 王英杰 袁利 +2 位作者 汤亮 黄煌 耿远卓 《宇航学报》 EI CAS CSCD 北大核心 2023年第10期1522-1533,共12页
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输... 针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输出结构进行设计,并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性,补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验,验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性,并提升任务完成率和降低燃料消耗。 展开更多
关键词 航天器 信息完备 轨道博弈 多智能体强化学习 长短期记忆网络 近端策略优化算法
下载PDF
模态信息非完备采样对水下声源检测的影响及改进方法 被引量:7
2
作者 李明杨 孙超 邵炫 《物理学报》 SCIE EI CAS CSCD 北大核心 2014年第20期207-220,共14页
给出了海洋波导中位置未知简谐声源的广义似然比检测器及其理论检测性能.通过对检测器中模态相关矩阵进行特征值分解,将该检测器分解为与各阶特征值相对应的谱成分.推导了各阶谱成分的统计特性并以此获得了谱成分对输入信号的空间处理增... 给出了海洋波导中位置未知简谐声源的广义似然比检测器及其理论检测性能.通过对检测器中模态相关矩阵进行特征值分解,将该检测器分解为与各阶特征值相对应的谱成分.推导了各阶谱成分的统计特性并以此获得了谱成分对输入信号的空间处理增益,该增益与谱成分对应的特征值成正比.当模态信息采样不完备时,模态相关矩阵存在部分接近于0的小特征值,相应的谱成分对输入信号的空间处理增益与其余谱成分相比非常小.通过舍去这部分谱成分,提出了有效谱检测器.该检测器在保持其输出中目标信号成分与广义似然比检测器相同的基础上,有效减少了其中的噪声成分,因此,具有比广义似然比检测器更好的检测性能.在典型的浅海环境下进行仿真实验,仿真结果验证了理论分析、推导以及有效谱检测器的有效性,并且表明非完备采样程度越严重,有效谱检测器相对于广义似然比检测器的检测性能提高越显著.此外,有效谱检测器具有比广义似然比检测器更好的数值计算稳健性. 展开更多
关键词 空间处理增益 小特征值 有效谱检测器 模态信息完备采样
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部