期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
信息非完备下多航天器轨道博弈强化学习方法
1
作者
王英杰
袁利
+2 位作者
汤亮
黄煌
耿远卓
《宇航学报》
EI
CAS
CSCD
北大核心
2023年第10期1522-1533,共12页
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输...
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输出结构进行设计,并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性,补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验,验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性,并提升任务完成率和降低燃料消耗。
展开更多
关键词
航天器
信息
非
完备
轨道博弈
多智能体强化学习
长短期记忆网络
近端策略优化算法
下载PDF
职称材料
模态信息非完备采样对水下声源检测的影响及改进方法
被引量:
7
2
作者
李明杨
孙超
邵炫
《物理学报》
SCIE
EI
CAS
CSCD
北大核心
2014年第20期207-220,共14页
给出了海洋波导中位置未知简谐声源的广义似然比检测器及其理论检测性能.通过对检测器中模态相关矩阵进行特征值分解,将该检测器分解为与各阶特征值相对应的谱成分.推导了各阶谱成分的统计特性并以此获得了谱成分对输入信号的空间处理增...
给出了海洋波导中位置未知简谐声源的广义似然比检测器及其理论检测性能.通过对检测器中模态相关矩阵进行特征值分解,将该检测器分解为与各阶特征值相对应的谱成分.推导了各阶谱成分的统计特性并以此获得了谱成分对输入信号的空间处理增益,该增益与谱成分对应的特征值成正比.当模态信息采样不完备时,模态相关矩阵存在部分接近于0的小特征值,相应的谱成分对输入信号的空间处理增益与其余谱成分相比非常小.通过舍去这部分谱成分,提出了有效谱检测器.该检测器在保持其输出中目标信号成分与广义似然比检测器相同的基础上,有效减少了其中的噪声成分,因此,具有比广义似然比检测器更好的检测性能.在典型的浅海环境下进行仿真实验,仿真结果验证了理论分析、推导以及有效谱检测器的有效性,并且表明非完备采样程度越严重,有效谱检测器相对于广义似然比检测器的检测性能提高越显著.此外,有效谱检测器具有比广义似然比检测器更好的数值计算稳健性.
展开更多
关键词
空间处理增益
小特征值
有效谱检测器
模态
信息
非
完备
采样
原文传递
题名
信息非完备下多航天器轨道博弈强化学习方法
1
作者
王英杰
袁利
汤亮
黄煌
耿远卓
机构
北京控制工程研究所
中国空间技术研究院
空间智能控制技术重点实验室
出处
《宇航学报》
EI
CAS
CSCD
北大核心
2023年第10期1522-1533,共12页
基金
国家自然科学基金(U21B6001)
国家自然科学基金青年基金(62203047)
中国博士后科学基金(2022M722994)。
文摘
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输出结构进行设计,并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性,补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验,验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性,并提升任务完成率和降低燃料消耗。
关键词
航天器
信息
非
完备
轨道博弈
多智能体强化学习
长短期记忆网络
近端策略优化算法
Keywords
Spacecraft
Incomplete information
Orbital game
Multi-agent reinforcement learning
Long short-term memory networks
Proximal policy optimization
分类号
V249.328 [航空宇航科学与技术—飞行器设计]
下载PDF
职称材料
题名
模态信息非完备采样对水下声源检测的影响及改进方法
被引量:
7
2
作者
李明杨
孙超
邵炫
机构
西北工业大学航海学院
出处
《物理学报》
SCIE
EI
CAS
CSCD
北大核心
2014年第20期207-220,共14页
基金
国家自然科学基金(批准号:11274252
51479169)资助的课题~~
文摘
给出了海洋波导中位置未知简谐声源的广义似然比检测器及其理论检测性能.通过对检测器中模态相关矩阵进行特征值分解,将该检测器分解为与各阶特征值相对应的谱成分.推导了各阶谱成分的统计特性并以此获得了谱成分对输入信号的空间处理增益,该增益与谱成分对应的特征值成正比.当模态信息采样不完备时,模态相关矩阵存在部分接近于0的小特征值,相应的谱成分对输入信号的空间处理增益与其余谱成分相比非常小.通过舍去这部分谱成分,提出了有效谱检测器.该检测器在保持其输出中目标信号成分与广义似然比检测器相同的基础上,有效减少了其中的噪声成分,因此,具有比广义似然比检测器更好的检测性能.在典型的浅海环境下进行仿真实验,仿真结果验证了理论分析、推导以及有效谱检测器的有效性,并且表明非完备采样程度越严重,有效谱检测器相对于广义似然比检测器的检测性能提高越显著.此外,有效谱检测器具有比广义似然比检测器更好的数值计算稳健性.
关键词
空间处理增益
小特征值
有效谱检测器
模态
信息
非
完备
采样
Keywords
spatial processing gain, small eigenvalues, effective spectrum detector, incomplete modal information sampling
分类号
P715.5 [天文地球—海洋科学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
信息非完备下多航天器轨道博弈强化学习方法
王英杰
袁利
汤亮
黄煌
耿远卓
《宇航学报》
EI
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
2
模态信息非完备采样对水下声源检测的影响及改进方法
李明杨
孙超
邵炫
《物理学报》
SCIE
EI
CAS
CSCD
北大核心
2014
7
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部