期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
敏捷凝视卫星密集点目标聚类与最优观测规划 被引量:8
1
作者 郭延宁 +2 位作者 李传江 马广富 李文博 《控制与决策》 EI CSCD 北大核心 2020年第3期613-621,共9页
针对敏捷凝视卫星密集点目标观测规划问题,提出一种快速观测任务聚类策略和启发式蚁群优化算法.首先,针对敏捷凝视卫星视场范围特点,提出基于顶点度的团划分算法,解决密集点观测任务聚类问题,形成系列团观测目标,有效提高观测效率;其次... 针对敏捷凝视卫星密集点目标观测规划问题,提出一种快速观测任务聚类策略和启发式蚁群优化算法.首先,针对敏捷凝视卫星视场范围特点,提出基于顶点度的团划分算法,解决密集点观测任务聚类问题,形成系列团观测目标,有效提高观测效率;其次,为得到最优团目标观测序列,考虑目标可见时间窗口约束以及卫星敏捷机动能力约束,构建基于多目标观测收益和姿态机动能耗的性能指标,实现能量高效的任务规划;再次,为克服传统蚁群算法易陷入局部极小值和收敛较慢的缺点,设计一种同时考虑目标点优先级、目标可见时间窗口、目标之间卫星姿态转换时间等因素的启发式蚁群算法;最后,选取大规模密集地面目标验证所提出算法的可行性和高效性. 展开更多
关键词 敏捷凝视卫星 密集点目标 凝视观测 任务规划 任务聚类 蚁群算法
原文传递
单推力航天器交会对接轨迹规划及跟踪控制 被引量:5
2
作者 李传江 +1 位作者 郭延宁 James Douglas BIGGS 《航空学报》 EI CAS CSCD 北大核心 2020年第9期186-200,共15页
针对单推力航天器交会对接问题,提出一种轨迹规划及跟踪算法。首先,考虑到追踪航天器只沿本体X轴安装推力器,且推力方向固定,为了实现从起始位置转移至期望位置并满足姿态要求,基于三维螺旋线设计两阶段转移轨迹,根据初末位置以及末端... 针对单推力航天器交会对接问题,提出一种轨迹规划及跟踪算法。首先,考虑到追踪航天器只沿本体X轴安装推力器,且推力方向固定,为了实现从起始位置转移至期望位置并满足姿态要求,基于三维螺旋线设计两阶段转移轨迹,根据初末位置以及末端速度方向要求,求解螺旋线参数。该螺旋线可以保证在初末速度方向固定情况下,曲率积分最小。其次,为了降低轨迹跟踪难度并减小初始时刻的位置跟踪控制力,需要将转移轨迹初始速度与追踪星X轴重合。传统螺旋线无法满足该约束条件。本文对传统螺旋线进行改进,提出一种旋转螺旋线轨迹设计方法。通过引入姿态旋转矩阵,将螺旋线在三维空间旋转,在不改变曲线形状的前提下满足初末位置及速度方向要求。然后,为了跟踪转移轨迹以及跟踪期望推力方向,提出基于CLF(Control Lyapunov Function)的滑模控制策略,当追踪星X轴与期望推力方向夹角较大时,采用CLF,保证最优性;当姿态误差收敛至滑模面附近时,切换为滑模控制,以提升系统鲁棒性。最后,通过仿真验证旋转螺旋线相比于传统螺旋线的优势。 展开更多
关键词 单推力航天器 交会对接 轨迹规划 旋转螺旋线 CLF
原文传递
混合空间目标下的多航天器抵近观测任务规划 被引量:2
3
作者 李传江 闫慧达 +2 位作者 郭延宁 叶睿卿 《宇航学报》 EI CAS CSCD 北大核心 2023年第12期1871-1882,共12页
研究了服务航天器对多个空间目标的抵近观测任务规划问题,并考虑了高价值航天器、普通航天器以及失效航天器或空间碎片3类待观测目标。通过构建合理的评价体系,对目标观测的任务方案进行评分。建立了综合观测目标数量、观测目标类型、... 研究了服务航天器对多个空间目标的抵近观测任务规划问题,并考虑了高价值航天器、普通航天器以及失效航天器或空间碎片3类待观测目标。通过构建合理的评价体系,对目标观测的任务方案进行评分。建立了综合观测目标数量、观测目标类型、燃料消耗、单次点火速度增量以及任务时长的多约束优化模型,涉及的优化变量包括目标分配向量、观测次序向量以及观测时刻向量。服务航天器通过一种四脉冲机动策略抵近每个目标。采用进化算法求解规划问题,并提出一种基于动态规划(DP)的局部搜索策略以优化观测时刻,提升优化效率。最后分别给出了针对单一类型和混合类型空间目标的抵近观测任务规划算例,通过与传统进化算法的求解结果对比,说明了所提出的DP搜索策略的优势。 展开更多
关键词 多航天器 抵近观测 混合空间目标 任务规划 动态规划
下载PDF
双体卫星对日定向姿态机动控制 被引量:3
4
作者 李传江 +1 位作者 孙延超 马广富 《宇航学报》 EI CAS CSCD 北大核心 2018年第7期740-750,共11页
研究了双体卫星(DFP)对日定向姿态机动控制问题。首先分析双体卫星工作机理,建立载荷舱与平台舱姿态模型,推导磁浮机构线圈和磁钢相对距离的数学表达式。提出基于PD控制的载荷舱对日姿态机动、平台舱姿态跟踪以及两舱避碰等控制策略。... 研究了双体卫星(DFP)对日定向姿态机动控制问题。首先分析双体卫星工作机理,建立载荷舱与平台舱姿态模型,推导磁浮机构线圈和磁钢相对距离的数学表达式。提出基于PD控制的载荷舱对日姿态机动、平台舱姿态跟踪以及两舱避碰等控制策略。在此基础上,为提高平台舱姿态跟踪速度,设计反步控制器对平台舱飞轮的动态特性进行补偿。进一步,为提高两舱协同控制性能,对传统PD控制进行改进,提出基于变增益PD控制的载荷舱姿态机动控制律,将两舱相对姿态信息包含在载荷舱对日姿态机动控制律中,有效降低了两舱碰撞风险,提高了两舱姿态机动速度。仿真结果表明,本文控制算法能有效实现双体卫星对日定向,且能避免两舱碰撞。 展开更多
关键词 双体卫星 对日定向 姿态机动 变增益PD控制 避碰控制
下载PDF
基于终端诱导强化学习的航天器轨道追逃博弈 被引量:9
5
作者 袁利 +1 位作者 黄煌 汤亮 《自动化学报》 EI CAS CSCD 北大核心 2023年第5期974-984,共11页
针对脉冲推力航天器轨道追逃博弈问题,提出一种基于强化学习的决策方法,实现追踪星在指定时刻抵近至逃逸星的特定区域,其中两星都具备自主博弈能力.首先,充分考虑追踪星和逃逸星的燃料约束、推力约束、决策周期约束、运动范围约束等实... 针对脉冲推力航天器轨道追逃博弈问题,提出一种基于强化学习的决策方法,实现追踪星在指定时刻抵近至逃逸星的特定区域,其中两星都具备自主博弈能力.首先,充分考虑追踪星和逃逸星的燃料约束、推力约束、决策周期约束、运动范围约束等实际约束条件,建立锥形安全接近区及追逃博弈过程的数学模型;其次,为了提升航天器面对不确定博弈对抗场景的自主决策能力,以近端策略优化(Proximal policy optimization,PPO)算法框架为基础,采用左右互搏的方式同时训练追踪星和逃逸星,交替提升两星的决策能力;在此基础上,为了在指定时刻完成追逃任务,提出一种终端诱导的奖励函数设计方法,基于CW(Clohessy Wiltshire)方程预测两星在终端时刻的相对误差,并将该预测误差引入奖励函数中,有效引导追踪星在指定时刻进入逃逸星的安全接近区.与现有基于当前误差设计奖励函数的方法相比,所提方法能够有效提高追击成功率.最后,通过与其他学习方法仿真对比,验证提出的训练方法和奖励函数设计方法的有效性和优越性. 展开更多
关键词 航天器追逃 智能博弈 近端策略优化 奖励函数设计 终端诱导
下载PDF
航天器轨道追逃博弈多阶段强化学习训练方法 被引量:5
6
作者 袁利 +1 位作者 汤亮 黄煌 《上海航天(中英文)》 CSCD 2022年第4期33-41,共9页
针对航天器轨道追逃博弈问题,提出一种多阶段学习训练赋能方法,使得追踪星在终端时刻抵近逃逸星的特定区域,而逃逸星需要通过轨道机动规避追踪星。首先,构建两星的训练策略集,基于逻辑规则设计追踪星和逃逸星的机动策略,通过实时预测对... 针对航天器轨道追逃博弈问题,提出一种多阶段学习训练赋能方法,使得追踪星在终端时刻抵近逃逸星的特定区域,而逃逸星需要通过轨道机动规避追踪星。首先,构建两星的训练策略集,基于逻辑规则设计追踪星和逃逸星的机动策略,通过实时预测对方的终端位置,设计己方的期望位置和脉冲策略,显式给出追逃策略的解析表达式,用于训练赋能;其次,为提升航天器的训练赋能效率及应对未知环境的博弈能力,提出一种基于强化学习技术多模式、分阶段的学习训练方法,先使追踪星和逃逸星分别应对上述逻辑规则引导下的逃逸星和追踪星,完成预训练;再次,开展二次训练,两星都采用邻近策略优化(PPO)策略进行追逃博弈,在博弈中不断调整网络权值,提升决策能力;最后,在仿真环境中验证提出的训练方法的有效性,经过二次训练后,追踪星和逃逸星可有效应对不同策略驱动下的对手,提升追逃成功率。 展开更多
关键词 轨道追逃 博弈决策 强化学习 训练赋能 多阶段学习
下载PDF
信息非完备下多航天器轨道博弈强化学习方法 被引量:2
7
作者 王英杰 袁利 +2 位作者 汤亮 黄煌 《宇航学报》 EI CAS CSCD 北大核心 2023年第10期1522-1533,共12页
针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输... 针对信息非完备约束下航天器轨道博弈难以自主决策的问题,基于多智能体强化学习提出一种多航天器轨道博弈决策方法。首先建立轨道博弈动力学和信息非完备约束。其次建立用于训练和决策的神经网络模型,依据分布式系统架构对网络的输入输出结构进行设计,并引入具有记忆功能的长短期记忆网络(LSTM),根据航天器轨道运动在时间、空间连续的属性,补偿位置、速度测量信息的非完备性。然后采用近端策略优化(PPO)算法开展红蓝左右互搏式学习训练。最后通过三组对比训练实验,验证了所提出的方法在信息非完备约束下能够有效增强学习训练过程的稳定性,并提升任务完成率和降低燃料消耗。 展开更多
关键词 航天器 信息非完备 轨道博弈 多智能体强化学习 长短期记忆网络 近端策略优化算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部