期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多智能体深度强化学习的测运控一体化资源调度方法
被引量:
2
1
作者
成思玥
李浩然
+2 位作者
白卫岗
周笛
朱彦
《天地一体化信息网络》
2023年第1期12-22,共11页
随着卫星通信技术的发展,星座规模的不断扩大,测运控一体化成为主流趋势。星座规模大、调度对象多、复杂操作联合控制给卫星网络测运控一体化资源调度带来巨大的挑战。受制于调度算法求解效率低、约束复杂等问题,传统的测运控资源调度...
随着卫星通信技术的发展,星座规模的不断扩大,测运控一体化成为主流趋势。星座规模大、调度对象多、复杂操作联合控制给卫星网络测运控一体化资源调度带来巨大的挑战。受制于调度算法求解效率低、约束复杂等问题,传统的测运控资源调度技术采用提前上注测控指令,按照固定部署执行任务,难以满足突发事件与紧急任务的调度需求。因此,提出一种基于多智能体演员-评判家确定性策略梯度算法的测运控一体化资源调度方法,采用集中式训练和分布式执行的方法,建立测运控一体化任务的多智能体模型,通过分析邻居智能体局部信息计算调度策略,提高任务的响应速度。依据测运控一体化资源调度问题中的模型和约束,选择影响意义大、可解释的约束,建立多智能体资源调度强化学习模型,并进行仿真测试。测试结果显示,该方法的任务收益较传统方法提高22%。
展开更多
关键词
测运控一体化
大规模
星座
系统
资源调度
多智能体深度强化学习
任务收益
下载PDF
职称材料
题名
基于多智能体深度强化学习的测运控一体化资源调度方法
被引量:
2
1
作者
成思玥
李浩然
白卫岗
周笛
朱彦
机构
西安电子科技大学通信工程学院
出处
《天地一体化信息网络》
2023年第1期12-22,共11页
基金
国家重点研发计划资助项目(No.2020YFB1806100)
国家自然科学基金青年项目(No.62101410)
秦创原引用高层次创新创业人才项目(No.QCYRCXM-2022-228)。
文摘
随着卫星通信技术的发展,星座规模的不断扩大,测运控一体化成为主流趋势。星座规模大、调度对象多、复杂操作联合控制给卫星网络测运控一体化资源调度带来巨大的挑战。受制于调度算法求解效率低、约束复杂等问题,传统的测运控资源调度技术采用提前上注测控指令,按照固定部署执行任务,难以满足突发事件与紧急任务的调度需求。因此,提出一种基于多智能体演员-评判家确定性策略梯度算法的测运控一体化资源调度方法,采用集中式训练和分布式执行的方法,建立测运控一体化任务的多智能体模型,通过分析邻居智能体局部信息计算调度策略,提高任务的响应速度。依据测运控一体化资源调度问题中的模型和约束,选择影响意义大、可解释的约束,建立多智能体资源调度强化学习模型,并进行仿真测试。测试结果显示,该方法的任务收益较传统方法提高22%。
关键词
测运控一体化
大规模
星座
系统
资源调度
多智能体深度强化学习
任务收益
Keywords
integration of TT&C and observation
large-scale constellation system
resources scheduling
multi-agent deep reinforcement learning
tasks reward
分类号
V19 [航空宇航科学与技术—人机与环境工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多智能体深度强化学习的测运控一体化资源调度方法
成思玥
李浩然
白卫岗
周笛
朱彦
《天地一体化信息网络》
2023
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部