-
题名基于DDPG算法的无人机集群追击任务
被引量:28
- 1
-
-
作者
张耀中
许佳林
姚康佳
刘洁凌
-
机构
西北工业大学电子信息学院
西安北方光电科技防务有限公司
-
出处
《航空学报》
EI
CAS
CSCD
北大核心
2020年第10期309-321,共13页
-
基金
航空科学基金(2017ZC53033)。
-
文摘
无人机的集群化应用技术是近年来的研究热点,随着无人机自主智能的不断提高,无人机集群技术必将成为未来无人机发展的主要趋势之一。针对无人机集群协同执行对敌方来袭目标的追击任务,构建了典型的任务场景,基于深度确定性策略梯度网络(DDPG)算法,设计了一种引导型回报函数有效解决了深度强化学习在长周期任务下的稀疏回报问题,通过引入基于滑动平均值的软更新策略减少了DDPG算法中Eval网络和Target网络在训练过程中的参数震荡,提高了算法的训练效率。仿真结果表明,训练完成后的无人机集群能够较好地执行对敌方来袭目标的追击任务,任务成功率达到95%。可以说无人机集群技术作为一种全新概念的作战模式在军事领域具有潜在的应用价值,人工智能算法在无人机集群的自主决策智能化发展方向上具有一定的应用前景。
-
关键词
DDPG算法
无人机集群
任务决策
深度强化学习
稀疏回报
-
Keywords
DDPG algorithm
UAV swarms
task decision
deep reinforcement learning
sparse rewards
-
分类号
V279
[航空宇航科学与技术—飞行器设计]
-
-
题名基于HMM和信息熵的分布式传感器协同任务规划研究
被引量:4
- 2
-
-
作者
张耀中
姚康佳
郭操
-
机构
西北工业大学电子信息学院
沈阳飞机设计研究所
-
出处
《电光与控制》
北大核心
2018年第12期5-10,15,共7页
-
基金
航空科学基金(2016ZC53031)
中央高校基本科研业务费专项资金(3102017jghk02012)
-
文摘
为了研究多平台传感器最优化任务规划问题中的随机性和不确定性因素,以隐马尔可夫模型(HMM)建模思想和信息熵理论为支撑,以平台传感器执行任务的单位损耗所带来的信息增益为目标函数,建立了基于多HMM过程的传感器动态规划模型,研究了多HMM过程的传感器动态规划执行步骤并进行了仿真。同时研究了在特殊情况下使用多HMM过程进行传感器动态调度的相关问题,为多平台传感器最优化任务规划问题的不确定性和随机性因素的建模与分析奠定了基础。
-
关键词
动态传感器调度
任务规划
HMM
信息熵
-
Keywords
dynamic sensor scheduling
mission planning
HMM
information entropy
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-