改进近似动态规划法的攻击占位决策被引量：6

Attack Placeholder Decision Based on Improved Approximate Dynamic Programming

下载PDF

导出

摘要瞬息万变的空战环境和日益复杂的空战任务导致应用动态规划法解决机动决策问题容易造成“维数灾难”。基于函数拟合思想优化逼近近似值函数,解决了空战状态的连续性问题。同时,针对近似动态规划在解决机动决策问题时未考虑“过冲”机动和碰撞的问题,提出惩罚因子对近似动态规划法的攻击占位决策方法进行改进。这种方法能够有效应对快速变化的战场态势,而且不需要对空战战术构建专有的战术库。为了验证模型的有效性,将改进的近似动态规划法进行了实验仿真,仿真结果表明改进的攻击决策方法能够有效避免“过冲”机动和碰撞问题,具有较强的鲁棒性。 Due to the ever-changing air combat environment and increasingly complex air combat tasks,the application of dynamic programming to solve the problem of maneuvering decision can easily lead to a"curse of dimensionality".In this paper,the problem of the continuity of air combat states is solved based on the function fitting theory.At the same time,in order to solve the problem of"overshoot"maneuvering and collision,the penalty factor is proposed to improve the method of attacking and place holding in the approximate dynamic programming.This approach is effective in responding to rapidly changing battlefield situations and doesn't require building a proprietary arsenal of air combat tactics.In order to prove the effectiveness of the model,the improved approximate method is simulated and verified in this paper.The simulation results show that the improved attack decision-making method can effectively avoid"overshoot"maneuvering and collision and has strong robustness.

作者姜龙亭寇雅楠王栋张彬超胡涛 JIANG Long-ting;KOU Ya-nan;WANG Dong;ZHANG Bin-chao;HU Tao(Aerospace Engineering Acadeny,Air Force Engineering University,Xi'an 710038,CAtna;Unit 95974 of PLA,Cangzhou 061000,China;Unit 95356 of PLA,Leiyang 421800,China)

机构地区空军工程大学航空工程学院解放军解放军

出处《火力与指挥控制》 CSCD 北大核心 2019年第7期135-141,共7页 Fire Control & Command Control

基金航空科学基金资助项目(20141396012)

关键词维数灾难近似动态规划自主攻击占位决策惩罚因子 curse of dimensionality approximate dynamic programming autonomous attack place holder decision penalty factor

分类号 V323 [航空宇航科学与技术—人机与环境工程] TJ01 [兵器科学与技术—兵器发射理论与技术]

引文网络
相关文献

参考文献6

1徐安,寇英信,于雷,李战武.基于RBF神经网络的Q学习飞行器隐蔽接敌策略[J].系统工程与电子技术,2012,34(1):97-101. 被引量：8
2HUANG Changqiang,DONG Kangsheng,HUANG Hanqiao,TANG Shangqin,ZHANG Zhuoran.Autonomous air combat maneuver decision using Bayesian inference and moving horizon optimization[J].Journal of Systems Engineering and Electronics,2018,29(1):86-97. 被引量：60
3李伟..基于微分对策理论的无人战机空战决策方法研究[D].沈阳航空航天大学,2014:
4徐安,于雷,寇英信,徐保伟,李战武.基于MDP框架的飞行器隐蔽接敌策略[J].系统工程与电子技术,2011,33(5):1063-1068. 被引量：11
5朴海音,刘茂汉,王鹤,蔡为民.通信时延对无人作战飞机NWL轰炸精度影响研究[J].火力与指挥控制,2017,42(1):110-113. 被引量：8
6魏慎娜..基于新型态势函数的空战微分对策问题研究[D].沈阳航空航天大学,2018:

二级参考文献33

1Peters J, Schaal S, Using reward-weighted regression for reinforcement learning of task space control[C]// Proc. of the IEEE Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007:262 - 267. 被引量：1
2Paternina-Arboleda C D, Montoya-Torres J R, Fabregas-Ariza A. Simulation optimization using a reinforcement learning approach[C]// Proc. of the Winter Simulation Conference, 2008 . 1376 - 1383. 被引量：1
3McGrew J S, How J P. Air combat strategy using approximate dynamic programming[J]. Journal of Guidance, Control and Dynamics, 2010,33 (5) : 1641 - 1654. 被引量：1
4Jia Y Y, Kakade S M, Shimkin N. Markov decision processes with arbitrary reward processes[J].Mathematics of Operations Research ,2009,34(3) :737 - 757. 被引量：1
5Even-Dar E, Kakade S M, Mansour Y. Online Markov decision processes[J]. Mathematics of Operations Research, 2009,34 (3):726- 736. 被引量：1
6Nguyen D, Fisher D C, Ryan L. Agraph-based approach to situation assessment[ C] // Proc. of the AIAA In f otech Aerospace, 2010 : 1 - 6. 被引量：1
7Garlappi L, Skoulakis G. Numerical solutions to dynamic portfolio problems: the case for value function iteration using taylor approxi mation[J]. Computional Economics, 2009,33 (2) 193 - 207. 被引量：1
8Virtanen K, Karelahti J, Raivio T. Modeling air combat by a moving horizon influence diagram game[J]. Journal of Guidance, Control, and Dynamics,2006,29(5) :1080 - 1091. 被引量：1
9Mukal H, Tanikawa A, Tunay I, et al. Sequential linear-quadratic method for differential games with air combat applications [J]. Computational Optimization and Applications, 2003, 25 ( 1 - 3 ) : 193 - 222. 被引量：1
10Frenk J B G, Kassay G, Kolumban J. On equivalent results in minimax theory[J].European Journal o f Operational Research ,2004, 157(1) 46 - 58. 被引量：1

共引文献79

1付昭旺,于雷,刘霞,曲大鹏.网络信息支持下目标“虚拟跟踪”方法研究[J].电光与控制,2013,20(4):1-6. 被引量：2
2付昭旺,于雷,李战武,李飞.战斗机隐蔽接敌轨迹优化方法[J].国防科技大学学报,2013,35(5):52-58. 被引量：6
3俞利新,来强,曲大鹏,付昭旺.基于威胁规避的战斗机网络瞄准攻击引导轨迹优化[J].空军工程大学学报（自然科学版）,2014,15(1):38-42. 被引量：2
4杜海文,崔明朗,韩统,魏政磊,唐传林,田野.基于多目标优化与强化学习的空战机动决策[J].北京航空航天大学学报,2018,44(11):2247-2256. 被引量：21
5张强,杨任农,俞利新,张涛,左家亮.基于Q-network强化学习的超视距空战机动决策[J].空军工程大学学报（自然科学版）,2018,19(6):8-14. 被引量：19
6陈侠,魏晓明,徐光延.多无人机模糊态势的分布式协同空战决策[J].上海交通大学学报,2014,48(7):907-913. 被引量：15
7赵雨,张斌,隋永华,徐安.带容许偏差的战斗机近似最优接敌策略[J].空军工程大学学报（自然科学版）,2015,16(1):19-23. 被引量：1
8徐西蒙,魏贤智,张涛,刘宏强.基于混沌粒子群优化算法的战斗机使用空射诱饵的攻击决策[J].电光与控制,2015,22(11):42-47. 被引量：2
9王杰,丁达理,许明,韩博,雷磊.基于目标逃逸机动预估的空空导弹可发射区[J].北京航空航天大学学报,2019,45(4):722-734. 被引量：7
10闫雪飞,李新明,刘东,王寿彪.基于Nash-Q的网络信息体系对抗仿真技术[J].系统工程与电子技术,2018,40(1):217-224. 被引量：7

同被引文献137

1周思羽,吴文海,李翔,董淼.空战机动决策集模型分析[J].飞机设计,2012(3):42-45. 被引量：8
2胖永新,金迪,孟宪东.球杆系统的建模、仿真与控制器设计[J].武汉大学学报（工学版）,2005,38(6):142-146. 被引量：27
3孔渊,陆虎敏.未来战斗机座舱显控系统发展动态[J].航空电子技术,2006,37(3):33-37. 被引量：10
4钟麟,佟明安,钟卫,张圣云.基于多级影响图的空战连续机动决策[J].系统仿真学报,2007,19(2):410-411. 被引量：4
5钟麟,佟明安,钟卫,张圣云.基于影响图的空战机动决策模型[J].系统仿真学报,2007,19(8):1796-1798. 被引量：7
6Zhong Lin,Tong Ming'an,Zhong Wei,Zhang Shengyun.Sequential maneuvering decisions based on multi-stage influence diagram in air combat[J].Journal of Systems Engineering and Electronics,2007,18(3):551-555. 被引量：7
7郑东良,黄文卿,孙亮.基于集对分析的预警机指挥多机编队空战态势评估[J].空军工程大学学报（自然科学版）,2008,9(1):9-13. 被引量：5
8钟友武,柳嘉润,杨凌宇,申功璋.自主近距空战中机动动作库及其综合控制系统[J].航空学报,2008,29(B05):114-121. 被引量：24
9张翔伦,杨蔷薇.基于机动动作库的实时轨迹生成与仿真研究[J].飞行力学,2008,26(3):29-32. 被引量：9
10钟友武,杨凌宇,柳嘉润,申功璋.基于智能微分对策的自主机动决策方法研究[J].飞行力学,2008,26(6):29-33. 被引量：4

引证文献6

1殷春霞,陈晓刚.作战飞机智能座舱研究[J].测控技术,2021,40(9):1-6. 被引量：4
2马智慧,苏晓明,李桂君,田振宇.改进的HDP算法研究及其在非线性系统中的应用[J].控制工程,2021,28(9):1893-1901. 被引量：2
3邱妍,赵宝奇,邹杰,刘仲凯.基于PPO算法的无人机近距空战自主引导方法[J].电光与控制,2023,30(1):8-14. 被引量：4
4周思羽,石瑜,杨文奇,王子健,高丽,高艳丽.基于Cook-Seiford群决策算法的多机协同空战机动决策[J].指挥控制与仿真,2023,45(4):44-51.
5陈浩,黄健,刘权,周思航,张中杰.自主空战机动决策技术研究进展与展望[J].控制理论与应用,2023,40(12):2104-2129. 被引量：3
6贺宝记,白林亭,文鹏程.基于态势评估及DDPG算法的一对一空战格斗控制方法[J].航空工程进展,2024,15(2):179-187.

二级引证文献13

1吴晓莉,张蓝,牛佳然,刘潇,韩炜毅.航战座舱显控交互研究进展与人机协同发展趋势[J].包装工程,2022,43(10):1-13. 被引量：2
2陈士涛,李书,李大喜.智能座舱辅助系统研究[J].中国电子科学研究院学报,2023,18(3):280-283.
3刘光辉,孙迪,李园园.飞机智慧座舱发展技术研究[J].航空工程进展,2024,15(1):141-148. 被引量：1
4孔飞,赵振根,程磊,梁惠勇.输入受限及干扰下固定翼无人机强化学习控制[J].电光与控制,2024,31(2):21-28.
5贺宝记,白林亭,文鹏程.基于态势评估及DDPG算法的一对一空战格斗控制方法[J].航空工程进展,2024,15(2):179-187.
6洪金文,王力超,陈邱卓,胡耀聪.一类欠驱动系统的变结构自抗扰控制[J].兵器装备工程学报,2024,45(5):259-266.
7王宝来,高显忠,谢涛,侯中喜.基于强化学习与种群博弈的近距空战决策[J].航空学报,2024,45(12):169-184. 被引量：1
8Ershen WANG,Fan LIU,Chen HONG,Jing GUO,Lin ZHAO,Jian XUE,Ning HE.MADRL-based UAV swarm non-cooperative game under incomplete information[J].Chinese Journal of Aeronautics,2024,37(6):293-306.
9吕茂隆,段海滨,杨任农,张群,万路军,陈希亮.无人机集群空中博弈对抗体系指挥控制模型[J].指挥与控制学报,2024,10(4):401-411.
10李佐龙,朱纪洪,匡敏驰,张杰,任洁.基于混合动作的空战分层强化学习决策算法[J].航空学报,2024,45(17):156-173. 被引量：1

1陶伟龙.某型军用飞机外挂副油箱安定面的改进设计探讨[J].时代农机,2018,45(6):250-250.
2黄汉桥,白俊强,周欢,程昊宇,常晓飞.智能空战体系下无人协同作战发展现状及关键技术[J].导航与控制,2019,18(1):10-18. 被引量：30
3小闵.X-47B,我的战场我做主[J].少年科普世界,2018,0(1):52-55.
4李惠峰,易文峰,程晓明.基于近似动态规划的目标追踪控制算法[J].北京航空航天大学学报,2019,45(3):597-605. 被引量：3
5张佳龙,闫建国,吕茂隆.鲁棒PI控制方法在无人机编队飞行稳定性中的应用[J].飞行力学,2019,37(3):38-42. 被引量：2
6“杀人蜂”微型自主攻击无人机[J].兵器知识,2018,0(3):13-13.
7鲁鸿轩,魏瑞轩.基于三支理论的无人机对地攻击认知决策方法[J].空军工程大学学报（自然科学版）,2018,19(5):1-6. 被引量：3
8晁恒,赵忠彩.高中低学段足球课堂教学有效开展策略探究——以彭阳县第一中学为例[J].青少年体育,2019,0(6):57-58. 被引量：2
9徐昊,易绵竹.神经网络语言模型的结构与技术研究评述[J].现代计算机,2019,0(19):18-23. 被引量：1
10周拴莲.动态心电图对老年心律失常患者的临床诊断价值策略[J].疾病监测与控制,2019,13(4):278-279. 被引量：3

火力与指挥控制

2019年第7期

浏览历史

内容加载中请稍等...

改进近似动态规划法的攻击占位决策被引量：6

参考文献6

二级参考文献33

共引文献79

同被引文献137

引证文献6

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

改进近似动态规划法的攻击占位决策 被引量：6

参考文献6

二级参考文献33

共引文献79

同被引文献137

引证文献6

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

改进近似动态规划法的攻击占位决策被引量：6