一种基于强化学习的指挥智能体控制方法

A Control Method of Command Agent Based on Reinforcement Learning

下载PDF

导出

摘要针对无人水下航行器(unmanned underwater vehicle,UUV)如何进行任务分配、航路规划、指挥控制问题,提出一种新的控制实现方法。搭建UUV指挥智能体训练平台,设计学习训练所需的想定,进行状态设计、数据适配、决策解析和规则库建立,选定近端策略优化(proximal policy optimization,PPO)强化学习算法进行训练,并进行应用验证。结果表明:指挥智能体能有效对UUV进行任务分配、航路规划、指挥控制;通过不断优化算法,可提高战胜基于规则的传统控制方法的胜率。 Aiming at the methods of task allocation,route planning and command control of unmanned underwater vehicle(UUV),a new control implementation method,command agent based on deep reinforcement learning,is proposed to replace human in the loop or automatic command and control.Build UUV command agent training platform,design scenarios required for learning and training,conduct state design,data adaptation,decision analysis and rule base establishment,and select proximal policy optimization(PPO)reinforcement learning algorithm for training.The application verification of the command agent generated by training and learning is carried out.The results show that the command intelligence can effectively carry out task allocation,route planning,command and control of UUV,and make bold guesses.By continuously optimizing the algorithm,the winning rate of defeating the traditional rule-based control method can be improved.

作者林九根朱衍明余景锋宋家平吴如悦 Lin Jiugen;Zhu Yanming;Yu Jingfeng;Song Jiaping;Wu Ruyue(Ai Department,CSSC Systems Engineering Research Institute,Beijing 100094,China)

机构地区中国船舶工业系统工程研究院智能中心

出处《兵工自动化》北大核心 2024年第1期92-96,共5页 Ordnance Industry Automation

关键词航路规划任务分配智能体强化学习 route planning task allocation agent reinforcement learning

分类号 TJ6 [兵器科学与技术—武器系统与运用工程] E925 [军事—军事装备学]

引文网络
相关文献

参考文献7

1孙现有,马琪.美海军UUV使命任务必要性与技术可行性分析[J].鱼雷技术,2010,18(3):231-235. 被引量：9
2徐卓..基于神经网络算法的无人机航迹规划研究[D].河北科技大学,2016:
3李聪,贾红军.无人水下航行器的智能航行控制[J].舰船科学技术,2018,40(4X):4-6. 被引量：4
4张玉平,王有成,赵铜星,胡波.区间直觉模糊决策在联合作战指挥员能力评估中的应用[J].兵工自动化,2013,32(11):45-48. 被引量：8
5方兴.基于贝叶斯网络的水下目标识别[J].舰船电子工程,2020,40(9):41-43. 被引量：2
6葛峰,韩建立,高松.基于BAS-BP神经网络的多应力加速寿命试验预测方法[J].兵工自动化,2020,39(6):5-9. 被引量：4
7苏玉民,曹建,徐锋,张国成.鱼雷形水下机器人非线性航迹跟踪控制[J].上海交通大学学报,2012,46(6):977-983. 被引量：8

二级参考文献50

1钱东,孟庆国,薛蒙,张少悟.美国海军UUV的任务与能力需求[J].鱼雷技术,2005,13(4):7-12. 被引量：32
2黄金,梁彦,程咏梅,潘泉,胡劲文.基于序列图像的自动目标识别算法[J].航空学报,2006,27(1):87-93. 被引量：19
3许韦韦,孟昭香.新兴的水下作战平台UUV[J].指挥控制与仿真,2006,28(3):16-19. 被引量：22
4孙碧娇,何静.美海军无人潜航器关键技术综述[J].鱼雷技术,2006,14(4):7-10. 被引量：29
5杨福平,白振兴.BP神经网络和D-S证据理论的目标识别[J].火力与指挥控制,2006,31(10):88-90. 被引量：21
6徐泽水,陈剑.一种基于区间直觉判断矩阵的群决策方法[J].系统工程理论与实践,2007,27(4):126-133. 被引量：140
7李晓阳,姜同敏.加速寿命试验中多应力加速模型综述[J].系统工程与电子技术,2007,29(5):828-831. 被引量：63
8田晓东,刘忠.基于形状相似度的水下目标识别算法[J].声学技术,2007,26(3):493-497. 被引量：5
9Fletcher B. UUV Master Plan: a Vision for Navy UUV Development [ J ]. Oceans 2000 MTS/IEEE. Conference and Eihibition. 2000( 1 ) :65-71. 被引量：1
10U.S. Department of the Navy. The Navy Unmanned Undersea Vehicle (UUV) Master Plan[ M] , 2004. 被引量：1

共引文献25

1桑金.观察型水下机器人ROV系统配置研究[J].海洋测绘,2012,32(4):81-84. 被引量：6
2郝阳,赵新华,辛久元.自主水下航行器模糊自校正航迹控制[J].微型机与应用,2014,33(8):75-77. 被引量：2
3万磊,张英浩,孙玉山,李岳明,何斌.欠驱动智能水下机器人的自抗扰路径跟踪控制[J].上海交通大学学报,2014,48(12):1727-1731. 被引量：14
4朱冬健,马宁,顾解忡.船舶航向非线性系统自适应模糊补偿控制[J].上海交通大学学报,2015,49(2):250-254. 被引量：7
5胡建华,康林.以“精品工程”为牵引努力提升陆军装备质量建设水平[J].兵工自动化,2015,34(4):13-14.
6徐强,章家岩,杜翠翠,冯旭刚.基于遗传算法的水下机器人滑模变结构控制策略[J].安徽工业大学学报（自然科学版）,2016,33(3):261-265. 被引量：4
7梁勇飞,侯远龙,朱忠贺,刘兰强.基于GA-RBF算法的FUZZY-RBF交流伺服系统控制[J].兵工自动化,2017,36(4):58-62. 被引量：2
8王珂,田甜.UUV水声侦听任务载荷设计与实现[J].舰船科学技术,2017,39(12):122-124.
9胡庆玉,舒国平,冯朝.深海AUV发展趋势研究[J].数字海洋与水下攻防,2018,1(2):77-80. 被引量：10
10刘志浩,吴金平,黄峰峰,杜毅.基于任务分类的UUV导航系统适配性分析[J].兵器装备工程学报,2019,0(9):82-86. 被引量：1

1都立立,邢传玺,万志良,李聪颖.基于CKF-SLAM改进的无人水下航行器动态目标跟踪算法研究[J].云南民族大学学报（自然科学版）,2024,33(1):102-110.
2李耀宇,金帅,马满好,任伟.无人空战指控建模仿真方法研究[J].指挥控制与仿真,2024,46(1):85-92.
3孙美燕,段宇,干伟东,周俊伟,王燚.广西沿海主要航路规划及通过能力研究[J].水运工程,2024(1):132-136.
4栾晓明,武守远,贾春娟,李小鹏,高立雪.基于主动型接地装置消弧控制不同电压反馈方法建模与分析[J].中国电机工程学报,2023,43(23):9084-9097.
5肖来祥,于兆磊,朱智林,段宇涵.基于ROMS模型的水声信道建模仿真[J].物联网技术,2024,14(2):52-54.
6李伟,代洪华,江腾耀,李继广.低成本无人机对地固定目标攻击方法研究[J].空天技术,2023(6):88-99.
7马镜,兰飞翔,游航.高速水下无人航行器仿生外形设计与阻力数值预报研究[J].应用科技,2024,51(1):158-165.
8马春华.基于仿真实验的智能并行训练方法[J].指挥控制与仿真,2024,46(1):93-99.
9赵冬梅,李玲,宋阳.改进萤火虫算法的武器目标分配问题研究[J].现代电子技术,2024,47(3):102-108. 被引量：1

兵工自动化

2024年第1期

浏览历史

内容加载中请稍等...

一种基于强化学习的指挥智能体控制方法

参考文献7

二级参考文献50

共引文献25

相关作者

相关机构

相关主题

浏览历史