检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到6篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于LSTM深度强化学习的UAV反应式避障方法被引量：5: 1; 作者杨秀霞高恒杰 +1 位作者刘伟张毅《飞行力学》 CSCD 北大核心 2022年第4期47-55,62,共10页; 针对传统避障方法难以应用于复杂多障碍的不确定环境问题,提出基于长短时记忆神经网络(LSTM)和深度确定性策略梯度算法(DDPG)的UAV反应式避障方法。首先,采用基于速度障碍法的DDPG避障方法给出了UAV在动态环境中的避障策略;其次,引入LST... 展开更多; 关键词无人机长短时记忆神经网路深度确定性策略梯度算法反应式避障不确定环境; 原文传递

基于改进深度Q网络的多UAV队形变换策略: 2; 作者李洁菁卢宗汉 +1 位作者高恒杰戴邵武《舰船电子工程》 2024年第6期22-29,共8页; 针对传统多UAV编队队形变换方法存在系统结构复杂,计算量大等问题,提出基于改进DQN算法的多UAV队形变换方法。首先,提出基于DQN的多UAV队形变换方法,将多UAV队形变换问题建模为马尔可夫决策过程;其次,利用动态目标点最优分配算法(DTA)... 展开更多; 关键词 DQN算法动态目标点分配互惠速度障碍法无人飞行器队形变换; 下载PDF 职称材料

基于阶段Q学习算法的机器人路径规划被引量：5: 3; 作者杨秀霞高恒杰 +1 位作者刘伟张毅《兵器装备工程学报》 CSCD 北大核心 2022年第5期197-203,共7页; 针对传统Q学习存在收敛速度慢、学习效率低等问题,提出一种基于阶段Q学习的机器人路径规划算法。首先基于环境规模设置每阶段探索步长,减少搜索重复度;其次设置奖励池和奖励阈值确保每一阶段为最优探索;最后组合阶段最优路径为全局最优... 展开更多; 关键词强化学习机器人路径规划 Q学习分阶段最优探索; 下载PDF 职称材料

库存物资重点管理法——ABC分析法被引量：3: 4; 作者高恒杰《小氮肥》 2003年第8期19-20,共2页; 关键词库存物资重点管理法 ABC分析法分类管理; 下载PDF 职称材料

RVO-DDPG算法在多UAV集结航路规划的应用: 5; 作者杨秀霞高恒杰 +1 位作者刘伟张毅《计算机工程与应用》 CSCD 北大核心 2023年第1期308-316,共9页; 针对传统智能优化算法处理不确定复杂环境下多UAV集结航路规划存在计算量大、耗时长的问题,提出了一种基于互惠速度障碍法(reciprocal velocity obstacle,RVO)的深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法。引... 展开更多; 关键词无人机航路规划编队集结深度确定性策略梯度算法(DDPG) 互惠速度障碍法(RVO); 下载PDF 职称材料

板式换热器的失效形式及防范措施: 6; 作者高恒杰张长乐《小氮肥》 2002年第3期21-21,共1页; 关键词板式换热器失效形式防范措施密封结垢酸洗; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部