期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
未知环境下基于Dueling DQN的无人机路径规划研究
1
作者
赵恬恬
孔建国
+1 位作者
梁海军
刘晨宇
《现代计算机》
2024年第5期37-43,共7页
为有效解决无人机在未知环境下的路径规划问题,提出一种基于Dueling DQN的路径规划方法。首先,在DQN的基础上,引入对抗网络架构,从而更好地提高成功率;其次,设计状态空间并定义离散化的动作和适当的奖励函数以引导无人机学习最优路径;...
为有效解决无人机在未知环境下的路径规划问题,提出一种基于Dueling DQN的路径规划方法。首先,在DQN的基础上,引入对抗网络架构,从而更好地提高成功率;其次,设计状态空间并定义离散化的动作和适当的奖励函数以引导无人机学习最优路径;最后在仿真环境中对DQN和Dueling DQN展开训练,结果表明:①Dueling DQN能规划出未知环境下从初始点到目标点的无碰撞路径,且能获得更高的奖励值;②经过50000次训练,Dueling DQN的成功率比DQN提高17.71%,碰撞率减少1.57%,超过最长步长率降低16.14%。
展开更多
关键词
无人机
路径规划
深度强化学习
dueling
dqn
算法
下载PDF
职称材料
基于深度强化学习的AUV路径规划研究
2
作者
房鹏程
周焕银
董玫君
《机床与液压》
北大核心
2024年第9期134-141,共8页
针对三维海洋环境水下自主航行器(AUV)路径规划问题,传统的路径规划算法在三维空间中搜索时间长,对环境的依赖性强,且环境发生改变时,需要重新规划路径,不满足实时性要求。为了使AUV能够自主学习场景并做出决策,提出一种改进的Dueling ...
针对三维海洋环境水下自主航行器(AUV)路径规划问题,传统的路径规划算法在三维空间中搜索时间长,对环境的依赖性强,且环境发生改变时,需要重新规划路径,不满足实时性要求。为了使AUV能够自主学习场景并做出决策,提出一种改进的Dueling DQN算法,更改了传统的网络结构以适应AUV路径规划场景。此外,针对路径规划在三维空间中搜寻目标点困难的问题,在原有的优先经验回放池基础上提出了经验蒸馏回放池,使智能体学习失败经验从而提高模型前期的收敛速度和稳定性。仿真实验结果表明:所提出的算法比传统路径规划算法具有更高的实时性,规划路径更短,在收敛速度和稳定性方面都优于标准的DQN算法。
展开更多
关键词
自主水下航行器(AUV)
三维路径规划
深度强化学习
dueling
dqn
算法
下载PDF
职称材料
基于改进D3QN的煤炭码头卸车排产智能优化方法
3
作者
秦保新
张羽霄
+2 位作者
吴思锐
曹卫冲
李湛
《系统仿真学报》
CAS
CSCD
北大核心
2024年第3期770-781,共12页
采用智能化决策排产能够提高大型港口的运营效率,是人工智能技术在智慧港口场景落地的重要研究方向之一。针对煤炭码头卸车智能排产任务,将其抽象为马尔可夫序列决策问题。建立了该问题的深度强化学习模型,并针对该模型中动作空间维度...
采用智能化决策排产能够提高大型港口的运营效率,是人工智能技术在智慧港口场景落地的重要研究方向之一。针对煤炭码头卸车智能排产任务,将其抽象为马尔可夫序列决策问题。建立了该问题的深度强化学习模型,并针对该模型中动作空间维度高且可行动作稀疏的特点,提出一种改进的D3QN算法,实现了卸车排产调度决策的智能优化。仿真结果表明,对于同一组随机任务序列,优化后的排产策略相比随机策略实现了明显的效率提升。同时,将训练好的排产策略应用于随机生成的新任务序列,可实现5%~7%的排产效率提升,表明该优化方法具有较好的泛化能力。此外,随着决策模型复杂度的提升,传统启发式优化算法面临建模困难、求解效率低等突出问题。所提算法为该类问题的研究提供了一种新思路,有望实现深度强化学习智能决策在港口排产任务中的更广泛应用。
展开更多
关键词
码头卸车排产
调度策略优化
智能决策
深度强化学习
dueling
Double
dqn
算法
下载PDF
职称材料
题名
未知环境下基于Dueling DQN的无人机路径规划研究
1
作者
赵恬恬
孔建国
梁海军
刘晨宇
机构
中国民用航空飞行学院空中交通管理学院
出处
《现代计算机》
2024年第5期37-43,共7页
基金
四川省科技计划资助项目(2022YFG0210)
中央高校基本科研业务费专项资金资助(PHD2023-035、ZHMH2022-009)。
文摘
为有效解决无人机在未知环境下的路径规划问题,提出一种基于Dueling DQN的路径规划方法。首先,在DQN的基础上,引入对抗网络架构,从而更好地提高成功率;其次,设计状态空间并定义离散化的动作和适当的奖励函数以引导无人机学习最优路径;最后在仿真环境中对DQN和Dueling DQN展开训练,结果表明:①Dueling DQN能规划出未知环境下从初始点到目标点的无碰撞路径,且能获得更高的奖励值;②经过50000次训练,Dueling DQN的成功率比DQN提高17.71%,碰撞率减少1.57%,超过最长步长率降低16.14%。
关键词
无人机
路径规划
深度强化学习
dueling
dqn
算法
Keywords
UAV
path
planning
deep
reinforcement
learning
dueling
dqn
algorithm
分类号
V279 [航空宇航科学与技术—飞行器设计]
V249
下载PDF
职称材料
题名
基于深度强化学习的AUV路径规划研究
2
作者
房鹏程
周焕银
董玫君
机构
东华理工大学机械与电子工程学院
出处
《机床与液压》
北大核心
2024年第9期134-141,共8页
基金
国家自然科学基金项目(62063001)
江西省自然科学基金项目(20224ACB204022)。
文摘
针对三维海洋环境水下自主航行器(AUV)路径规划问题,传统的路径规划算法在三维空间中搜索时间长,对环境的依赖性强,且环境发生改变时,需要重新规划路径,不满足实时性要求。为了使AUV能够自主学习场景并做出决策,提出一种改进的Dueling DQN算法,更改了传统的网络结构以适应AUV路径规划场景。此外,针对路径规划在三维空间中搜寻目标点困难的问题,在原有的优先经验回放池基础上提出了经验蒸馏回放池,使智能体学习失败经验从而提高模型前期的收敛速度和稳定性。仿真实验结果表明:所提出的算法比传统路径规划算法具有更高的实时性,规划路径更短,在收敛速度和稳定性方面都优于标准的DQN算法。
关键词
自主水下航行器(AUV)
三维路径规划
深度强化学习
dueling
dqn
算法
Keywords
autonomous
underwater
vehicles(AUV)
3D
path
planning
deep
reinforcement
learning
dueling
dqn
algorithm
分类号
U675.73 [交通运输工程—船舶及航道工程]
下载PDF
职称材料
题名
基于改进D3QN的煤炭码头卸车排产智能优化方法
3
作者
秦保新
张羽霄
吴思锐
曹卫冲
李湛
机构
国能(天津)港务有限责任公司
哈尔滨工业大学航天学院智能控制与系统研究所
鹏城实验室数学与理论部
出处
《系统仿真学报》
CAS
CSCD
北大核心
2024年第3期770-781,共12页
基金
国家自然科学基金(62273122)。
文摘
采用智能化决策排产能够提高大型港口的运营效率,是人工智能技术在智慧港口场景落地的重要研究方向之一。针对煤炭码头卸车智能排产任务,将其抽象为马尔可夫序列决策问题。建立了该问题的深度强化学习模型,并针对该模型中动作空间维度高且可行动作稀疏的特点,提出一种改进的D3QN算法,实现了卸车排产调度决策的智能优化。仿真结果表明,对于同一组随机任务序列,优化后的排产策略相比随机策略实现了明显的效率提升。同时,将训练好的排产策略应用于随机生成的新任务序列,可实现5%~7%的排产效率提升,表明该优化方法具有较好的泛化能力。此外,随着决策模型复杂度的提升,传统启发式优化算法面临建模困难、求解效率低等突出问题。所提算法为该类问题的研究提供了一种新思路,有望实现深度强化学习智能决策在港口排产任务中的更广泛应用。
关键词
码头卸车排产
调度策略优化
智能决策
深度强化学习
dueling
Double
dqn
算法
Keywords
terminal
unloading
scheduling
scheduling
strategy
optimization
intelligent
decision-making
deep
reinforcement
learning
dueling
Double
dqn
algorithm
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
TP278 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
未知环境下基于Dueling DQN的无人机路径规划研究
赵恬恬
孔建国
梁海军
刘晨宇
《现代计算机》
2024
0
下载PDF
职称材料
2
基于深度强化学习的AUV路径规划研究
房鹏程
周焕银
董玫君
《机床与液压》
北大核心
2024
0
下载PDF
职称材料
3
基于改进D3QN的煤炭码头卸车排产智能优化方法
秦保新
张羽霄
吴思锐
曹卫冲
李湛
《系统仿真学报》
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部