-
题名面向高密度交通场景的自动驾驶运动规划
- 1
-
-
作者
肖雨微
姚溪子
胡学敏
罗显志
-
机构
湖北大学计算机与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第14期114-122,共9页
-
基金
国家自然科学基金面上项目(62273135)
湖北省自然科学基金(2021CFB460)
+1 种基金
湖北省大学生创新创业训练计划基金(S202210512030,S202110512065)
湖北大学大学生创新创业训练计划基金(X202110512086)。
-
文摘
针对现有自动驾驶运动规划方法在提取状态信息时忽略了周边车辆交互、在高密度交通场景下规划效果不理想的问题,提出了一种联合图神经网络和深度强化学习的运动规划模型。基于图神经网络提出了一种自动驾驶车辆的交互式特征提取方法,再基于双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法从交互式特征中预测车辆的动作,从而实现运动规划。将所提模型与目前自动驾驶运动规划模型LSTM+TD3、TD3及深度确定性策略梯度(deep deterministic policy gradient,DDPG)模型进行对比,在PGDrive驾驶模拟器中进行训练和测试的实验结果表明,在高密度交通场景中,所提方法的训练奖励值和测试成功率相比于对比方法提升了约36%、43%、23%及13、19、53个百分点。表明所提方法能有效解决自动驾驶周边车辆的交互式信息感知问题,更好地实现自动驾驶运动规划。
-
关键词
自动驾驶
运动规划
交互式特征
图神经网络
强化学习
-
Keywords
autonomous driving
motion planning
interactive feature
graph neural network
reinforcement learning
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于分层强化学习的雅达利游戏决策算法
- 2
-
-
作者
周婉
姚溪子
肖雨薇
刘艳芳
-
机构
湖北大学计算机与信息工程学院
-
出处
《信息与电脑》
2022年第20期97-99,共3页
-
基金
湖北省大学生创新创业训练计划基金资助项目(项目编号:202110512065)
湖北大学大学生创新创业训练计划基金资助项目(项目编号:202110512086)。
-
文摘
随着机器学习的发展,深度强化学习凭借着能够对大规模输入进行自主探索试错从而学习到最优策略的优势成为研究热点。然而,传统的强化学习在针对复杂的决策任务时面临着维度灾难,并且无法解决稀疏奖励问题。文章提出一种融合Manager-Worker层次结构与强化学习经典算法深度Q网络(DeepQNetwork,DQN)的分层强化学习算法,在雅达利游戏环境中训练,使智能体能够在“环境-动作-反馈”中学习最优策略。实验表明,该方法在雅达利游戏的复杂决策中更有效,并且超过人类玩家的平均水平。
-
关键词
分层强化学习(HRL)
深度Q网络(DQN)
雅达利游戏
-
Keywords
Hierarchical Reinforcement Learning(HRL)
Deep Q Network(DQN)
Atari game
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
-