期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向高密度交通场景的自动驾驶运动规划
1
作者 肖雨微 +1 位作者 胡学敏 罗显志 《计算机工程与应用》 CSCD 北大核心 2024年第14期114-122,共9页
针对现有自动驾驶运动规划方法在提取状态信息时忽略了周边车辆交互、在高密度交通场景下规划效果不理想的问题,提出了一种联合图神经网络和深度强化学习的运动规划模型。基于图神经网络提出了一种自动驾驶车辆的交互式特征提取方法,再... 针对现有自动驾驶运动规划方法在提取状态信息时忽略了周边车辆交互、在高密度交通场景下规划效果不理想的问题,提出了一种联合图神经网络和深度强化学习的运动规划模型。基于图神经网络提出了一种自动驾驶车辆的交互式特征提取方法,再基于双延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法从交互式特征中预测车辆的动作,从而实现运动规划。将所提模型与目前自动驾驶运动规划模型LSTM+TD3、TD3及深度确定性策略梯度(deep deterministic policy gradient,DDPG)模型进行对比,在PGDrive驾驶模拟器中进行训练和测试的实验结果表明,在高密度交通场景中,所提方法的训练奖励值和测试成功率相比于对比方法提升了约36%、43%、23%及13、19、53个百分点。表明所提方法能有效解决自动驾驶周边车辆的交互式信息感知问题,更好地实现自动驾驶运动规划。 展开更多
关键词 自动驾驶 运动规划 交互式特征 图神经网络 强化学习
下载PDF
基于分层强化学习的雅达利游戏决策算法
2
作者 周婉 +1 位作者 肖雨薇 刘艳芳 《信息与电脑》 2022年第20期97-99,共3页
随着机器学习的发展,深度强化学习凭借着能够对大规模输入进行自主探索试错从而学习到最优策略的优势成为研究热点。然而,传统的强化学习在针对复杂的决策任务时面临着维度灾难,并且无法解决稀疏奖励问题。文章提出一种融合Manager-Wor... 随着机器学习的发展,深度强化学习凭借着能够对大规模输入进行自主探索试错从而学习到最优策略的优势成为研究热点。然而,传统的强化学习在针对复杂的决策任务时面临着维度灾难,并且无法解决稀疏奖励问题。文章提出一种融合Manager-Worker层次结构与强化学习经典算法深度Q网络(DeepQNetwork,DQN)的分层强化学习算法,在雅达利游戏环境中训练,使智能体能够在“环境-动作-反馈”中学习最优策略。实验表明,该方法在雅达利游戏的复杂决策中更有效,并且超过人类玩家的平均水平。 展开更多
关键词 分层强化学习(HRL) 深度Q网络(DQN) 雅达利游戏
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部