期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于考虑状态分布的深度确定性策略梯度算法的端到端自动驾驶策略
被引量:
5
1
作者
王庭晗
罗禹贡
+1 位作者
刘金鑫
李克强
《清华大学学报(自然科学版)》
CSCD
北大核心
2021年第9期881-888,共8页
端到端方法是实现自动驾驶的方法之一,而自动驾驶的场景较为丰富,不同场景的特征差别较大,这使得基于强化学习的端到端自动驾驶方法训练时的随机性衰减速度难以确定,若衰减过快,在面对新场景时无法获得较好的自动驾驶效果,反之则会使得...
端到端方法是实现自动驾驶的方法之一,而自动驾驶的场景较为丰富,不同场景的特征差别较大,这使得基于强化学习的端到端自动驾驶方法训练时的随机性衰减速度难以确定,若衰减过快,在面对新场景时无法获得较好的自动驾驶效果,反之则会使得算法难以快速收敛。针对这一问题,该文提出了一种基于输入状态分布筛选的随机策略和经验回放方法,将当前输入的状态数据和已保存的状态数据之间的距离进行对比,根据不同的距离选择不同的随机策略参数,同时在经验回放时提高出现频率较低场景的回放概率。仿真结果表明:该算法在训练后期面对与前期数据分布差异较大的场景时仍有足够的探索能力,提高了基于深度确定性策略梯度算法的端到端自动驾驶策略在全新工况下的车道保持能力。
展开更多
关键词
端到端自动驾驶
强化学习
随机策略
经验回放
原文传递
端到端自动驾驶方法的发展现状
2
作者
王庭晗
罗禹贡
李克强
《中国基础科学》
2019年第S01期36-46,F0002,共12页
端到端自动驾驶方法作为卖现自动驾驶的方法之-',相对于“感知-决策-栓制”方法,有着思路简单、感知信息利用克分、工况过渡平滑的优点,目裔越来越多的学者对其开展研老。本丈青先讨论了卖现自动驾驶的两种方法;第二,呵顾了端到端...
端到端自动驾驶方法作为卖现自动驾驶的方法之-',相对于“感知-决策-栓制”方法,有着思路简单、感知信息利用克分、工况过渡平滑的优点,目裔越来越多的学者对其开展研老。本丈青先讨论了卖现自动驾驶的两种方法;第二,呵顾了端到端旨动驾驶方法发展的易史幷将其分为3个阶段,即1989-2005年、2006-2015年和2016年至今;第三,总体概述了研老现状,卖现算法主要为谦度神经网络和深度增强学习等,并对基于不同算法的相关研老进行了详细论述.;最后,对端到端自动驾飒研老进行了总结。
展开更多
关键词
端到端自动驾驶方法
发展现状
深度神经网络
深度增强学习
原文传递
题名
基于考虑状态分布的深度确定性策略梯度算法的端到端自动驾驶策略
被引量:
5
1
作者
王庭晗
罗禹贡
刘金鑫
李克强
机构
清华大学汽车安全与节能国家重点实验室
出处
《清华大学学报(自然科学版)》
CSCD
北大核心
2021年第9期881-888,共8页
基金
国家自然科学基金项目(51975310)
国家重点研发计划(2016YFB0100905)。
文摘
端到端方法是实现自动驾驶的方法之一,而自动驾驶的场景较为丰富,不同场景的特征差别较大,这使得基于强化学习的端到端自动驾驶方法训练时的随机性衰减速度难以确定,若衰减过快,在面对新场景时无法获得较好的自动驾驶效果,反之则会使得算法难以快速收敛。针对这一问题,该文提出了一种基于输入状态分布筛选的随机策略和经验回放方法,将当前输入的状态数据和已保存的状态数据之间的距离进行对比,根据不同的距离选择不同的随机策略参数,同时在经验回放时提高出现频率较低场景的回放概率。仿真结果表明:该算法在训练后期面对与前期数据分布差异较大的场景时仍有足够的探索能力,提高了基于深度确定性策略梯度算法的端到端自动驾驶策略在全新工况下的车道保持能力。
关键词
端到端自动驾驶
强化学习
随机策略
经验回放
Keywords
end
-to-
end
self
-
driving
reinforcement
learning
random
policy
experience
replay
分类号
U469.79 [机械工程—车辆工程]
原文传递
题名
端到端自动驾驶方法的发展现状
2
作者
王庭晗
罗禹贡
李克强
机构
清华大学汽车安全与节能国家重点实验室
出处
《中国基础科学》
2019年第S01期36-46,F0002,共12页
基金
国家重点研发计划项目(2016YFB0100905)。
文摘
端到端自动驾驶方法作为卖现自动驾驶的方法之-',相对于“感知-决策-栓制”方法,有着思路简单、感知信息利用克分、工况过渡平滑的优点,目裔越来越多的学者对其开展研老。本丈青先讨论了卖现自动驾驶的两种方法;第二,呵顾了端到端旨动驾驶方法发展的易史幷将其分为3个阶段,即1989-2005年、2006-2015年和2016年至今;第三,总体概述了研老现状,卖现算法主要为谦度神经网络和深度增强学习等,并对基于不同算法的相关研老进行了详细论述.;最后,对端到端自动驾飒研老进行了总结。
关键词
端到端自动驾驶方法
发展现状
深度神经网络
深度增强学习
Keywords
end
-to-
end
self
-
driving
development
status
deep
neural
network
deep
reinforcement
learning
分类号
TP273 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于考虑状态分布的深度确定性策略梯度算法的端到端自动驾驶策略
王庭晗
罗禹贡
刘金鑫
李克强
《清华大学学报(自然科学版)》
CSCD
北大核心
2021
5
原文传递
2
端到端自动驾驶方法的发展现状
王庭晗
罗禹贡
李克强
《中国基础科学》
2019
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部