期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习的车辆自主避撞决策控制模型
被引量:
7
1
作者
李文礼
张友松
+2 位作者
韩迪
钱洪
石晓辉
《汽车安全与节能学报》
CAS
CSCD
北大核心
2021年第2期201-209,共9页
为提高车辆对行驶环境的自我学习和决策能力,提出了一种基于深度确定性策略梯度(DDPG)的车辆自主避撞决策控制模型。基于Markov决策过程的强化学习理论和车辆纵向运动学特性,设计了决策所需目标对象及自车信息的状态空间和自车减速度的...
为提高车辆对行驶环境的自我学习和决策能力,提出了一种基于深度确定性策略梯度(DDPG)的车辆自主避撞决策控制模型。基于Markov决策过程的强化学习理论和车辆纵向运动学特性,设计了决策所需目标对象及自车信息的状态空间和自车减速度的动作空间,以安全性、舒适性和效率因素为多目标奖励函数的端到端的车辆自主避撞决策模型。利用Matlab/Simulink构建的DDPG算法与交通环境的交互模型,通过了前车静止(CCRs)和前车制动(CCRb)场景测试。结果表明:本决策算法具有很好的收敛性,引入加速度和冲击度的极限值,在实现车辆有效避撞的同时,兼顾乘坐舒适性,且性能优于模糊控制。
展开更多
关键词
车辆安全
自主避撞
深度确定性策略梯度(DDPG)
控制模型
多目标奖励函数
下载PDF
职称材料
题名
基于深度强化学习的车辆自主避撞决策控制模型
被引量:
7
1
作者
李文礼
张友松
韩迪
钱洪
石晓辉
机构
重庆理工大学汽车零部件先进制造技术教育部重点实验室
出处
《汽车安全与节能学报》
CAS
CSCD
北大核心
2021年第2期201-209,共9页
基金
重庆理工大学研究生创新项目资助(clgycx20202021)
重庆市巴南区科技成果转化及产业化专项(2020TJZ022)。
文摘
为提高车辆对行驶环境的自我学习和决策能力,提出了一种基于深度确定性策略梯度(DDPG)的车辆自主避撞决策控制模型。基于Markov决策过程的强化学习理论和车辆纵向运动学特性,设计了决策所需目标对象及自车信息的状态空间和自车减速度的动作空间,以安全性、舒适性和效率因素为多目标奖励函数的端到端的车辆自主避撞决策模型。利用Matlab/Simulink构建的DDPG算法与交通环境的交互模型,通过了前车静止(CCRs)和前车制动(CCRb)场景测试。结果表明:本决策算法具有很好的收敛性,引入加速度和冲击度的极限值,在实现车辆有效避撞的同时,兼顾乘坐舒适性,且性能优于模糊控制。
关键词
车辆安全
自主避撞
深度确定性策略梯度(DDPG)
控制模型
多目标奖励函数
Keywords
vehicle
safety
autonomous
collision
avoidance
deep
deterministic
policy
gradient(DDPG)
control
model
multi
-
objective
reward
function
分类号
U463.6 [机械工程—车辆工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习的车辆自主避撞决策控制模型
李文礼
张友松
韩迪
钱洪
石晓辉
《汽车安全与节能学报》
CAS
CSCD
北大核心
2021
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部