期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向无人驾驶时空同步约束制导的安全强化学习 被引量:3
1
作者 王金永 黄志球 +3 位作者 杨德艳 Xiaowei Huang 祝义 高洋 《计算机研究与发展》 EI CSCD 北大核心 2021年第12期2585-2603,共19页
无人驾驶系统综合了软件和硬件复杂的交互过程,在系统设计阶段,形式化方法可以保证系统满足逻辑规约和安全需求;在系统运行阶段,深度强化学习被广泛应用于无人驾驶系统决策中.然而,在面对没有经验的场景和复杂决策任务时,基于黑盒的深... 无人驾驶系统综合了软件和硬件复杂的交互过程,在系统设计阶段,形式化方法可以保证系统满足逻辑规约和安全需求;在系统运行阶段,深度强化学习被广泛应用于无人驾驶系统决策中.然而,在面对没有经验的场景和复杂决策任务时,基于黑盒的深度强化学习系统并不能保证系统的安全性和复杂任务奖励函数设置的可解释性.为此提出了一种形式化时空同步约束制导的安全强化学习方法.首先,提出了一种形式化时空同步约束规约语言,接近自然语言的安全需求规约使奖励函数的设置更具有解释性.其次,展示了时空同步自动机和状态动作空间迁移系统,保证强化学习的状态行为策略更加安全.然后,提出了结合形式化时空约束制导的安全强化学习方法.最后,通过无人驾驶汽车在高速场景变道超车的案例,验证所提方法的有效性. 展开更多
关键词 时空同步约束 形式化规约 安全强化学习 时序差分 智能交通仿真 无人驾驶安全
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部