期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于时空依赖关系多智能体强化学习的多路口交通信号协同控制方法
1
作者 王兆瑞 岩延 张宝贤 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2024年第3期398-410,共13页
面对日益严重的交通拥堵现象,智能交通信号控制已成为提升城市道路网络性能必不可少的手段。提出一种基于时空依赖关系多智能体强化学习算法的多路口交通信号控制方法STLight(spatiotemporal traffic light control)。通过基于注意力机... 面对日益严重的交通拥堵现象,智能交通信号控制已成为提升城市道路网络性能必不可少的手段。提出一种基于时空依赖关系多智能体强化学习算法的多路口交通信号控制方法STLight(spatiotemporal traffic light control)。通过基于注意力机制的时空依赖模块STDM(spatiotemporal dependent module),STLight可将初始交通观测数据提取为时空特征,以有效捕获各交叉路口间的时空依赖关系。此外,基于所提取的时空特征,STLight在基于集中训练分散执行框架的多智能体强化学习算法基础之上进一步为各个智能体引入全局时空信息,从而进一步提升多智能体之间的协作能力。实验结果表明,STLight在提升城市道路网络的性能方面具有显著的优势,有助于缓解当前大规模城市道路网络的交通拥堵问题。 展开更多
关键词 多智能体强化学习 多路交通信号控制 注意力机制 马尔可夫博弈 时空依赖
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部