期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多维时空层递的交通信号分布式强化学习方法
1
作者
王福建
范
诚
睿
+2 位作者
周斌
封春房
马东方
《中国公路学报》
EI
CAS
CSCD
北大核心
2024年第7期250-263,共14页
信号控制是智能交通系统的重要组成部分,融合人工智能等新技术的信号优化逐渐成为研究热点,具体策略可分为集中式和分布式2类。分布式控制的轻量化状态空间可以有效避免深度强化学习中的维度灾难问题,近年来愈发受到研究者关注。现有的...
信号控制是智能交通系统的重要组成部分,融合人工智能等新技术的信号优化逐渐成为研究热点,具体策略可分为集中式和分布式2类。分布式控制的轻量化状态空间可以有效避免深度强化学习中的维度灾难问题,近年来愈发受到研究者关注。现有的分布式协同控制策略多以图卷积网络或图注意力网络为基础挖掘路口的耦合关系,但对路口状态之间的时空关联性随时变交通流的动态变化特征考虑不足。为此,首先基于门控循环神经网络建立时变交通流特征的提取方法,确定多路口时空关联度;其次采用图注意力机制搭建区域时空特征的层递融合算法,以路口重要度为指标实现状态空间重构;再次,采用全连接理念面向自适应相位相序结构构造路口通行权切换决策模型。最后,基于实际路网仿真测试了模型控制效果。结果表明:相比于传统分布式强化学习算法,该模型在低、中、高3种流量下的车辆平均排队长度分别降低了13.74%、5.03%、6.30%以上,表明了新方法的潜在应用价值。
展开更多
关键词
交通工程
智能交通
深度强化学习
信号控制
多角度时空学习
层递学习
原文传递
题名
基于多维时空层递的交通信号分布式强化学习方法
1
作者
王福建
范
诚
睿
周斌
封春房
马东方
机构
浙江大学建筑工程学院
浙江大学工程师学院
公安部交通管理科学研究所
浙江大学海洋学院
出处
《中国公路学报》
EI
CAS
CSCD
北大核心
2024年第7期250-263,共14页
基金
国家自然科学基金项目(52172334)
浙江省智能交通工程技术研究中心开放课题项目(2023ERCITZJ-KF09)
浙江省教育厅科研项目(Y202353473)。
文摘
信号控制是智能交通系统的重要组成部分,融合人工智能等新技术的信号优化逐渐成为研究热点,具体策略可分为集中式和分布式2类。分布式控制的轻量化状态空间可以有效避免深度强化学习中的维度灾难问题,近年来愈发受到研究者关注。现有的分布式协同控制策略多以图卷积网络或图注意力网络为基础挖掘路口的耦合关系,但对路口状态之间的时空关联性随时变交通流的动态变化特征考虑不足。为此,首先基于门控循环神经网络建立时变交通流特征的提取方法,确定多路口时空关联度;其次采用图注意力机制搭建区域时空特征的层递融合算法,以路口重要度为指标实现状态空间重构;再次,采用全连接理念面向自适应相位相序结构构造路口通行权切换决策模型。最后,基于实际路网仿真测试了模型控制效果。结果表明:相比于传统分布式强化学习算法,该模型在低、中、高3种流量下的车辆平均排队长度分别降低了13.74%、5.03%、6.30%以上,表明了新方法的潜在应用价值。
关键词
交通工程
智能交通
深度强化学习
信号控制
多角度时空学习
层递学习
Keywords
traffic engineering
intelligent transportation
deep reinforcement learning
traffic signal control
multi-perspective spatio-temporal learning
hierarchical learning
分类号
U491.5 [交通运输工程—交通运输规划与管理]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于多维时空层递的交通信号分布式强化学习方法
王福建
范
诚
睿
周斌
封春房
马东方
《中国公路学报》
EI
CAS
CSCD
北大核心
2024
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部