期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
聚类与信息共享的多智能体深度强化学习协同控制交通灯
1
作者
杜同春
王波
+2 位作者
程浩然
罗乐
曾能民
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第2期538-545,共8页
该文提出一种适用于多路口交通灯实时控制的多智能体深度循环Q-网络(MADRQN),目的是提高多个路口的联合控制效果。该方法将交通灯控制建模成马尔可夫决策过程,将每个路口的控制器作为智能体,根据位置和观测信息对智能体聚类,然后在聚类...
该文提出一种适用于多路口交通灯实时控制的多智能体深度循环Q-网络(MADRQN),目的是提高多个路口的联合控制效果。该方法将交通灯控制建模成马尔可夫决策过程,将每个路口的控制器作为智能体,根据位置和观测信息对智能体聚类,然后在聚类内部进行信息共享和中心化训练,并在每个训练过程结束时将评价值最高的值函数网络参数分享给其它智能体。在城市交通仿真软件(SUMO)下的仿真实验结果表明,所提方法能够减少通信的数据量,使得智能体之间的信息共享和中心化训练更加可行和高效,车辆平均等待时长少于当前最优的基于多智能体深度强化学习的交通灯控制方法,能够有效地缓解交通拥堵。
展开更多
关键词
交通信号灯协同控制
集中训练分散执行
强化学习智能体聚类
生长型神经气
深度循环
q
网络
下载PDF
职称材料
基于DRQN的视觉SLAM参数自适应调整
2
作者
陈青梅
秦进
+2 位作者
黄仁婧
崔虎
黄初华
《计算机工程与设计》
北大核心
2022年第11期3235-3242,共8页
为解决传统视觉SLAM算法中的参数调整问题,提出一种基于深度循环Q网络的视觉SLAM参数自适应调整方法。筛选视觉SLAM参数构建动作空间;采用地标点的协方差矩阵描述视觉定位的不确定性,用地标点的不确定性构建奖励函数;参数智能体通过ε-g...
为解决传统视觉SLAM算法中的参数调整问题,提出一种基于深度循环Q网络的视觉SLAM参数自适应调整方法。筛选视觉SLAM参数构建动作空间;采用地标点的协方差矩阵描述视觉定位的不确定性,用地标点的不确定性构建奖励函数;参数智能体通过ε-greedy策略选择Q值最大的动作作用于视觉SLAM环境,根据环境的反馈更新网络参数。EuRoC和TUM-VI数据集上的实验结果表明,该方法提高了室内场景下的位姿轨迹精度,避免了复杂的参数调整过程。
展开更多
关键词
视觉SLAM
深度循环
q
网络
ε-greedy策略
不确定度
参数自适应调整
下载PDF
职称材料
基于强化学习的改进NSGA-Ⅱ算法的城市快速路入口匝道控制
3
作者
陈娟
郭琦
《上海大学学报(自然科学版)》
CAS
CSCD
北大核心
2023年第4期666-680,共15页
为了缓解城市快速路拥堵和尾气排放问题,提出了基于竞争结构和深度循环Q网络的改进非支配排序遗传算法(non-dominated sorting genetic algorithm Ⅱ based on dueling deep recurrent Q network, DRQN-NSGA-Ⅱ).该算法结合了基于竞争...
为了缓解城市快速路拥堵和尾气排放问题,提出了基于竞争结构和深度循环Q网络的改进非支配排序遗传算法(non-dominated sorting genetic algorithm Ⅱ based on dueling deep recurrent Q network, DRQN-NSGA-Ⅱ).该算法结合了基于竞争结构的深度Q网络(dueling deep Q network, Dueling DQN)、深度循环Q网络(deep recurrent Q network, DRQN)和NSGA-Ⅱ算法,将Dueling DRQN-NSGA-Ⅱ算法用于匝道控制问题.除了考虑匝道车辆汇入以提高快速路通行效率外,还考虑了环境和能源指标,将尾气排放和燃油消耗作为评价指标.除了与无控制情况及其他算法进行比较之外, Dueling DRQN-NSGA-Ⅱ还与NSGA-Ⅱ算法进行了比较.实验结果表明:与无控制情况相比,本算法能有效改善路网通行效率、缓解环境污染、减少能源损耗;相对于无控制情况,总花费时间(total time spent, TTS)减少了16.14%,总尾气排放(total emissions, TE)减少了9.56%,总燃油消耗(total fuel consumption, TF)得到了43.49%的改善.
展开更多
关键词
匝道控制
基于竞争结构的深度
q
网络
深度循环
q
网络
非支配排序遗传算法
下载PDF
职称材料
题名
聚类与信息共享的多智能体深度强化学习协同控制交通灯
1
作者
杜同春
王波
程浩然
罗乐
曾能民
机构
安徽师范大学计算机与信息学院
哈尔滨工程大学经济管理学院
出处
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第2期538-545,共8页
文摘
该文提出一种适用于多路口交通灯实时控制的多智能体深度循环Q-网络(MADRQN),目的是提高多个路口的联合控制效果。该方法将交通灯控制建模成马尔可夫决策过程,将每个路口的控制器作为智能体,根据位置和观测信息对智能体聚类,然后在聚类内部进行信息共享和中心化训练,并在每个训练过程结束时将评价值最高的值函数网络参数分享给其它智能体。在城市交通仿真软件(SUMO)下的仿真实验结果表明,所提方法能够减少通信的数据量,使得智能体之间的信息共享和中心化训练更加可行和高效,车辆平均等待时长少于当前最优的基于多智能体深度强化学习的交通灯控制方法,能够有效地缓解交通拥堵。
关键词
交通信号灯协同控制
集中训练分散执行
强化学习智能体聚类
生长型神经气
深度循环
q
网络
Keywords
Traffic
light
cooperative
control
Centralized
training
with
decentralized
execution
Reinforcement
learning
agent
cluster
Growing
neural
gas
deep
recurrent
q
-
network
分类号
TN929.5 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于DRQN的视觉SLAM参数自适应调整
2
作者
陈青梅
秦进
黄仁婧
崔虎
黄初华
机构
贵州大学计算机科学与技术学院
出处
《计算机工程与设计》
北大核心
2022年第11期3235-3242,共8页
基金
国家自然科学基金项目(61562009)
贵州省自然科学基金项目(黔科合基础[2019]1088)。
文摘
为解决传统视觉SLAM算法中的参数调整问题,提出一种基于深度循环Q网络的视觉SLAM参数自适应调整方法。筛选视觉SLAM参数构建动作空间;采用地标点的协方差矩阵描述视觉定位的不确定性,用地标点的不确定性构建奖励函数;参数智能体通过ε-greedy策略选择Q值最大的动作作用于视觉SLAM环境,根据环境的反馈更新网络参数。EuRoC和TUM-VI数据集上的实验结果表明,该方法提高了室内场景下的位姿轨迹精度,避免了复杂的参数调整过程。
关键词
视觉SLAM
深度循环
q
网络
ε-greedy策略
不确定度
参数自适应调整
Keywords
visual
SLAM
deep
recurrent
q
-
network
ε-greedy
strategy
uncertainty
parameter
adaptive
adjusting
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于强化学习的改进NSGA-Ⅱ算法的城市快速路入口匝道控制
3
作者
陈娟
郭琦
机构
上海大学悉尼工商学院
出处
《上海大学学报(自然科学版)》
CAS
CSCD
北大核心
2023年第4期666-680,共15页
基金
国家自然科学基金资助项目(61104166)。
文摘
为了缓解城市快速路拥堵和尾气排放问题,提出了基于竞争结构和深度循环Q网络的改进非支配排序遗传算法(non-dominated sorting genetic algorithm Ⅱ based on dueling deep recurrent Q network, DRQN-NSGA-Ⅱ).该算法结合了基于竞争结构的深度Q网络(dueling deep Q network, Dueling DQN)、深度循环Q网络(deep recurrent Q network, DRQN)和NSGA-Ⅱ算法,将Dueling DRQN-NSGA-Ⅱ算法用于匝道控制问题.除了考虑匝道车辆汇入以提高快速路通行效率外,还考虑了环境和能源指标,将尾气排放和燃油消耗作为评价指标.除了与无控制情况及其他算法进行比较之外, Dueling DRQN-NSGA-Ⅱ还与NSGA-Ⅱ算法进行了比较.实验结果表明:与无控制情况相比,本算法能有效改善路网通行效率、缓解环境污染、减少能源损耗;相对于无控制情况,总花费时间(total time spent, TTS)减少了16.14%,总尾气排放(total emissions, TE)减少了9.56%,总燃油消耗(total fuel consumption, TF)得到了43.49%的改善.
关键词
匝道控制
基于竞争结构的深度
q
网络
深度循环
q
网络
非支配排序遗传算法
Keywords
ramp
control
dueling
deep
q
network
(Dueling
D
q
N)
deep
recurrent
q
network
(DR
q
N)
non-dominated
sorting
genetic
algorithm
Ⅱ(NSGA-Ⅱ)
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
聚类与信息共享的多智能体深度强化学习协同控制交通灯
杜同春
王波
程浩然
罗乐
曾能民
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
基于DRQN的视觉SLAM参数自适应调整
陈青梅
秦进
黄仁婧
崔虎
黄初华
《计算机工程与设计》
北大核心
2022
0
下载PDF
职称材料
3
基于强化学习的改进NSGA-Ⅱ算法的城市快速路入口匝道控制
陈娟
郭琦
《上海大学学报(自然科学版)》
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部