期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于博弈论的右转无信号交叉口行人行为模拟
1
作者
李文礼
张祎楠
+1 位作者
石晓辉
王梦昕
《机械工程学报》
EI
CAS
CSCD
北大核心
2024年第10期86-101,共16页
为逼真模拟行人-车辆交互的真实交通场景,融合博弈理论和数据驱动的思想,在逆强化学习和博弈论的基础上提出博弈—深度最大熵逆强化学习算法(Game-deep max entropy inverse reinforcement learning,G-DMIRL)。将行人建模为智能体,通过...
为逼真模拟行人-车辆交互的真实交通场景,融合博弈理论和数据驱动的思想,在逆强化学习和博弈论的基础上提出博弈—深度最大熵逆强化学习算法(Game-deep max entropy inverse reinforcement learning,G-DMIRL)。将行人建模为智能体,通过真实的行人-车辆交互轨迹获取不同博弈决策下的行人的奖励函数,并推断行人-车辆交互的博弈机制,利用获取的奖励函数和动作策略开发出行人行为模拟模型。仿真结果表明,开发的模型在有限状态下能够准确地模拟出不同决策下行人的行为动作,建立的行人-车辆交通场景能够为自动驾驶汽车的识别、预测与路径规划算法的开发验证提供支撑。
展开更多
关键词
逆强化学习
强化学习
行人-车辆交互
博弈论
右转交叉口
原文传递
群体追逃微分博弈
2
作者
高红伟
孟斌斌
+1 位作者
刘剑
戴照鹏
《运筹学学报(中英文)》
CSCD
北大核心
2024年第3期46-62,共17页
本文以微分博弈和经典的追逃问题为主线,对群体追逃微分博弈的历史发展脉络进行梳理。针对大规模群体追逃问题,从平均场博弈视角出发,阐释了强化学习技术的应用前景。提出探索解决逆向追逃微分博弈的观点,可适用于水下无人舰艇、陆地机...
本文以微分博弈和经典的追逃问题为主线,对群体追逃微分博弈的历史发展脉络进行梳理。针对大规模群体追逃问题,从平均场博弈视角出发,阐释了强化学习技术的应用前景。提出探索解决逆向追逃微分博弈的观点,可适用于水下无人舰艇、陆地机器人以及空中无人机集群等同类场景。区别于其他综述性文章,作者对于俄罗斯以及苏联在本领域发展历史中代表性的学术流派给予了较多关注。
展开更多
关键词
追逃微分博弈
群体智能博弈
平均场博弈
逆向博弈
强化学习
下载PDF
职称材料
题名
基于博弈论的右转无信号交叉口行人行为模拟
1
作者
李文礼
张祎楠
石晓辉
王梦昕
机构
重庆理工大学汽车零部件先进制造技术教育部重点实验室
重庆长安汽车股份有限公司
出处
《机械工程学报》
EI
CAS
CSCD
北大核心
2024年第10期86-101,共16页
基金
重庆市自然科学基金(cstc2021jcyj-msxm X0183)
重庆市留学人员回国创业创新支持计划(CX2021070)
+1 种基金
重庆市教委科学技术研究(KJQN202201170)
重庆市技术创新与应用发展专项重大(CSTB2022TIAD-STX0003)资助项目。
文摘
为逼真模拟行人-车辆交互的真实交通场景,融合博弈理论和数据驱动的思想,在逆强化学习和博弈论的基础上提出博弈—深度最大熵逆强化学习算法(Game-deep max entropy inverse reinforcement learning,G-DMIRL)。将行人建模为智能体,通过真实的行人-车辆交互轨迹获取不同博弈决策下的行人的奖励函数,并推断行人-车辆交互的博弈机制,利用获取的奖励函数和动作策略开发出行人行为模拟模型。仿真结果表明,开发的模型在有限状态下能够准确地模拟出不同决策下行人的行为动作,建立的行人-车辆交通场景能够为自动驾驶汽车的识别、预测与路径规划算法的开发验证提供支撑。
关键词
逆强化学习
强化学习
行人-车辆交互
博弈论
右转交叉口
Keywords
inverse
reinforcement
learning
reinforcement
learning
human-vehicle
interaction
game theory
right-turn
intersection
分类号
U492 [交通运输工程—交通运输规划与管理]
TP391 [交通运输工程—道路与铁道工程]
原文传递
题名
群体追逃微分博弈
2
作者
高红伟
孟斌斌
刘剑
戴照鹏
机构
青岛大学数学与统计学院
军事科学院国防科技创新研究院智能博弈与决策实验室
海军潜艇学院
出处
《运筹学学报(中英文)》
CSCD
北大核心
2024年第3期46-62,共17页
基金
国家自然科学基金(No.72171126)。
文摘
本文以微分博弈和经典的追逃问题为主线,对群体追逃微分博弈的历史发展脉络进行梳理。针对大规模群体追逃问题,从平均场博弈视角出发,阐释了强化学习技术的应用前景。提出探索解决逆向追逃微分博弈的观点,可适用于水下无人舰艇、陆地机器人以及空中无人机集群等同类场景。区别于其他综述性文章,作者对于俄罗斯以及苏联在本领域发展历史中代表性的学术流派给予了较多关注。
关键词
追逃微分博弈
群体智能博弈
平均场博弈
逆向博弈
强化学习
Keywords
pursuit-evasion
differential
game
s
swarm
intelligence
game
s
mean-field
game
s
inverse
game theory
reinforcement
learning
分类号
O225 [理学—运筹学与控制论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于博弈论的右转无信号交叉口行人行为模拟
李文礼
张祎楠
石晓辉
王梦昕
《机械工程学报》
EI
CAS
CSCD
北大核心
2024
0
原文传递
2
群体追逃微分博弈
高红伟
孟斌斌
刘剑
戴照鹏
《运筹学学报(中英文)》
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部