期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于博弈论的右转无信号交叉口行人行为模拟
1
作者 李文礼 张祎楠 +1 位作者 石晓辉 王梦昕 《机械工程学报》 EI CAS CSCD 北大核心 2024年第10期86-101,共16页
为逼真模拟行人-车辆交互的真实交通场景,融合博弈理论和数据驱动的思想,在逆强化学习和博弈论的基础上提出博弈—深度最大熵逆强化学习算法(Game-deep max entropy inverse reinforcement learning,G-DMIRL)。将行人建模为智能体,通过... 为逼真模拟行人-车辆交互的真实交通场景,融合博弈理论和数据驱动的思想,在逆强化学习和博弈论的基础上提出博弈—深度最大熵逆强化学习算法(Game-deep max entropy inverse reinforcement learning,G-DMIRL)。将行人建模为智能体,通过真实的行人-车辆交互轨迹获取不同博弈决策下的行人的奖励函数,并推断行人-车辆交互的博弈机制,利用获取的奖励函数和动作策略开发出行人行为模拟模型。仿真结果表明,开发的模型在有限状态下能够准确地模拟出不同决策下行人的行为动作,建立的行人-车辆交通场景能够为自动驾驶汽车的识别、预测与路径规划算法的开发验证提供支撑。 展开更多
关键词 逆强化学习 强化学习 行人-车辆交互 博弈论 右转交叉口
原文传递
群体追逃微分博弈
2
作者 高红伟 孟斌斌 +1 位作者 刘剑 戴照鹏 《运筹学学报(中英文)》 CSCD 北大核心 2024年第3期46-62,共17页
本文以微分博弈和经典的追逃问题为主线,对群体追逃微分博弈的历史发展脉络进行梳理。针对大规模群体追逃问题,从平均场博弈视角出发,阐释了强化学习技术的应用前景。提出探索解决逆向追逃微分博弈的观点,可适用于水下无人舰艇、陆地机... 本文以微分博弈和经典的追逃问题为主线,对群体追逃微分博弈的历史发展脉络进行梳理。针对大规模群体追逃问题,从平均场博弈视角出发,阐释了强化学习技术的应用前景。提出探索解决逆向追逃微分博弈的观点,可适用于水下无人舰艇、陆地机器人以及空中无人机集群等同类场景。区别于其他综述性文章,作者对于俄罗斯以及苏联在本领域发展历史中代表性的学术流派给予了较多关注。 展开更多
关键词 追逃微分博弈 群体智能博弈 平均场博弈 逆向博弈 强化学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部