基于逆强化学习的混合动力汽车能量管理策略研究被引量：2

Research on Energy Management Strategy for Hybrid Electric Vehicles Based on Inverse Reinforcement Learning

下载PDF

导出

摘要能量管理策略是混合动力汽车关键技术之一。随着计算能力与硬件设备的不断升级,越来越多的学者逐步开展了基于学习的能量管理策略的研究。在基于强化学习的混合动力汽车能量管理策略研究中,智能体与环境相互作用的导向是由奖励函数决定。然而,目前的奖励函数设计多数是主观决定或者根据经验得来的,很难客观地描述专家的意图,所以在该条件不能保证智能体在给定奖励函数下学习到最优驾驶策略。针对这些问题,本文提出了一种基于逆向强化学习的能量管理策略,通过逆向强化学习的方法获取专家轨迹下的奖励函数权值,并用于指导发动机智能体和电池智能体的行为。之后将修改后的权重重新输入正向强化学习训练。从油耗值、SOC变化曲线、奖励训练过程、动力源转矩等方面,验证该权重值的准确性以及在节油能力方面具有一定的优势。综上所述,该算法的节油效果提高了5%~10%。 Energy management strategy is one of the key technologies for hybrid vehicles.With the continu‐ous upgrading of computing power and hardware devices,more and more scholars have gradually carried out re‐search on learning-based energy management strategies.In the study of reinforcement learning-based energy man‐agement strategies for hybrid electric vehicles,the orientation of the interaction between the intelligent agent and the environment is determined by the reward function.However,most of the current reward function design is sub‐jectively determined or based on experience,which is difficult to objectively describe the expert′s intention,so in that condition there is no guarantee that the intelligent body will learn the optimal driving strategy for a given reward function.To address these problems,an energy management strategy based on inverse reinforcement learning is pro‐posed in this paper to obtain the reward function weights under the expert trajectory by means of inverse reinforce‐ment learning and use them to guide the behavior of the engine and battery intelligent agents.Then,the modified weights are input again into the positive reinforcement learning training.The fuel consumption value,SOC variation curve,reward training process and power source torque are used to verify the accuracy of the weight value and its ad‐vantage in terms of fuel saving capability.In summary,the algorithm has improved the fuel saving effect by 5%~10%.

作者齐春阳宋传学宋世欣靳立强王达肖峰 Qi Chunyang;Song Chuanxue;Song Shixin;Jin Liqiang;Wang Da;Xiao Feng(Jilin University,State Key Laboratory of Automotive Simulation and Control,Changchun 130022;College of Automotive Engineering,Jilin University,Changchun 130022;School of Mechanical and Aerospace Engineering,Jilin University,Changchun 130022)

机构地区吉林大学吉林大学汽车工程学院吉林大学机械与航空航天工程学院

出处《汽车工程》 EI CSCD 北大核心 2023年第10期1954-1964,1974,共12页 Automotive Engineering

基金国家重点研发计划项目(2021YFB2500704)资助。

关键词混合动力汽车最大熵逆向强化学习能量管理策略正向强化学习 hybrid electric vehicle maximum entropy reverse reinforcement learning energy management strategy positive reinforcement learning

分类号 U469.7 [机械工程—车辆工程]

引文网络
相关文献

参考文献4

1唐小林,陈佳信,刘腾,李佳承,胡晓松.基于深度强化学习的混合动力汽车智能跟车控制与能量管理策略研究[J].机械工程学报,2021,57(22):237-246. 被引量：19
2刘腾..混合动力车辆强化学习能量管理研究[D].北京理工大学,2017:
3庞玉涵..基于分层强化学习的混合动力汽车能量管理策略研究[D].重庆理工大学,2022:
4李顶根,严索,邱君诚,高幼民,苗华春.基于规则控制的PHHV能量管理策略研究[J].汽车工程学报,2014,4(2):116-124. 被引量：3

二级参考文献14

1王保华,王伟明,张建武,罗永革.并联混合动力汽车控制策略比较研究[J].系统仿真学报,2006,18(2):401-404. 被引量：19
2张维刚,谭彧,朱小林.液压技术在混合动力汽车节能方面的应用[J].机床与液压,2006,34(6):144-146. 被引量：9
3张威.Stateflow逻辑系统建模[M].两安:西安电子科技大学出版社,2007. 被引量：1
4MILLER J M, EVERETT M. An Assessment of Ultra- Capacitors as the Power Cache in Toyota THS-II, GM- Allison AHS-2 and Ford FHS Hybrid Propulsion Sys- tems [C]. The 20th IEEE Applied Power Electronics Conference and Exposition, 2005 (1) : 481-490. 被引量：1
5钱耀义,吴鑫铭,蒋和.柴油机的机械损失[J].汽车技术,1987(2):7-13. 被引量：2
6HOFMAN T. Framework for Combined Control and Design Optimization of Hybrid Vehicle Propulsion Systems ED]. Eindhoven: TechnischeUniversiteitEindhoven, 2007. 被引量：1
7Wu Bin, LIN C C, FILIPI Z, et al. Optimal Power Management for A Hydraulic Hybrid Delivery Truck [J]. Vehicle SystemDynamics, 2004, 42(1): 23-40. 被引量：1
8高建平,何洪文,孙逢春.混合动力电动汽车机电耦合系统归类分析[J].北京理工大学学报,2008,28(3):197-201. 被引量：34
9周广猛,郝志刚,刘瑞林,陈东,管金发,张春海.基于MATLAB的发动机万有特性曲线绘制方法[J].内燃机与动力装置,2009,26(2):34-36. 被引量：16
10欧阳明高.中国新能源汽车的研发及展望[J].科技导报,2016,34(6):13-20. 被引量：101

共引文献20

1唐小林,陈佳信,高博麟,杨凯,胡晓松,李克强.基于云控系统高精度地图驱动的深度强化学习型混合动力汽车集成控制[J].机械工程学报,2022,58(24):163-177. 被引量：5
2魏玲.油电混合动力电动汽车油耗优化控制仿真研究[J].计算机仿真,2017,34(8):197-200. 被引量：9
3杨大举.混合动力汽车的控制策略研究[J].专用汽车,2022(9):34-36. 被引量：3
4高晓岚.混合动力汽车控制策略研究现状及发展趋势分析[J].专用汽车,2022(10):22-24. 被引量：2
5张瑞轩,黄晨,王猛猛.混合动力汽车能量管理策略研究现状与发展趋势[J].林业机械与木工设备,2022,50(10):50-55. 被引量：6
6封金凤,陈晓飞,刘长振,白书战.增程式混动汽车冷却系统控制策略[J].内燃机与动力装置,2022,39(6):29-36.
7郭玉帆,沈世全,刘冠颖,古鸿吉,高顺.加权双Q学习算法优化的PHEV能量管理策略研究[J].重庆理工大学学报（自然科学）,2023,37(2):86-96. 被引量：1
8廖鹏程,韦文祥,解金沾,喻博,刘家豪.基于驾驶意图识别的HEV模糊控制策略研究[J].汽车实用技术,2023,48(7):66-70.
9张志勇,黄大洋,黄彩霞,胡林,杜荣华.TD3算法改进与自动驾驶汽车并道策略学习[J].机械工程学报,2023,59(8):224-234. 被引量：3
10程力.基于深度强化学习的无人播种机自动路径规划研究[J].农机化研究,2023,45(12):30-34. 被引量：1

同被引文献47

1唐小林,陈佳信,刘腾,李佳承,胡晓松.基于深度强化学习的混合动力汽车智能跟车控制与能量管理策略研究[J].机械工程学报,2021,57(22):237-246. 被引量：19
2倪润宇,赵治国,高晓杰.新型插电式混合动力轿车能量管理策略优化[J].同济大学学报（自然科学版）,2019,47(S01):104-109. 被引量：5
3纽荷兰NH^(2TM)氢动力拖拉机——未来农业新能源动力的先行者[J].农业机械,2011(23):90-90. 被引量：3
4方树平,周志立,徐立友.串联式混合动力拖拉机能量管理策略[J].河南科技大学学报（自然科学版）,2015,36(6):61-66. 被引量：22
5吴明清,李传峰,罗华平,弋晓康,SHAKEEL Ahmed Soomro,陈坤杰,胡云峰,魏增宇,李飞,陈君然,杜威,刘彩玲,魏丹,宋建农,黎艳妮,都鑫,张福印,赵倩,王利春,郭文忠,陈晓丽,聂铭君,贾冬冬,王利军,郭燕,贺佳,王利民,张喜旺,刘婷,赵引,毛晓敏,薄丽媛,谢斌,武仲斌,毛恩荣,郭枭,张远巍,冯志诚,王飞,田瑞,侯贤清,李荣,吴鹏年,李培富,王西娜.线聚焦型太阳能二氧化碳发生器性能研究[J].农业机械学报,2018,49(8):1-17. 被引量：128
6邓涛,罗俊林,韩海硕,汪明明,程栋.混合动力汽车工况识别自适应能量管理策略[J].西安交通大学学报,2018,52(1):77-83. 被引量：17
7倪如尧,刘金玲,许思传.燃料电池汽车能量管理控制策略研究[J].汽车实用技术,2019,45(1):34-38. 被引量：11
8赵勇,王媛媛,魏路路.串联混合动力推土机能量管理策略[J].长安大学学报（自然科学版）,2019,39(2):108-116. 被引量：5
9张风奇,胡晓松,许康辉,唐小林,崔亚辉.混合动力汽车模型预测能量管理研究现状与展望[J].机械工程学报,2019,55(10):86-108. 被引量：54
10曾小华,王星琦,宋大凤,杨南南,王振伟.考虑电池寿命的插电式混合动力汽车能量管理优化[J].浙江大学学报（工学版）,2019,53(11):2206-2214. 被引量：11

引证文献2

1杨萌,王琳,邓晓亭,鲁杨.混合动力拖拉机能量管理策略综述[J].拖拉机与农用运输车,2024,51(2):7-15.
2汪少华,郑允祥,施德华.基于充电行为电量规划的自适应能量管理策略[J].重庆理工大学学报（自然科学）,2024,38(6):1-10.

1马智慧.基于学习科学理论的中职语文教学策略研究[J].炫动漫,2022(13):235-237.
2张飞鹏.基于学习通的半导体物理与器件课程线上线下融合教学研究[J].广西民族师范学院学报,2023,40(4):110-114.
3卢振威,汤晖,林志杭,吴诗锐,梁明虎,区校贤.针对MiniLED芯片载板的图像清晰度评价函数设计[J].机械工程与自动化,2023(6):89-90.
4王正宇,朱林,黄师禹,廖梦君.基于高斯函数-最大熵展开的风电并网系统概率潮流计算[J].电力系统保护与控制,2023,51(20):91-98. 被引量：2
5张宁,穆静,钱智哲,张洁,郭岱朋.非受控环境下基于混合注意力机制的面部表情识别[J].西安工业大学学报,2023,43(5):495-502.
6周博赞.重视具身体验发挥习题价值[J].河北教育（教学版）,2023,61(10):53-53.
7于蒙杰,张学军,王晓暄,马卫彬,史增录.基于学习通平台的机械原理课程混合式教学改革创新和实践研究[J].农业技术与装备,2023(9):128-130. 被引量：1
8舒军,王祥,李灵,雷建军,何俊成,杨莉.基于改进GANomaly网络的旋开盖缺陷检测方法[J].中南民族大学学报（自然科学版）,2023,42(6):788-798.
9张桃.基于学习通平台的二外日语教学实践及改进[J].电脑迷,2023(13):52-54.
10王宇琨,王泽,董力维,李妮.基于分层的智能建模方法的多机空战行为建模[J].系统仿真学报,2023,35(10):2249-2261. 被引量：1

汽车工程

2023年第10期

浏览历史

内容加载中请稍等...

基于逆强化学习的混合动力汽车能量管理策略研究被引量：2

参考文献4

二级参考文献14

共引文献20

同被引文献47

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于逆强化学习的混合动力汽车能量管理策略研究 被引量：2

参考文献4

二级参考文献14

共引文献20

同被引文献47

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于逆强化学习的混合动力汽车能量管理策略研究被引量：2