基于多步回溯Q(λ)学习算法的多目标最优潮流计算被引量：6

Multi-Objective Optimal Power Flow Calculation Based on Multi-Step Q(λ) Learning Algorithm

下载PDF

导出

摘要为了克服传统的最优化算法面对复杂、非线性描述的多目标最优潮流时无法满足电力系统实时调度运行的这一缺点,提出了一种基于半马尔可夫决策过程的多步Q(λ)学习算法,该算法不依赖于对象模型,将最优潮流问题中的约束、动作和目标转换成算法中的状态、动作与奖励,通过不断的试错、回溯、迭代来动态寻找最优的动作.将该算法在多个IEEE标准算例中与其他算法进行比较,取得了良好的效果,验证了多步Q(λ)学习算法在处理多目标最优潮流问题时的可行性和有效性. As the conventional optimization algorithms of power flow cannot meet the requirements of real-time scheduling of power system with complex and nonlinear descriptional multi-objective optimal power flow（OPF）,this paper presents a multi-step Q（λ） learning algorithm based on the semi-Markov decision process.This algorithm,independent of any accurate model,converts the constraints,actions and targets of the optimal power flow to the status,actions and rewards of the algorithm,and dynamically finds the optimal action by continuous fault testing,retrospecting and iteration.By comparing comparison of the proposed algorithm with other algorithms in several IEEE standard examples,it is found that the Q（λ） learning algorithm is feasible and effective in dealing with multi-objective OPF problems.

作者余涛胡细兵刘靖

机构地区华南理工大学电力学院

出处《华南理工大学学报（自然科学版）》 EI CAS CSCD 北大核心 2010年第10期139-145,共7页 Journal of South China University of Technology(Natural Science Edition)

基金国家自然科学基金资助项目(50807016) 广东省自然科学基金资助项目(9151064101000049) 中央高校基本科研业务费专项资金资助项目(2009ZM0251)

关键词电力系统最优潮流 Q(λ)学习算法多目标优化强化学习 electric power system optimal power flow Q（λ） learning algorithm multi-objective optimization reinforcement learning

分类号 TM761 [电气工程—电力系统及自动化] TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献10

1余涛,周斌,甄卫国.强化学习理论在电力系统中的应用及展望[J].电力系统保护与控制,2009,37(14):122-128. 被引量：28
2邱晓燕,张子健,李兴源.基于改进遗传内点算法的电网多目标无功优化[J].电网技术,2009,33(13):27-31. 被引量：48
3余涛,周斌,陈家荣.基于Q学习的互联电网动态最优CPS控制[J].中国电机工程学报,2009,29(19):13-19. 被引量：35
4韦化,李滨,杭乃善,刘东平,文杰,佐佐木博司.大规模水-火电力系统最优潮流的现代内点算法实现[J].中国电机工程学报,2003,23(6):13-18. 被引量：34
5赵晋泉,侯志俭,吴际舜.改进最优潮流牛顿算法有效性的对策研究[J].中国电机工程学报,1999,19(12):70-75. 被引量：28
6娄素华..现代电力系统优化模型及其相关算法研究[D].华中科技大学,2005:
7张汝波编著..强化学习理论及应用[M].哈尔滨:哈尔滨工程大学出版社,2001:287.
8周明,孙树栋编著..遗传算法原理及应用[M].北京:国防工业出版社,1999:203.
9Jing Peng,Ronald J. Williams. Incremental multi-step Q-learning[J] 1996,Machine Learning(1-3):283～290 被引量：1
10Christopher J.C.H. Watkins,Peter Dayan. Technical Note: Q-Learning[J] 1992,Machine Learning(3-4):279～292 被引量：1

二级参考文献83

1唐跃中,张王俊,张健,陈明.基于CPS的AGC控制策略研究[J].电网技术,2004,28(21):75-79. 被引量：61
2郭红霞,吴捷,刘永强,王春茹.基于强化学习算法的静止同步补偿电压控制器[J].电网技术,2004,28(19):9-13. 被引量：25
3邹斌,李庆华,言茂松.电力拍卖市场的智能代理仿真模型[J].中国电机工程学报,2005,25(15):7-11. 被引量：28
4万盛斌,陈明军.基于改进遗传算法的电力系统无功优化[J].继电器,2005,33(15):37-40. 被引量：25
5宋依群,吴炯.基于Q学习算法的发电公司决策新模型[J].上海交通大学学报,2006,40(4):568-571. 被引量：8
6夏可青,赵明奇,李扬.用于多目标无功优化的自适应遗传算法[J].电网技术,2006,30(13):55-60. 被引量：32
7郝玉国,张靖,于尔铿,刘广一.最优潮流的实用化研究[J].中国电机工程学报,1996,16(6):388-391. 被引量：18
8刘长军.电力系统无功优化控制中遗传算法的改进[J].电力建设,2006,27(12):18-20. 被引量：2
9李帅,王先培,王泉德,牛胜巍.基于SMDP强化学习的电力信息网络入侵检测研究[J].电力自动化设备,2006,26(12):75-78. 被引量：4
10刘科研,盛万兴,李运华.基于改进遗传模拟退火算法的无功优化[J].电网技术,2007,31(3):13-18. 被引量：59

共引文献162

1Shuang Wu,Wei Hu,Zongxiang Lu,Yujia Gu,Bei Tian,Hongqiang Li.Power System Flow Adjustment and Sample Generation Based on Deep Reinforcement Learning[J].Journal of Modern Power Systems and Clean Energy,2020,8(6):1115-1127. 被引量：10
2王宽,丁晓群,侯学勇.福建电网在线电压稳定监控系统与AVC系统的协调控制[J].福建电力与电工,2007,27(4):1-5. 被引量：1
3王宽,沈晔华,丁晓群,沈茂亚,侯学勇.计及电压稳定约束的无功优化及其策略研究[J].江苏电机工程,2007,26(4):9-12. 被引量：2
4田世力,束龙.电力系统无功优化方案比较[J].科协论坛（下半月）,2009(6):35-37. 被引量：1
5韦化,阳育德,李啸骢.多预想故障暂态稳定约束最优潮流[J].中国电机工程学报,2004,24(10):91-96. 被引量：34
6万黎,袁荣湘.最优潮流算法综述[J].继电器,2005,33(11):80-87. 被引量：26
7余娟,颜伟,徐国禹,杜鹏,刘方.基于预测-校正原对偶内点法的无功优化新模型[J].中国电机工程学报,2005,25(11):146-151. 被引量：62
8王承民,蒋传文,黄锐.基于回路分析的回路类型转换与支路潮流越限处理[J].电工电能新技术,2005,24(3):35-39. 被引量：2
9杨波,赵遵廉,陈允平,韩启业.一种求解最优潮流问题的改进粒子群优化算法[J].电网技术,2006,30(11):6-10. 被引量：19
10顾承红,艾芊.考虑电压稳定约束的最优潮流[J].电网技术,2006,30(16):29-34. 被引量：18

同被引文献73

1张勇军,任震,李邦峰.电力系统无功优化调度研究综述[J].电网技术,2005,29(2):50-56. 被引量：122
2郭红霞,吴捷,王春茹.基于强化学习的模型参考自适应控制[J].控制理论与应用,2005,22(2):291-294. 被引量：5
3高宗和,滕贤亮,张小白.互联电网CPS标准下的自动发电控制策略[J].电力系统自动化,2005,29(19):40-44. 被引量：74
4辜承林,韦忠朝,黄声华,陶醒世.对转子交流励磁电流实行矢量控制的变速恒频发电机──（第一部分：控制模型与数值仿真）[J].中国电机工程学报,1996,16(2):119-124. 被引量：53
5刘其辉,贺益康,张建华.交流励磁变速恒频风力发电机的运行控制及建模仿真[J].中国电机工程学报,2006,26(5):43-50. 被引量：204
6马豫超,蒋传文,候志俭,Ettore Bompard,王承民.基于自加强学习算法的发电商报价策略研究[J].中国电机工程学报,2006,26(17):12-17. 被引量：17
7王学宁,陈伟,张锰,徐昕,贺汉根.增强学习中的直接策略搜索方法综述[J].智能系统学报,2007,2(1):16-24. 被引量：8
8Dommel H W,Tinney W F.Optimal power flow solutions[J].IEEE Trans on PAS, 1968,87(10) : 1866-1876. 被引量：1
9L.C.A.Ferreira, A.C.Z.de Souza, S. Granville, and J.W.M.Lima.lnterior point method applied to voltage collapse problems and losses reduction[J]. Proc.lnst.Elect.Eng.-C, en., Transm., Distrib., 2002,149 ( 2 ) : 165-170. 被引量：1
10C.Z. de Souza, L. M. Hon 6 rio, G. L. Torres, and G. Lambert-Tones. Increasing the Loadability of Power Systems through Optimal-Local- Control Actions[J].IEEE Trans.Power Syst., 2004,19 ( 1 ) : 188-194. 被引量：1

引证文献6

1席磊,余璐,张弦,胡伟.基于深度强化学习的泛在电力物联网综合能源系统的自动发电控制[J].中国科学：技术科学,2020,50(2):221-234. 被引量：19
2邓佳佳,黄元生.基于改进粒子群算法的供电网络优化管理研究[J].生产力研究,2012(3):203-204.
3郝钏钏,方舟,李平.采用经验复用的高效强化学习控制方法[J].华南理工大学学报（自然科学版）,2012,40(6):70-75. 被引量：1
4李靖,余涛,王克英,唐捷.基于强化学习算法的双馈感应风力发电机自校正控制[J].微特电机,2013,41(3):52-55. 被引量：2
5郝钏钏,方舟,李平.基于参考模型的输出反馈强化学习控制[J].浙江大学学报（工学版）,2013,47(3):409-414. 被引量：1
6孙东磊,赵龙,秦敬涛,韩学山,杨明,王明强.基于学习理论的含光储联合系统的输电网双层规划[J].山东大学学报（工学版）,2020,50(4):90-97. 被引量：3

二级引证文献26

1王国芳,方舟,李平.基于批量递归最小二乘的自然Actor-Critic算法[J].浙江大学学报（工学版）,2015,49(7):1335-1342. 被引量：3
2孙振刚,魏德仙,谢坚伟,李璐,谢雨金.地铁隧道风力发电系统研究[J].可再生能源,2016,34(9):1333-1341. 被引量：4
3王园超,刘小河.基于改进粒子群算法的双馈电机网侧优化控制[J].北京信息科技大学学报（自然科学版）,2017,32(3):80-83. 被引量：1
4甄岩,袁健全,池庆玺,郝明瑞.深度强化学习方法在飞行器控制中的应用研究[J].战术导弹技术,2020(4):112-118. 被引量：3
5席磊,张乐,黄悦华,陈曦,徐艳春.基于贪婪策略的多层自动发电控制[J].中国电机工程学报,2020,40(16):5204-5216. 被引量：11
6刘俊勇,潘力,何迈.能源物联网及其关键技术[J].物联网学报,2020,4(4):9-16. 被引量：11
7张玉琼,段勉,张雅洁,韦翔,常喜强.风光能源基地远距离直流输电方式选择[J].科学技术与工程,2021,21(1):189-193. 被引量：4
8李争,张蕊,孙鹤旭,张文达,梅春晓.可再生能源多能互补制-储-运氢关键技术综述[J].电工技术学报,2021,36(3):446-462. 被引量：80
9席磊,刘宗静,孙梦梦,武俊男.面向多区域能源互联的多智能体协同AGC策略[J].中国科学：技术科学,2021,51(6):673-683. 被引量：4
10郭敏,夏明超,陈奇芳.基于能源自组织的能源-信息-交通-社会耦合网络研究综述[J].中国电机工程学报,2021,41(16):5521-5539. 被引量：10

1张孝顺,郑理民,余涛.基于多步回溯Q(λ)学习的电网多目标最优碳流算法[J].电力系统自动化,2014,38(17):118-123. 被引量：15
2陈圣磊,李卫红,姚娟.基于最小二乘的Q(λ)强化学习算法[J].计算机工程与应用,2008,44(34):47-50.
3余涛,刘靖,胡细兵.基于分布式多步回溯Q(λ)学习的复杂电网最优潮流算法[J].电工技术学报,2012,27(4):185-192. 被引量：11
4陈娟.福禄克新品Fluke 1000FLT荧光灯测试仪上市——30秒内轻松完成所有测试,让照明灯维修从此省时高效[J].中国计量,2014,0(10):122-122.
5傅启明,刘全,孙洪坤,高龙,李瑾,王辉.一种二阶TD Error快速Q(λ)算法[J].模式识别与人工智能,2013,26(3):282-292. 被引量：5
6汪友华.四种最优化方法的分析与比较[J].机床电器,1994(1):18-21.
7单渊达,叶留金,李扬,高晓萍.交直流混合输电系统发展规划的改进模型[J].东南大学学报（自然科学版）,1992,22(4):8-17.
8诸骏伟,金心明,朱正明.一种快速收敛的牛顿法最优潮流[J].东南大学学报（自然科学版）,1992,22(4):1-7. 被引量：6
9乐秀璠,覃振成,尹峰.基于自适应模拟退火遗传算法的多目标最优潮流[J].继电器,2005,33(7):10-15. 被引量：17
10林明,朱纪洪,孙增圻.固定长度经验回放对Q学习效率的影响[J].计算机工程,2006,32(6):7-10. 被引量：1

华南理工大学学报（自然科学版）

2010年第10期

浏览历史

内容加载中请稍等...

基于多步回溯Q(λ)学习算法的多目标最优潮流计算被引量：6

参考文献10

二级参考文献83

共引文献162

同被引文献73

引证文献6

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于多步回溯Q(λ)学习算法的多目标最优潮流计算 被引量：6

参考文献10

二级参考文献83

共引文献162

同被引文献73

引证文献6

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于多步回溯Q(λ)学习算法的多目标最优潮流计算被引量：6