期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于半马尔可夫控制过程的智能电网最优储能控制 被引量:6
1
作者 计鹿飞 江琦 +1 位作者 唐昊 谭琦 《电力系统自动化》 EI CSCD 北大核心 2015年第6期24-27,共4页
针对具有多种类型业务需求的智能电网储能控制问题,在考虑业务需求和用户行为的随机分布特性,以及储能设备的充放电特性的基础上,建立了基于半马尔可夫控制过程的系统分析模型和策略优化框架。在此基础上,以电网运行的长期平均代价最小... 针对具有多种类型业务需求的智能电网储能控制问题,在考虑业务需求和用户行为的随机分布特性,以及储能设备的充放电特性的基础上,建立了基于半马尔可夫控制过程的系统分析模型和策略优化框架。在此基础上,以电网运行的长期平均代价最小为目标,结合性能势基于样本轨道的估计,提出一种基于仿真的策略迭代优化算法。该算法有效缓解了系统大状态空间导致的维数灾问题,具有较快的收敛速度和良好的应用效果。仿真结果验证了该方法的有效性。 展开更多
关键词 智能电网 需求负荷控制 储能 半马尔可夫控制过程 策略迭代
下载PDF
动态电源管理超时策略自适应优化算法 被引量:3
2
作者 江琦 奚宏生 殷保群 《控制与决策》 EI CSCD 北大核心 2008年第4期372-377,共6页
基于强化学习的方法,提出一种动态电源管理超时策略自适应在线优化算法.构建基于超时策略动态电源管理系统的半Markov控制过程模型,将动态电源管理问题转化为一个带约束的优化问题.利用此模型的动态结构特性,结合在线梯度估计与随机逼... 基于强化学习的方法,提出一种动态电源管理超时策略自适应在线优化算法.构建基于超时策略动态电源管理系统的半Markov控制过程模型,将动态电源管理问题转化为一个带约束的优化问题.利用此模型的动态结构特性,结合在线梯度估计与随机逼近推导超时策略的在线优化算法.该算法自适应性强,计算量小,具有全局收敛性.通过无线网络通信节点动态电源管理的应用仿真验证了算法的有效性. 展开更多
关键词 动态电源管理 超时策略 markov控制过程 强化学习 在线优化
下载PDF
动态电源管理超时策略与随机型策略的等效关系 被引量:3
3
作者 江琦 奚宏生 殷保群 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第11期1646-1651,共6页
为了建立动态电源管理不同类型策略优化之间的联系,研究了超时策略与随机型策略在性能与功耗均衡上的等效关系.构建了动态电源管理系统基于半Markov控制过程的随机分析模型,通过分析该系统的稳态行为,揭示了超时策略和随机型策略在性能... 为了建立动态电源管理不同类型策略优化之间的联系,研究了超时策略与随机型策略在性能与功耗均衡上的等效关系.构建了动态电源管理系统基于半Markov控制过程的随机分析模型,通过分析该系统的稳态行为,揭示了超时策略和随机型策略在性能与功耗均衡上的等效性,推导出这2种策略之间的等效关系式;证明了超时策略具有最优的动态电源管理效果,并使得2种类型策略的优化结果能够相互转换.最后通过无线通信节点动态电源管理的数值仿真验证了这种等效关系. 展开更多
关键词 动态电源管理 markov控制过程 稳态分析 随机型策略 超时策略
下载PDF
半Markov控制过程在平均准则下的优化算法 被引量:1
4
作者 代桂平 殷保群 +2 位作者 李衍杰 周亚平 奚宏生 《中国科学技术大学学报》 CAS CSCD 北大核心 2005年第2期202-207,共6页
研究了一类半Markov控制过程(SMCP)在紧致行动集上关于无限水平平均代价准则的性能优化算法.利用等价Markov过程的方法,导出了SMCP的性能势公式和平均代价最优性方程,给出了求解最优或次最优平稳策略的策略迭代算法和数值迭代算法,并证... 研究了一类半Markov控制过程(SMCP)在紧致行动集上关于无限水平平均代价准则的性能优化算法.利用等价Markov过程的方法,导出了SMCP的性能势公式和平均代价最优性方程,给出了求解最优或次最优平稳策略的策略迭代算法和数值迭代算法,并证明了算法的收敛性.最后给出了一个数值例子来说明算法的应用. 展开更多
关键词 markov控制过程 紧致行动集 性能势 策略迭代 数值迭代
下载PDF
半Markov控制过程基于性能势仿真的并行优化算法
5
作者 代桂平 殷保群 +1 位作者 李衍杰 奚宏生 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第2期183-186,共4页
根据等价Markov过程方法,研究了一类半Markov控制过程在紧致行动集上关于无限水平平均代价准则的性能优化算法.由于实际系统的状态空间往往非常大,因此通常的串行仿真算法可能会耗时过长,或由于硬件限制而无法实现.针对这些问题,提出了... 根据等价Markov过程方法,研究了一类半Markov控制过程在紧致行动集上关于无限水平平均代价准则的性能优化算法.由于实际系统的状态空间往往非常大,因此通常的串行仿真算法可能会耗时过长,或由于硬件限制而无法实现.针对这些问题,提出了一种基于性能势的并行仿真优化算法,以期寻找系统的最优平稳策略,并用该算法对性能势的仿真和策略寻优分别进行了并行化,获得了较好的运行效率.仿真实例表明了该算法的有效性.这一算法可应用于大规模实际半Markov系统的性能优化. 展开更多
关键词 markov控制过程 紧致行动集 性能势 并行仿真算法
下载PDF
基于LTE-DRX的超时策略梯度估计算法 被引量:1
6
作者 宋捷 李方伟 朱江 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2013年第3期319-323,共5页
针对长期演进(long term evolution,LTE)系统的非连续接收(discontinuous reception,DRX)终端省电机制中不适当的状态切换造成能量开销较大的缺陷,提出了一种基于超时策略的梯度估计算法。通过构建半马尔可夫控制模型将状态切换问题转... 针对长期演进(long term evolution,LTE)系统的非连续接收(discontinuous reception,DRX)终端省电机制中不适当的状态切换造成能量开销较大的缺陷,提出了一种基于超时策略的梯度估计算法。通过构建半马尔可夫控制模型将状态切换问题转换为策略优化问题,结合在线梯度估计从而得到状态切换时间的最优解。仿真实验表明,在不同数据到达率的情况下该算法在平均时延以及节能性上都有更好的表现。 展开更多
关键词 LTE-DRX 动态电源管理 超时策略 markov控制过程 在线优化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部