期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
模型自由的离散时间系统的随机线性二次最优控制 被引量:2
1
作者 么彩莲 王涛 《辽宁石油化工大学学报》 CAS 2016年第6期64-68,共5页
针对模型自由的随机线性离散时间系统,通过Q学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,通过值迭代算法的思想构造Q学习算法;其次给出Q学习算法的等价形式并证明其收敛性;最后通过一个仿真实例... 针对模型自由的随机线性离散时间系统,通过Q学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,通过值迭代算法的思想构造Q学习算法;其次给出Q学习算法的等价形式并证明其收敛性;最后通过一个仿真实例说明Q学习算法的有效性。 展开更多
关键词 Q学习算法 值函数 随机线性二次最优控制 随机代数方程
下载PDF
随机线性二次最优控制:从离散到连续时间模型 被引量:1
2
作者 王晔 《数学年刊(A辑)》 CSCD 北大核心 2018年第4期429-448,共20页
在一般情形下,分析了离散时间LQ问题与连续时间情形两者之间的自然联系.首先回顾了连续时间和离散时间随机LQ问题及对应Riccati微分/差分方程的相关结论.接下来在假设Riccati微分方程有解的前提下,证明了离散化步长足够小时,Riccati差... 在一般情形下,分析了离散时间LQ问题与连续时间情形两者之间的自然联系.首先回顾了连续时间和离散时间随机LQ问题及对应Riccati微分/差分方程的相关结论.接下来在假设Riccati微分方程有解的前提下,证明了离散化步长足够小时,Riccati差分方程有解.然后针对连续和离散时间模型,采用配对问题最优控制的反馈形式,分别构造了一个辅助反馈控制,并证明该控制可驱使对应模型的性能指标逼近于配对问题的值函数,以此得到了关于两个模型之间联系的初步结论.最后藉由前述结论以及控制问题的特性,揭晓了连续时间和离散时间模型之间的自然联系,并给出了Riccati差分方程和微分方程的解之间的误差估计.由此联系,可构造相应离散系统和LQ问题,以适当的阶估计连续时间LQ问题的解,抑或为离散时间模型构造一个近似最优控制.无论哪种思路,都旨在降低直接求解原问题的难度和复杂性. 展开更多
关键词 随机线性二次最优控制 不定随机LQ控制 RICCATI方程 数值方法
下载PDF
由Lévy过程驱动的随机线性二次最优控制问题 被引量:1
3
作者 武灿文 唐矛宁 《湖州师范学院学报》 2021年第8期6-17,共12页
主要研究一类在更一般情况下的随机线性二次最优控制问题.该系统由Teugel’s鞅和布朗运动共同驱动,且状态方程中存在漂移项,性能指标中含有交叉项.研究中基于凸变分原理得到最优控制的存在唯一性;利用对偶技术导出最优控制的对偶表达式... 主要研究一类在更一般情况下的随机线性二次最优控制问题.该系统由Teugel’s鞅和布朗运动共同驱动,且状态方程中存在漂移项,性能指标中含有交叉项.研究中基于凸变分原理得到最优控制的存在唯一性;利用对偶技术导出最优控制的对偶表达式,建立随机Hamiltonian系统,该系统是一个含有Teugel’s鞅的、线性的、完全耦合的正倒向随机微分方程;通过随机Hamiltonian系统推导出相应的Riccati方程,并通过证明Riccati方程解的存在唯一性获得了最优控制的反馈表达式. 展开更多
关键词 Teugel’s鞅 随机线性二次最优控制 反馈表示 随机Hamiltonian系统 RICCATI方程
下载PDF
一类随机Riccati方程解的存在性
4
作者 许洁 吕显瑞 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2017年第3期613-616,共4页
考虑一类随机Riccati方程解的存在性条件.首先,基于随机Riccati方程自身结构的特点,利用It8公式,构造一个不带限制条件的倒向随机微分方程;其次,在倒向随机微分方程的构造中先使其解满足随机Riccati方程中相应的代数限制条件,再利用二... 考虑一类随机Riccati方程解的存在性条件.首先,基于随机Riccati方程自身结构的特点,利用It8公式,构造一个不带限制条件的倒向随机微分方程;其次,在倒向随机微分方程的构造中先使其解满足随机Riccati方程中相应的代数限制条件,再利用二者间的关系给出随机Riccati方程解的存在性条件. 展开更多
关键词 随机Riccati方程 限制条件 倒向随机微分方程 随机线性二次最优控制
下载PDF
考虑组合风险的指数化投资与随机线性二次最优控制
5
作者 李院德 陈启宏 《运筹与管理》 CSSCI CSCD 北大核心 2020年第2期28-39,共12页
指数化投资使投资者享有市场平均收益水平,具有投资风险分散化、投资组合透明化、投资成本低廉等优势,日益受到投资者的亲睐.由于通常指数化投资者不愿意承担较大风险,本文考虑极小化跟踪误差与投资组合的风险之和(其中风险用风险资产... 指数化投资使投资者享有市场平均收益水平,具有投资风险分散化、投资组合透明化、投资成本低廉等优势,日益受到投资者的亲睐.由于通常指数化投资者不愿意承担较大风险,本文考虑极小化跟踪误差与投资组合的风险之和(其中风险用风险资产的累积方差来衡量).本文证明了无论是连续时间或离散时间、有限时区或无限时区的情形,在一定的条件下,最优控制都唯一存在,即利用随机线性二次最优控制进行指数化投资,最优投资策略都唯一存在. 展开更多
关键词 指数化投资 随机线性二次最优控制 反馈控制 无限时区
下载PDF
由Lévy过程驱动的一类特殊的高维的BSRDE解的存在唯一性
6
作者 胡世培 《数学的实践与认识》 北大核心 2017年第12期249-255,共7页
讨论由Brownian运动和Lévy过程共同驱动的线性随机系统的随机LQ问题,其中代价泛函是关于Lévy过程生成的σ-代数取条件期望.得到由Lévy过程驱动的新的多维的倒向随机Riccati方程,利用Bellman拟线性原理和单调收敛方法证... 讨论由Brownian运动和Lévy过程共同驱动的线性随机系统的随机LQ问题,其中代价泛函是关于Lévy过程生成的σ-代数取条件期望.得到由Lévy过程驱动的新的多维的倒向随机Riccati方程,利用Bellman拟线性原理和单调收敛方法证明了此随机Riccati方程的解的存在性. 展开更多
关键词 倒向随机黎卡提微分方程 有限时区 LÉVY过程 随机线性二次最优控制
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部