期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
随机线性二次问题中一类改进的强化学习方法
1
作者 高晋鹏 《科技创新与应用》 2024年第32期142-145,共4页
随机线性二次问题是一类重要且研究较为成熟的随机控制问题。其中,部分信息条件下的随机线性二次问题是指系统的状态方程或代价函数中存在未知系数的情形,该文在前人工作的基础上,改进部分信息条件下线性二次问题的最优控制在线强化学... 随机线性二次问题是一类重要且研究较为成熟的随机控制问题。其中,部分信息条件下的随机线性二次问题是指系统的状态方程或代价函数中存在未知系数的情形,该文在前人工作的基础上,改进部分信息条件下线性二次问题的最优控制在线强化学习算法。所研究系统方程和代价函数的系数都存在未知量,在此条件下,算法通过可观察的样本轨迹和回报函数求得最优控制以及代价函数中的未知系数,进一步地,我们给出迭代过程收敛性与控制稳定性的证明。 展开更多
关键词 随机线性二次问题 部分信息 李雅普诺夫方程 强化学习 动态规划原理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部