期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
状态部分可观察的无界报酬马氏决策规划 被引量:3
1
作者 胡奇英 《数理统计与应用概率》 1998年第3期79-86,共8页
本文研究折扣准则的状态部分可观察无界报酬马氏决策规划,得到了一些新的结果,并探讨了将它转换为具可列状态集的马氏决策规划的可能性.
关键词 部分可观察 无界报酬 概率分布 折扣马氏决策规划 最优方程 乘积空间 初始状态 可列集 折扣准则 绝对收敛
下载PDF
无界报酬向量值折扣马氏决策规划──最优平稳策略及算法
2
作者 张升 张继红 《云南大学学报(自然科学版)》 CAS CSCD 1994年第4期299-305,共7页
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭... 本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭代算法. 展开更多
关键词 折扣马氏决策规划 最优平稳策略 无界报酬向量
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部