无界报酬非时齐折扣马氏决策模型被引量：2

A NON-STATIONARY DISCOUNTED MARKOVIAN DECISION MODEL WITH UNBOUNDED REWARDS

导出

摘要在文献[1]—[3]中在各自的条件下,讨论过非时齐折扣马氏决策模型及其ε(≥0)最优策略存在的条件.在文献[4],文献[5]中,在状态和行动集都是可数的条件下,讨论了具有绝对平均相对有界的无界报酬的时齐折扣马氏决策模型.本文在状态集仍为可数,行动集为任意的条件下,建立与[4]相应的非时齐的折扣马氏决策模型;给出模型的有限阶段逼近和建立最优方程;证明了ε(>0) In this paper, a non-stationary discounted Markovian decision model is investigated underabsolute average relatively bounded reward functions. The optimality equations for the modelare established. The existence of an ε-optimal policy is proved. Necessary and sufficientconditions for the optimality of a policy are derived. It is shown that if there is an optimalpolicy, then there exists an optimal Markovian policy. We also discuss the optimality of aconvex combination of these optimal policies. Finally, some properties of these optimal policiesare shown.

作者张昇郭世贞

机构地区云南大学昆明工学院

出处《应用数学学报》 CSCD 北大核心 1990年第3期314-323,共10页 Acta Mathematicae Applicatae Sinica

关键词马氏决策模型非时齐折扣策略

分类号 O221.3 [理学—运筹学与控制论]

引文网络
相关文献

参考文献2

1郭世贞.折扣马氏决策规划的方差最小最优策略问题[J]应用数学学报,1987(02). 被引量：1
2郭世贞.折扣目标马氏决策的最优策略问题[J]经济数学,1984(00). 被引量：1

同被引文献2

1朱成熹,魏文元.马尔柯夫决策规划的强最优准则[J].数学年刊（A辑）,1993,1(1):118-127. 被引量：3
2朱成熹,陈俊雅,魏文元.非齐次马尔可夫链函数的强大数定律[J]数学学报,1988(04). 被引量：1

引证文献2

1许永龙.机器更新决策规划中的强最优问题[J].天津师大学报（自然科学版）,1994,14(4):14-19.
2张继红,谭兴华,王跃宏.MDP 中非时齐折扣模型向时齐折扣模型的转化问题[J].昆明工学院学报,1997,22(6):30-36.

1邱德华.无界报酬非时齐折扣马氏决策模型[J].衡阳师专学报,1997,18(6):16-22.
2秦叔明.非时齐MDP向时齐MDP的转化[J].云南工业大学学报,1996,12(2):89-94.
3张升,郭世贞.非时齐折扣马氏决策规划(一)[J].云南大学学报（自然科学版）,1990,12(4):285-292. 被引量：1
4胡奇英.非时齐无界报酬马氏决策规划[J].西安电子科技大学学报,1992,19(1):72-83.
5张升,郭世贞.非时齐折扣马氏决策规划(二)——矩最优准则[J].云南大学学报（自然科学版）,1992,14(1):1-10. 被引量：1
6秦叔明,刘俊,王莉.连续时间的折扣向量值马氏决策模型[J].昆明理工大学学报（自然科学版）,1996,34(S1):73-76. 被引量：1
7秦叔明.时齐向量值马氏决策模型[J].数理统计与应用概率,1998,13(4):20-26.
8胡奇英.无界报酬折扣马氏决策规划中的逐次逼近法[J].数理统计与应用概率,1995,10(2):31-37.
9伍从斌.无界报酬折扣半马氏决策模型矩最优策略的结构[J].云南大学学报（自然科学版）,1990,12(4):299-306. 被引量：1
10伍从斌.无界报酬折扣半马氏决策模型矩最优策略的存在性[J].云南大学学报（自然科学版）,1991,13(3):199-206.

应用数学学报

1990年第3期

浏览历史

内容加载中请稍等...

无界报酬非时齐折扣马氏决策模型被引量：2

参考文献2

同被引文献2

引证文献2

相关作者

相关机构

相关主题

浏览历史

无界报酬非时齐折扣马氏决策模型 被引量：2

参考文献2

同被引文献2

引证文献2

相关作者

相关机构

相关主题

浏览历史

无界报酬非时齐折扣马氏决策模型被引量：2