非时齐MDP向时齐MDP的转化

The Transformation of From Non-stationary Markovian Decision Model To Stationary Markovian Decision Model

下载PDF

导出

摘要本文讨论了一类非时齐马氏决策模型向时齐马氏决策模型的转化问题，从而得到若πｔ是非时齐模型的ｋ（ｋ≥１）矩ε（ε≥０）最优策略，则由其导出的时齐策略是相应的时齐模型的ｋ（ｋ≥１）矩Ｓｉ－ε（ε≥０）最优策略的结论． in this paper, it has discussed the transformation of from a non-stationarydiscounted Markovian decision model to stationary Markvian decision model. It′s proved that if π′ is a k(k≥1) moment ε(ε≥0) optimal policy, then the policy π whitch is induced from π′ is the corresponding stationary model′s k (k≥1) moment St-ε (ε≥0)optimal policy.

作者秦叔明

机构地区云南工业大学基础部

出处《云南工业大学学报》 1996年第2期89-94,共6页

关键词非时齐马氏决策模型矩优化 non-stationary, Markvian decision model, moment optimal

分类号 O221.5 [理学—运筹学与控制论]

引文网络
相关文献

参考文献1

1张升,郭世贞.非时齐折扣马氏决策规划(二)——矩最优准则[J].云南大学学报（自然科学版）,1992,14(1):1-10. 被引量：1

二级参考文献3

1郭世贞.折扣马氏决策规划的方差最小最优策略问题[J]应用数学学报,1987(02). 被引量：1
2董泽清.马氏决策规划的加速逼近算法与最小方差问题[J]数学学报,1978(02). 被引量：1
3张升,郭世贞.非时齐折扣马氏决策规划(一)[J].云南大学学报（自然科学版）,1990,12(4):285-292. 被引量：1

1张昇,郭世贞.无界报酬非时齐折扣马氏决策模型[J].应用数学学报,1990,13(3):314-323. 被引量：2
2秦叔明,刘俊,王莉.连续时间的折扣向量值马氏决策模型[J].昆明理工大学学报（自然科学版）,1996,34(S1):73-76. 被引量：1
3秦叔明.时齐向量值马氏决策模型[J].数理统计与应用概率,1998,13(4):20-26.
4邱德华.无界报酬非时齐折扣马氏决策模型[J].衡阳师专学报,1997,18(6):16-22.
5秦叔明,张升.非时齐向量值马氏决策模型[J].应用概率统计,2000,16(1):57-65.
6魏文元.Π_m^d上有界报酬折扣马氏决策模型最优策略的几个等价条件[J].天津师大学报（自然科学版）,1990(1):22-26.
7贾让成.离散时间折扣多目标马氏决策模型:加权与字典序准则[J].运筹与管理,1999,8(1):6-9.
8晏木荣.具有约束的随机消费与投资最优控制[J].经济数学,1999,16(4):38-40.
9贾让成.多目标准则下的折扣非时齐马氏决策规划：分层序列法[J].西北师范大学学报（自然科学版）,1996,32(2):25-27. 被引量：1
10朱一飞,黄国策.备件储备量的马尔可夫决策模型研究[J].空军工程大学学报（自然科学版）,2001,2(2):91-94. 被引量：7

云南工业大学学报

1996年第2期

浏览历史

内容加载中请稍等...

非时齐MDP向时齐MDP的转化

参考文献1

二级参考文献3

相关作者

相关机构

相关主题

浏览历史