期刊文献+

约束折扣半马氏决策规划 被引量:2

ON DISCOUNTED SEMI-MARKOV DECISION PROCESSES WITH A CONSTRAINT
原文传递
导出
摘要 本文研究约束折扣半马氏决策规划(CDSMDP)问题,即在一折扣期望费用约束下,使折扣期望报酬达最大的约束最优问题.假设状态集可数,行动集为紧的非空Borel集.本文给出了p-约束最优策略的充要条件,证明了在适当的假设条件下必存在P-约束最优策略最后构造出一线性规划,证明了该线性规划的最优解与p-约束最优随机平稳策略之间存在——对应关系. In this paper, optimal causal policies maximizing the discounted reward over a semi-Markov decision process, subject to a constraint on a discounted cost, is investigated. Where the state set is countable, the action set is a non-empty Borel compact subset of a complete separable matric space. It is proved that there exists a p-constraint optimal stochastic stationary policy under some accessible conditions. Finally, a linear programming (LP) is given and the one-to-one corrpspondence between the optimal solution of LP and the p-constraint optimal stochastic stationary policy is proved.
作者 胡光华 张升
机构地区 云南大学数学系
出处 《应用数学学报》 CSCD 北大核心 1997年第2期187-195,共9页 Acta Mathematicae Applicatae Sinica
关键词 半马氏决策规划 约束最优策略 线性规划 CDSMDP Semi-Markov decision process, P-constraint optimal policy, Linear programming
  • 相关文献

参考文献3

  • 1刘建庸,运筹与决策.2,1992年,1607页 被引量:1
  • 2张升,运筹与决策.2,1992年,1614页 被引量:1
  • 3董泽清,马尔可夫决策规划引论,1985年 被引量:1

同被引文献8

引证文献2

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部