期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
连续时间的折扣向量值马氏决策模型 被引量:1
1
作者 秦叔明 刘俊 王莉 《昆明理工大学学报(自然科学版)》 CAS 1996年第S1期73-76,共4页
将连续时间标量值折扣马氏决策模型(简记为MDP)的主要结果(最优方程,平稳策略优势,最优策略)均在向量值模型中作了推广,使标量值模型成为其特款.
关键词 连续时间 向量值马氏决策模型 平稳策略优势
下载PDF
时齐向量值马氏决策模型
2
作者 秦叔明 《数理统计与应用概率》 1998年第4期20-26,共7页
有关时齐向量值马氏决策模型,(简记为VMDP),胡齐英[3]讨论了时齐VMDP的(ε1,…,εn)最优策略问题,张升等[4]给出了一存在最优策略的充分条件。本文继续讨论报酬函数满足一类绝对平均相对有界条件下的时齐VM... 有关时齐向量值马氏决策模型,(简记为VMDP),胡齐英[3]讨论了时齐VMDP的(ε1,…,εn)最优策略问题,张升等[4]给出了一存在最优策略的充分条件。本文继续讨论报酬函数满足一类绝对平均相对有界条件下的时齐VMDP,将时齐标量值模型的主要结果(存在最优策略的充要条件,最优方程,平稳、策略优势、ε最优策略等)均在此作了推广。 展开更多
关键词 向最值马氏决策模型 最优策略 平稳策略优势
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部