期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
连续时间的折扣向量值马氏决策模型
被引量:
1
1
作者
秦叔明
刘俊
王莉
《昆明理工大学学报(自然科学版)》
CAS
1996年第S1期73-76,共4页
将连续时间标量值折扣马氏决策模型(简记为MDP)的主要结果(最优方程,平稳策略优势,最优策略)均在向量值模型中作了推广,使标量值模型成为其特款.
关键词
连续时间
向量值马氏决策模型
平稳
策略
优势
下载PDF
职称材料
时齐向量值马氏决策模型
2
作者
秦叔明
《数理统计与应用概率》
1998年第4期20-26,共7页
有关时齐向量值马氏决策模型,(简记为VMDP),胡齐英[3]讨论了时齐VMDP的(ε1,…,εn)最优策略问题,张升等[4]给出了一存在最优策略的充分条件。本文继续讨论报酬函数满足一类绝对平均相对有界条件下的时齐VM...
有关时齐向量值马氏决策模型,(简记为VMDP),胡齐英[3]讨论了时齐VMDP的(ε1,…,εn)最优策略问题,张升等[4]给出了一存在最优策略的充分条件。本文继续讨论报酬函数满足一类绝对平均相对有界条件下的时齐VMDP,将时齐标量值模型的主要结果(存在最优策略的充要条件,最优方程,平稳、策略优势、ε最优策略等)均在此作了推广。
展开更多
关键词
向最值马氏决策模型
最优
策略
平稳
策略
优势
下载PDF
职称材料
题名
连续时间的折扣向量值马氏决策模型
被引量:
1
1
作者
秦叔明
刘俊
王莉
机构
云南工业大学基础部
出处
《昆明理工大学学报(自然科学版)》
CAS
1996年第S1期73-76,共4页
文摘
将连续时间标量值折扣马氏决策模型(简记为MDP)的主要结果(最优方程,平稳策略优势,最优策略)均在向量值模型中作了推广,使标量值模型成为其特款.
关键词
连续时间
向量值马氏决策模型
平稳
策略
优势
Keywords
continuous time MDP
optimal policy
dominating property of stationary policy
分类号
O224 [理学—运筹学与控制论]
下载PDF
职称材料
题名
时齐向量值马氏决策模型
2
作者
秦叔明
机构
云南工业大学基础部
出处
《数理统计与应用概率》
1998年第4期20-26,共7页
文摘
有关时齐向量值马氏决策模型,(简记为VMDP),胡齐英[3]讨论了时齐VMDP的(ε1,…,εn)最优策略问题,张升等[4]给出了一存在最优策略的充分条件。本文继续讨论报酬函数满足一类绝对平均相对有界条件下的时齐VMDP,将时齐标量值模型的主要结果(存在最优策略的充要条件,最优方程,平稳、策略优势、ε最优策略等)均在此作了推广。
关键词
向最值马氏决策模型
最优
策略
平稳
策略
优势
Keywords
Vector valued Markovian Decision Model
Optimal Policy
Dominating Property of Stationary Policy.
分类号
O21 [理学—概率论与数理统计]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
连续时间的折扣向量值马氏决策模型
秦叔明
刘俊
王莉
《昆明理工大学学报(自然科学版)》
CAS
1996
1
下载PDF
职称材料
2
时齐向量值马氏决策模型
秦叔明
《数理统计与应用概率》
1998
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部