期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
状态部分可观察的无界报酬马氏决策规划
被引量:
3
1
作者
胡奇英
《数理统计与应用概率》
1998年第3期79-86,共8页
本文研究折扣准则的状态部分可观察无界报酬马氏决策规划,得到了一些新的结果,并探讨了将它转换为具可列状态集的马氏决策规划的可能性.
关键词
部分可观察
无界报酬
概率分布
折扣
马氏
决策
规划
最优方程
乘积空间
初始状态
可列集
折扣
准则
绝对收敛
下载PDF
职称材料
无界报酬向量值折扣马氏决策规划──最优平稳策略及算法
2
作者
张升
张继红
《云南大学学报(自然科学版)》
CAS
CSCD
1994年第4期299-305,共7页
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭...
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭代算法.
展开更多
关键词
折扣
马氏
决策
规划
最优平稳策略
无界报酬向量
原文传递
题名
状态部分可观察的无界报酬马氏决策规划
被引量:
3
1
作者
胡奇英
机构
西安电子科技大学
出处
《数理统计与应用概率》
1998年第3期79-86,共8页
基金
国家(青年)自然科学基金
文摘
本文研究折扣准则的状态部分可观察无界报酬马氏决策规划,得到了一些新的结果,并探讨了将它转换为具可列状态集的马氏决策规划的可能性.
关键词
部分可观察
无界报酬
概率分布
折扣
马氏
决策
规划
最优方程
乘积空间
初始状态
可列集
折扣
准则
绝对收敛
分类号
O21 [理学—概率论与数理统计]
下载PDF
职称材料
题名
无界报酬向量值折扣马氏决策规划──最优平稳策略及算法
2
作者
张升
张继红
机构
云南大学
出处
《云南大学学报(自然科学版)》
CAS
CSCD
1994年第4期299-305,共7页
文摘
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭代算法.
关键词
折扣
马氏
决策
规划
最优平稳策略
无界报酬向量
Keywords
discounted Markovian decision programming, optimal stationary poli-cies,unbounded vector-valued reward
分类号
O22 [理学—运筹学与控制论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
状态部分可观察的无界报酬马氏决策规划
胡奇英
《数理统计与应用概率》
1998
3
下载PDF
职称材料
2
无界报酬向量值折扣马氏决策规划──最优平稳策略及算法
张升
张继红
《云南大学学报(自然科学版)》
CAS
CSCD
1994
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部