期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
SHP-VI:一种基于最短哈密顿通路的POMDP值迭代算法
被引量:
1
1
作者
冯奇
周雪忠
+1 位作者
黄厚宽
张小平
《计算机研究与发展》
EI
CSCD
北大核心
2011年第12期2343-2351,共9页
基于试探(trial-based)的值迭代算法是求解部分可观察Markov决策过程(partially observable Markov decision process,POMDP)模型的一类有效算法,其中FSVI算法是目前最快的算法之一.然而对于较大规模的POMDP问题,FSVI计算MDP值函数的时...
基于试探(trial-based)的值迭代算法是求解部分可观察Markov决策过程(partially observable Markov decision process,POMDP)模型的一类有效算法,其中FSVI算法是目前最快的算法之一.然而对于较大规模的POMDP问题,FSVI计算MDP值函数的时间是不容忽视的.提出一种基于最短哈密顿通路(shortest Hamiltonian path)的值迭代算法(shortest Hamiltonian path-based value iteration,SHP-VI).该方法用求解最短哈密顿通路问题的蚁群算法计算一条最优信念状态轨迹,然后在这些信念状态上反向更新值函数.通过与FSVI算法的实验比较,结果表明SHP-VI算法很大程度地提高了基于试探的算法计算信念状态轨迹的效率.
展开更多
关键词
部分可观察Markov决策过程
值迭代
基于
点
的
算法
基于
试探
的
算法
哈密顿通路
下载PDF
职称材料
题名
SHP-VI:一种基于最短哈密顿通路的POMDP值迭代算法
被引量:
1
1
作者
冯奇
周雪忠
黄厚宽
张小平
机构
北京交通大学计算机与信息技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第12期2343-2351,共9页
基金
国家科技重大专项基金项目(2009ZX10005-019)
国家"九七三"重点基础研究发展计划基金项目(2006CB504601)
+2 种基金
国家科技支撑计划基金项目(2007BAI10B06-01)
北京市科委科研攻关基金项目(D08050703020803
D08050703020804)
文摘
基于试探(trial-based)的值迭代算法是求解部分可观察Markov决策过程(partially observable Markov decision process,POMDP)模型的一类有效算法,其中FSVI算法是目前最快的算法之一.然而对于较大规模的POMDP问题,FSVI计算MDP值函数的时间是不容忽视的.提出一种基于最短哈密顿通路(shortest Hamiltonian path)的值迭代算法(shortest Hamiltonian path-based value iteration,SHP-VI).该方法用求解最短哈密顿通路问题的蚁群算法计算一条最优信念状态轨迹,然后在这些信念状态上反向更新值函数.通过与FSVI算法的实验比较,结果表明SHP-VI算法很大程度地提高了基于试探的算法计算信念状态轨迹的效率.
关键词
部分可观察Markov决策过程
值迭代
基于
点
的
算法
基于
试探
的
算法
哈密顿通路
Keywords
partially observable Markov decision process (POMDP)
value iteration
point-based algorithm
trial-based algorithm
Hamiltonian path
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
SHP-VI:一种基于最短哈密顿通路的POMDP值迭代算法
冯奇
周雪忠
黄厚宽
张小平
《计算机研究与发展》
EI
CSCD
北大核心
2011
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部