期刊文献+
共找到130篇文章
< 1 2 7 >
每页显示 20 50 100
Admission Control with Elastic QoS for Video on Demand Systems 被引量:4
1
作者 Fu-Shou Lin 1 Bao-Qun Yin 1,2 Jing Huang 1 Xu-Min Wu 1 1 Key Lab of Anhui Network Communication System and Control, University of Science and Technology of China, Hefei 230027, China 2 National Network New Media Engineering Research Center, Institute of Acoustics, Chinese Academy of Science, Beijing 100190, China 《International Journal of Automation and computing》 EI 2012年第5期467-473,共7页
In network service systems, satisfying quality of service (QoS) is one of the main objectives. Admission control and resource allocation strategy can be used to guarantee the QoS requirement. Based on partially observ... In network service systems, satisfying quality of service (QoS) is one of the main objectives. Admission control and resource allocation strategy can be used to guarantee the QoS requirement. Based on partially observable Markov decision processes (POMDPs), this paper proposes a novel admission control model for video on demand (VOD) service systems with elastic QoS. Elastic QoS is also considered in resource allocation strategy. Policy gradient algorithm is often available to find the solution of POMDP problems, with a satisfactory convergence rate. Through numerical examples, it can be shown that the proposed admission control strategy has better performance than complete admission control strategy. 展开更多
关键词 Partially observable Markov decision processes (pomdps) admission control resource allocation elastic quality of service (QoS) policy gradient
原文传递
基于点的POMDPs在线值迭代算法 被引量:3
2
作者 仵博 吴敏 佘锦华 《软件学报》 EI CSCD 北大核心 2013年第1期25-36,共12页
部分可观察马尔可夫决策过程(partially observable Markov decision processes,简称POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有离线算法陷入信念状态"维数灾"和"历史灾"问题,而现有在线算法无法同时... 部分可观察马尔可夫决策过程(partially observable Markov decision processes,简称POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有离线算法陷入信念状态"维数灾"和"历史灾"问题,而现有在线算法无法同时满足低误差与高实时性的要求,造成理想的POMDPs模型无法在实际工程中得到应用.对此,提出一种基于点的POMDPs在线值迭代算法(point-based online value iteration,简称PBOVI).该算法在给定的可达信念状态点上进行更新操作,避免对整个信念状态空间单纯体进行求解,加速问题求解;采用分支界限裁剪方法对信念状态与或树进行在线裁剪;提出信念状态结点重用思想,重用上一时刻已求解出的信念状态点,避免重复计算.实验结果表明,该算法具有较低误差率、较快收敛性,满足系统实时性的要求. 展开更多
关键词 部分可观察马尔可夫决策过程 信念状态 基于点的算法 在线算法 与或树
下载PDF
POMDPs算法复杂度对比分析研究
3
作者 仵博 郑红燕 冯延蓬 《深圳职业技术学院学报》 CAS 2013年第1期3-10,共8页
部分可观察马尔可夫决策过程(Partially Observable Markov Decision Processes,POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有算法都陷入"维数灾"和"历史灾"问题,造成理想的POMDPs模型无法在实际工程中... 部分可观察马尔可夫决策过程(Partially Observable Markov Decision Processes,POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有算法都陷入"维数灾"和"历史灾"问题,造成理想的POMDPs模型无法在实际工程中得到应用.本文首先详细分析了POMDPs精确算法的复杂度,阐述问题求解的难点;然后比较分析现有基于点的离线算法和在线算法两类算法的算法思想和时间复杂度,指出两类算法的优缺点;最后简介POMDPs实际应用情况和未来的研究方向. 展开更多
关键词 部分可观察马尔可夫决策过程 序贯决策 信念状态空间 在线算法 维数灾
下载PDF
基于部分客观马尔科夫决策(POMDPs)的动态电源管理技术
4
作者 安双文 黎俊德 《电子制作》 2014年第11X期28-29,共2页
0引言降低"能耗"是现代社会最紧要的问题之一。仪器中电源消耗的能源占了总能耗的一大块,本文就如何降低电源的能耗同时保障运行的性能作出阐述。目前常用的电源管理技术主要包括启发式策略和随机型策略。启发式策略主要指&qu... 0引言降低"能耗"是现代社会最紧要的问题之一。仪器中电源消耗的能源占了总能耗的一大块,本文就如何降低电源的能耗同时保障运行的性能作出阐述。目前常用的电源管理技术主要包括启发式策略和随机型策略。启发式策略主要指"Time-out"电源管理策略和预测式策略。系统在达到设定的时间之后,电源管理组件就将状态切换到低功耗状态,由于其实现简单,被广泛使用。预测式(Predictive)电源管理策略使用预测的方法,推断下一个系统空闲阶段达到预测的时间值之后,系统完成切换。这两类策略都是预先设定的,只限于在两种状态之间切换,不能保证达到最优效果。 展开更多
关键词 动态电源管理 pomdps 马尔科夫决策 预测式 策略使用 启发式策略 随机型 最优策略 状态切换
下载PDF
强化学习的地–空异构多智能体协作覆盖研究 被引量:7
5
作者 张文旭 马磊 +1 位作者 贺荟霖 王晓东 《智能系统学报》 CSCD 北大核心 2018年第2期202-207,共6页
以无人机(unmanned aerial vehicle,UAV)和无人车(unmanned ground vehicle,UGV)的异构协作任务为背景,通过UAV和UGV的异构特性互补,为了扩展和改进异构多智能体的动态覆盖问题,提出了一种地–空异构多智能体协作覆盖模型。在覆盖过程中... 以无人机(unmanned aerial vehicle,UAV)和无人车(unmanned ground vehicle,UGV)的异构协作任务为背景,通过UAV和UGV的异构特性互补,为了扩展和改进异构多智能体的动态覆盖问题,提出了一种地–空异构多智能体协作覆盖模型。在覆盖过程中,UAV可以利用速度与观测范围的优势对UGV的行动进行指导;同时考虑智能体的局部观测性与不确定性,以分布式局部可观测马尔可夫(decentralized partially observable Markov decision processes,DEC-POMDPs)为模型搭建覆盖场景,并利用多智能体强化学习算法完成对环境的覆盖。仿真实验表明,UAV与UGV间的协作加快了团队对环境的覆盖速度,同时强化学习算法也提高了覆盖模型的有效性。 展开更多
关键词 异构多智能体 覆盖问题 地–空 UAV/UGV DEC-pomdps 强化学习
下载PDF
一种基于独立任务的POMDP问题的解决方法
6
作者 房俊恒 朱斐 +2 位作者 刘全 伏玉琛 凌兴宏 《计算机应用研究》 CSCD 北大核心 2016年第1期147-152,共6页
通常利用POMDPs对在部分可观测的随机环境中决策的agents建模。针对完整POMDP的求解方法扩展能力弱的问题,提出把多元POMDP分解成多个受限制的POMDPs,然后独立求解每个模型,以获得值函数,并将这些受限制的POMDPs的值函数结合起来以便获... 通常利用POMDPs对在部分可观测的随机环境中决策的agents建模。针对完整POMDP的求解方法扩展能力弱的问题,提出把多元POMDP分解成多个受限制的POMDPs,然后独立求解每个模型,以获得值函数,并将这些受限制的POMDPs的值函数结合起来以便获得完整POMDP策略。该方法主要阐述识别与独立任务相关的状态变量的过程,以及如何构造被限制在单独任务上的模型。将该方法应用到两个不同规模的岩石采样问题中,实验结果表明,该方法能够获得很好的策略。 展开更多
关键词 pomdp 基于点的算法 相互独立的任务 多元pomdp 受限制的pomdps
下载PDF
部分可观测Markov环境下的激励学习综述
7
作者 谢丽娟 陈焕文 《长沙电力学院学报(自然科学版)》 2002年第2期23-27,共5页
对智能体在不确定环境下的学习与规划问题的激励学习技术进行了综述 .首先介绍了用于描述隐状态问题的部分可观测Markov决策理论 (POMDPs) ,在简单回顾其它POMDP求解技术后 ,重点讨论环境模型事先未知的激励学习技术 ,包括两类 :一类为... 对智能体在不确定环境下的学习与规划问题的激励学习技术进行了综述 .首先介绍了用于描述隐状态问题的部分可观测Markov决策理论 (POMDPs) ,在简单回顾其它POMDP求解技术后 ,重点讨论环境模型事先未知的激励学习技术 ,包括两类 :一类为基于状态的值函数学习 ;一类为策略空间的直接搜索 .最后分析了这些方法尚存在的问题 ,并指出了未来可能的研究方向 . 展开更多
关键词 激励学习 部分可观测Markov决策过程 机器学习 人工智能 智能体 值函数学习 策略空间
下载PDF
U-Clustering:基于效用聚类的激励学习算法
8
作者 陈焕文 殷苌茗 谢丽娟 《计算机工程与应用》 CSCD 北大核心 2005年第26期37-42,74,共7页
提出了一个新的效用聚类激励学习算法U-Clustering。该算法完全不用像U-Tree算法那样进行边缘节点的生成和测试,它首先根据实例链的观测动作值对实例进行聚类,然后对每个聚类进行特征选择,最后再进行特征压缩,经过压缩后的新特征就成为... 提出了一个新的效用聚类激励学习算法U-Clustering。该算法完全不用像U-Tree算法那样进行边缘节点的生成和测试,它首先根据实例链的观测动作值对实例进行聚类,然后对每个聚类进行特征选择,最后再进行特征压缩,经过压缩后的新特征就成为新的状态空间树节点。通过对NewYorkDriving[2,13]的仿真和算法的实验分析,表明U-Clustering算法对解决大型部分可观测环境问题是比较有效的算法。 展开更多
关键词 激励学习 效用聚类 部分可观测Markov决策过程
下载PDF
基于后验信念聚类的在线规划算法
9
作者 仵博 吴敏 《计算机工程》 CAS CSCD 2013年第4期214-218,共5页
在连续状态的部分可观察马尔可夫决策过程中,在线规划无法同时满足高实时性与低误差的要求。为此,提出一种基于后验信念聚类的在线规划算法。使用KL散度分析连续状态下后验信念之间的误差,根据误差分析结果对后验信念进行聚类,利用聚类... 在连续状态的部分可观察马尔可夫决策过程中,在线规划无法同时满足高实时性与低误差的要求。为此,提出一种基于后验信念聚类的在线规划算法。使用KL散度分析连续状态下后验信念之间的误差,根据误差分析结果对后验信念进行聚类,利用聚类后验信念计算报酬值,并采用分支界限裁剪方法裁剪后验信念与或树。实验结果表明,该算法能够有效降低求解问题的规模,消除重复计算,具有较好的实时性和较低的误差。 展开更多
关键词 部分可观察马尔可夫决策过程 后验信念聚类 在线规划 KL散度 分支界限
下载PDF
基于信念重用的WSNs能量高效跟踪
10
作者 仵博 吴敏 +1 位作者 郑红燕 冯延蓬 《传感器与微系统》 CSCD 北大核心 2012年第8期30-33,共4页
针对无线传感器网络(WSNs)中目标跟踪性能与传感器能量消耗难以平衡问题,提出一种信念重用的WSNs能量高效跟踪算法。使用部分可观察马尔可夫决策过程(POMDPs)对动态不确定环境下的WSNs进行建模,将跟踪性能与能量消耗平衡优化问题转化为P... 针对无线传感器网络(WSNs)中目标跟踪性能与传感器能量消耗难以平衡问题,提出一种信念重用的WSNs能量高效跟踪算法。使用部分可观察马尔可夫决策过程(POMDPs)对动态不确定环境下的WSNs进行建模,将跟踪性能与能量消耗平衡优化问题转化为POMDPs最优值函数求解过程;采用最大报酬值启发式查找方法获得跟踪性能的逼近最优值;采用信念重用方法避免重复获取信念,有效降低传感器通信带来的能量消耗。实验结果表明:信念重用算法能够有效优化跟踪性能与能量消耗之间的平衡,达到以较低的能量消耗获得较高跟踪性能的目的。 展开更多
关键词 无线传感器网络 能量高效跟踪 信念重用 部分可观察马尔可夫决策过程
下载PDF
一种动态不确定性环境中的持续规划系统 被引量:11
11
作者 李响 陈小平 《计算机学报》 EI CSCD 北大核心 2005年第7期1163-1170,共8页
规划是人工智能研究的一个重要方向,具有极其广泛的应用背景.近年来,研究重点已经转移到动态不确定性环境中的规划问题.该文将部分可观察马尔可夫决策过程(POMDP)和过程性推理系统(PRS)的优点相结合,提出一种对动态不确定环境具有更全... 规划是人工智能研究的一个重要方向,具有极其广泛的应用背景.近年来,研究重点已经转移到动态不确定性环境中的规划问题.该文将部分可观察马尔可夫决策过程(POMDP)和过程性推理系统(PRS)的优点相结合,提出一种对动态不确定环境具有更全面适应能力的持续规划系统———POMDPRS.该系统利用PRS的持续规划机制,交叉地进行规划与执行,在一定条件下提高了动态环境中POMDP决策的效率;另一方面,用POMDP的概率分布信念模型和极大效用原理替代PRS的一阶逻辑信念表示和计划选择机制,大大增强了处理环境不确定性的能力. 展开更多
关键词 持续规划 动态不确定性环境 PRS pomdp pomdpRS
下载PDF
A non-myopic scheduling method of radar sensors for maneuvering target tracking and radiation control 被引量:15
12
作者 Gan-lin Shan Gong-guo Xu Cheng-lin Qiao 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2020年第1期242-250,共9页
In decades,the battlefield environment is becoming more and more complex with plenty of electronic equipments.Thus,in order to improve the survivability of radar sensors and satisfy the requirement of maneuvering targ... In decades,the battlefield environment is becoming more and more complex with plenty of electronic equipments.Thus,in order to improve the survivability of radar sensors and satisfy the requirement of maneuvering target tracking with a low probability of intercept,a non-myopic scheduling is proposed to minimize the radiation cost with tracking accuracy constraint.At first,the scheduling problem is formulated as a partially observable Markov decision process(POMDP).Then the tracking accuracy and radiation cost over the future finite time horizon are predicted by the posterior carmer-rao lower bound(PCRLB) and the hidden Markov model filter,respectively.Finally,the proposed scheduling is implemented efficiently by utilizing the branch and bound(B&B) pruning algorithm.Simulation results show that the performance of maneuvering target tracking was improved by the improved interacting multiple model(IMM),and the scheduler time and maximum memory consumption were significant reduced by the present B&B pruning algorithm without losing the optimal solution. 展开更多
关键词 Non-myopic scheduling RADIATION CONTROL PCRLB pomdp Branch and BOUND
下载PDF
不确定性环境下基于进化算法的强化学习 被引量:12
13
作者 刘海涛 洪炳熔 +1 位作者 朴松昊 王雪梅 《电子学报》 EI CAS CSCD 北大核心 2006年第7期1356-1360,共5页
不确定性和隐状态是目前强化学习所要面对的重要难题.本文提出了一种新的算法MA-Q-learning算法来求解带有这种不确定性的POMDP问题近似最优策略.利用M em etic算法来进化策略,而Q学习算法得到预测奖励来指出进化策略的适应度值.针对隐... 不确定性和隐状态是目前强化学习所要面对的重要难题.本文提出了一种新的算法MA-Q-learning算法来求解带有这种不确定性的POMDP问题近似最优策略.利用M em etic算法来进化策略,而Q学习算法得到预测奖励来指出进化策略的适应度值.针对隐状态问题,通过记忆agent最近经历的确定性的有限步历史信息,与表示所有可能状态上的概率分布的信度状态相结合,共同决策当前的最优策略.利用一种混合搜索方法来提高搜索效率,其中调整因子被用于保持种群的多样性,并且指导组合式交叉操作与变异操作.在POMDP的Benchm ark实例上的实验结果证明本文提出的算法性能优于其他的POMDP近似算法. 展开更多
关键词 部分可观察马尔可夫决策过程 Q学习 MEMETIC算法 信度状态 隐状态
下载PDF
基于POMDP的认知无线电自适应频谱感知算法 被引量:12
14
作者 许瑞琛 蒋挺 《通信学报》 EI CSCD 北大核心 2013年第6期49-56,共8页
针对如何建立适合毫秒级频谱空洞场景的频谱感知机制这一问题,推导出最佳次级用户单次数据传输时间长度,解决了数据传输量最大化的问题;其次提出一种基于部分可观测马尔科夫决策过程(POMDP,partiallyobservable Markov decision process... 针对如何建立适合毫秒级频谱空洞场景的频谱感知机制这一问题,推导出最佳次级用户单次数据传输时间长度,解决了数据传输量最大化的问题;其次提出一种基于部分可观测马尔科夫决策过程(POMDP,partiallyobservable Markov decision process)的自适应频谱感知算法,解决了快速接入毫秒级频谱空洞的问题。该算法根据上一决策时段的信念向量和感知结果自适应确定在当前决策时段内进行频谱感知或数据传输行为。仿真结果表明,该自适应频谱感知算法能够有效控制次级用户和主用户的冲突概率并增加频谱利用率。 展开更多
关键词 部分可观测马尔科夫决策过程 自适应感知 数据传输时间 冲突概率 频谱利用率
下载PDF
基于部分可观察马尔可夫决策过程的多被动传感器组网协同反隐身探测任务规划 被引量:12
15
作者 万开方 高晓光 +1 位作者 李波 梅军峰 《兵工学报》 EI CAS CSCD 北大核心 2015年第4期731-743,共13页
针对反隐身作战需求,提出多被动传感器组网协同战术。为提升反隐身探测效能,引入部分可观察马尔可夫决策过程(POMDP)理论,分析了POMDP任务规划要素,建立起多被动传感器组网协同反隐身探测任务规划POMDP模型。建立了多被动传感器协同控... 针对反隐身作战需求,提出多被动传感器组网协同战术。为提升反隐身探测效能,引入部分可观察马尔可夫决策过程(POMDP)理论,分析了POMDP任务规划要素,建立起多被动传感器组网协同反隐身探测任务规划POMDP模型。建立了多被动传感器协同控制系统结构,提出了基于无迹卡尔曼滤波(UKF)的信念状态更新方法和基于蒙特卡洛Rollout采样(MCRS)的Q值估计方法,并设计了CCSP基本策略。仿真结果表明,所建立的模型能够实现多被动传感器的高效管理调度,能够控制多被动传感器对隐身目标进行有效探测跟踪,即模型有效性得到了验证。 展开更多
关键词 控制科学与技术 传感器技术 反隐身 多传感器组网 部分可观察马尔可夫决策过程 信念状态 任务规划
下载PDF
人机混驾环境下无信号交叉口自动驾驶汽车左转运动规划研究 被引量:12
16
作者 张名芳 李慢 +2 位作者 陈子凡 王庞伟 程文冬 《中国公路学报》 EI CAS CSCD 北大核心 2021年第7期67-78,共12页
为了使自动驾驶汽车在人机混驾环境下能安全、高效地左转通过无信号交叉口,在借鉴人类驾驶人左转时会对周围车辆驾驶意图进行提前预判的基础上,提出了一种基于周围车辆驾驶意图预测的自动驾驶汽车左转运动规划模型。首先将无信号交叉口... 为了使自动驾驶汽车在人机混驾环境下能安全、高效地左转通过无信号交叉口,在借鉴人类驾驶人左转时会对周围车辆驾驶意图进行提前预判的基础上,提出了一种基于周围车辆驾驶意图预测的自动驾驶汽车左转运动规划模型。首先将无信号交叉口处周围车辆的驾驶意图分为左转、右转、直行3种类型,利用相关向量机预测周围车辆驾驶意图,以概率形式输出意图预测结果并实时更新,进一步界定自动驾驶汽车与周围车辆的潜在冲突区域并判断是否存在时空冲突;接着,在充分考虑他车速度、航向及车辆到达冲突区域边界距离的基础上建立基于部分可观测马尔可夫决策过程的自动驾驶汽车左转运动规划模型,生成一系列期望加速度;最后,基于Prescan-Simulink联合仿真平台搭建无信号交叉口仿真场景,对所提左转运动规划方法进行仿真验证,将基于博弈论的运动规划方法、基于人工势场理论的运动规划方法与所提出的方法进行比较,并选取行进比例达到1所用的时间和碰撞次数作为评价指标。研究结果表明:基于相关向量机的驾驶意图预测方法可在自动驾驶汽车到达交叉口之前准确预测出他车驾驶意图;基于部分可观测马尔可夫决策过程的左转运动规划方法能够通过速度调整策略实现人机混驾环境下自动驾驶汽车与周围车辆在无信号交叉口处的交互;不同算法对比效果表明,所提左转运动规划方法在自动驾驶汽车与不同数量周围车辆交互的仿真场景下均可有效避免碰撞事故发生并提高自动驾驶汽车左转通过无信号交叉口的效率。 展开更多
关键词 汽车工程 左转运动规划 部分可观测马尔可夫决策过程 无信号交叉口 人机混驾 自动驾驶汽车
原文传递
基于部分可观测Markov决策过程理论的盾构推进载荷规划 被引量:6
17
作者 胡祥涛 张红旗 +1 位作者 李自成 黄永安 《机械工程学报》 EI CAS CSCD 北大核心 2014年第21期84-91,共8页
针对盾构掘进过程中位姿控制问题,提出了基于部分可观测马尔科夫决策过程(Partially observable Markov decision processes,POMDP)理论的推进载荷规划方法。在推进载荷规划模型中,将盾构自动纠偏看成不确定环境下序贯决策问题,充分考... 针对盾构掘进过程中位姿控制问题,提出了基于部分可观测马尔科夫决策过程(Partially observable Markov decision processes,POMDP)理论的推进载荷规划方法。在推进载荷规划模型中,将盾构自动纠偏看成不确定环境下序贯决策问题,充分考虑掘进过程中随机因素的影响,将盾构掘进过程中受到的阻力、推进载荷和盾构位姿分别定义为POMDP的状态集、行动集和观测集,然后重点讨论了信念状态、状态转移函数和观测函数等几个关键参数的获取方法。在计算值函数时,考虑了盾构位姿偏离程度和盾构载荷平稳程度对推进载荷决策的影响,建立了立即收益函数和长期折扣收益函数,并采用基于点的值迭代算法寻求推进载荷最优规划策略。针对天津地铁9号线进行了案例分析,结果表明基于POMDP的推进载荷规划方法是合理有效的,能够顺应掘进阻力随机变化。 展开更多
关键词 盾构法 自动纠偏 pomdp 推进载荷规划
下载PDF
基于点的POMDP算法的预处理方法 被引量:6
18
作者 卞爱华 王崇骏 陈世福 《软件学报》 EI CSCD 北大核心 2008年第6期1309-1316,共8页
基于点的算法是部分可观察马尔可夫决策过程(partially observable Markov decision processes,简称POMDP)的一类近似算法.它们只在一个信念点集上进行Backup操作,避免了线性规划并使用了更少的中间变量,从而将计算瓶颈由选择向量转向... 基于点的算法是部分可观察马尔可夫决策过程(partially observable Markov decision processes,简称POMDP)的一类近似算法.它们只在一个信念点集上进行Backup操作,避免了线性规划并使用了更少的中间变量,从而将计算瓶颈由选择向量转向了生成向量.但这类算法在生成向量时含有大量重复和无意义计算,针对于此,提出了基于点的POMDP算法的预处理方法(preprocessing method for point-based algorithms,简称PPBA).该方法对每个样本信念点作预处理,并且在生成α-向量之前首先计算出该选取哪个动作和哪些α-向量,从而消除了重复计算.PPBA还提出了基向量的概念,利用问题的稀疏性避免了无意义计算.通过在Perseus上的实验,表明PPBA很大地提高了算法的执行速度. 展开更多
关键词 pomdp 值迭代 基于点的算法 预处理 基向量
下载PDF
一种动态不确定环境中机器人路径规划方法 被引量:5
19
作者 肖国宝 严宣辉 《计算机系统应用》 2012年第4期92-98,45,共8页
针对动态不确定环境下的机器人路径规划问题,将部分可观察马尔可夫决策过程(POMDP)与人工势场法(APF)的优点相结合,提出一种新的机器人路径规划方法。该方法充分考虑了实际环境中信息的部分可观测性,并且利用APF无需大量计算的优点指导P... 针对动态不确定环境下的机器人路径规划问题,将部分可观察马尔可夫决策过程(POMDP)与人工势场法(APF)的优点相结合,提出一种新的机器人路径规划方法。该方法充分考虑了实际环境中信息的部分可观测性,并且利用APF无需大量计算的优点指导POMDP算法的奖赏值设定,以提高POMDP算法的决策效率。仿真实验表明,所提出的算法拥有较高的搜索效率,能够快速地到达目标点。 展开更多
关键词 pomdp APF 路径规划 动态不确定环境 移动机器人
下载PDF
预测行人运动的服务机器人POMDP导航 被引量:5
20
作者 钱堃 马旭东 +1 位作者 戴先中 房芳 《机器人》 EI CSCD 北大核心 2010年第1期18-24,33,共8页
为提高室内动态环境下服务机器人对行人的自然避让能力,对人的运动轨迹模式进行建模,在此基础上引入了将行人运动长、短期预测结合起来的方法.为适应传感器噪声及网络延迟等因素所造成的感知—控制回路中的多源不确定性,将人与机器人的... 为提高室内动态环境下服务机器人对行人的自然避让能力,对人的运动轨迹模式进行建模,在此基础上引入了将行人运动长、短期预测结合起来的方法.为适应传感器噪声及网络延迟等因素所造成的感知—控制回路中的多源不确定性,将人与机器人的相对位置关系建模为部分可观的马尔可夫状态.采用部分可观的马尔可夫决策过程(POMDP)进行多源不确定性下的概率决策,协调控制机器人全局路径规划、反应式运动及速度控制等行为模块.实验结果验证,它能够实现提前避碰的安全导航,因避免反复的曲折与徘徊运动而提高了机器人导航效率. 展开更多
关键词 预测导航 运动估计 不确定性 pomdp
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部