期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
发现和学习不可复位动态系统的预测状态表示的一种新算法 被引量:2
1
作者 刘云龙 李人厚 《电子学报》 EI CAS CSCD 北大核心 2009年第1期126-131,共6页
提出了一种发现和学习不可复位动态系统的预测状态表示的新算法.在证明系统的任意landmark均可作为系统的初始状态的基础上,利用发现的landmark确定系统在任意时间步所处的经历,然后采用蒙特卡罗方法估计任意经历下任意检验发生的概率,... 提出了一种发现和学习不可复位动态系统的预测状态表示的新算法.在证明系统的任意landmark均可作为系统的初始状态的基础上,利用发现的landmark确定系统在任意时间步所处的经历,然后采用蒙特卡罗方法估计任意经历下任意检验发生的概率,解决了在不可复位动态系统中,经历下检验发生的概率难以获取问题,进而发现和学习不可复位动态系统的预测状态表示.实验结果表明,本文算法获得的系统的预测状态表示在预测精度上明显优于suffix-history算法,验证了所提算法的有效性. 展开更多
关键词 预测状态表示 不可复位动态系统 LANDMARK suffix—history算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部