期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种数据高效的第三人称模仿学习方法 被引量:1
1
作者 姜冲 章宗长 +2 位作者 陈子璇 朱佳成 蒋俊鹏 《计算机科学》 CSCD 北大核心 2021年第2期238-244,共7页
模仿学习提供了一种能够使智能体从专家示范中学习如何决策的框架。在学习过程中,智能体无需与专家进行交互,也不依赖于环境的奖励信号,而只需要大量的专家示范。经典的模仿学习方法需要使用第一人称的专家示范,该示范由一个状态序列以... 模仿学习提供了一种能够使智能体从专家示范中学习如何决策的框架。在学习过程中,智能体无需与专家进行交互,也不依赖于环境的奖励信号,而只需要大量的专家示范。经典的模仿学习方法需要使用第一人称的专家示范,该示范由一个状态序列以及对应的专家动作序列组成。但是,在现实生活中,专家示范通常以第三人称视频的形式存在。相比第一人称专家示范,第三人称示范的观察视角与智能体的存在差异,导致两者之间缺乏一一对应关系,因此第三人称示范无法被直接用于模仿学习中。针对此问题,文中提出了一种数据高效的第三人称模仿学习方法。首先,该方法在生成对抗模仿学习的基础上引入了图像差分方法,利用马尔可夫决策过程的马尔可夫性质以及其状态的时间连续性,去除环境背景、颜色等领域特征,以得到观察图像中与行为策略最相关的部分,并将其用于模仿学习;其次,该方法引入了一个变分判别器瓶颈,以对判别器进行限制,进一步削弱了领域特征对策略学习的影响。为了验证所提算法的性能,通过MuJoCo平台中的3个实验环境对其进行了测试,并与已有算法进行了比较。实验结果表明,与已有的模仿学习方法相比,该方法在第三人称模仿学习任务中具有更好的性能表现,并且不需要额外增加对样本的需求。 展开更多
关键词 模仿学习 第三人称 领域特征 数据高效 图像差分 变分判别器瓶颈
下载PDF
协方差驱动子空间模态参数辨识方法改进分析 被引量:2
2
作者 李永军 马立元 +1 位作者 王天辉 李世龙 《中国机械工程》 EI CAS CSCD 北大核心 2012年第13期1533-1536,共4页
针对协方差驱动子空间模态参数辨识方法难以识别弱小模态的问题,提出了一种根据数据有效率选择数据块的改进方法。该方法采用数据有效率来选择协方差矩阵块,以提高自相关能量在协方差矩阵中的比例,从而实现对弱小模态的识别。对该方法... 针对协方差驱动子空间模态参数辨识方法难以识别弱小模态的问题,提出了一种根据数据有效率选择数据块的改进方法。该方法采用数据有效率来选择协方差矩阵块,以提高自相关能量在协方差矩阵中的比例,从而实现对弱小模态的识别。对该方法进行了仿真实验验证,验证结果表明,这一方法可以有效提高弱小模态的辨识质量。 展开更多
关键词 协方差 子空间 对角占优 数据有效率
下载PDF
模糊先验引导的高效强化学习移动机器人导航 被引量:1
3
作者 刘浚嘉 付庄 +2 位作者 谢荣理 张俊 费健 《机械与电子》 2021年第8期72-76,共5页
针对移动机器人仅使用RGB D相机在室内场景下执行坐标点主动视觉导航任务,提出了一种基于模糊先验引导的高效强化学习控制算法,设计了一种先验与强化学习的融合控制方式。结果表明,所提出的融合控制方法能够在确保较好的导航准确率基础... 针对移动机器人仅使用RGB D相机在室内场景下执行坐标点主动视觉导航任务,提出了一种基于模糊先验引导的高效强化学习控制算法,设计了一种先验与强化学习的融合控制方式。结果表明,所提出的融合控制方法能够在确保较好的导航准确率基础上,避免训练中无意义的探索并缩短强化学习训练时长,实现强化学习策略的高效学习。 展开更多
关键词 移动机器人主动视觉导航 坐标点导航 数据高效强化学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部