期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种数据高效的第三人称模仿学习方法
被引量:
1
1
作者
姜冲
章宗长
+2 位作者
陈子璇
朱佳成
蒋俊鹏
《计算机科学》
CSCD
北大核心
2021年第2期238-244,共7页
模仿学习提供了一种能够使智能体从专家示范中学习如何决策的框架。在学习过程中,智能体无需与专家进行交互,也不依赖于环境的奖励信号,而只需要大量的专家示范。经典的模仿学习方法需要使用第一人称的专家示范,该示范由一个状态序列以...
模仿学习提供了一种能够使智能体从专家示范中学习如何决策的框架。在学习过程中,智能体无需与专家进行交互,也不依赖于环境的奖励信号,而只需要大量的专家示范。经典的模仿学习方法需要使用第一人称的专家示范,该示范由一个状态序列以及对应的专家动作序列组成。但是,在现实生活中,专家示范通常以第三人称视频的形式存在。相比第一人称专家示范,第三人称示范的观察视角与智能体的存在差异,导致两者之间缺乏一一对应关系,因此第三人称示范无法被直接用于模仿学习中。针对此问题,文中提出了一种数据高效的第三人称模仿学习方法。首先,该方法在生成对抗模仿学习的基础上引入了图像差分方法,利用马尔可夫决策过程的马尔可夫性质以及其状态的时间连续性,去除环境背景、颜色等领域特征,以得到观察图像中与行为策略最相关的部分,并将其用于模仿学习;其次,该方法引入了一个变分判别器瓶颈,以对判别器进行限制,进一步削弱了领域特征对策略学习的影响。为了验证所提算法的性能,通过MuJoCo平台中的3个实验环境对其进行了测试,并与已有算法进行了比较。实验结果表明,与已有的模仿学习方法相比,该方法在第三人称模仿学习任务中具有更好的性能表现,并且不需要额外增加对样本的需求。
展开更多
关键词
模仿学习
第三人称
领域特征
数据高效
图像差分
变分判别器瓶颈
下载PDF
职称材料
协方差驱动子空间模态参数辨识方法改进分析
被引量:
2
2
作者
李永军
马立元
+1 位作者
王天辉
李世龙
《中国机械工程》
EI
CAS
CSCD
北大核心
2012年第13期1533-1536,共4页
针对协方差驱动子空间模态参数辨识方法难以识别弱小模态的问题,提出了一种根据数据有效率选择数据块的改进方法。该方法采用数据有效率来选择协方差矩阵块,以提高自相关能量在协方差矩阵中的比例,从而实现对弱小模态的识别。对该方法...
针对协方差驱动子空间模态参数辨识方法难以识别弱小模态的问题,提出了一种根据数据有效率选择数据块的改进方法。该方法采用数据有效率来选择协方差矩阵块,以提高自相关能量在协方差矩阵中的比例,从而实现对弱小模态的识别。对该方法进行了仿真实验验证,验证结果表明,这一方法可以有效提高弱小模态的辨识质量。
展开更多
关键词
协方差
子空间
对角占优
数据有效率
下载PDF
职称材料
模糊先验引导的高效强化学习移动机器人导航
被引量:
1
3
作者
刘浚嘉
付庄
+2 位作者
谢荣理
张俊
费健
《机械与电子》
2021年第8期72-76,共5页
针对移动机器人仅使用RGB D相机在室内场景下执行坐标点主动视觉导航任务,提出了一种基于模糊先验引导的高效强化学习控制算法,设计了一种先验与强化学习的融合控制方式。结果表明,所提出的融合控制方法能够在确保较好的导航准确率基础...
针对移动机器人仅使用RGB D相机在室内场景下执行坐标点主动视觉导航任务,提出了一种基于模糊先验引导的高效强化学习控制算法,设计了一种先验与强化学习的融合控制方式。结果表明,所提出的融合控制方法能够在确保较好的导航准确率基础上,避免训练中无意义的探索并缩短强化学习训练时长,实现强化学习策略的高效学习。
展开更多
关键词
移动机器人主动视觉导航
坐标点导航
数据高效强化学习
下载PDF
职称材料
题名
一种数据高效的第三人称模仿学习方法
被引量:
1
1
作者
姜冲
章宗长
陈子璇
朱佳成
蒋俊鹏
机构
苏州大学计算机科学与技术学院
南京大学计算机软件新技术国家重点实验室
出处
《计算机科学》
CSCD
北大核心
2021年第2期238-244,共7页
基金
国家自然科学基金面上项目(61876119)
江苏省自然科学基金面上项目(BK20181432)
中央高校基本科研业务费专项资金(14380005)。
文摘
模仿学习提供了一种能够使智能体从专家示范中学习如何决策的框架。在学习过程中,智能体无需与专家进行交互,也不依赖于环境的奖励信号,而只需要大量的专家示范。经典的模仿学习方法需要使用第一人称的专家示范,该示范由一个状态序列以及对应的专家动作序列组成。但是,在现实生活中,专家示范通常以第三人称视频的形式存在。相比第一人称专家示范,第三人称示范的观察视角与智能体的存在差异,导致两者之间缺乏一一对应关系,因此第三人称示范无法被直接用于模仿学习中。针对此问题,文中提出了一种数据高效的第三人称模仿学习方法。首先,该方法在生成对抗模仿学习的基础上引入了图像差分方法,利用马尔可夫决策过程的马尔可夫性质以及其状态的时间连续性,去除环境背景、颜色等领域特征,以得到观察图像中与行为策略最相关的部分,并将其用于模仿学习;其次,该方法引入了一个变分判别器瓶颈,以对判别器进行限制,进一步削弱了领域特征对策略学习的影响。为了验证所提算法的性能,通过MuJoCo平台中的3个实验环境对其进行了测试,并与已有算法进行了比较。实验结果表明,与已有的模仿学习方法相比,该方法在第三人称模仿学习任务中具有更好的性能表现,并且不需要额外增加对样本的需求。
关键词
模仿学习
第三人称
领域特征
数据高效
图像差分
变分判别器瓶颈
Keywords
Imitation
learning
Third-person
Domain
feature
data
efficient
Image
difference
Variational
discriminator
bottleneck
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
协方差驱动子空间模态参数辨识方法改进分析
被引量:
2
2
作者
李永军
马立元
王天辉
李世龙
机构
军械工程学院
出处
《中国机械工程》
EI
CAS
CSCD
北大核心
2012年第13期1533-1536,共4页
文摘
针对协方差驱动子空间模态参数辨识方法难以识别弱小模态的问题,提出了一种根据数据有效率选择数据块的改进方法。该方法采用数据有效率来选择协方差矩阵块,以提高自相关能量在协方差矩阵中的比例,从而实现对弱小模态的识别。对该方法进行了仿真实验验证,验证结果表明,这一方法可以有效提高弱小模态的辨识质量。
关键词
协方差
子空间
对角占优
数据有效率
Keywords
covariance
subspace
diagonal
dominate
data
efficient
ratio
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
模糊先验引导的高效强化学习移动机器人导航
被引量:
1
3
作者
刘浚嘉
付庄
谢荣理
张俊
费健
机构
上海交通大学机械系统与振动国家重点实验室
上海交通大学医学院附属瑞金医院
出处
《机械与电子》
2021年第8期72-76,共5页
基金
国家自然科学基金面上项目(61973210)
医工交叉项目(YG2019ZDA17,ZH2018QNB23)
八院联合基金(USCAST2020-7)。
文摘
针对移动机器人仅使用RGB D相机在室内场景下执行坐标点主动视觉导航任务,提出了一种基于模糊先验引导的高效强化学习控制算法,设计了一种先验与强化学习的融合控制方式。结果表明,所提出的融合控制方法能够在确保较好的导航准确率基础上,避免训练中无意义的探索并缩短强化学习训练时长,实现强化学习策略的高效学习。
关键词
移动机器人主动视觉导航
坐标点导航
数据高效强化学习
Keywords
mobile
robot
active
visual
navigation
point
navigation
data
efficient
reinforcement
learning
分类号
TP249 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种数据高效的第三人称模仿学习方法
姜冲
章宗长
陈子璇
朱佳成
蒋俊鹏
《计算机科学》
CSCD
北大核心
2021
1
下载PDF
职称材料
2
协方差驱动子空间模态参数辨识方法改进分析
李永军
马立元
王天辉
李世龙
《中国机械工程》
EI
CAS
CSCD
北大核心
2012
2
下载PDF
职称材料
3
模糊先验引导的高效强化学习移动机器人导航
刘浚嘉
付庄
谢荣理
张俊
费健
《机械与电子》
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部