期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
记忆增强型深度强化学习研究综述 被引量:6
1
作者 汪晨 曾凡玉 郭九霞 《小型微型计算机系统》 CSCD 北大核心 2021年第3期454-461,共8页
近年来,深度强化学习的取得了飞速发展,为了提高深度强化学习处理高维状态空间或动态复杂环境的能力,研究者将记忆增强型神经网络引入到深度强化学习,并提出了不同的记忆增强型深度强化学习算法,记忆增强型深度强化学习已成为当前的研... 近年来,深度强化学习的取得了飞速发展,为了提高深度强化学习处理高维状态空间或动态复杂环境的能力,研究者将记忆增强型神经网络引入到深度强化学习,并提出了不同的记忆增强型深度强化学习算法,记忆增强型深度强化学习已成为当前的研究热点.本文根据记忆增强型神经网络类型,将记忆增强型深度强化学习分为了4类:基于经验回放的深度强化学习、基于记忆网络的深度强化学习算法、基于情景记忆的深度强化学习算法、基于可微分计算机的深度强化学习.同时,系统性地总结和分析了记忆增强型深度强化学习的一系列研究成果存在的优势和不足.另外,给出了深度强化学习常用的训练环境.最后,对记忆增强型深度强化学习进行了展望,指出了未来研究方向. 展开更多
关键词 深度强化学习 经验回放 记忆网络 情景记忆 可微分计算机
下载PDF
记忆神经网络在机器人导航领域的应用与研究进展 被引量:4
2
作者 王作为 徐征 +2 位作者 张汝波 洪才森 王殊 《智能系统学报》 CSCD 北大核心 2020年第5期835-846,共12页
记忆神经网络非常适合解决时间序列决策问题,将其用于机器人导航领域是非常有前景的新兴研究领域。本文主要讨论记忆神经网络在机器人导航领域的研究进展。给出几种基本记忆神经网络结合导航任务的工作机理,总结了不同模型的优缺点;对... 记忆神经网络非常适合解决时间序列决策问题,将其用于机器人导航领域是非常有前景的新兴研究领域。本文主要讨论记忆神经网络在机器人导航领域的研究进展。给出几种基本记忆神经网络结合导航任务的工作机理,总结了不同模型的优缺点;对记忆神经网络在导航领域的研究进展进行简要综述;进一步介绍导航验证环境的发展;最后梳理了记忆神经网络在导航问题所面临的复杂性挑战,并预测了记忆神经网络在导航领域未来的发展方向。 展开更多
关键词 记忆神经网络 机器人导航 深度强化学习 可微神经计算机 可微神经字典 深度学习 强化学习 记忆网络
下载PDF
基于可微神经计算机和贝叶斯网络的知识推理方法 被引量:3
3
作者 孙建强 许少华 《计算机应用》 CSCD 北大核心 2021年第2期337-342,共6页
针对人工神经网络(ANN)对面向知识图谱(KG)的知识推理的记忆能力有限以及KG无法处理不确定知识的问题,提出一种可微神经计算机(DNC)和贝叶斯网络(BN)相结合的推理方法DNC-BN。首先,将长短时记忆(LSTM)网络作为控制器,在每个时刻对输入... 针对人工神经网络(ANN)对面向知识图谱(KG)的知识推理的记忆能力有限以及KG无法处理不确定知识的问题,提出一种可微神经计算机(DNC)和贝叶斯网络(BN)相结合的推理方法DNC-BN。首先,将长短时记忆(LSTM)网络作为控制器,在每个时刻对输入向量和从记忆体获取的读向量进行处理,得到网络输出向量和交互向量;其次,通过读写头实现控制器与记忆体的交互,使用读取权重计算数据的加权平均以得到读向量,并用写入权重结合擦除向量及写入向量进行写操作,对存储矩阵进行修改;最后,基于概率推理机制,使用BN对数据节点之间存在的推理关系进行判断,对KG进行补全。在数据集WN18RR上的推理中,DNC-BN的Mean Rank为2615,Hits@10为0.528;在数据集FB15k-237上的推理中,DNC-BN的Mean Rank为202,Hits@10为0.519。实验结果表明,DNC-BN方法对面向KG的知识推理具有良好的应用效果。 展开更多
关键词 知识图谱 知识推理 可微神经计算机 贝叶斯网络 长期记忆
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部