-
题名记忆增强型深度强化学习研究综述
被引量:6
- 1
-
-
作者
汪晨
曾凡玉
郭九霞
-
机构
电子科技大学计算机科学与工程学院
中国民航飞行学院空中交通管理学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第3期454-461,共8页
-
基金
国家自然科学基金-联合基金项目(U181320052)资助
国家自然科学基金面上项目(6177020680)资助
+2 种基金
国家自然科学基金青年科学基金项目(62003381)资助
国家重点研发计划项目(2018YFC0831801)资助
四川省重点研发项目(17ZDYF3184)资助.
-
文摘
近年来,深度强化学习的取得了飞速发展,为了提高深度强化学习处理高维状态空间或动态复杂环境的能力,研究者将记忆增强型神经网络引入到深度强化学习,并提出了不同的记忆增强型深度强化学习算法,记忆增强型深度强化学习已成为当前的研究热点.本文根据记忆增强型神经网络类型,将记忆增强型深度强化学习分为了4类:基于经验回放的深度强化学习、基于记忆网络的深度强化学习算法、基于情景记忆的深度强化学习算法、基于可微分计算机的深度强化学习.同时,系统性地总结和分析了记忆增强型深度强化学习的一系列研究成果存在的优势和不足.另外,给出了深度强化学习常用的训练环境.最后,对记忆增强型深度强化学习进行了展望,指出了未来研究方向.
-
关键词
深度强化学习
经验回放
记忆网络
情景记忆
可微分计算机
-
Keywords
deep reinforcement learning
experience replay
memory networks
episodic memory
differentiable neural computer
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名记忆神经网络在机器人导航领域的应用与研究进展
被引量:4
- 2
-
-
作者
王作为
徐征
张汝波
洪才森
王殊
-
机构
天津工业大学计算机科学与技术学院
天津工业大学机械工程学院博士后工作站
天津动核芯科技有限公司
天津职业技术师范大学汽车与交通学院
大连民族大学机电工程学院
-
出处
《智能系统学报》
CSCD
北大核心
2020年第5期835-846,共12页
-
基金
国家自然科学基金面上项目(61972456)
天津市教委科研计划项目(2019KJ018)
天津工业大学学位与研究生教育改革项目(Y20180104).
-
文摘
记忆神经网络非常适合解决时间序列决策问题,将其用于机器人导航领域是非常有前景的新兴研究领域。本文主要讨论记忆神经网络在机器人导航领域的研究进展。给出几种基本记忆神经网络结合导航任务的工作机理,总结了不同模型的优缺点;对记忆神经网络在导航领域的研究进展进行简要综述;进一步介绍导航验证环境的发展;最后梳理了记忆神经网络在导航问题所面临的复杂性挑战,并预测了记忆神经网络在导航领域未来的发展方向。
-
关键词
记忆神经网络
机器人导航
深度强化学习
可微神经计算机
可微神经字典
深度学习
强化学习
记忆网络
-
Keywords
memory neural network
robot navigation
deep reinforcement learning
differentiable neural computer
differentiable neural dictionary
deep learning
reinforcement learning
memory networks
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于可微神经计算机和贝叶斯网络的知识推理方法
被引量:3
- 3
-
-
作者
孙建强
许少华
-
机构
山东科技大学计算机科学与工程学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第2期337-342,共6页
-
基金
国家重点研发计划项目(2018YFC1406203)。
-
文摘
针对人工神经网络(ANN)对面向知识图谱(KG)的知识推理的记忆能力有限以及KG无法处理不确定知识的问题,提出一种可微神经计算机(DNC)和贝叶斯网络(BN)相结合的推理方法DNC-BN。首先,将长短时记忆(LSTM)网络作为控制器,在每个时刻对输入向量和从记忆体获取的读向量进行处理,得到网络输出向量和交互向量;其次,通过读写头实现控制器与记忆体的交互,使用读取权重计算数据的加权平均以得到读向量,并用写入权重结合擦除向量及写入向量进行写操作,对存储矩阵进行修改;最后,基于概率推理机制,使用BN对数据节点之间存在的推理关系进行判断,对KG进行补全。在数据集WN18RR上的推理中,DNC-BN的Mean Rank为2615,Hits@10为0.528;在数据集FB15k-237上的推理中,DNC-BN的Mean Rank为202,Hits@10为0.519。实验结果表明,DNC-BN方法对面向KG的知识推理具有良好的应用效果。
-
关键词
知识图谱
知识推理
可微神经计算机
贝叶斯网络
长期记忆
-
Keywords
Knowledge Graph(KG)
knowledge reasoning
differentiable neural computer
Bayesian network
longterm memory
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-