深度强化学习(DRL)已被成功应用于移动机器人路径规划中,基于DRL的移动机器人路径规划算法适用于高维环境,是实现移动机器人自主学习的重要方法。而训练DRL模型需要大量的环境交互经验,这意味着更高的计算成本。此外,DRL算法的经验池容...深度强化学习(DRL)已被成功应用于移动机器人路径规划中,基于DRL的移动机器人路径规划算法适用于高维环境,是实现移动机器人自主学习的重要方法。而训练DRL模型需要大量的环境交互经验,这意味着更高的计算成本。此外,DRL算法的经验池容量有限,无法确保经验的有效利用。作为类脑计算重要工具之一的脉冲神经网络(Spiking Neural Networks,SNNs)以其独有的生物似真性,能同时融入时空信息,适用于机器人环境感知及控制。结合SNNs、卷积神经网络(CNNs)和策略融合,针对基于DRL的移动机器人路径规划算法进行研究,完成了以下工作:1)提出SCDDPG(SCDDP)算法。该算法利用CNNs对输入状态进行多通道特征提取,利用SNNs对提取的特征进行时空学习。2)在SCDDPG的基础上,提出SC2DDPG(SC2DDPG)算法。SC2DDPG通过设计状态约束策略对机器人运行状态进行约束,避免了不必要的环境探索,提升了SC2DDPG中DRL的收敛速度。3)在SCDDPG的基础上,提出了PFTDDPG(Policy Fusion and Transfer SCDDPG,PFTDDPG)算法。该算法采用分阶控制模式与DRL算法融合,针对环境中的楔形障碍物实施沿墙行走策略,并引入迁移学习对先验知识进行策略迁移。PFTDDPG算法不仅完成了单纯依靠RL不能完成的路径规划任务,还可以得到最优无碰路径。此外PFTDDPG提升了模型的收敛速度和路径规划性能。实验结果证明了所提出的3种路径规划算法的有效性,对比实验结果表明:在SpikeDDPG,SCDDPG,SC2DDPG和PFTDDPG算法中,PFTDDPG算法在路径规划成功率、训练收敛速度、规划路径长度等性能指标上表现最佳。本工作为移动机器人路径规划提出了新思路,丰富了DRL在移动机器人路径规划中的解决方案。展开更多
0625143服务机器人多通道人机交互感知反馈工作机制及关键技术=Information perception and feedback mechanism and key techniques of multi-modality human-robot inter- action for service robots[刊,英]/赵其杰//上海大学学报(英...0625143服务机器人多通道人机交互感知反馈工作机制及关键技术=Information perception and feedback mechanism and key techniques of multi-modality human-robot inter- action for service robots[刊,英]/赵其杰//上海大学学报(英文版).—2006,10(3).—281(E) 0625144可重构星球探测机器人跨越壕沟能力研究=Crossing ditch for reconfigurable planetary robocs[刊,英]/张力平//上海大学学报(英文版).—2006,10(3).—256-261 (E) 0625145一种2自由度平面并联机器人的精度分析[刊,中]/李贯成//南昌大学学报(工科版).—2006,28(2).—130- 133(G)以一种2自由度平面并联机器人机构为对象,分析了该并联机器人机构的误差源,首先利用图解法得到该平面并联机器人机构的可达工作空间和有效工作空间,再利用环路增量法和误差分离技术导出了末端位置误差与误差源之间的映射关系,因而为其...展开更多
Y98-61482-470 9908556电子设计自动化和网络=EDA and network[会,英]/Spiller,M.D.& Newton,A.R.//1997 IEEE Inter-national Conference on Computer-Aided Design.—470~476(HG)Y98-61482-507 9908557硬件/软件联合设计的划分(...Y98-61482-470 9908556电子设计自动化和网络=EDA and network[会,英]/Spiller,M.D.& Newton,A.R.//1997 IEEE Inter-national Conference on Computer-Aided Design.—470~476(HG)Y98-61482-507 9908557硬件/软件联合设计的划分(含3篇文章)=Session9B:partitioning for HW/SW codesign[会,英]//1997IEEE International Conference on Computer-Aided De-sign.—507~529(HG)展开更多
文摘深度强化学习(DRL)已被成功应用于移动机器人路径规划中,基于DRL的移动机器人路径规划算法适用于高维环境,是实现移动机器人自主学习的重要方法。而训练DRL模型需要大量的环境交互经验,这意味着更高的计算成本。此外,DRL算法的经验池容量有限,无法确保经验的有效利用。作为类脑计算重要工具之一的脉冲神经网络(Spiking Neural Networks,SNNs)以其独有的生物似真性,能同时融入时空信息,适用于机器人环境感知及控制。结合SNNs、卷积神经网络(CNNs)和策略融合,针对基于DRL的移动机器人路径规划算法进行研究,完成了以下工作:1)提出SCDDPG(SCDDP)算法。该算法利用CNNs对输入状态进行多通道特征提取,利用SNNs对提取的特征进行时空学习。2)在SCDDPG的基础上,提出SC2DDPG(SC2DDPG)算法。SC2DDPG通过设计状态约束策略对机器人运行状态进行约束,避免了不必要的环境探索,提升了SC2DDPG中DRL的收敛速度。3)在SCDDPG的基础上,提出了PFTDDPG(Policy Fusion and Transfer SCDDPG,PFTDDPG)算法。该算法采用分阶控制模式与DRL算法融合,针对环境中的楔形障碍物实施沿墙行走策略,并引入迁移学习对先验知识进行策略迁移。PFTDDPG算法不仅完成了单纯依靠RL不能完成的路径规划任务,还可以得到最优无碰路径。此外PFTDDPG提升了模型的收敛速度和路径规划性能。实验结果证明了所提出的3种路径规划算法的有效性,对比实验结果表明:在SpikeDDPG,SCDDPG,SC2DDPG和PFTDDPG算法中,PFTDDPG算法在路径规划成功率、训练收敛速度、规划路径长度等性能指标上表现最佳。本工作为移动机器人路径规划提出了新思路,丰富了DRL在移动机器人路径规划中的解决方案。
文摘0625143服务机器人多通道人机交互感知反馈工作机制及关键技术=Information perception and feedback mechanism and key techniques of multi-modality human-robot inter- action for service robots[刊,英]/赵其杰//上海大学学报(英文版).—2006,10(3).—281(E) 0625144可重构星球探测机器人跨越壕沟能力研究=Crossing ditch for reconfigurable planetary robocs[刊,英]/张力平//上海大学学报(英文版).—2006,10(3).—256-261 (E) 0625145一种2自由度平面并联机器人的精度分析[刊,中]/李贯成//南昌大学学报(工科版).—2006,28(2).—130- 133(G)以一种2自由度平面并联机器人机构为对象,分析了该并联机器人机构的误差源,首先利用图解法得到该平面并联机器人机构的可达工作空间和有效工作空间,再利用环路增量法和误差分离技术导出了末端位置误差与误差源之间的映射关系,因而为其...
文摘Y98-61482-470 9908556电子设计自动化和网络=EDA and network[会,英]/Spiller,M.D.& Newton,A.R.//1997 IEEE Inter-national Conference on Computer-Aided Design.—470~476(HG)Y98-61482-507 9908557硬件/软件联合设计的划分(含3篇文章)=Session9B:partitioning for HW/SW codesign[会,英]//1997IEEE International Conference on Computer-Aided De-sign.—507~529(HG)