可变环境下仿人机器人智能姿态控制被引量：8

Intelligent Posture Control of Humanoid Robot in Variable Environment

导出

摘要为了解决仿人机器人运动控制精度和运动稳定性差等问题,提出智能运动姿态控制算法。将连续动作和连续状态空间的深度强化学习应用于姿态控制,建立机器人运动智能姿态控制器。并针对物理样机训练样本少、效率低等问题,提出使用机器人辨识模型对姿态控制器进行离线的预训练,作为真实物理环境下继续学习提升的先验知识,提高了后期训练效率。将优化后的机器人姿态控制器用于机器人的运动控制中,分别和加入PID控制器、MPC控制器、以及PID+MPC控制器的机器人运动相比,在环境过渡步行试验中机器人上身俯仰姿态轨迹跟踪残差标准差分别减少60.97%,46.36%,23.98%,在平地障碍物步行试验中机器人上身俯仰姿态轨迹跟踪残差标准差分别减少60.38%,26.38%,9.52%。 To solve the problems of motion instability of humanoid robots in variable uncertain,unstructured terrain and the low accuracy motion control,intelligent posture motion control algorithm is proposed.The deep reinforcement learning based continuous motion and continuous state space is applied to posture control,and the humanoid robot motion intelligent posture controller is established.Aiming at the problems of less sample and low efficiency of physical prototype training,the identification robot model is present to perform offline pre-training of the posture controller as a prior knowledge for continuous learning and in the real physical environment,improve the training efficiency in the later stage.The optimized robot posture controller is applied to the motion control of the robot.Compared with the robot motion with PID controller,MPC controller and PID+MPC controller,the standard deviation of the upper body pitch posture trajectory tracking error of the robot is reduced by 60.97%,46.36%,23.98%in the environmental transitional walking test,respectively.In the walking test of ground obstacles,the standard deviations of the trajectory tracking errors of the robot's upper body pitching posture are reduced by 60.38%,26.38%and 9.52%,respectively.

作者施群吕雷谢家骏 SHI Qun;Lü Lei;XIE Jiajun(School of Mechanical and Electrical Engineering and Automation,Shanghai University,Shanghai 200444)

机构地区上海大学机电工程与自动化学院

出处《机械工程学报》 EI CAS CSCD 北大核心 2020年第3期64-72,共9页 Journal of Mechanical Engineering

关键词双足步行深度强化学习运动控制 bipedal walking deep reinforcement learning motion control

分类号 TG156 [金属学及工艺—热处理]

引文网络
相关文献

参考文献8

1陈奇石..强化学习在仿人机器人行走稳定控制上的研究及实现[D].华南理工大学,2016:
2丁长涛..随机不确定扰动下平面双足机器人动力学响应特性研究[D].浙江大学,2016:
3ZHANG Junyuan,JIN Yang,XIE Lizhe,CHEN Chao.Establishment and Validation for the Theoretical Model of the Vehicle Airbag[J].Chinese Journal of Mechanical Engineering,2015,28(3):487-495. 被引量：2
4刘道远..基于Q学习的欠驱动双足机器人行走控制研究[D].浙江大学,2013:
5侯文擎,叶鸣,李巍华.基于改进堆叠降噪自编码的滚动轴承故障分类[J].机械工程学报,2018,54(7):87-96. 被引量：67
6Si-Yu Shao,Wen-Jun Sun,Ru-Qiang Yan,Peng Wang,Robert X Gao.A Deep Learning Approach for Fault Diagnosis of Induction Motors in Manufacturing[J].Chinese Journal of Mechanical Engineering,2017,30(6):1347-1356. 被引量：18
7王文玺,肖世德,孟祥印,陈应松,张卫华.基于Agent的递阶强化学习模型与体系结构[J].机械工程学报,2010,46(2):76-82. 被引量：4
8ZHOU Shihua,SONG Guiqiu,REN Zhaohui,WEN Bangchun.Nonlinear Dynamic Analysis of Coupled Gear-Rotor-Bearing System with the Effect of Internal and External Excitations[J].Chinese Journal of Mechanical Engineering,2016,29(2):281-292. 被引量：11

二级参考文献31

1ZHANG Junyuan,MA Yue,CHEN Chao,ZHANG Yan.Design and Optimization for the Occupant Restraint System of Vehicle Based on a Single Freedom Model[J].Chinese Journal of Mechanical Engineering,2013,26(3):492-497. 被引量：6
2罗英伟,汪小林,许卓群.分布式GIS的多Agent系统建模与实现[J].计算机辅助设计与图形学学报,2004,16(12):1730-1737. 被引量：13
3周庆忠,曾慧娥.基于多智能代理的装备动态优化调拨系统研究[J].机械工程学报,2005,41(2):97-101. 被引量：9
4伍奎,李润方,刘景浩.智能化系统的知识表达与推理机制[J].机械工程学报,2005,41(5):98-103. 被引量：19
5杜春侠,高云,张文.多智能体系统中具有先验知识的Q学习算法[J].清华大学学报（自然科学版）,2005,45(7):981-984. 被引量：21
6袁胜发,褚福磊,何永勇.基于网格支持矢量机的涡轮泵多故障诊断[J].机械工程学报,2007,43(4):152-158. 被引量：9
7SUTTON R S, BARTO AG. Reinforcement learning- introduction[M]. Cambridge: The MIT Press, 1998. 被引量：1
8BRATMAN M E. Intentions, plans, and practical reason[M]. Cambridge, MA: Harvard University Press, 1987. 被引量：1
9DIETTERICH T G. Machine learning research: Four current directions[J]. Artificial Intelligence Magazine,1997, 18(4): 97-136. 被引量：1
10SPIROS K, DANIEL K. Reinforcement learning of coordination in cooperative MAS[C]//The 18th National Conference on AI, Alberta, Canada: ACM Press, 2002: 326-331. 被引量：1

共引文献96

1魏卫,王磊,张鑫.基于AEN重构误差的滚动轴承异常检测方法研究[J].数字制造科学,2019,0(4):292-297. 被引量：1
2王皓,韩科立,韩树杰,郝付平,韩增德,赵亚宁.基于粒子群算法和SDAE的采棉头故障诊断研究[J].农业机械学报,2023,54(S02):164-172. 被引量：3
3徐阳.用高新技术驾驭天气[J].国外科技动态,2000,0(1):27-28.
4李昕.适应一个更温暖的世界[J].国外科技动态,2000(1):38-39.
5张希.关于调和映照的一个Liouville型定理[J].浙江大学学报（理学版）,2000,27(2):124-127. 被引量：2
6刘全,傅启明,杨旭东,荆玲,李瑾,李娇.一种基于智能调度的可扩展并行强化学习方法[J].计算机研究与发展,2013,50(4):843-851. 被引量：3
7刘杨,李炎臻,石拓,马辉,闻邦椿.转子-滑动轴承系统不对中-碰摩耦合故障分析[J].机械工程学报,2016,52(13):79-86. 被引量：32
8钱露露,唐进元,陈思雨,刘洋.单级齿轮传动系统有限元节点动力学模型及高速动态性能分析[J].机械工程学报,2016,52(17):155-161. 被引量：10
9洪煌杰,王红岩,李建阳,吕哲源,芮强.空投装备缓冲气囊匹配设计与仿真计算研究[J].装备环境工程,2017,14(5):1-7. 被引量：7
10冯海生,王黎钦,彭波,赵小力,郑德志.高速大功率密度齿轮传动系统的干摩擦阻尼环减振特性研究[J].机械工程学报,2017,53(21):37-45. 被引量：10

同被引文献52

1胡艳明,李德才,何玉庆,韩建达.基于增量式RBF网络的Q学习算法[J].机器人,2019,41(5):562-573. 被引量：7
2宿月文,朱爱斌,陈渭,谢友柏.间隙约束副摩擦接触对多体系统动态特性的影响[J].润滑与密封,2008,33(8):16-19. 被引量：4
3常宝娴,丁洁,朱俊武,章永龙.未知环境下机器人Q学习覆盖算法[J].南京理工大学学报,2013,37(6):792-798. 被引量：2
4陈宗海,杨志华,王海波,盛捷.从知识的表达和运用综述强化学习研究[J].控制与决策,2008,23(9):961-968. 被引量：15
5刘业超,金明河,刘宏.柔性关节机器人基于柔性补偿的奇异摄动控制[J].机器人,2008,30(5):460-466. 被引量：24
6孙汉旭,褚明,贾庆轩.柔性关节摩擦和不确定补偿的小波神经——鲁棒复合控制[J].机械工程学报,2010,46(13):68-75. 被引量：7
7丁千,翟红梅.机械系统摩擦动力学研究进展[J].力学进展,2013,43(1):112-131. 被引量：82
8王珂,卜祥津,李瑞峰,赵立军.景深约束下的深度强化学习机器人路径规划[J].华中科技大学学报（自然科学版）,2018,46(12):77-82. 被引量：20
9谢立敏,陈力.漂浮基柔性关节、柔性臂空间机器人动力学建模、饱和鲁棒模糊滑模控制及双重柔性振动主动抑制[J].机械工程学报,2015,51(1):76-82. 被引量：15
10吴伟国.面向作业与人工智能的仿人机器人研究进展[J].哈尔滨工业大学学报,2015,47(7):1-19. 被引量：34

引证文献8

1沈为清.一种交叉足步行机器人的设计[J].机电工程技术,2020,49(12):95-96. 被引量：2
2施群,蒋坤.基于协同学习的柔性关节智能控制[J].工业控制计算机,2021,34(5):97-99. 被引量：1
3董豪,杨静,李少波,王军,段仲静.基于深度强化学习的机器人运动控制研究进展[J].控制与决策,2022,37(2):278-292. 被引量：43
4刘臻,胡三宝,胡军华,向超.基于深度学习方法的含间隙铰链多刚体系统的动力学建模与分析[J].机械工程学报,2022,58(9):136-146. 被引量：6
5段书用,章霖鑫,韩旭,刘桂荣.具有光滑-直行功能的Q-Learning路径优化算法[J].机械工程学报,2022,58(11):72-87. 被引量：1
6邓齐林,鲁娟,陈勇辉,冯健,廖小平,马俊燕.基于深度强化学习的数控铣削加工参数优化方法[J].浙江大学学报（工学版）,2022,56(11):2145-2155. 被引量：9
7谢鸿涛.仿人机器人的发展进程与实际应用研究[J].造纸装备及材料,2022,51(12):56-58. 被引量：1
8韩晓峰,周雨溪,赵慧.基于MPC的双足机器人质心与足端联合步态规划[J].农业装备与车辆工程,2024,62(11):138-147.

二级引证文献63

1刘峰波,党飞飞,杨满囤,马平,赵俊达.井下防淤积清仓机器人行走机构纠偏控制研究[J].煤炭工程,2022,54(S01):195-199.
2程鑫瑶.深度强化学习算法分析与对比研究[J].网络安全技术与应用,2021(11):33-34.
3肖潇.机器人的柔性关节机械手控制分析[J].数字农业与智能农机,2021(20):125-126.
4杨蒙蒙,邓三星,李帅,毕战文,杨岚松.基于STM32单片机的双足竞走机器人设计[J].物联网技术,2022,12(5):123-126. 被引量：6
5刘保瑞,刘杨斌.基于集成环境表示的未知动态环境中移动机器人导航方法研究[J].太原学院学报（自然科学版）,2022,40(2):44-50. 被引量：2
6郝杰,唐叶剑.基于密度峰值聚类并行麻雀搜索算法的食品机器人路径规划[J].食品与机械,2022,38(6):123-130. 被引量：4
7刘泽双,韩金,王一帆.智能制造人机协作运行功能标准模型研究[J].科技进步与对策,2022,39(20):21-31. 被引量：3
8王童,李骜,宋海荦,刘伟,王明会.基于分层深度强化学习的移动机器人导航方法[J].控制与决策,2022,37(11):2799-2807. 被引量：11
9李俊圣,岳龙飞,左家亮,俞利新,赵家乐.基于深度强化学习的多无人机协同进攻作战智能规划[J].航空工程进展,2022,13(6):40-49. 被引量：2
10王茹玉,张治国.波动载荷下高速列车受电弓与接触网载流摩擦研究[J].自动化与仪器仪表,2022(12):55-59.

1李善玉.如何在初中英语教学中开展合作学习提升阅读能力[J].新一代（理论版）,2020,0(10):188-188.
2陈晓倩,刘瑞祥.基于最小二乘策略迭代的无人机航迹规划方法[J].计算机工程与应用,2020,56(1):191-195. 被引量：6
3轿车[J].汽车观察,2019,0(11):137-156.
4王亚萍,李荣培,葛昂,满宜刚.先天性糖基化异常Ik型的诊断学特征并文献复习[J].中华诊断学电子杂志,2019,7(4):249-253. 被引量：1
5冯海燕.运用小组合作学习优化小学英语教学[J].小学生（多元智能大王）,2019,0(12):43-43.
6高宏.维纳过程样本轨道特性[J].数学学习与研究,2019(24):2-3. 被引量：1
7唐沂国.高中物理教学中学生解题能力的培养思路[J].新课程教学（电子版）,2019,0(18):31-32.
8陈伟善,郭则庆,刘如石,黄振贵.空化器形状对超空泡射弹尾拍运动影响的数值研究[J].工程力学,2020,37(4):248-256. 被引量：19
9孔令芳.图式学习提升学生自主复习能力的探析[J].教育观察,2020,9(3):131-131. 被引量：1

机械工程学报

2020年第3期

浏览历史

内容加载中请稍等...

可变环境下仿人机器人智能姿态控制被引量：8

参考文献8

二级参考文献31

共引文献96

同被引文献52

引证文献8

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

可变环境下仿人机器人智能姿态控制 被引量：8

参考文献8

二级参考文献31

共引文献96

同被引文献52

引证文献8

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

可变环境下仿人机器人智能姿态控制被引量：8