期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
Advanced Policy Learning Near-Optimal Regulation 被引量:3
1
作者 Ding Wang Xiangnan Zhong 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2019年第3期743-749,共7页
Designing advanced design techniques for feedback stabilization and optimization of complex systems is important to the modern control field. In this paper, a near-optimal regulation method for general nonaffine dynam... Designing advanced design techniques for feedback stabilization and optimization of complex systems is important to the modern control field. In this paper, a near-optimal regulation method for general nonaffine dynamics is developed with the help of policy learning. For addressing the nonaffine nonlinearity, a pre-compensator is constructed, so that the augmented system can be formulated as affine-like form. Different cost functions are defined for original and transformed controlled plants and then their relationship is analyzed in detail. Additionally, an adaptive critic algorithm involving stability guarantee is employed to solve the augmented optimal control problem. At last, several case studies are conducted for verifying the stability, robustness, and optimality of a torsional pendulum plant with suitable cost. 展开更多
关键词 adaptive critic algorithm learning control NEURAL APPROXIMATION nonaffine DYNAMICS optimal REGULATION
下载PDF
一种基于强化学习的多指手位置控制方法 被引量:1
2
作者 马志峰 王从庆 《计算机测量与控制》 CSCD 2006年第7期896-899,共4页
为解决多指手模型复杂和模型参数不确定问题,针对一类不确定系统,给出了一种基于强化学习的控制方法,该方法将反馈控制与强化学习相结合;在多指手的控制中,反馈控制使关节和被抓持的物体运动跟踪期望轨迹,强化学习控制使关节和被抓持... 为解决多指手模型复杂和模型参数不确定问题,针对一类不确定系统,给出了一种基于强化学习的控制方法,该方法将反馈控制与强化学习相结合;在多指手的控制中,反馈控制使关节和被抓持的物体运动跟踪期望轨迹,强化学习控制使关节和被抓持的物体运动逼近期望轨迹;仿真结果表明,该方法能克服多指手动力学模型的不确定性和黏性滑动摩擦力造成的影响,具有良好的鲁棒性,提高了控制性能。 展开更多
关键词 多指手 非线性 强化学习 自适应评价算法
下载PDF
风帆助航船舶直线航迹跟踪的自适应非线性迭代滑模控制 被引量:1
3
作者 沈智鹏 张晓玲 《中国航海》 CSCD 北大核心 2017年第4期1-6,共6页
针对风帆助航船舶易受风、浪等因素的影响产生航线偏离的特点,提出一种自适应非线性迭代滑模直线航迹跟踪控制方法。该方法利用双曲正切函数设计系统状态的非线性迭代滑动模态,采用模糊系统对滑模控制参数进行优化,增强控制器的自适应... 针对风帆助航船舶易受风、浪等因素的影响产生航线偏离的特点,提出一种自适应非线性迭代滑模直线航迹跟踪控制方法。该方法利用双曲正切函数设计系统状态的非线性迭代滑动模态,采用模糊系统对滑模控制参数进行优化,增强控制器的自适应能力。通过定义一种控制量抖振测量变量和自适应启发评价函数,对模糊系统的结构参数进行在线调整,很好地抑制控制量的抖振。将该控制器应用到风帆助航船舶直线航迹控制领域中,结果表明,该控制器能有效地处理风、浪等外界扰动,跟踪控制性能良好,具有较强的鲁棒性。 展开更多
关键词 风帆助航船舶 直线航迹跟踪 迭代滑模 自启发评价 模糊逻辑推理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部