期刊文献+
共找到219篇文章
< 1 2 11 >
每页显示 20 50 100
关于多排螺旋CT剂量的探讨 被引量:20
1
作者 王晓峰 彭明辰 《医疗设备信息》 2004年第12期23-25,20,共4页
随着螺旋CT探测器排数的增加 ,病人所受辐射剂量也出现了新的变化。本文就多排螺旋CT的剂量表征、测量进行了探讨 ,对其临床诊断剂量参考水平进行了调研。分析了多排螺旋CT管球对热容量的要求以及其剂量效率的变化。最后提出了在不降低... 随着螺旋CT探测器排数的增加 ,病人所受辐射剂量也出现了新的变化。本文就多排螺旋CT的剂量表征、测量进行了探讨 ,对其临床诊断剂量参考水平进行了调研。分析了多排螺旋CT管球对热容量的要求以及其剂量效率的变化。最后提出了在不降低影像质量的情况下如何降低病人剂量的方法。 展开更多
关键词 辐射剂量 多排螺旋CT 螺距 CTDIvol 剂量效率 drl
下载PDF
BL法直接还原工艺研究和开发 被引量:8
2
作者 李永全 陈宏 +3 位作者 周渝生 李咸伟 甘青松 陈炳庆 《钢铁》 CAS CSCD 北大核心 1999年第9期6-10,共5页
介绍了由上海宝钢集团公司和鲁南化学工业公司联合开发的 B L法直接还原新工艺,完成了完全用煤作一次能源,将德士古煤气化技术用于竖炉生产直接还原铁的半工业性试验,得到了合格的海绵铁。
关键词 BL法直接还原 煤气化 直接还原铁
下载PDF
深度强化学习与移动通信资源管理:算法、进展与展望 被引量:3
3
作者 孙恩昌 袁永仪 +2 位作者 吴兵 屈晗星 张延华 《北京工业大学学报》 CAS CSCD 北大核心 2023年第1期71-88,共18页
深度强化学习(deep reinforcement learning,DRL)将深度学习从高维数据提取低维特征的能力与强化学习的决策能力相结合,是移动通信资源管理与优化的高效算法之一.在引入DRL相关算法概念与原理的基础上,重点对DRL在网络切片、云计算、雾... 深度强化学习(deep reinforcement learning,DRL)将深度学习从高维数据提取低维特征的能力与强化学习的决策能力相结合,是移动通信资源管理与优化的高效算法之一.在引入DRL相关算法概念与原理的基础上,重点对DRL在网络切片、云计算、雾计算、移动边缘计算等通信技术与场景中的资源管理与优化效果进行综述与分析,结合DRL在移动通信资源管理的算法原理与研究进展,论述了DRL面临的问题与挑战,并提出相应解决思路.最后,展望了DRL在移动通信资源管理领域的发展趋势和主要研究方向. 展开更多
关键词 深度强化学习(deep reinforcement learning drl) 通信资源管理 网络切片 云计算 雾计算 移动边缘计算
下载PDF
基于Struts框架的Web应用重构 被引量:2
4
作者 李卓 孙建伶 《计算机工程与设计》 CSCD 北大核心 2006年第2期352-355,共4页
重构是在不改变软件可观察行为的前提下,通过对软件内部结构的改变,提高软件的可理解性并降低变化成本。Struts是目前Web应用表现层MVC模式的一个流行实现框架。以一个典型的Web应用为例,通过分析发生在此应用的两个迭代生命周期之间的... 重构是在不改变软件可观察行为的前提下,通过对软件内部结构的改变,提高软件的可理解性并降低变化成本。Struts是目前Web应用表现层MVC模式的一个流行实现框架。以一个典型的Web应用为例,通过分析发生在此应用的两个迭代生命周期之间的重构过程(基于Struts框架),以及实施重构之后给系统带来的积极影响,验证了重构在平衡满足用户需求与保证开发过程健康有序进行之间的作用。 展开更多
关键词 重构 敏捷开发 STRUTS MVC drl
下载PDF
基于DRL与微分对策的无人机空战决策研究 被引量:6
5
作者 杨霄 李晓婷 +1 位作者 赵彦东 张亚星 《火力与指挥控制》 CSCD 北大核心 2021年第5期71-75,80,共6页
随着无人机战场环境越来越复杂,空战对抗将逐渐成为主要的一种无人机作战方式。为了能够确保我方无人机在快速演变的战场态势下抓住先机、精确决策、快速致胜,需要根据实际作战环境、作战样式,建立无人机和环境进行交互的规则、无人机... 随着无人机战场环境越来越复杂,空战对抗将逐渐成为主要的一种无人机作战方式。为了能够确保我方无人机在快速演变的战场态势下抓住先机、精确决策、快速致胜,需要根据实际作战环境、作战样式,建立无人机和环境进行交互的规则、无人机空战对抗中采用的战术使用规则,并结合规则,通过智能决策算法,达到提升无人机空战对抗胜率的目的。提出一种结合微分对策(Differential Games,DG)的深度强化学习方法(Deep Reinforcement Learning,DRL)解决此问题,利用深度强化学习的智能决策性以及微分对策的准确机动性,实现战术决策到机动决策。最后以空战对抗1V1为例,对提出的方法进行验证,结果证明方法可行有效。 展开更多
关键词 空战决策 微分对策 drl 空中对抗
下载PDF
基于深度强化学习的机器人轴孔装配策略仿真研究
6
作者 朱子璐 刘永奎 +2 位作者 张霖 王力翚 林廷宇 《系统仿真学报》 CAS CSCD 北大核心 2024年第6期1414-1424,共11页
针对现有轴孔装配方法存在的依赖于精确的接触状态模型、数据采集困难、采样效率低、安全性差等问题,提出了一种基于DRL的机器人轴孔装配策略仿真研究方法。搭建了基于ROSGazebo机器人轴孔装配仿真环境,提出了基于最小二乘法对力/力矩... 针对现有轴孔装配方法存在的依赖于精确的接触状态模型、数据采集困难、采样效率低、安全性差等问题,提出了一种基于DRL的机器人轴孔装配策略仿真研究方法。搭建了基于ROSGazebo机器人轴孔装配仿真环境,提出了基于最小二乘法对力/力矩传感器进行重力补偿的方法;基于RL的范式对轴孔装配问题建模,并提出了一种基于SAC(soft actor-critic)算法的机器人轴孔装配方法;通过ROS建立了仿真环境与深度强化学习算法的通信机制。实验结果表明:该算法能够使机器人自主且柔顺地完成轴孔装配任务,并具有较好的泛化性。 展开更多
关键词 轴孔装配 drl 柔顺控制 装配策略仿真 ROS-Gazebo仿真环境
下载PDF
基于深度强化学习的无人机着陆轨迹跟踪控制 被引量:8
7
作者 宋欣屿 王英勋 +3 位作者 蔡志浩 赵江 陈小龙 宋栋梁 《航空科学技术》 2020年第1期68-75,共8页
本文针对固定翼无人机自主着陆控制问题,提出了基于深度强化学习(DRL)的无人机着陆轨迹跟踪控制方法。首先,搭建了小型固定翼无人机Ultra Stick 25E的仿真模型,设计了满足过程和终端约束的着陆参考轨迹。其次,提出了基于深度确定性策略... 本文针对固定翼无人机自主着陆控制问题,提出了基于深度强化学习(DRL)的无人机着陆轨迹跟踪控制方法。首先,搭建了小型固定翼无人机Ultra Stick 25E的仿真模型,设计了满足过程和终端约束的着陆参考轨迹。其次,提出了基于深度确定性策略梯度(DDPG)的无人机一体化控制框架,设计了考虑跟踪误差和轨迹平稳性的奖励函数。最后,通过离线训练,得到了轨迹跟踪一体化控制器。仿真试验结果表明,本文提出的方法比传统PID控制方法精度更高。 展开更多
关键词 固定翼无人机 自主着陆 轨迹跟踪控制 深度强化学习 深度确定性策略梯度
下载PDF
基于梯度的深度强化学习解释方法 被引量:1
8
作者 王远 徐琳 +2 位作者 宫小泽 张永亮 王永利 《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1130-1140,共11页
DQN等深度强化学习方法的学习过程与工作机制不透明,无法感知其决策依据与决策可靠性,使模型做出的决策饱受质疑,极大限制了深度强化学习的应用场景。为了解释智能体的决策机理,提出一种基于梯度的显著性图生成算法(saliency map genera... DQN等深度强化学习方法的学习过程与工作机制不透明,无法感知其决策依据与决策可靠性,使模型做出的决策饱受质疑,极大限制了深度强化学习的应用场景。为了解释智能体的决策机理,提出一种基于梯度的显著性图生成算法(saliency map generation algorithm based on gradient,SMGG)。使用高层卷积层生成的特征图梯度信息计算不同特征图的重要性,在模型的结构和内部参数已知的情况下,从模型最后一层入手,通过对特征图梯度的计算,生成不同特征图相对于显著性图的权重;对特征重要性进行正向和负向分类,利用有正向影响的权值将特征图中捕获的特征进行加权,构成当前决策的正向解释;利用对其他类别有负向影响的权值将特征图中捕获的特征进行加权,构成当前决策的反向解释。二者共同生成决策的显著性图,得出智能体决策行为的依据,实验证明了该方法的有效性。 展开更多
关键词 深度强化学习 显著性图 可解释性 智能体 梯度
下载PDF
内河无人船的自主路径规划模型研究
9
作者 杨娇 张庆年 +2 位作者 杨杰 吴绩伟 凌强 《武汉理工大学学报(交通科学与工程版)》 2023年第2期263-268,274,共7页
文中提出基于双延迟深度确定性策略梯度(twin-delayed deep deterministic policy gradient,TD3)算法的无人船自主路径规划改进模型.模型中通过对良好驾驶经验量化以提升算法效率,还通过增加目标点吸引策略的方式优化奖励函数以确保导... 文中提出基于双延迟深度确定性策略梯度(twin-delayed deep deterministic policy gradient,TD3)算法的无人船自主路径规划改进模型.模型中通过对良好驾驶经验量化以提升算法效率,还通过增加目标点吸引策略的方式优化奖励函数以确保导航标准化的同时加快算法收敛速度.对模型进行训练并将结果与深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法结果进行比较,得出其性能明显优于DDPG.借助人工势场法(artificial potential field,APF)对其优化得到APF-TD3模型.比较TD3与APF-TD3的训练结果表明:APF-TD3模型在收敛速度、稳定性等方面均更优.仿真结果显示:其规划得到的路径平滑、无冗余,验证了改进模型的有效性及优越性. 展开更多
关键词 交通运输工程 航运安全 drl TD3 内河无人船 自主路径规划
下载PDF
儿童头颅CT检查不同辐射剂量衡量指标差异性比较及相关性分析
10
作者 张见 杨凤 张晓军 《医疗卫生装备》 CAS 2024年第7期46-50,共5页
目的:比较容积CT剂量指数(volume CT dose index,CTDI_(VOL))及基于水当量直径的体型特异性剂量估计值(size-specific dose estimate based on water equivalent diameter,SSDE_(WED))在衡量儿童头颅CT辐射剂量中的差异性,并分析CTDI_(V... 目的:比较容积CT剂量指数(volume CT dose index,CTDI_(VOL))及基于水当量直径的体型特异性剂量估计值(size-specific dose estimate based on water equivalent diameter,SSDE_(WED))在衡量儿童头颅CT辐射剂量中的差异性,并分析CTDI_(VOL)、SSDE_(WED)与曝光量、水当量直径(water equivalent diameter,WED)的相关性,以为临床检查中儿童头颅CT辐射剂量衡量提供参考。方法:回顾性分析2021年1—12月于某院进行头颅CT检查的1297例患儿的临床资料,根据年龄将患儿分为≤1个月组、>1个月~4岁组、>4~10岁组、>10~15岁组。记录患儿的曝光量、年龄、CTDI_(VOL)、剂量长度乘积,并计算WED、转换因子及SSDE_(WED)。比较CTDI_(VOL)与SSDE_(WED)的差异;建立CTDI_(VOL)、SSDE_(WED)与曝光量、WED的回归模型,并采用Pearson分析CTDI_(VOL)、SSDE_(WED)与曝光量、WED之间的相关性;对比国内诊断参考水平(diagnostic reference level,DRL)、欧盟DRL及本医疗机构诊断参考水平(local diagnostic reference level,LDRL)的差异。采用SPSS 25.0统计学软件进行分析。结果:患儿头颅CT的CTDI_(VOL)为(9.22±1.63)mGy,SSDE_(WED)为(8.14±0.84)mGy,CTDI_(VOL)较SSDE_(WED)高13.27%,差异有统计学意义(t=47.66,P<0.001)。CTDI_(VOL)、SSDE_(WED)与曝光量、WED均呈正相关关系(P<0.001);CTDI_(VOL)、SSDE_(WED)与曝光量、WED回归模型拟合性较强(R^(2)为0.58~0.99)。与国内DRL及欧盟DRL比较,LDRL均处于较低水平。结论:在儿童头颅CT辐射剂量衡量中,相较于CTDI_(VOL),SSDE_(WED)对辐射剂量的衡量更准确。同时定期对医疗机构的DRL值进行统计更新并优化检查参数,是减少辐射剂量的重要方式。 展开更多
关键词 儿童头颅CT CTDIVOL SSDEWED Ldrl drl 辐射剂量
下载PDF
基于DRL的边缘监控任务卸载与资源分配算法
11
作者 李超 李贾宝 +2 位作者 丁才昌 叶志伟 左方威 《系统仿真学报》 CAS CSCD 北大核心 2024年第9期2113-2126,共14页
为解决边缘计算环境下密集型监控任务资源受限的问题,提出一种基于DRL的监控任务卸载与资源分配算法。以监控任务时延和识别精度为优化目标,将监控系统中的任务卸载、无线信道分配和图像压缩率的联合决策目标优化求解建模为马尔可夫决... 为解决边缘计算环境下密集型监控任务资源受限的问题,提出一种基于DRL的监控任务卸载与资源分配算法。以监控任务时延和识别精度为优化目标,将监控系统中的任务卸载、无线信道分配和图像压缩率的联合决策目标优化求解建模为马尔可夫决策过程;针对无线信道动态性和监控任务随机性引起的训练样本波动性较大,导致算法收敛速度慢和不稳定,采用Transformer注意力机制对多时隙序列的信道状态和监控任务信息进行联合编码。编码后的状态信息能够捕捉多时隙状态序列之间的依赖关系,提升网络状态的表征能力,并以此提高算法鲁棒性。实验结果表明:与传统强化学习算法和启发式算法相比,该算法在降低任务计算时延的同时能够有效提高识别精度。 展开更多
关键词 监控任务 移动边缘计算 深度强化学习 任务卸载 资源分配 注意力机制
下载PDF
DRL在卷烟厂AGV路径规划应用中的准确性优化研究
12
作者 杨丁成 刘昇 潘朱良 《今日制造与升级》 2024年第6期107-110,共4页
为解决卷烟厂自动引导车运行效率与路径准确性问题,设计一套基于DRL技术的路径规划系统。考虑AGV所在环境、自身位置、避让需求等内容,引入ROS和OpenPose模块实现独立感知与定位实现环境搭建。同时,引入奖惩机制提高AGV系统对复杂环境... 为解决卷烟厂自动引导车运行效率与路径准确性问题,设计一套基于DRL技术的路径规划系统。考虑AGV所在环境、自身位置、避让需求等内容,引入ROS和OpenPose模块实现独立感知与定位实现环境搭建。同时,引入奖惩机制提高AGV系统对复杂环境的表征效果。仿真结果显示,通过该系统和DRL算法所构建的AGV路径精度与效率提升策略,不仅能够满足基础性运输需求,还能实现避让现场行人与其他引导车,保证复杂工作条件下的运行安全。 展开更多
关键词 drl 自动导引车 卷烟厂
下载PDF
Traffic Engineering and Quality of Service in Hybrid Software Defined Networks
13
作者 Samiullah Mehraban Rajesh Kumar Yadav 《China Communications》 SCIE CSCD 2024年第2期96-121,共26页
For Future networks, many research projects have proposed different architectures around the globe;Software Defined Network(SDN) architectures, through separating Data and Control Layers, offer a crucial structure for... For Future networks, many research projects have proposed different architectures around the globe;Software Defined Network(SDN) architectures, through separating Data and Control Layers, offer a crucial structure for it. With a worldwide view and centralized Control, the SDN network provides flexible and reliable network management that improves network throughput and increases link utilization. In addition, it supports an innovative flow scheduling system to help advance Traffic Engineering(TE). For Medium and large-scale networks migrating directly from a legacy network to an SDN Network seems more complicated & even impossible, as there are High potential challenges, including technical, financial, security, shortage of standards, and quality of service degradation challenges. These challenges cause the birth and pave the ground for Hybrid SDN networks, where SDN devices coexist with traditional network devices. This study explores a Hybrid SDN network’s Traffic Engineering and Quality of Services Issues. Quality of service is described by network characteristics such as latency, jitter, loss, bandwidth,and network link utilization, using industry standards and mechanisms in a Hybrid SDN Network. We have organized the related studies in a way that the Quality of Service may gain the most benefit from the concept of Hybrid SDN networks using different algorithms and mechanisms: Deep Reinforcement Learning(DRL), Heuristic algorithm, K path partition algorithm, Genetic algorithm, SOTE algorithm, ROAR method, and Routing Optimization with different optimization mechanisms that help to ensure high-quality performance in a Hybrid SDN Network. 展开更多
关键词 drl hSDN QOE QOS SDN TE
下载PDF
CoopAI-Route: DRL Empowered Multi-Agent Cooperative System for Efficient QoS-Aware Routing for Network Slicing in Multi-Domain SDN
14
作者 Meignanamoorthi Dhandapani V.Vetriselvi R.Aishwarya 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第9期2449-2486,共38页
The emergence of beyond 5G networks has the potential for seamless and intelligent connectivity on a global scale.Network slicing is crucial in delivering services for different,demanding vertical applications in this... The emergence of beyond 5G networks has the potential for seamless and intelligent connectivity on a global scale.Network slicing is crucial in delivering services for different,demanding vertical applications in this context.Next-generation applications have time-sensitive requirements and depend on the most efficient routing path to ensure packets reach their intended destinations.However,the existing IP(Internet Protocol)over a multi-domain network faces challenges in enforcing network slicing due to minimal collaboration and information sharing among network operators.Conventional inter-domain routing methods,like Border Gateway Protocol(BGP),cannot make routing decisions based on performance,which frequently results in traffic flowing across congested paths that are never optimal.To address these issues,we propose CoopAI-Route,a multi-agent cooperative deep reinforcement learning(DRL)system utilizing hierarchical software-defined networks(SDN).This framework enforces network slicing in multi-domain networks and cooperative communication with various administrators to find performance-based routes in intra-and inter-domain.CoopAI-Route employs the Distributed Global Topology(DGT)algorithm to define inter-domain Quality of Service(QoS)paths.CoopAI-Route uses a DRL agent with a message-passing multi-agent Twin-Delayed Deep Deterministic Policy Gradient method to ensure optimal end-to-end routes adapted to the specific requirements of network slicing applications.Our evaluation demonstrates CoopAI-Route’s commendable performance in scalability,link failure handling,and adaptability to evolving topologies compared to state-of-the-art methods. 展开更多
关键词 6G MULTI-DOMAIN MULTI-AGENT ROUTING drl SDN
下载PDF
基于Cheat-FlipIt博弈的网络安全对抗建模与分析
15
作者 熊鑫立 黄郡 姚倩 《信息对抗技术》 2024年第4期63-80,共18页
针对网络空间安全中的建模问题,以典型的高级持续威胁(advanced persisted threat, APT)攻击中对目标的隐蔽控制为背景,将FlipIt博弈模型进行扩展,引入攻击者的欺骗能力,提出Cheat-FlipIt博弈模型。并基于该模型,探索深度强化学习防御... 针对网络空间安全中的建模问题,以典型的高级持续威胁(advanced persisted threat, APT)攻击中对目标的隐蔽控制为背景,将FlipIt博弈模型进行扩展,引入攻击者的欺骗能力,提出Cheat-FlipIt博弈模型。并基于该模型,探索深度强化学习防御决策对具有一定欺骗能力攻击者的鲁棒性和适用性。理论分析和实验结果表明,所建立的Cheat-FlipIt博弈模型较好地反映了APT的欺骗过程和特点。 展开更多
关键词 网络空间建模与仿真 博弈论 深度强化学习
下载PDF
面向电网拓扑调度仿真的采样效率优化方法研究
16
作者 赵莹莹 董普森 +5 位作者 朱天晨 李凡 苏运 邰振赢 孙庆赟 凡航 《系统仿真学报》 CAS CSCD 北大核心 2024年第2期283-295,共13页
为解决新型电力系统的规模性与复杂性导致的仿真计算量较大,仿真速度相对变缓的问题,提出了一种基于分布式与量化机制的拓扑调度仿真加速方法。通过拓扑调度模型的并行,增大了单位时间内数据仿真采样的规模;引入了量化算子,加快拓扑调... 为解决新型电力系统的规模性与复杂性导致的仿真计算量较大,仿真速度相对变缓的问题,提出了一种基于分布式与量化机制的拓扑调度仿真加速方法。通过拓扑调度模型的并行,增大了单位时间内数据仿真采样的规模;引入了量化算子,加快拓扑调度模型算子计算,减少单次仿真的时间成本。算例分析验证了拓扑仿真加速的有效性,在单位时间内将仿真电力系统的可用传输容量提升了约2倍,并在不同规模电网算例实现了1.5~2.5倍的仿真加速。 展开更多
关键词 拓扑调度仿真 深度强化学习 采样效率优化 模型量化 电网数字孪生
下载PDF
基于全并行深度Q网络的通信干扰资源快速分配算法
17
作者 陆永安 陈杰豪 +1 位作者 张琪露 唐洪莹 《现代电子技术》 北大核心 2024年第13期47-54,共8页
智能干扰技术已成为认知电子战的重要研究方向。文中研究了对抗场景下最优干扰与有限资源分配的策略优化问题,通过设计一个可以自适应调整干扰策略的认知干扰器,选择出当前状态下最优的干扰参数,满足干扰资源分配的实时性和有效性需求... 智能干扰技术已成为认知电子战的重要研究方向。文中研究了对抗场景下最优干扰与有限资源分配的策略优化问题,通过设计一个可以自适应调整干扰策略的认知干扰器,选择出当前状态下最优的干扰参数,满足干扰资源分配的实时性和有效性需求。为了进一步降低干扰能耗,引入了干扰持续时间这一干扰参数,同时考虑了能量有限的约束条件。此外,为加快干扰机的学习速度,还提出了一种具有平行学习独立决策功能的深度强化学习干扰资源快速分配算法。仿真结果表明,所提算法能够在满足干扰效果的前提下,其干扰能量利用率和训练速度均优于其他的深度强化学习干扰算法,同时对比差距会随着干扰决策空间维度的增加而扩大。 展开更多
关键词 认知干扰 深度强化学习 干扰资源分配 干扰持续时间 认知电子战 全并行
下载PDF
基于数字孪生的果园虚拟交互系统构建
18
作者 王红军 林俊强 +5 位作者 邹湘军 张坡 周铭轩 邹伟锐 唐昀超 罗陆锋 《系统仿真学报》 CAS CSCD 北大核心 2024年第6期1493-1508,共16页
针对果园种植管理系统存在可视性低、实时性差、适应性弱和交互方式单一的问题,提出一种面向种植管理过程的果园数字孪生系统六维模型。从管理要素实体建模、管理过程动态建模、管理系统仿真建模和管理策略优化建模4个方面论述了系统模... 针对果园种植管理系统存在可视性低、实时性差、适应性弱和交互方式单一的问题,提出一种面向种植管理过程的果园数字孪生系统六维模型。从管理要素实体建模、管理过程动态建模、管理系统仿真建模和管理策略优化建模4个方面论述了系统模型构建理论与技术体系。以六维模型为基础,理论与技术体系为支撑,设计了基于数字孪生的果园虚拟交互系统架构,并对系统开发过程的关键技术进行了阐述。借助Unity3D仿真平台搭建了果园虚拟交互系统,实现对果园的三维可视化监测。实验结果表明:该系统在农业物联网平台数据共享基础上,通过数据驱动、三维展示、人机交互、重构事件和智能决策方面提升了果园种植管理系统监测能力,为建设智慧果园提供参考。 展开更多
关键词 数字孪生 果园种植管理 农业物联网 虚拟现实 深度强化学习
下载PDF
基于DRL和自由步态的六足机器人运动规划研究
19
作者 王鑫鹏 傅汇乔 +3 位作者 邓归洲 唐开强 陈春林 留沧海 《系统仿真学报》 CAS CSCD 北大核心 2024年第2期373-384,共12页
为提高六足机器人在非结构环境下的通过率和运动性能,提出一种基于DRL和自由步态规划器的多接触运动规划算法。自由步态规划器获取目标状态下可达落足点从而输出最优步态序列;利用DRL训练得到六足机器人在随机生成的梅花桩环境中的质心... 为提高六足机器人在非结构环境下的通过率和运动性能,提出一种基于DRL和自由步态规划器的多接触运动规划算法。自由步态规划器获取目标状态下可达落足点从而输出最优步态序列;利用DRL训练得到六足机器人在随机生成的梅花桩环境中的质心运动策略。为了保证机器人在运动过程中相邻状态之间的可达性,利用状态转移可行性模型对状态转移可行性进行判定,实现六足机器人在不同宽度沟壑梅花桩环境下的落脚点规划。仿真与样机实验表明:多接触运动规划算法能够让机器人快速平稳地从起点到达目标区域,并自动调整步态模式以应对不同环境下随机分布的梅花桩。 展开更多
关键词 六足机器人 自由步态 深度强化学习 多接触运动规划 非结构环境
下载PDF
基于深度强化学习的履带机器人摆臂控制方法
20
作者 潘海南 陈柏良 +4 位作者 黄开宏 任君凯 程创 卢惠民 张辉 《系统仿真学报》 CAS CSCD 北大核心 2024年第2期405-414,共10页
摆臂式履带机器人具有一定的地形适应能力,实现摆臂的自主控制对提升机器人在复杂环境中的智能化作业水平具有重要意义。结合专家越障知识和技术指标对机器人的摆臂控制问题进行马尔可夫决策过程(Markov decision process,MDP)建模,基... 摆臂式履带机器人具有一定的地形适应能力,实现摆臂的自主控制对提升机器人在复杂环境中的智能化作业水平具有重要意义。结合专家越障知识和技术指标对机器人的摆臂控制问题进行马尔可夫决策过程(Markov decision process,MDP)建模,基于物理仿真引擎Pymunk搭建了越障训练的仿真环境;提出一种基于D3QN(dueling double DQN)网络模型的深度强化学习摆臂控制算法,以地形信息与机器人状态为输入,以机器人前后四摆臂转角为输出,能够实现挑战性地形下履带机器人摆臂的自学习控制。在Gazebo三维仿真环境中将算法学得的控制策略与人工操纵进行了对比实验,结果表明:所提算法相对人工操纵具有更加高效的复杂地形通行能力。 展开更多
关键词 履带机器人 摆臂自主控制 自主越障 深度强化学习 机器人操作
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部