检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到7篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于深度强化学习的自适应股票交易策略被引量：1: 1; 作者孙志磊唐俊洋 +4 位作者丰硕刘炜兰雪锋张文珠赵澄《浙江工业大学学报》 CAS 北大核心 2024年第2期188-195,共8页; 股票交易策略的制定在金融市场投资中起着至关重要的作用。为帮助投资者在多变复杂的股票市场作出最优决策,降低制定投资策略的难度,基于LSTM-SAC模型构建自适应股票交易策略。首先,将堆叠式长短期记忆网络(Long short-term memory,LSTM... 展开更多; 关键词深度强化学习股票交易策略堆叠式长短期记忆网络柔性演员评论家; 下载PDF 职称材料

基于改进强化学习的移动机器人动态避障方法被引量：5: 2; 作者徐建华邵康康 +1 位作者王佳惠刘学聪《中国惯性技术学报》 EI CSCD 北大核心 2023年第1期92-99,共8页; 针对未知环境下移动机器人动态避障存在规划轨迹长、行驶速度慢和鲁棒性差等问题,提出一种基于改进强化学习的移动机器人动态避障方法。移动机器人根据自身速度、目标位置和激光雷达信息直接得到动作信号,实现端到端的控制。基于距离梯... 展开更多; 关键词移动机器人动态避障强化学习柔性演员评论家算法卷积神经网络; 下载PDF 职称材料

基于改进柔性演员评论家算法的研究被引量：2: 3; 作者胡仕柯赵海军《太原师范学院学报（自然科学版）》 2021年第3期48-52,共5页; 针对柔性演员评论家算法训练速度慢且训练过程不稳定的问题,提出了一种改进柔性演员评论家算法.通过在原有算法中引入内在好奇心机制,提高智能体探索能力与样本利用效率,并在仿真环境中用于求解倒立摆问题,实验结果表明文章算法具有更... 展开更多; 关键词深度强化学习柔性演员评论家算法内在好奇心样本利用效率; 下载PDF 职称材料

基于柔性演员-评论家算法的自适应巡航控制研究被引量：4: 4; 作者赵克刚石翠铎 +2 位作者梁志豪李梓棋王玉龙《汽车技术》 CSCD 北大核心 2023年第3期26-34,共9页; 针对目前自适应巡航控制技术中,深度强化学习的控制算法环境适应能力不足、模型迁移性及泛化能力较差的问题,提出一种基于最大熵原理和随机离线策略的柔性演员-评论家(SAC)控制算法。构建演员和评论家网络拟合动作值函数和动作策略函数... 展开更多; 关键词自适应巡航控制柔性演员-评论家可迁移性深度强化学习; 下载PDF 职称材料

基于最大熵深度强化学习的双足机器人步态控制方法被引量：1: 5; 作者李源潮陶重犇王琛《计算机应用》 CSCD 北大核心 2024年第2期445-451,共7页; 针对双足机器人连续直线行走的步态稳定控制问题,提出一种基于最大熵深度强化学习(DRL)的柔性演员-评论家(SAC)步态控制方法。首先,该方法无需事先建立准确的机器人动力学模型,所有参数均来自关节角而无需额外的传感器;其次,采用余弦相... 展开更多; 关键词双足机器人步态控制深度强化学习最大熵柔性演员-评论家算法; 下载PDF 职称材料

基于柔性演员-评论家算法的决策规划协同研究被引量：1: 6; 作者唐斌刘光耀 +3 位作者江浩斌田宁米伟王春宏《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第2期105-113,187,共10页; 为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与... 展开更多; 关键词智能交通自动驾驶柔性演员-评论家算法决策规划协同深度强化学习; 下载PDF 职称材料

基于多智能体柔性演员-评论家学习的服务功能链部署算法被引量：2: 7; 作者唐伦李师锐 +1 位作者杜雨聪陈前斌《电子与信息学报》 EI CSCD 北大核心 2023年第8期2893-2901,共9页; 针对网络功能虚拟化(NFV)架构下业务请求动态变化引起的服务功能链(SFC)部署优化问题,该文提出一种基于多智能体柔性演员-评论家(MASAC)学习的SFC部署优化算法。首先,建立资源负载惩罚、SFC部署成本和时延成本最小化的模型,同时受限于SF... 展开更多; 关键词网络功能虚拟化服务功能链柔性演员-评论家学习多智能体强化学习; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部