期刊文献+
共找到247篇文章
< 1 2 13 >
每页显示 20 50 100
基于深度强化学习的微能源网能量管理与优化策略研究 被引量:60
1
作者 刘俊峰 陈剑龙 +2 位作者 王晓生 曾君 黄倩颖 《电网技术》 EI CSCD 北大核心 2020年第10期3794-3803,共10页
面向多种可再生能源接入的微能源网,提出一种基于深度强化学习(deep reinforcement learning,DRL)的微能源网能量管理与优化方法。该方法使用深度Q网络(deepQ network,DQN)对预测负荷、风/光等可再生能源功率输出和分时电价等环境信息... 面向多种可再生能源接入的微能源网,提出一种基于深度强化学习(deep reinforcement learning,DRL)的微能源网能量管理与优化方法。该方法使用深度Q网络(deepQ network,DQN)对预测负荷、风/光等可再生能源功率输出和分时电价等环境信息进行学习,通过习得的策略集对微能源网进行能量管理,是一种模型无关基于价值的智能算法。首先,基于能量总线模型,建立了微能源网研究框架及设备模型。在深入阐述强化学习的框架、Q学习算法和DQN算法的基础理论的基础上,分析了提升DQN性能的经验回放机制与冻结参数机制,并以经济性为目标完成了微能源网能量管理与优化。通过对比不同参数的DQN算法及Q学习算法在微能源网能量管理中的表现,仿真结果展示了继承策略集后算法性能的提升,验证了深度强化学习相比启发式算法在微能源网能量管理应用的可行性和优越性。 展开更多
关键词 微能源网 能量管理 深度强化学习 q学习 深度q网络
下载PDF
基于深度Q网络学习的机器人端到端控制方法 被引量:27
2
作者 张浩杰 苏治宝 苏波 《仪器仪表学报》 EI CAS CSCD 北大核心 2018年第10期36-43,共8页
为了提高机器人在没有障碍物地图或者激光雷达数据稀疏情况下进行无碰撞运动的准确性,将强化学习与深度学习方法融合,提出了一种基于深度Q网络学习的机器人端到端控制方法。首先,利用传统Q学习方法进行强化学习,生成大量的有标签数据样... 为了提高机器人在没有障碍物地图或者激光雷达数据稀疏情况下进行无碰撞运动的准确性,将强化学习与深度学习方法融合,提出了一种基于深度Q网络学习的机器人端到端控制方法。首先,利用传统Q学习方法进行强化学习,生成大量的有标签数据样本;然后,利用深度神经网络构建从激光雷达数据输入到机器人运动速度输出的端到端控制模型,该模型由输入层、输出层和两个全连接层组成;最后,在仿真环境中完成了模型的训练和评估,并将其部署在机器人平台上测试。实验结果表明,该方法训练生成的模型有效地建立了激光雷达数据与机器人运动速度之间的映射关系,按照这种映射关系,机器人在每一个控制周期选择Q值最大的动作执行,能运动平顺地规避障碍物。 展开更多
关键词 深度强化学习 深度q网络 端到端 无碰撞运动
下载PDF
物联网数据收集中无人机路径智能规划 被引量:16
3
作者 付澍 杨祥月 +4 位作者 张海君 陈晨 喻鹏 简鑫 刘敏 《通信学报》 EI CSCD 北大核心 2021年第2期124-133,共10页
为解决无人机在数据收集过程中的路径规划问题,将其分为全局路径规划和局部路径规划。针对全局路径规划,将其建模为一个定向问题,定向问题是背包问题和旅行商问题2种经典优化问题的组合。采用指针网络深度学习对该模型进行求解,并在无... 为解决无人机在数据收集过程中的路径规划问题,将其分为全局路径规划和局部路径规划。针对全局路径规划,将其建模为一个定向问题,定向问题是背包问题和旅行商问题2种经典优化问题的组合。采用指针网络深度学习对该模型进行求解,并在无人机能量约束下得到其服务节点集合及服务顺序。针对局部路径规划,基于无人机接收到节点的参考信号强度,通过深度Q网络学习对无人机局部飞行路径进行规划,使无人机逼近节点位置并服务各节点。仿真结果表明,所提方案能够在无人机能量约束下有效提升其数据收集的收益。 展开更多
关键词 无人机 数据收集 路径规划 指针网络 深度q网络
下载PDF
基于改进深度强化学习方法的单交叉口信号控制 被引量:15
4
作者 刘志 曹诗鹏 +1 位作者 沈阳 杨曦 《计算机科学》 CSCD 北大核心 2020年第12期226-232,共7页
利用深度强化学习技术实现路口信号控制是智能交通领域的研究热点。现有研究大多利用强化学习来全面刻画交通状态以及设计有效强化学习算法以解决信号配时问题,但这些研究往往忽略了信号灯状态对动作选择的影响以及经验池中的数据采样效... 利用深度强化学习技术实现路口信号控制是智能交通领域的研究热点。现有研究大多利用强化学习来全面刻画交通状态以及设计有效强化学习算法以解决信号配时问题,但这些研究往往忽略了信号灯状态对动作选择的影响以及经验池中的数据采样效率,导致训练过程不稳定、迭代收敛较慢等问题。为此,文中在智能体模型设计方面,将信号灯状态纳入状态设计,并引入动作奖惩系数来调节智能体动作选择,以满足相位最小绿灯时间和最大绿灯时间的约束。同时,结合短期内交通流存在的时序相关性,文中采用优先级序列经验回放(Priority Sequence Experience Replay,PSER)的方式来更新经验池中序列样本的优先级,使得智能体获取与交通状况匹配度更高的前序相关样本,并通过双Q网络和竞争式Q网络来进一步提升DQN(Deep Q Network)算法的性能。最后,以杭州市萧山区市心中路和山阴路形成的单交叉口为例,在仿真平台SUMO(Simulation of Urban Mobility)上对算法进行验证,实验结果表明,提出的智能体模型优于无约束单一状态模型,在此基础上提出的算法能够有效缩短车辆平均等待时间和路口总排队长度,控制效果优于实际配时策略以及传统的DQN算法。 展开更多
关键词 信号控制 动作奖惩系数 多指标系数加权 优先级序列经验回放 深度q网络
下载PDF
基于深度强化学习的城市配电网多级动态重构优化运行方法 被引量:13
5
作者 王子晗 高红均 +3 位作者 高艺文 卿竹雨 胡铭洋 刘俊勇 《电力系统保护与控制》 EI CSCD 北大核心 2022年第24期60-70,共11页
随着配电网分布式电源的大量接入以及城市区域负荷的快速发展,使得配电网运行环境愈发复杂。同时由于配电网重构涉及大量的开关状态二进制零散变量,现有优化方法很难求解大规模城市配电网重构问题。基于此,提出一种基于深度强化学习的... 随着配电网分布式电源的大量接入以及城市区域负荷的快速发展,使得配电网运行环境愈发复杂。同时由于配电网重构涉及大量的开关状态二进制零散变量,现有优化方法很难求解大规模城市配电网重构问题。基于此,提出一种基于深度强化学习的城市配电网多级动态重构方法。首先,建立基于深度学习的配电网多级重构快速判断模型,通过该模型实现对重构级别在线决策,并对智能体动作空间进行降维。其次,使用含参数冻结和经验回放机制的深度Q网络对预测负荷、光伏能源输出功率等环境信息进行学习。以运行成本、电压偏移度以及负荷均衡度最优为目标,通过习得的策略集对配电网进行动态重构与运行优化。建立多智能体强化学习模型,对各个时段的不同重构主体进行联合优化。最后,通过算例分析验证了所提方法的有效性。 展开更多
关键词 城市配电网 配电网重构 机器学习 深度q网络
下载PDF
基于DQN的多类型拦截装备复合式反无人机任务分配方法 被引量:9
6
作者 黄亭飞 程光权 +2 位作者 黄魁华 黄金才 刘忠 《控制与决策》 EI CSCD 北大核心 2022年第1期142-150,共9页
针对当前反无人系统无法有效压制无人机的问题,使用多种拦截装备构建一种新的反无人机方法.传统多目标优化算法无法解决动态的任务分配问题,对此,提出一种基于深度Q网络(DQN)的多类型拦截装备复合式反无人机任务分配模型. DQN模块对任... 针对当前反无人系统无法有效压制无人机的问题,使用多种拦截装备构建一种新的反无人机方法.传统多目标优化算法无法解决动态的任务分配问题,对此,提出一种基于深度Q网络(DQN)的多类型拦截装备复合式反无人机任务分配模型. DQN模块对任务分配问题进行初期决策.为了提高算法收敛速度和学习效率,该方法未采用下一时刻的状态来预测Q值,而是采用当前时刻的状态来预测Q值,消除训练过程中Q值过估计的影响.之后采用进化算法对决策结果进行优化,输出多个拦截方案.以国内某机场跑道周围区域开阔地为防护对象,构建反无人机系统的任务分配仿真环境,仿真结果验证了所提出方法的有效性.同时,将DQN与Double DQN方法相比,所提出改进DQN算法训练的智能体表现更为精确,并且算法的收敛性和所求解的表现更为优异.所提出方法为反无人机问题提供了新的思路. 展开更多
关键词 反无人机 深度q网络 任务分配 q 多目标优化 智能体
原文传递
深度强化学习的无人作战飞机空战机动决策 被引量:10
7
作者 李永丰 史静平 +1 位作者 章卫国 蒋维 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2021年第12期33-41,共9页
无人作战飞机(unmanned combat aerial vehicle,UCAV)在进行空战自主机动决策时,面临大规模计算,易受敌方不确定性操纵的影响。针对这一问题,提出了一种基于深度强化学习算法的无人作战飞机空战自主机动决策模型。利用该算法,无人作战... 无人作战飞机(unmanned combat aerial vehicle,UCAV)在进行空战自主机动决策时,面临大规模计算,易受敌方不确定性操纵的影响。针对这一问题,提出了一种基于深度强化学习算法的无人作战飞机空战自主机动决策模型。利用该算法,无人作战飞机可以在空战中自主地进行机动决策以获得优势地位。首先,基于飞机控制系统,利用MATLAB/Simulink仿真平台搭建了六自由度无人作战飞机模型,选取适当的空战动作作为机动输出。在此基础上,设计了无人作战飞机空战自主机动的决策模型,通过敌我双方的相对运动构建作战评估模型,分析了导弹攻击区的范围,将相应的优势函数作为深度强化学习的评判依据。之后,对无人作战飞机进行了由易到难的分阶段训练,并通过对深度Q网络的研究分析了最优机动控制指令。从而无人作战飞机可以在不同的态势情况下选择相应的机动动作,独立评估战场态势,做出战术决策,以达到提高作战效能的目的。仿真结果表明,该方法能使无人作战飞机在空战中自主的选择战术动作,快速达到优势地位,极大地提高了无人作战飞机的作战效率。 展开更多
关键词 无人作战飞机 深度强化学习 空战自主机动决策 六自由度 优势函数 深度q网络
下载PDF
基于注意力机制的深度强化学习交通信号控制 被引量:6
8
作者 任安妮 周大可 +2 位作者 冯锦浩 唐慕尧 李涛 《计算机应用研究》 CSCD 北大核心 2023年第2期430-434,共5页
深度强化学习(DRL)广泛应用于具有高度不确定性的城市交通信号控制问题中,但现有的DRL交通信号控制方法中,仅仅使用传统的深度神经网络,复杂交通场景下其感知能力有限。此外,状态作为强化学习的三要素之一,现有方法中的交通状态也需要... 深度强化学习(DRL)广泛应用于具有高度不确定性的城市交通信号控制问题中,但现有的DRL交通信号控制方法中,仅仅使用传统的深度神经网络,复杂交通场景下其感知能力有限。此外,状态作为强化学习的三要素之一,现有方法中的交通状态也需要人工精心的设计。因此,提出了一种基于注意力机制(attention mecha-nism)的DRL交通信号控制算法。通过引入注意力机制,使得神经网络自动地关注重要的状态分量以增强网络的感知能力,提升了信号控制效果,并减少了状态向量设计的难度。在SUMO(simulation of urban mobility)仿真平台上的实验结果表明,在单交叉口、多交叉口中,在低、高交通流量条件下,仅仅使用简单的交通状态,与三种基准信号控制算法相比,所提算法在平均等待时间、行驶时间等指标上都具有最好的性能。 展开更多
关键词 注意力机制 深度强化学习 交通信号控制 深度q网络 SUMO
下载PDF
基于DRL的无人船混合动力系统能量管理策略研究 被引量:10
9
作者 陈剑龙 刘俊峰 +2 位作者 王振刚 曾君 洪晓斌 《中国测试》 CAS 北大核心 2020年第2期9-15,共7页
无人船混合动力系统的能量管理是提高无人船能源供应稳定性和提升无人船续航里程的关键因素。该文针对无人船运行特点,设计一种光柴储混合动力系统,并提出一种基于深度强化学习的无人船混合动力系统能量管理策略。该文首先分析光柴储混... 无人船混合动力系统的能量管理是提高无人船能源供应稳定性和提升无人船续航里程的关键因素。该文针对无人船运行特点,设计一种光柴储混合动力系统,并提出一种基于深度强化学习的无人船混合动力系统能量管理策略。该文首先分析光柴储混合动力无人船的动力系统结构和运行模式,引入深度强化学习理论,将结合深度学习与强化学习的深度Q网络算法应用于混合动力无人船的智能能量管理方法。仿真结果表明混合动力船舶相较柴电动力船舶在成本、节能和环保等方面具有优势,所提出的能量管理策略具备自学习能力,能合理有效地自主应对突发场景,从而有效支撑无人船技术的发展。 展开更多
关键词 混合动力船舶 无人船 能量管理 深度强化学习 深度q网络
下载PDF
基于深度宽卷积Q网络的行星齿轮箱故障智能诊断方法 被引量:9
10
作者 王辉 徐佳文 严如强 《仪器仪表学报》 EI CAS CSCD 北大核心 2022年第3期109-120,共12页
针对行星齿轮箱故障诊断常依赖较强的专业知识,诊断模型通用性差的问题,基于深度强化学习,提出一种深度宽卷积Q网络的行星齿轮箱故障智能诊断方法。首先将行星齿轮箱的故障诊断分解为序贯决策问题,采用分类马尔科夫决策过程进行描述,并... 针对行星齿轮箱故障诊断常依赖较强的专业知识,诊断模型通用性差的问题,基于深度强化学习,提出一种深度宽卷积Q网络的行星齿轮箱故障智能诊断方法。首先将行星齿轮箱的故障诊断分解为序贯决策问题,采用分类马尔科夫决策过程进行描述,并建立故障诊断模拟环境;其次设计深度宽卷积神经网络作为深度Q网络模型中的动作值网络,增强对环境状态的感知能力;最后模型通过与环境间的不断交互,并依据环境反馈的奖励,自主学习最佳诊断策略,从而完成行星齿轮箱的状态辨识。试验及案例结果表明:该方法能够在多个工况下均可有效、准确地实现行星齿轮箱的智能诊断,诊断准确率均超过99%,增强了诊断模型的泛化性和通用性。 展开更多
关键词 行星齿轮箱 故障诊断 马尔科夫决策过程 卷积神经网络 深度q网络
下载PDF
结合状态预测的深度强化学习交通信号控制 被引量:8
11
作者 唐慕尧 周大可 李涛 《计算机应用研究》 CSCD 北大核心 2022年第8期2311-2315,共5页
深度强化学习(deep reinforcement learning,DRL)可广泛应用于城市交通信号控制领域,但在现有研究中,绝大多数的DRL智能体仅使用当前的交通状态进行决策,在交通流变化较大的情况下控制效果有限。提出一种结合状态预测的DRL信号控制算法... 深度强化学习(deep reinforcement learning,DRL)可广泛应用于城市交通信号控制领域,但在现有研究中,绝大多数的DRL智能体仅使用当前的交通状态进行决策,在交通流变化较大的情况下控制效果有限。提出一种结合状态预测的DRL信号控制算法。首先,利用独热编码设计简洁且高效的交通状态;然后,使用长短期记忆网络(long short-term memory,LSTM)预测未来的交通状态;最后,智能体根据当前状态和预测状态进行最优决策。在SUMO(simulation of urban mobility)仿真平台上的实验结果表明,在单交叉口、多交叉口的多种交通流量条件下,与三种典型的信号控制算法相比,所提算法在平均等待时间、行驶时间、燃油消耗、CO_(2)排放等指标上都具有最好的性能。 展开更多
关键词 交通信号控制 状态预测 深度强化学习 深度q网络 长短期记忆网络
下载PDF
基于5G网络切片的数据链动态资源分配算法 被引量:4
12
作者 周晨 杨春兰 张剑东 《指挥信息系统与技术》 2023年第1期30-34,74,共6页
将第5代移动通信(5G)网络切片技术应用于数据链的资源动态分配,可提升数据链网络的作战性能,因此提出了基于5G网络切片的数据链动态资源分配算法。基于不同作战任务的虚拟网络切片之间资源的相互隔离特性,确保了每个虚拟网络的相对独立... 将第5代移动通信(5G)网络切片技术应用于数据链的资源动态分配,可提升数据链网络的作战性能,因此提出了基于5G网络切片的数据链动态资源分配算法。基于不同作战任务的虚拟网络切片之间资源的相互隔离特性,确保了每个虚拟网络的相对独立性,减少了网间干;构建5G虚拟网络切片架构,使作战任务数量或单任务内节点数量发生变化时可进行快速响应,动态地以按需分配模式提升网络资源利用率,并通过网络随业务变化方式提升组网管理的灵活性。采用基于深度Q网络框架的Ape‑X方法为每个网络切片设立专用代理,利用多步引导目标通过决斗网络建立虚拟网络切片的资源分配模型,并通过该算法对切片的网络资源进行分配。 展开更多
关键词 网络切片 深度q网络 Ape‑X方法 第5代移动通信技术
下载PDF
基于强化学习的无人驾驶匝道汇入模型 被引量:8
13
作者 乔良 鲍泓 +2 位作者 玄祖兴 梁军 潘峰 《计算机工程》 CAS CSCD 北大核心 2018年第7期20-24,31,共6页
传统的强化学习方法受离散状态空间和离散动作空间的限制,不能很好地应用于匝道汇入场景。为此,构建一种基于强化学习的无人驾驶匝道汇入模型。使用深度Q网络构建强化学习模型,依据该模型将匝道汇入问题纳入强化学习问题的范畴后进行求... 传统的强化学习方法受离散状态空间和离散动作空间的限制,不能很好地应用于匝道汇入场景。为此,构建一种基于强化学习的无人驾驶匝道汇入模型。使用深度Q网络构建强化学习模型,依据该模型将匝道汇入问题纳入强化学习问题的范畴后进行求解。实验结果表明,该模型可以针对不同的环境车辆速度采取不同的策略,从而提高无人驾驶在匝道汇入场景下的智能化决策水平。 展开更多
关键词 无人驾驶 决策 匝道汇入 强化学习 深度q网络
下载PDF
基于深度强化学习的旋转机械故障诊断策略 被引量:7
14
作者 龙舰涵 《机械设计与制造》 北大核心 2021年第10期288-294,共7页
由于传统深度学习方法无法挖掘原始振动数据与旋转机械状态之间的非线性映射关系,提出了一种基于堆叠式自动编码器与深度Q网络相结合的深度强化学习旋转机械故障诊断方法。首先建立故障诊断“博弈”模型,该博弈模型可以为故障诊断代理... 由于传统深度学习方法无法挖掘原始振动数据与旋转机械状态之间的非线性映射关系,提出了一种基于堆叠式自动编码器与深度Q网络相结合的深度强化学习旋转机械故障诊断方法。首先建立故障诊断“博弈”模型,该博弈模型可以为故障诊断代理提供观察、行动和获得奖励的交互式环境。然后,堆叠式自动编码器采用完全连接模型进行逐级的内在特征学习从而构建了故障诊断代理,然后通过引入记忆回放和迭代更新策略以及奖励反馈机制,使得深度Q网络实现了原始振动信号与故障模式之间的非线性映射关系。最后通过实验证明了提出方法的有效性与可行性。 展开更多
关键词 故障诊断 旋转机械 深度强化学习 堆叠式自动编码器 深度q网络
下载PDF
干线动态协调控制的深度Q网络方法 被引量:4
15
作者 郭瑝清 陈锋 《信息技术与网络安全》 2020年第6期1-6,共6页
为有效降低城市交通干线的车均延误与停车次数,将深度Q网络引入干线协调控制,给出了一种干线动态协调控制的DDDQN(Dueling Double Deep Q Network)方法。该方法结合双重深度Q网络与基于竞争架构深度Q网络,并将干线作为整体处理,通过深... 为有效降低城市交通干线的车均延误与停车次数,将深度Q网络引入干线协调控制,给出了一种干线动态协调控制的DDDQN(Dueling Double Deep Q Network)方法。该方法结合双重深度Q网络与基于竞争架构深度Q网络,并将干线作为整体处理,通过深度神经网络挖掘干线各交叉口协调控制的相关性,基于Q学习进行交通信号控制决策。通过仿真实验,在近饱和流量和干线存在初始排队的情况下,将DDDQN方法与现有绿波方法,以及经典深度Q网络、双重深度Q网络、基于竞争架构深度Q网络的干线协调控制算法进行对比,实验结果表明基于DDDQN的干线动态协调控制算法性能优于其他四种方法。 展开更多
关键词 城市交通 干线协调控制 深度q网络 双重深度q网络 基于竞争架构深度q网络
下载PDF
深度强化学习在交通控制中的应用 被引量:7
16
作者 喻金忠 曹进德 《工业控制计算机》 2019年第6期88-89,92,共3页
交通路口的信号控制是缓解交通拥堵压力、提高出行效率并减少安全事故的重要手段。交通控制系统是一个复杂的不确定系统,并具有非线性结构。传统的控制方法,如建模实现信号控制方法在实际应用中局限性较大。随着近年来深度学习方法的不... 交通路口的信号控制是缓解交通拥堵压力、提高出行效率并减少安全事故的重要手段。交通控制系统是一个复杂的不确定系统,并具有非线性结构。传统的控制方法,如建模实现信号控制方法在实际应用中局限性较大。随着近年来深度学习方法的不断发展与在实际中的应用,强化学习的方法在交通控制中的应用也越来越多。提出了基于神经网络和强化学习相结合的控制算法,即深度Q学习算法,一定程度上改善了交通路口的交通状况。并采用一款开源的微观交通仿真器SUMO对交通路口的信号控制进行仿真,实验结果表明该方法的有效性。 展开更多
关键词 城市交通信号控制 深度q学习 卷积神经网络 SUMO
下载PDF
基于DQN的海战场舰船路径规划及仿真 被引量:7
17
作者 黄晓冬 苑海涛 +1 位作者 毕敬 刘涛 《系统仿真学报》 CAS CSCD 北大核心 2021年第10期2440-2448,共9页
为实现海战场环境下多智能体路径规划及目标追踪,以智能体(潜艇或者舰艇)为研究对象,提出一种基于强化学习的深度Q网络算法。通过设计两个结构相同但参数不同的神经网络,分别对其Q实际值和估计值的更新来实现价值函数的收敛。运用ε-贪... 为实现海战场环境下多智能体路径规划及目标追踪,以智能体(潜艇或者舰艇)为研究对象,提出一种基于强化学习的深度Q网络算法。通过设计两个结构相同但参数不同的神经网络,分别对其Q实际值和估计值的更新来实现价值函数的收敛。运用ε-贪婪算法设计动作选择机制和基于应用环境设计奖励函数,显著提高LER算法的更新速度和泛化能力等。仿真结果表明,与现有的路径规划算法和多智能体路径规划算法相比,每个智能体能够在陌生环境中有效躲避障碍物,并且通过一定步数的学习实现更加高效的智能规划路线及追踪目标。 展开更多
关键词 深度q网络 强化学习 智能体 路径规划 目标追踪
下载PDF
基于DQN的异构测控资源联合调度方法 被引量:3
18
作者 薛乃阳 丁丹 +2 位作者 贾玉童 王志强 刘渊 《系统仿真学报》 CAS CSCD 北大核心 2023年第2期423-434,共12页
以异构测控网资源联合调度为研究对象,提出一种基于强化学习的深度Q网络(deep Q network, DQN)算法。在充分分析异构测控资源联合调度问题特点后,用数学语言对影响问题求解的约束条件进行描述,建立了资源联合调度模型;从应用强化学习解... 以异构测控网资源联合调度为研究对象,提出一种基于强化学习的深度Q网络(deep Q network, DQN)算法。在充分分析异构测控资源联合调度问题特点后,用数学语言对影响问题求解的约束条件进行描述,建立了资源联合调度模型;从应用强化学习解决问题的角度,对求解的问题进行马尔科夫决策过程描述后,分别设计了2个结构相同的神经网络和基于ε贪婪算法的动作选择策略,并建立了DQN求解框架。仿真结果表明:基于DQN的异构测控资源调度方法较遗传算法能够找到调度收益更优的测控调度方案。 展开更多
关键词 航天测控 异构测控资源联合调度 深度q网络 调度收益 强化学习
下载PDF
基于深度学习的水风光短期随机优化调度研究
19
作者 张一凡 《水电与新能源》 2024年第3期34-37,共4页
我国致力于可再生能源发展,提出水-风-光多能互补系统,因风光能源的不确定性,需实时电网调度调整。文章运用深度学习(DQN)优化系统的短期调度,最大化发电效益。采用拉丁超立方抽样和考虑Kantorovich距离的场景削减技术,反映可再生能源... 我国致力于可再生能源发展,提出水-风-光多能互补系统,因风光能源的不确定性,需实时电网调度调整。文章运用深度学习(DQN)优化系统的短期调度,最大化发电效益。采用拉丁超立方抽样和考虑Kantorovich距离的场景削减技术,反映可再生能源不确定性分布,结合深度强化学习建立多能互补系统短期优化调度模型。模拟实际数据,显示该方法有效解决高维等问题,较于传统方法有显著优势。 展开更多
关键词 短期调度 不确定性 拉丁超立方抽样 场景削减 deep q network
下载PDF
基于SAE与深度Q网络的旋转机械故障诊断 被引量:6
20
作者 王登峰 胡浩 吴建德 《组合机床与自动化加工技术》 北大核心 2021年第4期40-44,共5页
为了解决传统深度学习方法无法挖掘原始振动数据与旋转机械状态之间的非线性映射关系问题,提出了一种基于堆叠式自动编码器与深度Q网络相结合的深度强化学习旋转机械故障诊断方法。首先,建立故障诊断“博弈”模型从而为故障诊断代理提... 为了解决传统深度学习方法无法挖掘原始振动数据与旋转机械状态之间的非线性映射关系问题,提出了一种基于堆叠式自动编码器与深度Q网络相结合的深度强化学习旋转机械故障诊断方法。首先,建立故障诊断“博弈”模型从而为故障诊断代理提供观察、行动和获得奖励的交互式环境;其次,堆叠式自动编码器采用完全连接模型进行逐级的内在特征学习进一步构建了故障诊断代理,然后通过引入记忆回放和迭代更新策略以及奖励反馈机制,使得深度Q网络实现了原始振动信号与故障模式之间的非线性映射关系。实验结果显示提出的方法在滚动轴承以及液压泵故障诊断上具备较高的诊断精度,验证了该方法能够有效地实现了旋转机械端到端的故障诊断。 展开更多
关键词 故障诊断 旋转机械 深度强化学习 深度q网络
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部