检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于多智能体深度确定策略梯度算法的有功-无功协调调度模型被引量：19: 1; 作者赵冬梅陶然 +2 位作者马泰屹夏轩王浩翔《电工技术学报》 EI CSCD 北大核心 2021年第9期1914-1925,共12页; 实现有功-无功协调调度是促成"未来一体化大电网调控系统"建设中的关键一环。为解决调度中存在反复调节、难以协调冲突等问题,采用多智能体技术,智能组织多种有功调控资源和无功调控资源,建立电网有功-无功协调调度模型;为解... 展开更多; 关键词多智能体多智能体深度确定策略梯度算法策略迭代灵活调控资源有功-无功协调; 下载PDF 职称材料

基于多智能体深度强化学习的多星观测任务分配方法: 2; 作者王桢朗何慧群 +1 位作者周军金云飞《上海航天（中英文）》 CSCD 2024年第1期108-115,共8页; 为应对多星环境中复杂多约束条件下的任务分配场景,提出一种多星自主决策观测任务分配算法,该算法采用基于集中式训练、分布式执行的多智能体深度强化学习算法。通过这种方式训练后的卫星智能体,即使在没有中心决策节点或通信受限的情况... 展开更多; 关键词多智能体系统深度强化学习多星系统多智能体深度确定性策略梯度算法任务规划; 下载PDF 职称材料

基于深度强化学习的无人机集群协同作战决策方法被引量：1: 3; 作者赵琳吕科 +4 位作者郭靖宏晨向贤财薛健王泳《计算机应用》 CSCD 北大核心 2023年第11期3641-3646,共6页; 在无人机(UAV)集群攻击地面目标时,UAV集群将分为两个编队:主攻目标的打击型UAV集群和牵制敌方的辅助型UAV集群。当辅助型UAV集群选择激进进攻或保存实力这两种动作策略时,任务场景类似于公共物品博弈,此时合作者的收益小于背叛者。基于... 展开更多; 关键词无人机多集群公共物品博弈多智能体深度确定性策略梯度协同作战决策方法; 下载PDF 职称材料

基于强化学习的非正交多址接入和移动边缘计算联合系统信息年龄更新被引量：4: 4; 作者李保罡石泰 +3 位作者陈静李诗璐王宇张天魁《电子与信息学报》 EI CSCD 北大核心 2022年第12期4238-4245,共8页; 物联网发展对信息时效性的需求越来越高,信息新鲜度变得至关重要。为了维持信息新鲜度,在非正交多址接入(NOMA)和移动边缘计算(MEC)的联合系统中,对多设备单边缘计算服务器的传输场景进行了研究。在该场景中,如何分配卸载任务量和卸载... 展开更多; 关键词非正交多址接入移动边缘计算信息年龄多代理深度确定性策略梯度; 下载PDF 职称材料

基于多智能体强化学习的轨道追逃博弈方法被引量：8: 5; 作者许旭升党朝辉 +2 位作者宋斌袁秋帆肖余之《上海航天（中英文）》 CSCD 2022年第2期24-31,共8页; 针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协调等问题,提出一种基于多智能体深度强化学习算法的集群卫星空间轨道追逃博弈方法。首先通过对博弈场景进... 展开更多; 关键词集群卫星非合作目标追逃博弈奖励塑造多智能体深度确定性策略梯度算法涌现智能; 下载PDF 职称材料

基于MADDPG的多AGVs路径规划算法: 6; 作者尹华一尤雅丽 +1 位作者黄新栋段青娜《厦门理工学院学报》 2024年第1期37-46,共10页; 针对多辆自动导引车系统(automated guided vehicle system,AGVs)在动态不确定环境下完成货物运送并进行路径规划的问题,提出一种基于多智能体深度确定性策略梯度(MADDPG)的多AGVs路径规划算法。本方法通过状态空间、动作空间、奖励函... 展开更多; 关键词自动导引车系统(AGVs) 路径规划多智能体深度确定性策略梯度(maddpg)算法深度强化学习多智能体; 下载PDF 职称材料

基于后验经验回放的MADDPG算法被引量：4: 7; 作者孙彧徐越 +3 位作者潘宣宏戴定成孙健陈新群《指挥信息系统与技术》 2021年第6期78-84,共7页; 训练效率过低和收敛速度过慢是多智能体深度强化学习(MDRL)领域一大问题。多智能体深度确定性策略梯度(MADDPG)作为经典算法已应用于多种仿真场景,但其原始的经验回放机制在样本存放和抽取方面效率较低。针对该问题,提出了基于后验经验... 展开更多; 关键词多智能体系统多智能体深度强化学习多智能体深度确定性策略梯度算法后验经验回放; 下载PDF 职称材料

深度强化学习驱动的双馈抽蓄抽水工况下调频控制: 8; 作者劳文洁史林军 +2 位作者李杨吴峰林克曼《电力系统及其自动化学报》 CSCD 北大核心 2023年第12期59-70,共12页; 为改善新型电力系统的频率特性,利用抽水工况下双馈抽水蓄能机组功率可调的特点,提出基于多智能体深度确定性策略梯度算法的系统频率控制方法。首先,基于抽水工况下双馈抽水蓄能的频率控制策略,构建多能互补系统的频率控制模型;其次,以... 展开更多; 关键词调频双馈抽水蓄能机组多智能体深度确定性策略梯度算法多能互补系统控制性能标准; 下载PDF 职称材料

无人集群系统行为决策学习奖励机制: 9; 作者张婷婷蓝羽石宋爱国《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第12期2442-2451,共10页; 未来作战的发展方向是由多智能体系统构成的无人集群系统通过智能体之间自主协同来完成作战任务。由于每个智能体自主采取行为和改变状态,增加了智能群体行为策略训练的不稳定性。通过先验约束条件和智能体间的同构特性增强奖励信号的... 展开更多; 关键词无人集群系统 maddpg算法对抗任务行为决策奖励机制; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部