期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种联合边缘服务器部署与服务放置的方法
1
作者 张俊娜 韩超臣 +2 位作者 陈家伟 赵晓焱 袁培燕 《计算机工程》 CAS CSCD 北大核心 2024年第10期266-280,共15页
边缘计算(EC)在靠近用户的网络边缘部署边缘服务器(ES),并将服务放置在ES上,从而可以满足用户的服务需求。独立研究ES部署和服务放置问题的成果已有很多,但两者存在高度耦合关系。考虑到EC系统的收益,有必要提供付费服务,使得EC系统处... 边缘计算(EC)在靠近用户的网络边缘部署边缘服务器(ES),并将服务放置在ES上,从而可以满足用户的服务需求。独立研究ES部署和服务放置问题的成果已有很多,但两者存在高度耦合关系。考虑到EC系统的收益,有必要提供付费服务,使得EC系统处理用户服务请求时会获得相应收入。同时,EC系统处理用户服务请求时会产生时延和能耗成本,为了最大化EC系统的收益,在用户服务请求和服务价格不同的约束下,需要合适的服务放置方案来提高EC系统的收益。为此,在ES与基站之间的位置关系、ES部署和服务放置之间的耦合关系、服务副本数和服务价格等约束下,提出一种包括改进的k-means算法和多智能体强化学习算法的两步方法,使EC系统的收益最大化。首先,构建一个联合ES部署和服务放置模型,其中ES部署明确考虑了基站之间的位置关系,服务放置明确考虑了ES部署的位置,以及不同的服务请求和价格;然后,基于基站的位置关系和基站的服务请求负载,通过带约束的k-means算法,在不同约束条件下分别确定最佳的ES部署位置以及ES的协作域;最后,以最大化EC系统收益为目标,通过多智能体强化学习算法在ES上放置服务。实验结果表明,与对比方法相比,所提方法能够提高收益7%~23%。 展开更多
关键词 边缘计算 边缘服务器部署 服务放置 K-MEANS聚类算法 智能强化学习算法
下载PDF
可扩展的无人机多机飞行冲突解脱算法研究 被引量:1
2
作者 张凯 隋东 邹国良 《航空计算技术》 2022年第2期62-66,共5页
随着无人机数量的增长,无人机间飞行冲突的自动解脱研究成为热点。针对冲突无人机数量变化的多机冲突解脱问题,采用一个集中式的深度多智能体强化学习算法——BiCNet算法。BiCNet算法包含参数共享机制和双向循环神经网络,使得冲突解脱... 随着无人机数量的增长,无人机间飞行冲突的自动解脱研究成为热点。针对冲突无人机数量变化的多机冲突解脱问题,采用一个集中式的深度多智能体强化学习算法——BiCNet算法。BiCNet算法包含参数共享机制和双向循环神经网络,使得冲突解脱模型可以支持动态扩展,即能够使用不同数量UAV的多机冲突场景进行训练,并理论上可以解脱任意数量冲突无人机的多机冲突,进而提高冲突解脱模型的训练效率。此外,基于微软面向无人机的开源仿真环境AirSim,设计了大量高密度的无人机多机冲突场景,并对冲突解脱模型进行了训练和测试。从实验的结果来看,训练曲线和测试结果表明解脱模型在求解时间和解脱率方面有很好的表现。 展开更多
关键词 无人机 空中交通管制 飞行冲突解脱 动态扩展 智能强化学习算法
下载PDF
基于多智能体迁移强化学习算法的电力系统最优碳–能复合流求解 被引量:21
3
作者 陈艺璇 张孝顺 +1 位作者 郭乐欣 余涛 《高电压技术》 EI CAS CSCD 北大核心 2019年第3期863-872,共10页
为避免碳排放责任的重复计算,首次在电力系统最优碳–能复合流模型中提出发电侧、电网侧、用户侧之间的碳排放责任分摊机制。并进一步提出一种全新的多智能体迁移强化学习算法,以实现电力系统最优碳–能复合流模型的快速、高质量求解。... 为避免碳排放责任的重复计算,首次在电力系统最优碳–能复合流模型中提出发电侧、电网侧、用户侧之间的碳排放责任分摊机制。并进一步提出一种全新的多智能体迁移强化学习算法,以实现电力系统最优碳–能复合流模型的快速、高质量求解。此算法同时组织多个智能体执行优化任务,并将知识学习机制、多智能体交互机制和知识迁移机制相结合,不仅使每个智能体都具有较强的自主学习能力,还通过多个智能体之间的协调实现了问题的合作求解;知识迁移可以复用历史任务学习经验,使新任务学习效率大幅提升。IEEE 57节点系统、IEEE 300节点系统及深圳电网模型仿真结果均表明,此算法在保证最优解质量和寻优稳定性的同时,收敛速度可达其他算法的4.7~50.5倍,具有明显的优势和实用价值。 展开更多
关键词 智能迁移强化学习算法 碳-能复合流 碳排放责任分摊 迁移学习 强化学习
下载PDF
基于兵棋推演的空战编组对抗智能决策方法
4
作者 陈晓轩 冯旸赫 +2 位作者 黄金才 刘忠 徐越 《指挥与控制学报》 CSCD 北大核心 2024年第2期213-219,共7页
基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大... 基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大时,算法收敛慢,且对仿真平台有较高的要求。针对上述问题,提出了一种融合知识数据和强化学习的空战编组对抗智能决策方法,该决策方法的输入是战场融合态势,使用分层决策框架控制算子选择并执行任务,上层包含使用专家知识驱动的动作选择器,下层包含使用专家知识和作战规则细化的避弹动作执行器、侦察动作执行器和使用强化学习算法控制的打击动作执行器。最后基于典型作战场景进行实验,验证了该方法的可行性和实用性,且具有建模准确、训练高效的优点。 展开更多
关键词 空战编组对抗 算子的协作与控制 智能深度强化学习算法 分层决策模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部