期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
电力物联网中基于聚类的任务卸载在线优化方法
1
作者 夏元轶 滕昌志 +2 位作者 曾锃 张瑞 王思洋 《计算机技术与发展》 2024年第6期66-72,共7页
随着电力物联网(electric Internet of Things,eIoT)技术的快速发展,海量电力设备在网络边缘环境中产生了丰富的数据。移动边缘计算(Mobile Edge Computing,MEC)技术在靠近终端设备的位置部署边缘代理可以有效减少数据处理延迟,这使其... 随着电力物联网(electric Internet of Things,eIoT)技术的快速发展,海量电力设备在网络边缘环境中产生了丰富的数据。移动边缘计算(Mobile Edge Computing,MEC)技术在靠近终端设备的位置部署边缘代理可以有效减少数据处理延迟,这使其非常适用于延迟敏感的电力物联网场景。然而,目前的大多数研究没有考虑到部分边缘终端设备也可以作为代理设备提供计算服务,造成了资源浪费。为了充分利用移动边缘计算过程中边缘代理以及边缘终端设备的计算能力,提出了一种基于设备聚类的任务卸载方案。首先,基于分层DBSCAN(hierarchical density-based spatial clustering of applications with noise)算法,对系统中的静态和动态边缘设备进行聚类。其次,将任务卸载问题建模为多臂老虎机(Multi-Armed Bandits,MAB)模型,目标为最小化卸载延迟。再次,提出了一种基于自适应置信上限算法的算法来寻找簇内与簇间的卸载策略。最后,仿真结果表明,该方案在平均延迟方面表现出了更好的性能,并且设备簇的存活时间延长了10%~20%。 展开更多
关键词 电力物联网 移动边缘计算 设备簇 任务卸载 多臂老虎机
下载PDF
基于在线学习的面向居民用户激励型需求响应 被引量:3
2
作者 姜昊 王玉峰 《电工电能新技术》 CSCD 北大核心 2023年第6期23-33,共11页
激励型需求响应是一种通过补贴信号灵活调度需求侧能源的手段,对于维持电力系统供需平衡,提升经济效益有巨大潜力。在面向居民用户的激励型需求响应中,电力运营商选择削减电量潜力大的居民用户并向其提供补贴价格,以激励其削减电量。然... 激励型需求响应是一种通过补贴信号灵活调度需求侧能源的手段,对于维持电力系统供需平衡,提升经济效益有巨大潜力。在面向居民用户的激励型需求响应中,电力运营商选择削减电量潜力大的居民用户并向其提供补贴价格,以激励其削减电量。然而,站在电力运营商的角度,面对居民用户未知且不确定的用电行为,识别并选择削减电量潜力大的居民用户以及如何动态制定补贴价格是关键挑战。为了解决这一问题,本文提出基于在线学习的激励型需求响应算法(IDR-OL),利用多臂赌博机框架在线学习居民用户削减电量潜力,建立电力运营商运营成本优化模型选择最优参与需求响应的居民用户并动态制定补贴价格。仿真结果表明,本文提出的IDR-OL算法能够在实现供需平衡的同时更大限度地降低电力运营商运营成本。 展开更多
关键词 需求响应 多臂赌博机 削减电量潜力 动态定价 居民用户选择
下载PDF
基于多臂赌博机的频率捷变雷达在线决策方法
3
作者 朱鸿宇 何丽丽 +2 位作者 刘峥 谢荣 冉磊 《雷达学报(中英文)》 EI CSCD 北大核心 2023年第6期1263-1274,共12页
频率捷变技术发挥了雷达在电子对抗中主动对抗优势,可以有效提升雷达的抗噪声压制式干扰性能。然而,随着干扰环境的日益复杂,在无法事先了解环境性质的情况下,设计一种具有动态适应能力的频率捷变雷达在线决策方法是一个具有挑战性的问... 频率捷变技术发挥了雷达在电子对抗中主动对抗优势,可以有效提升雷达的抗噪声压制式干扰性能。然而,随着干扰环境的日益复杂,在无法事先了解环境性质的情况下,设计一种具有动态适应能力的频率捷变雷达在线决策方法是一个具有挑战性的问题。该文根据干扰策略的特征,将压制式干扰场景分为3类,并以最大化检测概率为目标,设计了一种基于多臂赌博机(MAB)的频率捷变雷达在线决策方法。该方法是一种在线学习算法,无需干扰环境的先验知识和离线训练过程,在不同干扰场景下均实现了优异的学习性能。理论分析和仿真结果表明,与经典算法和随机捷变策略相比,所提方法具有更强的灵活性,在多种干扰场景下均能够有效提升频率捷变雷达的抗干扰和目标检测性能。 展开更多
关键词 频率捷变 噪声压制式干扰 检测概率 多臂赌博机(mab) 在线学习
下载PDF
基于5G的列车云边端协同计算设计与优化
4
作者 徐建喜 魏思雨 李宗平 《太赫兹科学与电子信息学报》 2024年第11期1199-1208,共10页
城市轨道交通对于缓解城市交通拥堵具有重要作用,城轨列车多车协同控制是近年来的研究热点。多车协同计算任务受通信的限制,存在资源分配平衡差、系统对环境变化响应慢、协同运行能力有限等问题。5G通信与移动边缘计算(MEC)的结合可有... 城市轨道交通对于缓解城市交通拥堵具有重要作用,城轨列车多车协同控制是近年来的研究热点。多车协同计算任务受通信的限制,存在资源分配平衡差、系统对环境变化响应慢、协同运行能力有限等问题。5G通信与移动边缘计算(MEC)的结合可有效改进任务处理的实时性与准确性,提高系统整体性能。本文设计了一种基于5G与MEC的城轨列车运行控制系统自主协同计算架构,根据多车协同控制任务的特征,将多车协同计算卸载中的边缘服务器选择问题建模为多臂匪徒(MAB)学习模型,并提出一种基于置信区间上限(UCB)算法的求解方案,使城轨列车多车协同控制系统的整体能耗和时延最小。仿真结果表明,本文所提出的算法模型在平均奖励、最佳选择概率、平均执行时延、加权总成本等方面具有显著的性能优势。 展开更多
关键词 多车协作 移动边缘(MEC)计算 5G网络 任务卸载 多臂匪徒(mab)学习 置信区间上限(UCB)算法
下载PDF
基于强化学习的大规模多模Mesh网络联合路由选择及资源调度算法 被引量:1
5
作者 朱晓荣 贺楚闳 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第7期2773-2782,共10页
为了平衡新型电力系统中大规模多模Mesh网络的传输可靠性和效率,该文在对优化问题进行描述和分析的基础上提出一种基于强化学习的大规模多模Mesh网络联合路由选择及资源调度算法,分为两个阶段。在第1阶段中,根据网络拓扑结构信息和业务... 为了平衡新型电力系统中大规模多模Mesh网络的传输可靠性和效率,该文在对优化问题进行描述和分析的基础上提出一种基于强化学习的大规模多模Mesh网络联合路由选择及资源调度算法,分为两个阶段。在第1阶段中,根据网络拓扑结构信息和业务需求,利用一种多条最短路径路由算法,输出所有最短路径。在第2阶段中,提出一种基于多臂老虎机(MAB)的资源调度算法,该算法基于得到的最短路径集合构建MAB的摇臂,然后根据业务需求计算回报,最终给出最优的路由选择及资源调度方式用于业务传输。仿真结果表明,所提算法能够满足不同的业务传输需求,实现端到端路径的平均时延和平均传输成功率的高效平衡。 展开更多
关键词 MESH网络 路由选择 资源调度 多臂老虎机 强化学习
下载PDF
一种MTC快速上行授权接入改进算法
6
作者 陈发堂 杨夏 韩才君 《系统工程与电子技术》 EI CSCD 北大核心 2023年第12期4064-4072,共9页
快速上行授权接入是大规模机器类通信的关键技术之一,而缓解上行共享信道资源紧张并针对时延和速率等服务质量(quality of services,QoS)高效地进行调度是对其进行优化的重要方向。针对这一问题,提出一种应用多臂赌博机(multi-armed ban... 快速上行授权接入是大规模机器类通信的关键技术之一,而缓解上行共享信道资源紧张并针对时延和速率等服务质量(quality of services,QoS)高效地进行调度是对其进行优化的重要方向。针对这一问题,提出一种应用多臂赌博机(multi-armed bandit,MAB)学习和功率域非正交多址接入(power-domain non-orthogonal multiple access,PD-NOMA)技术的快速上行授权接入算法。所提算法通过多路MAB筛选高接入速率、低接入忍耐时延要求和低接入速率、低接入忍耐时延要求的两类设备,允许其优先被调度并复用上行资源进行接入。仿真结果表明,算法降低了系统的上行资源浪费率,在提高了接入能力的同时减少了因非正交多址接入(non-orthogonal multiple access,NOMA)造成速率损失带来的影响,并优化了系统QoS。 展开更多
关键词 机器类通信 快速上行授权 多臂赌博机 非正交多址接入
下载PDF
给定预算下基于相对熵置信区间的蒙特卡洛树搜索最优动作识别算法
7
作者 刘郭庆 钱宇华 +1 位作者 张亚宇 王婕婷 《计算机研究与发展》 EI CSCD 北大核心 2023年第8期1780-1794,共15页
蒙特卡洛树搜索(Monte Carlo tree search, MCTS)将强化学习的反馈优化与生长树的动态规划相结合,在输出当前状态的最佳动作的同时极大地减少了计算量,因此成为开放环境下众多领域智能系统的关键通用方法.但由于计算资源匮乏或者计算成... 蒙特卡洛树搜索(Monte Carlo tree search, MCTS)将强化学习的反馈优化与生长树的动态规划相结合,在输出当前状态的最佳动作的同时极大地减少了计算量,因此成为开放环境下众多领域智能系统的关键通用方法.但由于计算资源匮乏或者计算成本昂贵等原因,完全充分地对树结构进行搜索是难以实现的,因此在有限的预算下高效合理地分配计算资源从而获得当前状态下的最优动作是目前研究的一个重要问题.现有大多数算法仅以识别准确率作为性能指标,通过实验对比验证算法性能,缺少对算法的识别误差和影响因素的分析,从而降低了算法的可信性和可解释性.针对该问题,选择基础核心的2名玩家、完全信息、零和博弈场景,提出了固定预算设定下MCTS抽象模型的最优行动识别算法DLU——基于相对熵置信区间的纯探索(relative entropy confidence interval based pure exploration).首先提出了基于相对熵置信区间的估值方法对叶子节点胜率进行估计,其可以从底层提高树节点估值准确性;其次给出了第1层节点值估计、最优节点选择策略以形成完整算法流程;然后推导了DLU算法的识别误差上界,并分析了算法性能的影响因素;最后在人造树模型和井字棋2种场景下验证算法性能.实验结果表明,在人造树模型上基于相对熵的算法类具有更高的准确度,且模型越复杂识别难度越高时,该算法类的性能优势越显著.在井字棋场景下,DLU算法能有效地识别最优动作. 展开更多
关键词 蒙特卡洛树搜索 最优动作识别 多臂赌博机 误差最小化 强化学习
下载PDF
高速铁路场景中基于MAB模型的多信道选择算法
8
作者 朱豪 彭艺 +1 位作者 张申 李启骞 《吉林大学学报(理学版)》 CAS 北大核心 2021年第2期365-371,共7页
针对高速列车越区切换过程中,切换带为多信道分布的问题,提出一种基于多臂老虎机(multi-armed bandit,MAB)模型的信道选择算法.首先,以置信区间上界(UCB)算法为基础,通过设置信道空闲差异因子,使算法快速收敛于最优信道;其次,通过引入... 针对高速列车越区切换过程中,切换带为多信道分布的问题,提出一种基于多臂老虎机(multi-armed bandit,MAB)模型的信道选择算法.首先,以置信区间上界(UCB)算法为基础,通过设置信道空闲差异因子,使算法快速收敛于最优信道;其次,通过引入满意通信概率(SCP),衡量移动列车的通信质量,分析与切换过程中误码率之间的关系;最后,利用最优信道选择比率、成功传输率和累积接入损失作为评判标准,分析算法的性能.仿真结果表明,该算法的累积接入损失比原始UCB算法减少了约18.5%;对比随机选择算法与原始UCB算法,成功传输率提高了约30.2%和3.3%;最优选择比率提高了约88.3%和13.5%. 展开更多
关键词 越区切换 多臂老虎机模型 置信区间上界算法 满意通信概率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部