基于Stackelberg博弈与深度强化学习的计算卸载策略被引量：1

Computation Offloading Strategy Based on Stackelberg Game and DRL

下载PDF

导出

摘要为使5G混合专网结构的2种用户能获得最优计算卸载策略,将2种用户竞争移动边缘计算(mobile edge computing,MEC)服务器资源的问题建模成Stackelberg博弈,并分别讨论了完全信息博弈和不完全信息博弈下的策略。完全信息博弈下,存在唯一纳什均衡解;不完全信息博弈下,将环境建模为部分可观测的马尔可夫决策过程(partially observable Markov decision process,POMDP),并提出一种基于二阶段深度强化学习(two-stage deep reinforcement learning,TSDRL)的最优卸载策略。仿真实验表明:该算法相较于D-DRL算法能减少20.81%的时延及3.38%的能耗,有效提高用户QoE(quality of experience)。 To achieve the optimal computation offloading strategy for two kinds of MEC users in 5G hybrid private network, Stackelberg game is used to build the model of the competition for MEC server resources of two kinds of users, and the strategies of complete information game and partially incomplete information game are researched respectively. It is proved that there is only one Nash equilibrium solution in the complete information scenario. In the incomplete information scenario, the environment is modeled as POMDP, and a two-stage deep reinforcement learning(TSDRL) is proposed to obtain the optimal computation offloading strategy. Simulation results show the proposed algorithm having a total reduction of 20.81% time delay and 3.38 % energy consumption compared with the D-DRL algorithm and can effectively improve the user QoE(quality of experience).

作者周娴玮龚启旭余松森 Zhou Xianwei;Gong Qixu;Yu Songsen(School of Software,South China Normal University,Foshan 528225,China)

机构地区华南师范大学软件学院

出处《系统仿真学报》 CAS CSCD 北大核心 2023年第2期372-385,共14页 Journal of System Simulation

基金广东省应用型科技研发重大专项(2016B020244003) 广东省基础与应用基础研究基金(2020B1515120089,2020A1515110783) 广东省企业科技特派员项目(GDKTP2020014000)。

关键词 5G混合专网计算卸载 STACKELBERG博弈 NASH均衡马尔可夫决策过程 5G hybrid private network computation offloading Stackelberg game theory Nash equilibrium partially observable Markov decision process(POMDP)

分类号 TP393.01 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1董思岐,李海龙,屈毓锛,张钊,胡磊.移动边缘计算中的计算卸载策略研究综述[J].计算机科学,2019,46(11):32-40. 被引量：30
2李长云,黎建波,徐曦,李亭立.具有能量收集设备的移动边缘计算资源分配研究[J].系统仿真学报,2022,34(11):2313-2322. 被引量：2
3吴学文,廖婧贤.云边协同系统中基于博弈论的资源分配与任务卸载方案[J].系统仿真学报,2022,34(7):1468-1481. 被引量：12

二级参考文献6

1宋晓诗,闫岩,王梦源.面向5G的MEC系统关键技术[J].中兴通讯技术,2018,24(1):21-25. 被引量：26
2Feng Wei,Sixuan Chen,Weixia Zou.A Greedy Algorithm for Task Offloading in Mobile Edge Computing System[J].China Communications,2018,15(11):149-157. 被引量：33
3王凌,吴楚格,范文慧.边缘计算资源分配与任务调度优化综述[J].系统仿真学报,2021,33(3):509-520. 被引量：23
4陈加法,赵宜升,高锦程,陈忠辉.基于混合能量收集的移动边缘计算系统资源分配策略[J].重庆邮电大学学报（自然科学版）,2021,33(2):193-201. 被引量：8
5徐思雅,邢逸斐,郭少勇,杨超,邱雪松,孟洛明.基于深度强化学习的能源互联网智能巡检任务分配机制[J].通信学报,2021,42(5):191-204. 被引量：16
6付主木,王俊朋,司鹏举,陶发展,于晓升.基于李雅普诺夫随机优化的车辆边缘计算资源管理[J].控制与决策,2022,37(3):721-728. 被引量：6

共引文献41

1田兴鹏,朱晓荣,朱洪波.基于KM算法的分布式无线节点任务分配方法[J].北京邮电大学学报,2020(6):96-102. 被引量：8
2丁远.5G边缘计算平台在医院信息化平台建设的应用研究[J].信息技术与信息化,2019,0(9):195-198. 被引量：4
3刘炎培,朱淇,赵进超.边缘环境下计算密集型应用的卸载技术研究[J].计算机工程与应用,2020,56(15):1-14. 被引量：4
4王一然.基于匹配理论的电力物联网边缘服务器选择机制[J].无线互联科技,2020,17(11):29-30. 被引量：3
5林引盈,李亮.基于智能电视交互计算的移动设备卸载方法的设计与实现[J].电视技术,2020,44(5):70-73. 被引量：1
6梁冰,纪雯.基于次模优化的边云协同多用户计算任务迁移方法[J].通信学报,2020,41(10):25-36. 被引量：8
7董超,沈赟,屈毓锛.基于无人机的边缘智能计算研究综述[J].智能科学与技术学报,2020,2(3):227-239. 被引量：14
8梁俊斌,田凤森,蒋婵,王天舒.物联网中多设备多服务器的移动边缘计算任务卸载技术综述[J].计算机科学,2021,48(1):16-25. 被引量：6
9王艺洁,凡佳飞,王陈宇.云边环境下基于博弈论的两阶段任务迁移策略[J].计算机应用,2021,41(5):1392-1398. 被引量：7
10胡恒,金凤林,郎思琪.移动边缘计算环境中的计算卸载技术研究综述[J].计算机工程与应用,2021,57(14):60-74. 被引量：13

同被引文献7

1唐琴琴,谢人超,刘旭,张亚生,何辞,李诚成,黄韬.融合MEC的星地协同网络:架构、关键技术与挑战[J].通信学报,2020,41(4):162-181. 被引量：23
2唐清清,李斌.面向空天地一体化网络的移动边缘计算技术[J].无线电通信技术,2021,47(1):27-35. 被引量：11
3陶滢,刘伟,高梓贺,张磊.天地一体化信息网络中星载边缘计算应用与挑战[J].无线电通信技术,2022,48(5):763-772. 被引量：4
4康绍莉,缪德山,索士强,孙韶辉.面向6G的空天地一体化系统设计和关键技术[J].信息通信技术与政策,2022(9):18-26. 被引量：19
5苏新,孟蕾蕾,周一青,CELIMUGE Wu.基于深度强化学习的海洋移动边缘计算卸载方法[J].通信学报,2022,43(10):133-145. 被引量：3
6张冰洁,杨彦红,曹少中.面向多接入边缘计算的计算卸载方案研究综述[J].计算机科学与探索,2023,17(9):2030-2046. 被引量：5
7赵亚军,郁光辉,徐汉青.6G移动通信网络:愿景、挑战与关键技术[J].中国科学：信息科学,2019,0(8):963-987. 被引量：184

引证文献1

1葛林.基于空天地网络的卫星边缘计算卸载方案研究[J].长江信息通信,2024,37(9):43-47.

1Zhu Ruijie,Li Gong,Wang Peisen,Zhang Wenchao.Reinforced virtual optical network embedding algorithm in EONs for edge computing[J].The Journal of China Universities of Posts and Telecommunications,2022,29(6):18-29.
2李斌,沈渊,汪澍萌.面向工业物联网的边缘计算卸载方法研究[J].无线互联科技,2023,20(1):156-158.
3徐林玲,周远,黄鸿云,刘杨.基于碰撞危急程度和深度强化学习的实时轨迹规划算法[J].计算机科学,2023,50(3):323-332. 被引量：1
4何平,王晨辉.互补产品供应链的授权与竞争[J].管理工程学报,2023,37(2):99-107. 被引量：2
5周驰,王艺馨,于静.批发,代理还是混合?——与自营平台竞争的复合平台销售模式选择策略[J].山东大学学报（理学版）,2023,58(1):89-100.
6王潇,李永强,许雪冬,曲娜.基于强化学习的飞机发动机健康维护[J].沈阳航空航天大学学报,2022,39(6):80-86.
7崔庆安,孙艺.基于制造商行为偏好的零件质量升级努力与定价策略研究[J].工业工程,2023,26(1):8-18.
8张晓彤,王嘉诚,何景涛,陈仕韬,郑南宁.面向不确定性环境的自动驾驶运动规划:机遇与挑战[J].模式识别与人工智能,2023,36(1):1-21. 被引量：3
9徐静,罗淑丹,黄小芹.考虑消费者环保意识的车企生产决策及最优补贴研究[J].管理工程学报,2023,37(2):71-79. 被引量：6
10陈立家,孙中泽,黄立文,许毅,李胜为.一种基于深度强化学习的船舶智能避碰方法[J].武汉理工大学学报（交通科学与工程版）,2023,47(1):191-196. 被引量：5

系统仿真学报

2023年第2期

浏览历史

内容加载中请稍等...

基于Stackelberg博弈与深度强化学习的计算卸载策略被引量：1

参考文献3

二级参考文献6

共引文献41

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Stackelberg博弈与深度强化学习的计算卸载策略 被引量：1

参考文献3

二级参考文献6

共引文献41

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Stackelberg博弈与深度强化学习的计算卸载策略被引量：1