一种基于深度强化学习的调度优化方法被引量：17

A Scheduling Optimization Method Based on Depth Intensive Study

下载PDF

导出

摘要深度强化学习在于将深度学习的感知能力与强化学习的决策能力相结合,可以直接根据输入进行控制,是一种更接近人类思维方式的人工智能方法。旨在二者结合基础上,研究了一种基于深度强化学习的资源调度算法的设计框架。该框架首先利用从网络节点获取的大量先验数据,训练深度学习网络;然后利用强化学习来分配网络资源;接着通过大量的自我对弈,实现基于深度强化学习的价值网络学习。最后,设计实验方案对算法的性能进行了仿真和对比验证,以验证该算法的有效性。 Depth intensive study is a combination of deep learning perceived ability and enhanced learning decision-making ability which can be controlled by the input. Depth intensive study is an artificial intelligence method which is closer to human thinking. Based on the combination of the two methods, the paper studies a designed framework of resource scheduling algorithm based on depth intensive study. First, the framework utilizes a large number of priori data from the network nodes to train depth learning network. Then use the enhanced learning to allocate network resources, Next realize the value of network learning based on deep reinforcement learning through a lot of self-chess. Finally, the performance of the algorithm is simulated and compared, and the results confirm the effectiveness of the algorithm.

作者邓志龙张琦玮曹皓谷志阳

机构地区西北工业大学电子信息学院西北工业大学自动化学院

出处《西北工业大学学报》 EI CAS CSCD 北大核心 2017年第6期1047-1053,共7页 Journal of Northwestern Polytechnical University

基金国家自然科学基金(U1609216)资助

关键词深度学习调度算法蒙特卡洛模拟强化学习 deep learning scheduling algorithms Monte Carlo simulation reinforcement learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014,31(7):1921-1930. 被引量：292
2尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015,41(1):48-59. 被引量：385
3邓正宏,薛静.基于数量化II类的数据分析库的设计与实现[J].计算机工程与应用,2003,39(28):42-45. 被引量：1
4张浩,吴秀娟,王静.深度学习的目标与评价体系构建[J].中国电化教育,2014(7):51-55. 被引量：312

二级参考文献189

1Anderson T W.The asymptotic distribution of certain characteristic roots and vectors[C].In:Proc Second Berkeley Symp Math Statist Probability,Univ.California Press.Berkeley and Los Angeles,2001 : 103-130. 被引量：1
2Xu L,Krzyzak A,Oja E.Rival penalized competitive learning for clustering analysis,RBF net,and curve detection[J].IEEE Transactions on Neural Networks,1999;4(4) :636--649. 被引量：1
3Deemer,Walter L,Olkin Ingrain.The Jacobians of certain matrix transformations useful in multivariate analysis.Based on lectures of P L Hsu at the University of North Carolina,Biometrika,1997;38:345-367. 被引量：1
4王文静.创新的教育研究范式:基于设计的研究[M].上海:华东师范大学出版社,2011.25. 被引量：1
5[美]L·W·安德森等.学习、教学和评估的分类学——布鲁姆教育目标分类学修订版(简缩本)[M].上海:华东师范大学出版社,2007.58-76. 被引量：1
6Biggs,J.B.,Collis,K.F..Evaluating the Quality of Learning:the SOLO Taxonomy[M].New York:Academic Press,1982. 被引量：1
7Smith,T.W.,Colby,S.A..Teaching for Deep Learning[J].The Clearing House,2007,80(5):205-209. 被引量：1
8李锋.信息技术课程学习评价的理论与方法研究[D].上海:华东师范大学,2004.24-29. 被引量：1
9[美]D·R·克拉斯沃尔,B·S·布卢姆等.教育目标分类学[M].上海:华东师范大学出版社,1989. 被引量：1
10KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Imagenet classification with deep convolutional neural networks[C]∥Advances in Neural Information Processing Systems.Red Hook,NY:Curran Associates,2012:1097-1105. 被引量：1

共引文献963

1沈文君.让幼儿在游戏中实现深度学习[J].学园,2021,14(25):57-59.
2陶然.导向深度学习的初中数学教学目标设计[J].数理天地（初中版）,2022(20):20-22. 被引量：2
3李本岳,李伟荣,潘华峰,王宏,王奇.人工智能对中医诊断的影响[J].世界科学技术-中医药现代化,2020,22(5):1624-1628. 被引量：23
4张格,林岚,吴水才.脑群体图中图卷积神经网络应用研究综述[J].生命科学仪器,2021,19(4):23-30. 被引量：2
5高嵩.深度学习在机场能见度预测中的应用[J].计算机产品与流通,2020,0(4):260-260. 被引量：2
6李彩艺.基于“问题解决”能力培养的课堂深度学习教学模式探究[J].乌鲁木齐职业大学学报,2023,32(4):50-53. 被引量：1
7邢家伟.“双一流”背景下英语写作课动态学习评价体系构建[J].辽宁教育行政学院学报,2020(5):68-71.
8张雪,孙先洪.基于精准教学的大学英语深度教学模式探析[J].中国多媒体与网络教学学报（电子版）,2020(34):212-214. 被引量：2
9田琳,舒康安,黄远明,黄志生,孙谦,盛剑胜.发电商滥用市场力行为识别方法研究——基于朴素贝叶斯方法的分析[J].价格理论与实践,2021(5):43-48. 被引量：2
10秦朋绪.信息技术支持下促进深度学习的教学研究[J].汉字文化,2022(16):161-163. 被引量：5

同被引文献162

1冯润明,王国玉,黄柯棣.TENA中间件的设计与实现[J].系统仿真学报,2004,16(11):2373-2377. 被引量：23
2董晓菲,韩增林.“十一五”期间东北综合交通运输发展战略布局研究[J].国土与自然资源研究,2007(1):14-15. 被引量：2
3陈庆奎.基于强化学习的多机群网格资源调度模型[J].计算机科学,2007,34(11):67-70. 被引量：5
4张丽霞,赵又群,潘福全.Hopfield神经网络算法求解路网最优路径[J].哈尔滨工业大学学报,2009,41(9):222-224. 被引量：8
5刘君瑞,陈颖图,樊晓桠.基于先到先服务的二维动态优先级信令排队算法[J].计算机科学,2011,38(5):89-92. 被引量：4
6王倩.Matlab环境下多变量问题的神经网络求解[J].福建电脑,2012,28(7):109-110. 被引量：1
7林伟伟,齐德昱.云计算资源调度研究综述[J].计算机科学,2012,39(10):1-6. 被引量：126
8左利云,曹志波.云计算中调度问题研究综述[J].计算机应用研究,2012,29(11):4023-4027. 被引量：47
9殷凡,牛丽.基于云计算资源调度的多Agent遗传算法[J].科技通报,2014,30(12):247-249. 被引量：2
10尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015,41(1):48-59. 被引量：385

引证文献17

1王文东,武海妮,侯勉.物联网下分布式在线学习资源个性化调度仿真[J].计算机仿真,2019,36(1):417-420. 被引量：2
2刘朋硕.基于加权密集连接卷积的深度强化学习方法总结[J].电子世界,2018,0(13):66-66.
3顾洵,李储信.基于Detroit模型和深度学习的交通流调度方法应用分析[J].中国电子科学研究院学报,2019,14(2):111-117. 被引量：4
4崔小洛,栾晓飞.基于深度强化学习的图像修复算法设计[J].物联网技术,2019,9(6):58-60. 被引量：2
5何杨,肖基毅.基于深度强化学习的网络共享资源智能调度方法[J].自动化与仪器仪表,2019,0(6):80-82. 被引量：3
6易卓,孙慕明,杜学绘.基于服务映射与分块调度的天基接入点密码资源调度算法[J].信息安全研究,2019,5(9):805-811. 被引量：1
7周碧莹,王爱平,费长江,虞万荣,赵宝康.基于强化学习的卫星网络资源调度机制[J].计算机工程与科学,2019,41(12):2134-2142. 被引量：5
8荆荣丽,葛书荣,王鹏,宁玉文.基于强化学习的网络时延自动化控制数学建模研究[J].自动化与仪器仪表,2020,0(3):57-59.
9李孜恒,孟超.基于深度强化学习的无线网络资源分配算法[J].通信技术,2020,53(8):1913-1917. 被引量：9
10汪欣,王广东.基于神经网络的部队投送路径优化方法研究[J].国防交通工程与技术,2021,19(2):9-14. 被引量：2

二级引证文献36

1王盈,李友荣.物联网环境下多并发任务分簇调度方法仿真[J].计算机仿真,2020,37(3):475-479. 被引量：2
2李凤华,张林杰,陆月明,耿魁,郭云川.天地网络安全保障技术研究[J].天地一体化信息网络,2020,1(1):17-25. 被引量：2
3孙鹤锋,周学军.基于GEO的低轨航天器星间通信链路控制系统设计[J].计算机测量与控制,2020,28(12):112-116. 被引量：1
4蒋学琦,张睿.基于智能算法的通信网络优化应用综述[J].长江信息通信,2021(2):102-103. 被引量：2
5缪巍巍,吴海洋,陈鹏,李伟,蒋春霞,朱鹏宇.基于深度强化学习的通信网故障智能感知与预警模型研究[J].机械设计与制造工程,2021,50(6):102-104. 被引量：12
6李凤,陈艳君.基于模糊聚类的在线数学课程智能匹配算法设计与仿真[J].现代电子技术,2021,44(16):125-128. 被引量：2
7陶伟琪,魏宇.战场资源统一管理和调度技术综述[J].自动化与仪器仪表,2021(7):55-57. 被引量：3
8彭艺,朱桢以,魏翔,谢钊萍.一种基于强化Q学习的跳频交会算法[J].通信技术,2021,54(8):1820-1826. 被引量：1
9张立友.基于最佳匹配块搜索算法的皮质性白内障OCT图像自动修复方法研究[J].自动化与仪器仪表,2021(8):40-43.
10高靖宇,潘博.改进型深度学习算法的医学教育数据分析方法[J].信息技术,2021,45(8):106-111.

1张爱玲,刘慧.开拓创新推动航天企业安全生产工作上水平[J].中国安全生产,2017,0(12):4-4.
2曾绍发.浅谈学生自主学习的阻力及解决途径——以《秘书理论与实务》课程为例[J].各界,2017,0(22):77-77.
3马若骜.面向对象的模块化无人机概念设计[J].设备管理与维修,2017(19):126-128. 被引量：1
4周大崴.大学生自媒体背景下自主学习存在的问题及成因[J].科教文汇,2018(2):50-51.
5梁晨晨.“轴心时代"中西方人类思维方式的比较研究[J].陇东学院学报,2017,28(4):71-73.
6左明明,左晓兵,罗铭,曹振兴.应用型本科院校实验创新训练课程教学改革的探索[J].广东化工,2017,44(23):148-148. 被引量：2
7林艺城,孟安波,陈云龙.梯级电站群短期水火联合经济调度优化方法[J].宁夏电力,2017(5):1-10.
8曲芸.学习网络安全法保障校园网络安全[J].计算机与网络,2017,43(22):52-52.
9刘久利,周波,刘杰,涂兰芬,刘迎娜.应用先验数据的高分三号卫星快速定位方法[J].航天器工程,2017,26(6):24-28. 被引量：2
10兰歆喆,郑玉甫.高铁环境下基于多业务的资源调度算法研究[J].信息通信,2017,30(12):197-200. 被引量：1

西北工业大学学报

2017年第6期

浏览历史

内容加载中请稍等...

一种基于深度强化学习的调度优化方法被引量：17

参考文献4

二级参考文献189

共引文献963

同被引文献162

引证文献17

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

一种基于深度强化学习的调度优化方法 被引量：17

参考文献4

二级参考文献189

共引文献963

同被引文献162

引证文献17

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

一种基于深度强化学习的调度优化方法被引量：17