基于R学习的合同网实时调度模型被引量：1

Real-time contract-net-protocol scheduling model based on R-learning

下载PDF

导出

摘要提出一种融入合同网运行机制的R学习方法,以此方法为核心构造Agent形成具有学习能力的实时调度模型。模型以最小化作业累计平均流动比为主要目标,同时借助对强化学习报酬的设计减小机器负载的不均衡性,实现对调度过程的双重优化;构造实时调度实例投入测试的结果证明了模型的绩效。另外,一个包含强化学习Agent与无学习Agent的混合机器环境被构建并测试其性能,测试结果表明:在Agent之间借助强化学习过程形成了某种隐性的合作,正是这种合作保证了高质量实时调度方案的输出。 This paper proposes a real-time scheduling model based on contract net protocol structure employing reinforcement learning agents. To this end, an R-learning procedure is elaborated and embedded in machine agents’decision process, enabling them to treat bid-invitations in more complicated way than in a simple contract net protocol environment. Efficiency of the proposed method is verified through experiments in a simulated real-time scheduling environment. Furthermore, the performance of mixed machine groups which comprises both reinforcement learning agents and non-reinforcement-learning agents shows that there is spontaneous implicit teamwork occurring between reinforcement learning agents, and this teamwork guarantees high quality output of the scheduling model.

作者赵良辉熊作贞

机构地区五邑大学经济管理学院

出处《计算机工程与应用》 CSCD 2014年第10期221-226,237,共7页 Computer Engineering and Applications

基金广东省自然科学基金资助项目(No.8452902001001552)

关键词 R学习合同网多AGENT合作实时调度 R-learning contract net protocol multi-agent cooperation real-time schedule

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献15

1Smith R G.The contract net protocol :High-level communi- cation and control in a distributed problem Solver[J].IEEE Transactions on Computers, 1980, C- 19 (12) : 1104-1113. 被引量：1
2张国海,江平宇,周光辉.多设计任务调度的非合作博弈研究[J].西安交通大学学报,2007,41(3):303-306. 被引量：6
3周光辉,王蕊,江平宇,张国海.作业车间调度的非合作博弈模型与混合自适应遗传算法[J].西安交通大学学报,2010,44(5):35-39. 被引量：8
4Ma Huiye, Leung Hofung.Agent-based CDAs and bidding strategies[M]//Bidding strategies in agent-based continuous double auctions.Basel: Birkhauser, 2008 : 9-28. 被引量：1
5Martin A,Richard P.Genetic programming for the acqui- sition of double auction market strategies[M]//Advances in genetic programming.Cambridge: MIT Press, 1994: 355-368. 被引量：1
6Zhang W, Dietterich T G.A reinforcement learning approach to job-shop scheduling[C]//Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence. San Francisco:Morgan Kaufmann Publishers Inc, 1995. 被引量：1
7Palombarini J, Martinez E.SmartGantt-An intelligent system for real time rescheduling based on relational reinforcement learning[J].Expert Systems with Applications, 2012,39 ( 11 ) : 10251-10268. 被引量：1
8Csanad C B, Laszlo M, Botond K.Reinforcement learning in a distributed market-based production control system[J]. Advanced Engineering Informatics, 2006,20(3 ) : 279-288. 被引量：1
9Hsieh Fu-Shiung.Design of reconfiguration mechanism for holonic manufacturing systems based on formal models[J]. Engineering Applications of Artificial Intelligence, 2010, 23(7) : 1187-1199. 被引量：1
10Li Ying, Zheng Jiaqiang, Yang Shanlin.Multi-agent-based fuzzy scheduling for shop floor[J].International Journal of Advanced Manufacturing Technology, 2010,49 (5/8) : 689-695. 被引量：1

二级参考文献33

1黄洪钟,李丽,刘伟.并行工程中设计任务的动态调度[J].机械工程学报,2002,38(z1):164-167. 被引量：12
2任东锋,方宗德.并行设计中任务调度问题的研究[J].计算机集成制造系统,2005,11(1):32-38. 被引量：18
3JIANG Pingyu,ZHOU Guanghui,ZHAO Gang,et al.E-2-MES:an e-service-driven networked manufacturing platform for extended enterprises[J].International Journal of Computer Integrated Manufacturing,2007,20(2/3):127-142. 被引量：1
4ZHOU Guanghui,JIANG Pingyu,ZHANG Guohai.Game theoretical framework for process plan decision of jobs in networked manufacturing[C]//Proceedings of the IEEE International Conference on Automation and Logistics.Piscataway,NJ USA:IEEE,2007:1868-1873. 被引量：1
5SAKAWA M,MORI T.An efficient genetic algorithm for job-shop scheduling problems with fuzzy processing time and fuzzy due date[J].Computers & Industrial Engineering,1999,36(2):325-341. 被引量：1
6MATTFELD D C,BIERWIRTH C.An efficient genetic algorithm for job shop scheduling with tardiness objectives[J].European Journal of Operational Research,2004,155(3):616-630. 被引量：1
7YUN Y S.Genetic algorithm with fuzzy logic controller for preemptive and non-preemptive joh-shop scheduling problems[J].Computers & Industry Engineering,2002,43(3):623-644. 被引量：1
8KIM B H.A new game-theoretic framework for maintenance strategy analysis[J].IEEE Transactions on Powet Systems,2003,18(2):698-706. 被引量：1
9ALI R Y.An effective hybrid immune-hill climbing optimization approach for solving design and manufacturing optimization problems in industry[J].Journal of Materials Processing Technology,2009,209(6):Z773-2780. 被引量：1
10SRINIVAS M,PATNAIK L M.Adaptive probabilities of crossover and mutation in genetic algorithm[J].IEEE Tram on Systems,Man and Cybernetics,1994,24(4):656-667. 被引量：1

共引文献19

1黄炳强,曹广益,费燕琼,王占全.基于平均报酬模型的强化学习算法研究[J].上海理工大学学报,2006,28(5):418-422. 被引量：1
2李济泽,李科杰,宋萍.基于非合作博弈模型的多移动节点任务分配[J].福建工程学院学报,2010,8(4):388-391.
3余涛,袁野.基于平均报酬模型全过程R(λ)学习的互联电网CPS最优控制[J].电力系统自动化,2010,34(21):27-33. 被引量：10
4石小光,孙树栋,涂袁志,金玫.一种面向Job-shop的制造资源冲突消解方法[J].机械科学与技术,2011,30(12):1985-1989. 被引量：3
5李英姿,张晓冬,张硕,张志强.基于人员-任务-资源匹配度的产品设计项目静态调度[J].工业工程与管理,2012,17(3):74-80. 被引量：10
6丁彬楚,汤洪涛.面向作业车间重调度的改进合同网机制研究[J].机电工程,2013,30(2):147-151.
7王蕊,周光辉.基于非合作博弈批量调度优化[J].制造业自动化,2013,35(14):16-18. 被引量：1
8严珍珍,邢立宁,陈英武.求解任务分配问题的带有推荐功能的蚁群算法[J].计算机集成制造系统,2013,19(9):2220-2228. 被引量：5
9刘久义,李博,王克勤.基于制造能力和角色的航天制造装备递阶配置方法[J].机械制造,2013,51(1):85-87.
10李霞.基于非合作博弈模型的无线传感器网络多移动节点任务分配[J].自动化与仪器仪表,2013(6):128-129.

同被引文献10

1陈华东,王航宇,王树宗,吴玲.基于合同机制的协同作战分布式目标分配研究[J].系统仿真学报,2009,21(16):5116-5119. 被引量：14
2刘传波,邱志明,吴玲,王航宇.动态武器目标分配问题的研究现状与展望[J].电光与控制,2010,17(11):43-48. 被引量：46
3唐苏妍,梅珊,朱一凡,雷永林,李群.基于扩展合同网协议的分布式武器目标分配方法[J].系统工程与电子技术,2011,33(3):568-574. 被引量：21
4杨萍,刘颖,裴莹.改进合同网协议的Agent动态任务分配[J].火力与指挥控制,2011,36(10):77-80. 被引量：10
5郝会成,姜维,李一军,袁子清.基于Multi-Agent敏捷卫星动态任务规划问题[J].国防科技大学学报,2013,35(1):53-59. 被引量：23
6陈华东,刘忠,李云凡,谢连朋.黄页服务的合同网在编队武器目标分配中的应用[J].火力与指挥控制,2013,38(7):103-106. 被引量：4
7杨颖,武健,魏鹏.基于多智能体和合同网的巡航导弹自主任务分配[J].战术导弹技术,2014(1):63-66. 被引量：5
8刘刚,王瑛,张发,郭戎潇.合同网协议协商机制收敛性与收敛速率分析[J].控制与决策,2014,29(6):1027-1034. 被引量：6
9于连飞,刘进,张维明,修保新,刘嵩.武器-目标分配问题算法研究综述[J].数学的实践与认识,2016,46(2):26-32. 被引量：19
10李明,刘玮,张彦铎.基于改进合同网协议的多Agent动态任务分配[J].山东大学学报（工学版）,2016,46(2):51-56 63. 被引量：23

引证文献1

1郭智杰,糜玉林,肖阳,姜文志,贺林波.改进合同网协议在防空武器目标分配中的应用[J].现代防御技术,2017,45(4):104-111. 被引量：11

二级引证文献11

1张先剑,杨乐平.空天防御作战规划问题研究[J].国防科技,2018,39(6):20-26. 被引量：1
2付光远,李源,付文宇,王湘瑶.改进合同网在多机器人围捕任务分配中的应用[J].兵器装备工程学报,2019,40(3):98-102. 被引量：9
3张梦颖,王蒙一,王晓东,宋勋.基于改进合同网的无人机群协同实时任务分配问题研究[J].航空兵器,2019,26(4):38-46. 被引量：25
4邱少明,胡宏章,杜秀丽,吕亚娜.基于DDE改进蝙蝠算法的动态火力分配方法[J].现代防御技术,2019,47(6):61-67. 被引量：6
5马悦,吴琳,许霄,刘昀.智能化作战任务规划需求分析[J].指挥控制与仿真,2021,43(4):61-67. 被引量：16
6史红权,隆雨佟,曾黎.基于IGHS的防空火力资源优化分配模型[J].电子科技大学学报,2021,50(5):720-727. 被引量：3
7马悦,吴琳,薄其蒙,郭圣明.作战任务规划模型与求解方法综述[J].火力与指挥控制,2022,47(9):1-8. 被引量：2
8赵飞扬,陈洪超,康林,王长城.基于改进合同网的分布式协同目标分配[J].兵工自动化,2023,42(3):26-30.
9马悦,吴琳,郭圣明.作战任务分配建模及求解方法研究[J].系统仿真学报,2023,35(4):887-898. 被引量：5
10马悦,吴琳,许霄.基于多智能体强化学习的协同目标分配[J].系统工程与电子技术,2023,45(9):2793-2801. 被引量：1

1周如益,高阳.一种基于性能势的无折扣强化学习算法[J].广西师范大学学报（自然科学版）,2006,24(4):58-61. 被引量：2
2老董.ISA Server学习问答[J].网管员世界,2011(7):120-123.
3徐恭旭,肖刚,陆佳炜,张元鸣.基于反射机制的多Agent数据交互模型研究[J].计算机应用,2009,29(10):2830-2832. 被引量：1
4折淑舫.基于移动Agent的入侵检测系统技术研究[J].电脑学习,2004(4):50-51.
5唐忠平,李雅文,郑乐意,沈波.基于J2EE和Ionic的ITer学习APP设计与开发[J].电脑知识与技术,2016,12(7X):85-86. 被引量：1
6VR/AR产品未来路在何方[J].中外玩具制造,2017,0(2):20-21.
7李常洪,寇纪淞,李敏强.多Agent合作中的欺骗及其对策[J].天津大学学报（社会科学版）,2003,5(2):137-139. 被引量：5
8郑淑丽,韩江洪,骆祥峰,蒋建文.多Agent系统的协作及强化学习算法研究[J].模式识别与人工智能,2002,15(4):453-457. 被引量：2
9徐国浪,魏延.基于二叉树结构双优化的SVM多分类算法研究[J].重庆师范大学学报（自然科学版）,2013,30(6):109-113. 被引量：4
10任小娟,常玉红.模型驱动架构之探讨[J].电脑知识与技术,2007(7):148-149.

计算机工程与应用

2014年第10期

浏览历史

内容加载中请稍等...

基于R学习的合同网实时调度模型被引量：1

参考文献15

二级参考文献33

共引文献19

同被引文献10

引证文献1

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于R学习的合同网实时调度模型 被引量：1

参考文献15

二级参考文献33

共引文献19

同被引文献10

引证文献1

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于R学习的合同网实时调度模型被引量：1