一种自适应程序设计方法被引量：1

Method of adaptive programming

下载PDF

导出

摘要当前的程序设计都是人工设计执行流程,这种方法具有被动性、机械性、缺乏灵活性等缺点。提出一种基于强化学习的程序设计机制,并实现了相应的算法。根据环境情况和问题要求让计算机自主选择执行流程,通过学习使结果达到最优,同时能实现分层调用。采用这种方法,程序执行可以自主决策,较好地实现了自适应,减少了对设计者的依赖。结果显示,这种方法能取得较好的运行效率。 The current computer programming is designed artificially,which has the weakness of passivity,rigidity and lack of flexibility.This paper proposes a method based on reinforcement learning mechanism,and realizes the corresponding algorithm.According to the environment and requirements,the agent can choose executive process independently and arrive at the optimal result by learning,realize the layered calls.Using this method,the executing program is decision-making,has a way to realize the adaption,and reduces the dependence on designer.The result shows that the method can achieve satisfactory execution efficiency.

作者刘智斌朱晓龙曹宝香

机构地区曲阜师范大学计算机科学学院西安邮电学院计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2011年第36期80-82,126,共4页 Computer Engineering and Applications

基金山东省自然科学基金(No.ZR2009GM009) 陕西省教育厅专项科研计划项目(No.08JK430)

关键词自适应程序设计强化学习 Q学习 AGENT 优化算法 adaptive programming reinforcement learning Q-learning agent optimization algorithm

分类号 TP311.1 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1Nerving P, Chon D.Adaptive software[EB/OL].http ://www.norvig.com/adapaper-pcai.html. 被引量：1
2王千祥,申峻嵘,梅宏.自适应软件初探[J].计算机科学,2004,31(10):168-171. 被引量：21
3Kaelbling L P, Littman M L, Moore A W.Reinforcement learning: a survey[J].Joumal of Artelligence Research, 1996,4:237-285. 被引量：1
4苏畅,高阳,陈世福,陈兆乾.基于SMDP环境的自主生成options算法的研究[J].模式识别与人工智能,2005,18(6):679-684. 被引量：9
5Watins P,Dayan N.Q-learning[J].Machine Learning, 1992,8(3): 279-292. 被引量：1
6Simpkins C,Bhat S, Mateas M.Towards adaptive programming integrating reinforcement learning into a programming language[C]// ACM SIGPLAN Conference on Object-Oriented Programming,Systems, Languages, and Applications, Nashville, TN, USA, 2008: 19-23. 被引量：1
7Sutton R S, Precup D, Shagh S P.Between MDPs and semi-MDPs: a framework for temporal abstraction in reinforcement learning[J]. Artificial Intelligence, 1999,112 (1/2) : 181-211. 被引量：1
8Dietterich T G.Hierarchical reinforcement learning with the MAXQ value function decomposition[J].Journal of Artificial Intelligence Research, 2000,13 : 227-303. 被引量：1
9Parr R.Hierachical control and learning for Markov decision pro- cesses[D].Berkeley, USA: University of California, 1998. 被引量：1
10沈晶编著..分层强化学习理论与方法[M].哈尔滨:哈尔滨工程大学出版社,2007:141.

二级参考文献26

1msrc. wvu. edu/nsf_epscor/cluster_research/ arpa_baa98_1.html 被引量：1
2Kepbart J O,Chess D M. The Vision of Autonomic Computing.IEEE Computer, Jan. 2003. 41-50 被引量：1
3Wang Qianxiang, Huang Gang, Shen Junrong, Mei Hong, Yang Fuqing. Runtime Software Architecture Based Software Evolution And Adaptation, COMPSAC 2003, Dallas, Nov. 2003 被引量：1
4Laddaga R. Creating robust software through self-adaptation.IEEE Intelligent Systems, 14, May/June 1999.26-29 被引量：1
5Laddaga R, et al. Introduction to Self-adaptive Software: Applications. Lecture Notes in Computer Science,2001,1936:1 - 5 被引量：1
6Kephart J O,Chess D M. The Vision of Autonomic Computing.IEEE Computer, 2003,36(1) :41-50 被引量：1
7Laddaga R, et al. Results of The First International Workshop on Self Adaptive Software, Lecture Notes in Computer Science,2001,1936:242-247 被引量：1
8Kokar MM, Baclawski K, Eracar Y A. Control theory based foundations of self controlling software. IEEE Intelligent Systems, 1999,14 (3): 37-45 被引量：1
9Diao Y, Hellerstein J L,Parekh S, Bigus J P. Managing Web Server Performance with AutoTune Agents. IBM Systems Journal, 2003,42 (1). URL. www. research. ibm. com/journal/sj/421/diao. pdf 被引量：1
10Oreizy P, et al. An architecture-based approach to self-adaptive software. IEEE INTELLIGENTSYSTEMS,MAY/JUNE 1999 被引量：1

共引文献28

1杨晓艳,程学先.基于自适应技术的高校工资管理信息系统开发[J].湖北工业大学学报,2006,21(1):71-73.
2彭志平,李绍平.一种基于PSO的分层策略搜索算法[J].模式识别与人工智能,2008,21(1):98-103. 被引量：1
3廖备水,李石坚,姚远,高济.自主计算概念模型与实现方法[J].软件学报,2008,19(4):779-802. 被引量：33
4杜小勤,李庆华,韩建军.一种基于HAMs体系的层次分解方法[J].小型微型计算机系统,2008,29(4):653-658.
5石川,史忠植,王茂光.基于路径匹配的在线分层强化学习方法[J].计算机研究与发展,2008,45(9):1470-1476. 被引量：4
6毛新军,屈婷婷,王戟.自适应多Agent系统的面向Agent软件开发方法学ODAM[J].计算机研究与发展,2008,45(11):1892-1901. 被引量：6
7张梅.开放式高校工资管理系统的设计策略[J].经济师,2008(12):128-129. 被引量：3
8李学斯,毛新军,董孟高.Agent主体的自演化技术及其支撑软件环境[J].计算机科学与探索,2010,4(4):312-323. 被引量：1
9毛新军,李学斯,尹俊文,董孟高,胡翠云,吴斌.自适应网构软件的集成开发环境SADE[J].电子学报,2010,38(B02):207-212. 被引量：3
10刘辉,苏文超.C/S和B/S架构的高校工资管理系统的设计[J].科技创新导报,2010,7(17):255-256. 被引量：2

同被引文献53

1邹广天.建筑设计创新与可拓思维模式[J].哈尔滨工业大学学报,2006,38(7):1120-1123. 被引量：60
2王涛,邹广天.空间元与建筑室内空间设计中的矛盾问题[J].哈尔滨工业大学学报,2006,38(7):1139-1142. 被引量：8
3吕建,马晓星,陶先平,徐锋,胡昊.网构软件的研究与进展[J].中国科学（E辑）,2006,36(10):1037-1080. 被引量：101
4辜希武,卢正鼎.基于Pi-演算的BPEL4 WS Web服务组合形式化模型[J].计算机科学,2007,34(3):69-74. 被引量：13
5常志明,毛新军,王戟,齐治昌.多Agent系统中软构件的动态绑定机制及其操作语义[J].计算机研究与发展,2007,44(5):806-814. 被引量：7
6杨春燕,蔡文.可拓信息-知识-智能形式化体系研究[J].智能系统学报,2007,2(3):8-11. 被引量：20
7叶广仔,李卫华,张希花.防治空气污染的可拓策略生成系统研究与实现[J].广东工业大学学报,2007,24(4):42-48. 被引量：8
8LADDAGA R. Creating robust software through self-adapta- tion[J]. IEEE Intelligent Systems and Their Applications, 1999, 14(3) : 26-29. 被引量：1
9KAKOUSIS K, PASPALLIS N PAPADOPOULOS G A. A survey of software adaptation in mobile and ubiquitous com- puting [ J ]. Enterprise Information Systems, 2010, 4 (4) : 355-389. 被引量：1
10F D MACIAS-ESCRIVA, R HAW, R DEL TOROV, et al. Self-adaptive systems: a survey of current approaches, re- search challenges and applications [ J]. Expert Systems with Applications, 2013, 40(18) : 7267-7279. 被引量：1

引证文献1

1范锐,彭银桥,陈月峰,雷桂斌,刘小辉.基于可拓学的自适应软件形式化方法[J].智能系统学报,2015,10(6):901-911. 被引量：3

二级引证文献3

1王小刚,闫光辉,周宁.一种软件体系结构可拓建模和求精设计方法[J].兰州交通大学学报,2018,37(4):34-39. 被引量：1
2范锐,颜思伟,彭中煌,廖永乐,陈月峰,罗小行,林恒,谭治.可拓策略生成软件架构及其应用研究[J].广东工业大学学报,2017,34(2):1-5. 被引量：4
3李宇洁,李卫华.基于第一创造法的可拓创新软件设计[J].广东工业大学学报,2017,34(2):6-11. 被引量：4

1陈昊,孙辉,许畅,马晓星.一种支持自适应程序设计的移动机器人中间件[J].计算机科学,2012,39(10):119-124. 被引量：1
2郭健强,蔡希尧.基于系统稳定理论的程序自适应模型[J].西安电子科技大学学报,1998,25(6):752-756.
3汪先锋.以MRP为核心建立信息管理系统应注意的几个问题[J].管理信息系统,2001(8):47-48. 被引量：1
4朱杰.单片机C语言中断问题及解决办法[J].计算机光盘软件与应用,2014,17(5):308-309. 被引量：2
5冯顺培.从技术维护角度看高校公共机房管理现状[J].计算机光盘软件与应用,2014,17(14):314-315. 被引量：2
6郭强,王阿慧.电子政务中政府信息化的中日韩比较分析[J].湖北经济学院学报（人文社会科学版）,2005,2(3):85-86.
7张新兰,张弩,苏杰.以数据为中心抓设计院信息资源建设[J].天津科技,2004,31(3):28-31.
8闫素红.浅谈办公计算机的使用技巧[J].大观周刊,2013(12):313-313. 被引量：2
9黄隽,金可音.一种动态监测模型的研究[J].湖南工业大学学报,2011,25(2):55-58. 被引量：1
10陈琼娜.重视网络媒体关注舆论引导[J].供电企业管理,2008(6):19-20. 被引量：1

计算机工程与应用

2011年第36期

浏览历史

内容加载中请稍等...

一种自适应程序设计方法被引量：1

参考文献11

二级参考文献26

共引文献28

同被引文献53

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种自适应程序设计方法 被引量：1

参考文献11

二级参考文献26

共引文献28

同被引文献53

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

一种自适应程序设计方法被引量：1