基于不完全信息随机博弈与Q-learning的防御决策方法被引量：9

Defense decision-making method based on incomplete information stochastic game and Q-learning

下载PDF

导出

摘要针对现有随机博弈大多以完全信息假设为前提,且与网络攻防实际不符的问题,将防御者对攻击者收益的不确定性转化为对攻击者类型的不确定性,构建不完全信息随机博弈模型。针对网络状态转移概率难以确定,导致无法确定求解均衡所需参数的问题,将Q-learning引入随机博弈中,使防御者在攻防对抗中通过学习得到的相关参数求解贝叶斯纳什均衡。在此基础上,设计了能够在线学习的防御决策算法。仿真实验验证了所提方法的有效性。 Most of the existing stochastic games are based on the assumption of complete information,which are not consistent with the fact of network attack and defense.Aiming at this problem,the uncertainty of the attacker’s revenue was transformed to the uncertainty of the attacker type,and then a stochastic game model with incomplete information was constructed.The probability of network state transition is difficult to determine,which makes it impossible to determine the parameter needed to solve the equilibrium.Aiming at this problem,the Q-learning was introduced into stochastic game,which allowed defender to get the relevant parameter by learning in network attack and defense and to solve Bayesian Nash equilibrium.Based on the above,a defense decision algorithm that could learn online was designed.The simulation experiment proves the effectiveness of the proposed method.

作者张红旗杨峻楠张传富 ZHANG Hongqi;YANG Junnan;ZHANG Chuanfu(The Third Institute,Information Engineering University,Zhengzhou 450001,China;Henan Province Key Laboratory of Information Security,Zhengzhou 450001,China)

机构地区信息工程大学三院河南省信息安全重点实验室

出处《通信学报》 EI CSCD 北大核心 2018年第8期56-68,共13页 Journal on Communications

基金国家高技术研究发展计划("863"计划)基金资助项目(No.2014AA7116082 No.2015AA7116040)~~

关键词网络攻防随机博弈 Q-LEARNING 贝叶斯纳什均衡防御决策 network attack and defense stochastic game Q-learning Bayesian Nash equilibrium defense strategy

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1王震,袁勇,安波,李明楚,王飞跃.安全博弈论研究综述[J].指挥与控制学报,2015,1(2):121-149. 被引量：13
2刘陶,何炎祥,熊琦.一种基于Q学习的LDoS攻击实时防御机制及其CPN实现[J].计算机研究与发展,2011,48(3):432-439. 被引量：8
3姜伟,方滨兴,田志宏,张宏莉.基于攻防随机博弈模型的防御策略选取研究[J].计算机研究与发展,2010,47(10):1714-1723. 被引量：71
4张恒巍,李涛.基于多阶段攻防信号博弈的最优主动防御[J].电子学报,2017,45(2):431-439. 被引量：30
5胡浩,叶润国,张红旗,杨英杰,刘玉岭.基于攻击预测的网络安全态势量化方法[J].通信学报,2017,38(10):122-134. 被引量：28

二级参考文献122

1冯萍慧,连一峰,戴英侠,李闻,张颖君.面向网络系统的脆弱性利用成本估算模型[J].计算机学报,2006,29(8):1375-1382. 被引量：28
2方滨兴.解读信息安全创新突破点[OL].[2008-03-21].http://www.cert.org.cn/articles/news/common/2007051823317.shtml,2008. 被引量：1
3Nash J.Equilibrium points in n-person games[J].Proc of the National Academy of Sciences of the United States of America,1950,36(1):48-49. 被引量：1
4Lee W.Toward cost-sensitive modeling for intrusion detection and response[J].Journal of Computer Security,2002,10(1/2):5-22. 被引量：1
5Wang L Y,Noel S,Jajodia S.Minimum-cost network hardening using attack graphs[J].Computer Communications,2006,29(18):3812-3824. 被引量：1
6Syverson P F.A different look at secure distributed computation[C]//Proc of the 1997 IEEE Computer Security Foundations Workshop.Washington:IEEE Computer Society,1997:109-115. 被引量：1
7Burke D.Towards a game theory model of information warfare[D].Montgomery,AL:Air force Institute of Technology,Air University,1999. 被引量：1
8Lye Kong-wei,Wing J.Game strategies in network security.International Journal of Information Security,2005,4(1/2):71-86. 被引量：1
9Liu P,Zang W.Incentive-based modeling and inference of attacker intent,objectives,and strategies[C]//Proc of the 10th ACM Computer and Communications Security Conf (CCS03).New York:ACM,2003:179-189. 被引量：1
10Jiang Wei,Tian Zhihong,Zhang Hongli,et al.A stochastic game theoretic approach to attack prediction and optimal active defense strategy decision[C]//Proc of 2008 IEEE Int Conf on Networking,Sensing and Control.Washington:IEEE Computer Society,2008:648-653. 被引量：1

共引文献128

1李迎涛,马春光,付韬.网络安全中的积极防御探讨[J].保密科学技术,2012,0(8):61-65.
2张新刚,潘恒,王保平.高校计算机公共实验室的典型安全威胁及防御[J].实验室研究与探索,2011,30(7):197-200. 被引量：11
3赖英旭,赵轶文,杨震,李健.可信计算领域技术标准分析——从事实标准与法定标准比较出发[J].信息技术与标准化,2012(6):23-26. 被引量：1
4潘丽敏,罗森林,张笈.信息安全与对抗竞赛中个人挑战赛的设计方法[J].实验技术与管理,2012,29(12):203-206. 被引量：4
5刘永磊,金志刚.Security enhancement of WAPI access authentication protocol (WAI)[J].Journal of Harbin Institute of Technology(New Series),2012,19(6):42-46. 被引量：2
6陈靖,彭武,王冬海.基于信度评估的网络安全决策系统[J].计算机工程与设计,2013,34(5):1584-1588. 被引量：2
7韩文英,闫明星,柴艳妹,王秀利.基于博弈论的企业信息安全攻防策略研究[J].计算机工程,2013,39(9):162-166. 被引量：6
8梁霄,孟相如,陈铎龙,伍文.基于随机博弈模型的网络可生存性跟踪评估[J].火力与指挥控制,2013,38(9):32-36. 被引量：2
9王秀利,朱建明,李洋,贾恒越.基于多阶段动态博弈的信息安全技术评价[J].小型微型计算机系统,2013,34(10):2335-2339. 被引量：3
10张志威,张传富,岳云天.网电空间中基于蠕虫的攻防对抗技术研究[J].计算机工程,2013,39(11):119-122.

同被引文献79

1陈刚,王超,谢松,周波,唐茂林.基于博弈论的电力大用户直接购电交易研究[J].电网技术,2004,28(13):75-79. 被引量：37
2姜伟,方滨兴,田志宏,张宏莉.基于攻防博弈模型的网络安全测评和最优主动防御[J].计算机学报,2009,32(4):817-827. 被引量：153
3王元卓,林闯,程学旗,方滨兴.基于随机博弈模型的网络攻防量化分析方法[J].计算机学报,2010,33(9):1748-1762. 被引量：62
4姜伟,方滨兴,田志宏,张宏莉.基于攻防随机博弈模型的防御策略选取研究[J].计算机研究与发展,2010,47(10):1714-1723. 被引量：71
5林旺群,王慧,刘家红,邓镭,李爱平,吴泉源,贾焰.基于非合作动态博弈的网络安全主动防御技术研究[J].计算机研究与发展,2011,48(2):306-316. 被引量：63
6刘陶,何炎祥,熊琦.一种基于Q学习的LDoS攻击实时防御机制及其CPN实现[J].计算机研究与发展,2011,48(3):432-439. 被引量：8
7刘玉岭,冯登国,吴丽辉,连一峰.基于静态贝叶斯博弈的蠕虫攻防策略绩效评估[J].软件学报,2012,23(3):712-723. 被引量：33
8伍文,孟相如,马志强,陈铎龙.模块化动态博弈的网络可生存性态势跟踪方法[J].西安交通大学学报,2012,46(12):18-23. 被引量：4
9陈永强,付钰,吴晓平.基于非零和攻防博弈模型的主动防御策略选取方法[J].计算机应用,2013,33(5):1347-1349. 被引量：17
10邓祥力,尹璇,贡鹏浩.基于完全信息序贯博弈模型的大型变压器柔性保护策略[J].中国电机工程学报,2018,38(23):6937-6946. 被引量：4

引证文献9

1孙骞,薛雷琦,高岭,王海,王宇翔.基于随机博弈与禁忌搜索的网络防御策略选取[J].计算机研究与发展,2020,57(4):767-777. 被引量：4
2胡永进,马骏,郭渊博,张晗.基于多阶段网络欺骗博弈的主动防御研究[J].通信学报,2020,41(8):32-42. 被引量：13
3金志刚,王新建,李根,岳顺民.融合攻击图和博弈模型的网络防御策略生成方法[J].信息网络安全,2021(1):1-9. 被引量：11
4高雅卓,刘亚群,张国敏,邢长友,王秀磊.基于多阶段博弈的虚拟化蜜罐动态部署机制[J].计算机科学,2021,48(10):294-300. 被引量：2
5刘小虎,张恒巍,马军强,张玉臣,谭晶磊.基于攻防博弈的网络防御决策方法研究综述[J].网络与信息安全学报,2022,8(1):1-14. 被引量：11
6王霄汉,张霖,赖李媛君,谢堃钰,胡听春.基于DEVS原子模型的智能体离散仿真构建方法[J].系统仿真学报,2022,34(2):191-200. 被引量：2
7李毅,杨雅琪,李芳,张坤,栾浩,马红兵.基于随机博弈的医疗系统入侵检测优化配置[J].中国医疗设备,2023,38(6):55-60.
8胡浩,赵昌军,刘璟,宋昱欣,姜迎畅,张玉臣.基于随机博弈与A3C深度强化学习的网络防御策略优选[J].指挥与控制学报,2024,10(1):47-58.
9张倩,张延迟,解大.含分布式能源的电网优化调度研究[J].上海电机学院学报,2019,0(3):130-134.

二级引证文献42

1徐茂淑.计算机网络防御策略求精关键技术分析[J].信息与电脑,2020,32(20):203-205. 被引量：2
2魏学勇.基于Markov模型的智慧校园网络安全攻防策略[J].电子设计工程,2021,29(15):72-76. 被引量：4
3廖海生.基于大数据技术的智慧校园安全管控平台设计研究[J].计算机测量与控制,2021,29(10):133-138. 被引量：8
4邵晓,刘曼琳.基于强化学习的网络欺骗防御动态部署研究[J].网络安全技术与应用,2021(12):13-15. 被引量：1
5丁朝晖,张伟,杨国玉.基于动态伪装技术的网络安全防御系统研究[J].电子技术应用,2022,48(1):129-132. 被引量：10
6刘小虎,张恒巍,马军强,张玉臣,谭晶磊.基于攻防博弈的网络防御决策方法研究综述[J].网络与信息安全学报,2022,8(1):1-14. 被引量：11
7李凌书,邬江兴,刘文彦.SaaS云环境下基于容器指纹匿名的网络欺骗方法[J].信息安全学报,2022,7(2):72-86. 被引量：2
8李萌,张荷.新一代网络安全管理及运营平台建设的思考与实践[J].信息网络安全,2021(S01):125-128. 被引量：3
9孙鹏宇,谭晶磊,李晨蔚,张恒巍.基于时间微分博弈的网络安全防御决策方法[J].信息网络安全,2022(5):64-74. 被引量：1
10韩峰.基于云计算的数据驱动网络安全防御技术[J].数据通信,2022(2):37-40. 被引量：4

1柴伟文,李乾颖,曹黎侠.新股申购风险信息披露的博弈模型[J].甘肃科技,2018,34(6):43-47.
2涂勇,郭良,何秉顺.山洪灾害防治项目绩效评价指标体系研究[J].中国水利,2017(20):31-33. 被引量：1
3宁浩.国家安全谁保？战争胜负谁定？——无处不在的网络攻击[J].兵器,2018,0(10):18-19.
4陈哲,梁绍东.基于贝叶斯纳什均衡的政府补贴福利分析——以垂直不完全竞争市场为例[J].重庆师范大学学报（自然科学版）,2018,35(4):7-10. 被引量：1
5刘震,张宏.OFDI提升我国装备制造业国际竞争优势的博弈分析[J].软科学,2017,31(11):25-29. 被引量：1
6张丽敏.基于云计算技术的网络安全攻防实验平台设计与研究[J].电子设计工程,2018,26(17):62-65. 被引量：13
7赵冬梅,刘金星,李喜喜.基于认知的网络安全防御决策思维属性研究[J].信息安全研究,2017,3(11):995-999.
8杨珊珊,彭军志.清单计价下建筑工程投标报价博弈模型研究[J].环球市场,2017,0(30):339-339. 被引量：1
9龚玉云,李文芳.基于博弈论的建设工程投标报价模型研究[J].长江大学学报（自然科学版）,2017,14(13):48-54. 被引量：7
10刘景玮,刘京菊,陆余良,杨斌,朱凯龙.基于网络攻防博弈模型的最优防御策略选取方法[J].计算机科学,2018,45(6):117-123. 被引量：14

通信学报

2018年第8期

浏览历史

内容加载中请稍等...

基于不完全信息随机博弈与Q-learning的防御决策方法被引量：9

参考文献5

二级参考文献122

共引文献128

同被引文献79

引证文献9

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于不完全信息随机博弈与Q-learning的防御决策方法 被引量：9

参考文献5

二级参考文献122

共引文献128

同被引文献79

引证文献9

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于不完全信息随机博弈与Q-learning的防御决策方法被引量：9