基于word-hashing的DGA僵尸网络深度检测模型被引量：9

Deep model for DGA botnet detection based on word-hashing

下载PDF

导出

摘要针对使用域名生成算法(DGA)僵尸网络隐蔽性强,传统检测算法特征提取复杂的问题,提出一种无需提取具体特征的深度学习模型DGA域名检测方法.首先基于word-hashing将所有域名转用二元语法字符串表示,利用词袋模型把域名映射到高维向量空间.然后利用5层深度神经网络对转换为高维向量的域名进行训练分类检测.通过深度模型,能够从训练数据中发现不同层次抽象的隐藏模式和特征,而这些模式和特征使用传统的统计方法大多是无法发现的.实验中使用了10万条DGA域名和10万条合法域名作为样本,与基于自然语言特征分类算法进行对比实验.实验结果表明该深度模型对DGA域名检测准确率达到97.23%,比基于自然语言特征分类算法得到的检测准确率高3.7%. To solve the problem of botnet concealment using domain generation algorithm( DGA)and feature extraction difficulty of traditional detection algorithms,a DGA domain name detection model without extracting specific features is proposed based on deep learning. First,all the domain name strings are extracted to bigram strings based on word-hashing and bag-of-words model maps the domain names to a high-dimensional vector space. Then,the domain names converted into high-dimensional vectors are classified by a 5-layer depth neural network. Through the depth of the model structure,different levels of abstract hidden patterns and features are found from the training data,and these patterns and features mostly can not be discovered by traditional statistical methods. In the experiment,100 000 DGA domain names and 100 000 legal domain names are used as samples,compared with the natural language feature classification algorithm. The experimental results show that the accuracy rate of the DGA domain name is 97. 23%,it is 3. 7% higher than that of the natural language feature classification algorithm.

作者赵科军葛连升秦丰林洪晓光

机构地区山东大学信息化工作办公室山东大学计算机科学与技术学院

出处《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2017年第A01期30-33,共4页 Journal of Southeast University：Natural Science Edition

基金赛尔网络下一代互联网技术创新资助项目(NGII20150412)

关键词 DGA 僵尸网络 wordhashing 深度学习 domain generation algorithm(DGA) botnet word-hashing deep learning

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1张维维,龚俭,刘茜,刘尚东,胡晓艳.基于词素特征的轻量级域名检测算法[J].软件学报,2016,27(9):2348-2364. 被引量：30
2周昌令,陈恺,公绪晓,陈萍,马皓.基于Passive DNS的速变域名检测[J].北京大学学报（自然科学版）,2016,52(3):396-402. 被引量：16

二级参考文献57

1Riden J. Know your enemy: fast-flux service net- works [EB/OL]. (2008-08-16)[2015-05-01]. http:// www.honeynet.org/papers/ff. 被引量：1
2Perdisci R, Corona I, Giacinto G. Early detection of malicious flux networks via large-scale passive DNS traffic analysis. IEEE Transactions on Dependable and Secure Computing, 2012, 9(5): 714-726. 被引量：1
3Weimer F. Passive DNS replication // FIRST Conference on Computer Security Incident. Singa- pore, 2005:1-13. 被引量：1
4Mockapetris P V. Domain names, concepts and facilities [EB/OL]. (1987)[2015-03-01]. http://tools.iet f.org/html/rfc 1034. 被引量：1
5Holz T, Gorecki C, Rieck K, et al. Measuring and detecting fast-flux service networks // NDSS, San Diego, 2008:487--492. 被引量：1
6Passerini E, Paleari R, Martignoni L, et al. Fluxor: detecting and monitoring fast-flux service networks// Detection of Intrusions and Malware, and Vulnera- bility Assessment. Berlin: Springer, 2008:186-206. 被引量：1
7Huang S Y, Mao C H, Lee H M. Fast-flux service network detection based on spatial snapshot mecha- nism for delay-free detection//Proceedings of the 5th ACM Symposium on Information, Computer and Communications Security. Beijing, 2010:101-111. 被引量：1
8Antonakakis M, Perdisci R, Dagon D, et al. Building a dynamic reputation system for DNS // USENIX Security Symposium. Washington DC, 2010:273-290. 被引量：1
9Bilge L, Kirda E, Kruegel C, et al. EXPOSURE: finding malicious domains using passive DNS analysis//NDSS. San Diego, 2011:1-5. 被引量：1
10Pedregosa F, Varoquaux G, Gramfort A, et al. Scikit- learn: machine learning in Python. The Journal of Machine Learning Research, 2011, 12:2825-2830. 被引量：1

共引文献42

1赵珂雨,陈婉莹.一种基于stacking集成学习的DGA域名检测方法[J].数据通信,2020(6):19-24.
2郭楠馨,林宏刚,张运理,陈麟.基于元学习的僵尸网络检测研究[J].成都信息工程大学学报,2022,37(6):615-621.
3林思明,陈腾跃,梁煜麓.基于BiLstm神经网络的DGA域名检测方法[J].网络安全技术与应用,2019(1):15-17. 被引量：4
4周梦源,常鹏,张永铮.互联网下多元属性特征恶意停靠域名检测仿真[J].计算机仿真,2018,35(2):406-409. 被引量：2
5杜静,杨军.互联网海量数据中用户关键信息准确识别仿真[J].计算机仿真,2018,35(5):258-261. 被引量：3
6臧小东,龚俭,胡晓艳.基于AGD的恶意域名检测[J].通信学报,2018,39(7):15-25. 被引量：20
7赵宏,常兆斌,王乐.基于词法特征的恶意域名快速检测算法[J].计算机应用,2019,39(1):227-231. 被引量：25
8张慧,钱丽萍,汪立东,袁辰,张婷.面向恶意网址检测的广谱特征选择与评估[J].现代电子技术,2019,42(9):60-64.
9朱琪,林果园.基于改进随机森林算法的钓鱼网站检测方法研究[J].微电子学与计算机,2019,36(4):43-46. 被引量：5
10王辉,周忠锦,王世晋,史卓颖.基于MLP深度学习算法的DGA准确识别技术研究[J].信息安全研究,2019,5(6):495-499. 被引量：2

同被引文献34

1朱新玲.马尔科夫链蒙特卡罗方法研究综述[J].统计与决策,2009,25(21):151-153. 被引量：32
2马立东.Metaphone语音匹配算法及其应用研究[J].计算机时代,2010(10):39-43. 被引量：2
3江健,诸葛建伟,段海新,吴建平.僵尸网络机理与防御技术[J].软件学报,2012,23(1):82-96. 被引量：63
4朱旭东,刘志镜.基于主题隐马尔科夫模型的人体异常行为识别[J].计算机科学,2012,39(3):251-255. 被引量：38
5林思明,陈腾跃,梁煜麓.基于BiLstm神经网络的DGA域名检测方法[J].网络安全技术与应用,2019(1):15-17. 被引量：4
6王世伟.论信息安全、网络安全、网络空间安全[J].中国图书馆学报,2015,41(2):72-84. 被引量：217
7网络杀伤链[J].通信技术,2016,49(5):581-581. 被引量：4
8周昌令,陈恺,公绪晓,陈萍,马皓.基于Passive DNS的速变域名检测[J].北京大学学报（自然科学版）,2016,52(3):396-402. 被引量：16
9张维维,龚俭,刘茜,刘尚东,胡晓艳.基于词素特征的轻量级域名检测算法[J].软件学报,2016,27(9):2348-2364. 被引量：30
10马旸,强小辉,蔡冰,王林汝.大规模网络中基于集成学习的恶意域名检测[J].计算机工程,2016,42(11):170-176. 被引量：4

引证文献9

1王辉,周忠锦,王世晋,史卓颖.基于MLP深度学习算法的DGA准确识别技术研究[J].信息安全研究,2019,5(6):495-499. 被引量：2
2王媛媛,吴春江,刘启和,谭浩,周世杰.恶意域名检测研究与应用综述[J].计算机应用与软件,2019,36(9):310-316. 被引量：26
3杨路辉,刘光杰,翟江涛,刘伟伟,白惠文,戴跃伟.一种改进的卷积神经网络恶意域名检测算法[J].西安电子科技大学学报,2020,47(1):37-43. 被引量：16
4吴警,芦天亮,杜彦辉.基于Char-RNN改进模型的恶意域名训练数据生成技术[J].信息网络安全,2020(9):6-11. 被引量：9
5刘伯成,王浩宇,李向军,肖聚鑫,肖楚霁,孔珂.基于Deep-IndRNN的DGA域名检测方法[J].南昌大学学报（理科版）,2020,44(6):598-609. 被引量：2
6姜天,匡立伟.基于fastText的恶意域名分类方法[J].电子设计工程,2021,29(17):35-39. 被引量：3
7王伟,罗鹏宇.基于机器学习建模的DGA恶意域名检测[J].通信技术,2022,55(6):753-761. 被引量：2
8杨成,芦天亮,闫尚义,张建岭.基于N-gram和Transformer的DGA恶意域名检测[J].中国人民公安大学学报（自然科学版）,2022,28(3):100-108. 被引量：2
9王青,韩冬旭,卢志刚,姜波,董聪,刘俊荣,石文昌,刘玉岭.恶意域名检测方法研究进展[J].信息安全学报,2024,9(5):229-249.

二级引证文献54

1罗海波,陈星池,董建虎.DGA域名检测方法选优方案[J].新一代信息技术,2020,3(8):10-16.
2吴警,芦天亮,杜彦辉.基于Char-RNN改进模型的恶意域名训练数据生成技术[J].信息网络安全,2020(9):6-11. 被引量：9
3杨林海.基于网络层的DDoS攻击模型与安全防御策略研究[J].网络空间安全,2020,11(10):44-52. 被引量：3
4周琳娜,吕欣一.基于SVM的DGA家族分类方法研究[J].中国科技论文,2020,15(11):1328-1333. 被引量：3
5王志强,李舒豪,池亚平,张健毅.基于深度学习的恶意DGA域名检测[J].计算机工程与设计,2021,42(3):601-606. 被引量：15
6顾兆军,杨文瑾,周景贤.基于迁移学习的小样本DGA恶意域名检测方法[J].计算机工程与应用,2021,57(14):103-109. 被引量：4
7罗海波,陈星池,董建虎.基于DGA域名检测方法的选优方案研究[J].新一代信息技术,2021,4(8):36-42.
8姜天,匡立伟.基于fastText的恶意域名分类方法[J].电子设计工程,2021,29(17):35-39. 被引量：3
9陈晓军,姚浩浩,王月领,左苗.基于DNS日志的恶意域名态势预警研究[J].信息技术与信息化,2021(7):99-101. 被引量：1
10戴云伟,沈春苗.一种高效的DNS重定向实现方法[J].通信技术,2021,54(9):2150-2156.

1葛日波,徐佳辉.Python中字符串切片技术在游戏开发中的应用研究[J].计算机教育,2017(11):111-114. 被引量：4
2数字[J].中国信息安全,2010(8):8-9.
3曹鹏.网络攻击:惯用伎俩曾相似[J].中国信息安全,2010,0(2):48-49.
4武清.“WireX Botnet”僵尸网络攻击预警公告[J].计算机与网络,2017,43(18):55-55.
5袁鑫攀,汪灿飞,龙军,彭成.CS-Chord:基于聚类分离的分布式高维向量索引[J].计算机科学,2017,44(B11):494-497. 被引量：1
6周颖洁.CT血管造影在腹主动脉瘤术前评估中的应用价值[J].医疗装备,2017,30(21):18-19. 被引量：1
7李娟,于忠臣,韩文英.智慧城市中物联网摄像头安全风险分析[J].信息安全与通信保密,2017,15(12):40-48. 被引量：4
8董刚,滕云,姜鑫阳,郭东,李强.利用确定性树突状细胞算法在线检测僵尸网络[J].吉林大学学报（理学版）,2017,55(6):1485-1490.
9张清超.酶联免疫吸附法测定猪肉中盐酸克伦特罗的方法[J].现代食品,2017,2(22):80-82.
10张涛.独家揭秘走进国家信息安全漏洞库[J].中国信息安全,2010,0(11):36-37. 被引量：1

东南大学学报（自然科学版）

2017年第A01期

浏览历史

内容加载中请稍等...

基于word-hashing的DGA僵尸网络深度检测模型被引量：9

参考文献2

二级参考文献57

共引文献42

同被引文献34

引证文献9

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

基于word-hashing的DGA僵尸网络深度检测模型 被引量：9

参考文献2

二级参考文献57

共引文献42

同被引文献34

引证文献9

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

基于word-hashing的DGA僵尸网络深度检测模型被引量：9