基于机器学习的匿名流量分类方法研究

Research on Anonymous Traffic Classification Method Based on Machine Learning

下载PDF

导出

摘要匿名通信工具在进行用户隐私保护的同时也为违法犯罪提供了便利,使得网络环境净化与监管愈发困难。对匿名网络信息交换产生的匿名流量进行分类可以细化网络监管范围。文章针对现有匿名流量分类方法存在流量分类粒度不细致和应用层匿名流量分类准确率偏低等问题,提出一种基于机器学习的匿名流量分类方法。该方法包括基于自动编码器和随机森林的特征提取模型以及基于卷积神经网络和XGBoost的匿名流量多分类模型两个模型,通过特征重构和模型结合的方式提升分类效果。最后在Anon17公开匿名流量数据集上进行了验证,证明了模型的可用性、有效性和准确性。 Anonymous communication tools not only protect users’privacy,but also provide shelter for crimes,making it more difficult to purify and supervise the network environment.Classification of anonymous traffic generated during information exchange in anonymous networks can refine the scope of network supervision.Aiming at the problems of insufficient granularity of traffic classification and low accuracy of anonymous traffic classification in the application layer in the existing anonymous traffic classification field,this paper proposed an application layer multi classification method for anonymous traffic based on machine learning.It included the feature extraction model based on auto-encoder and random forest,and the anonymous traffic multi classification model based on convolutional neural networks and XGBoost.The classification effect is improved through feature reconstruction and model combination,and is verified on Anon17 public anonymous traffic dataset,proving the usability,effectiveness and accuracy of the designed model.

作者赵小林王琪瑶赵斌薛静锋 ZHAO Xiaolin;WANG Qiyao;ZHAO Bin;XUE Jingfeng(School of Computer Science&Technology,Beijing Institute of Technology,Beijing 100081,China)

机构地区北京理工大学计算机学院

出处《信息网络安全》 CSCD 北大核心 2023年第5期1-10,共10页 Netinfo Security

基金国家重点研发计划[2020YFB1712104] 山东省重点研发计划(重大科技创新工程)[2020CXGC010116]。

关键词机器学习匿名流量自动编码器特征提取卷积神经网络 machine learning anonymous traffic auto-encoder feature extraction convolutional neural networks

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1曹诗敏,王娟.特殊网络流量识别综述[J].电脑知识与技术,2018,14(6Z):22-26. 被引量：2
2魏松杰,李成豪,沈浩桐,张文哲.基于深度森林的网络匿名流量检测方法研究与应用[J].信息网络安全,2022(8):64-71. 被引量：3
3王曦锐,芦天亮,张建岭,丁锰.基于加权Stacking集成学习的Tor匿名流量识别方法[J].信息网络安全,2021(12):118-125. 被引量：7
4李郅琴,杜建强,聂斌,熊旺平,黄灿奕,李欢.特征选择方法综述[J].计算机工程与应用,2019,55(24):10-19. 被引量：122
5张戈,王建林.基于混合ABC和CRO的高维特征选择方法[J].计算机工程与应用,2019,55(11):93-101. 被引量：6
6蔡满春,王腾飞,岳婷,芦天亮.基于ARF的Tor网站指纹识别技术[J].信息网络安全,2021(4):39-48. 被引量：6
7孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：608

二级参考文献72

1郎茂祥.装卸混合车辆路径问题的模拟退火算法研究[J].系统工程学报,2005,20(5):485-491. 被引量：50
2BENGIO Y, DELALLEAU O. On the expressive power of deep archi- tectures[ C ]//Proc of the 14th International Conference on Discovery Science. Berlin : Springer-Verlag, 2011 : 18 - 36. 被引量：1
3BENGIO Y. Leaming deep architectures for AI[ J]. Foundations and Trends in Machine Learning ,2009,2 ( 1 ) : 1-127. 被引量：1
4HINTON G,OSINDERO S,TEH Y. A fast learning algorithm for deep belief nets [ J ]. Neural Computation ,2006,18 (7) : 1527-1554. 被引量：1
5BENGIO Y, LAMBLIN P, POPOVICI D, et al. Greedy layer-wise training of deep networks [ C ]//Proc of the 12th Annual Conference on Neural Information Processing System. 2006:153-160. 被引量：1
6LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning ap- plied to document recognition[ J]. Proceedings of the iEEE, 1998, 86( 11 ) :2278-2324. 被引量：1
7VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders[ C ]//Proc of the 25th International Conference on Machine Learning. New York: ACM Press ,2008 : 1096-1103. 被引量：1
8VINCENT P, LAROCHELLE H, LAJOIE I, et aL Stacked denoising autoencoders:learning useftd representations in a deep network with a local denoising criterion [ J ]. Journal of Machine Learning Re- search ,2010,11 ( 12 ) :3371-3408. 被引量：1
9YU Dong, DENG Li. Deep convex net: a scalable architecture for speech pattern classification [ C]//Proc of the 12th Annual Confe-rence of International Speech Comunication Association. 2011 : 2285- 2288. 被引量：1
10POON H, DOMINGOS P. Sum-product networks:a new deep architec- ture[ C ]//Proc of IEEE Intemational Conference on Computer Vi- sion. 2011:689-690. 被引量：1

共引文献745

1吴秀平,赵咏梅,凌静思.幼儿游戏深度学习行为的支持体系建构[J].教育科学论坛,2024(2):63-66.
2赵珂雨,陈婉莹.一种基于stacking集成学习的DGA域名检测方法[J].数据通信,2020(6):19-24.
3曹长玲,翁郁华,李晓琼,王超蕾.基于机器学习的糖尿病视网膜病变合并症风险预测模型[J].生命科学仪器,2023,21(2):56-63. 被引量：1
4高嵩.深度学习在机场能见度预测中的应用[J].计算机产品与流通,2020,0(4):260-260. 被引量：2
5刘猛猛,徐国天.改进鲸鱼优化算法在入侵检测中的应用研究[J].网信军民融合,2022(7):48-56.
6徐畅,丁俊琦,赵聃桐,乔岩,张领先.基于LightGBM和处方数据的番茄病害诊断方法[J].农业机械学报,2022,53(9):286-294. 被引量：4
7张永玲.以深度学习为核心的小学数学有效教学策略研究[J].理科爱好者（教育教学版）,2019,0(5):248-249. 被引量：2
8周帆,陈晓蝶,钟婷,吴劲.面向金融科技的深度学习技术综述[J].计算机科学,2022,49(S02):20-36. 被引量：3
9李灿强,夏志方,丁邡.基于人工智能技术的“数字政府”研究[J].中国经贸导刊,2019(5Z):138-139. 被引量：6
10彭婉,田良臣.信息技术支持下促进深度学习的教学研究——基于语文课程的研究[J].汉字文化,2022(15):159-161. 被引量：1

1张茼茼,刘恒.基于潜在特征重构和注意力机制的人脸图像修复[J].重庆工商大学学报（自然科学版）,2023,40(2):73-78. 被引量：2
2麻文刚,郭进,马亮,张亚东,禹倩.基于CB-CNN与分割残差优化的列控系统网络攻击流量检测[J].铁道学报,2023,45(4):62-76. 被引量：1
3肖玉强,郭云飞,王亚文.一种基于操作码N-gram特征的代码混淆技术识别模型[J].信息工程大学学报,2023,24(1):72-80.
4张新民,金瑛.资产负债表重构:基于数字经济时代企业行为的研究[J].复印报刊资料（企业管理研究）,2022(12):125-144.

信息网络安全

2023年第5期

浏览历史

内容加载中请稍等...

基于机器学习的匿名流量分类方法研究

参考文献7

二级参考文献72

共引文献745

相关作者

相关机构

相关主题

浏览历史