一种基于本体的并行网络流量分类方法被引量：5

An Ontology Based Parallel Network Traffic Classification Method

下载PDF

导出

摘要海量网络流量数据的处理与单一节点的计算能力瓶颈这一矛盾导致数据分类效率低,无法满足现实需求。为解决这一问题,结合本体与MapReduce技术各自在海量异构数据描述与处理方面的优势,提出一种基于本体的并行网络流量分类方法。该方法基于MapReduce并行计算架构,根据网络流量本体结构,对网络流量本体并行化构建;通过并行知识推理完成基于流量统计特征的网络流量分类。实验结果表明,集群环境下基于MapReduce的网络流量本体构建效率明显高于单机环境,而且适当增加计算节点使得加速比线性提升;并行知识推理的分类方法能够有效地提高大规模网络流量的分类效率。 The contradiction between the processing of mass network traffic data and the computing bottleneck of a single node leads to low efficiency of data classification. To address this challenge, we propose an ontology based parallel network traffic classification method by integrating the advantage of ontology and MapReduce in dealing with the description and processing of mass heterogeneous data. Our approach makes use of MapReduce, a framework of parallel computing. Firstly, it uses the ontology to describe and manage network traffic data, and constructs the layered and parallel network traffic ontology. Then it builds the classification model by employing the decision tree algorithm, by which the inference rule set is generated. Network traffic classification based on traffic statistical features is completed by utilizing parallel knowledge reasoning. Implementation results show that data classification efficiency of the proposed approach in group environment is higher than in stand-alone scenario. The speedup ratio increases linearly when increasing the quantity of compute nodes. In addition, the new method is able to improve the classification efficiency of large-scale network traffic significantly.

作者陶晓玲韦毅王勇

机构地区桂林电子科技大学认知无线电与信息处理省部共建教育部重点实验室桂林电子科技大学广西高校云计算与复杂系统重点实验室桂林电子科技大学广西可信软件重点实验室

出处《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第3期417-422,共6页 Journal of University of Electronic Science and Technology of China

基金国家自然科学基金(61163058 61363006) 广西可信软件重点实验室开放课题(KX201306) 广西高校云计算与复杂系统重点实验室开放课题(14104)

关键词知识推理 MAPREDUCE 网络流量分类本体并行化 knowledge reasoning MapReduce network traffic classification ontology parallelization

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献23

1WANG Yu, XIANG Yang, ZHANG Jun, et al. Intemet traffic classification using constrained clustering[J]. IEEE Transactions on Parallel and Distributed Systems, 2014, 25(11): 2932-2943. 被引量：1
2CARELA-ESPAIqOL V, BARLET-ROS P, MULA-VALLS O, et al. An autonomic traffic classification system for network operation and management[J]. Journal of Network and Systems Management, 2015, 23(3): 401-419. 被引量：1
3刘凯鹏,方滨兴.基于社会性标注的本体学习方法[J].计算机学报,2010,33(10):1823-1834. 被引量：14
4陶晓玲,韦毅,孔德艳,张哲.基于本体的网络流量分类方法[J].计算机工程与设计,2016,37(1):31-36. 被引量：4
5HAUG P J, FERRARO J P, HOLMEN J, et al. An ontology-driven, diagnostic modeling system[J]. Journal of the American Medical Informatics Association, 2013, 20(el) el02-ell0. 被引量：1
6OELLRICH A, WALLS R L, CANNON E K S, et al. An ontology approach to comparative phenomics in plants[J]. Plant Methods, 2015, 11(I): 10. 被引量：1
7AZEVEDO C L B, IACOB M E, ALMEIDA J P A, et al. Modeling resources and capabilities in enterprise architecture: a well-founded ontology-based proposal for archimate[J]. Information Systems, 2015, 54(12): 235-262. 被引量：1
8EBRAHIMIPOUR V, YACOUT S. Ontology-based schema to support maintenance knowledge representation with a case study of a pneumatic valve[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2015, 45(4): 702-712. 被引量：1
9Gene Ontology Consortium. Gene ontology annotations and resources[J]. Nucleic Acids Research, 2013, 41(D1): D530-D535. 被引量：1
10ALMENDROS-JIMENEZ J M, DOMENE L, PIEDRA- FERNANDEZ J A. A framework for ocean satellite image classification based on ontologies[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2013, 6(2): 1048-1063. 被引量：1

二级参考文献36

1Gruber T R. Toward principles for the design of ontologies used for knowledge sharing. International Journal Human Computer Studies, 1995, 43(5-6): 907-928. 被引量：1
2Cimiano P. Ontology Learning and Population From Text: Algorithms, Evaluation and Applications. Heidelberg, Germany: Springer, 2006. 被引量：1
3Sanderson M, Croft B. Deriving concept hierarchies from text//Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in InformationRetrieval(SIGIR'99). Berkeley, CA, USA, 1999: 206- 213. 被引量：1
4Golder S A, Huberman B A. Usage patterns of collaborative tagging systems. Journal of Information Science, 2006, 32 (2): 198-208. 被引量：1
5Halpin H, Robu V, Shepherd H. The complex dynamics of collaborative tagging//Proceedings of the 16th International Conference on World Wide Web (WWW'07). Banff, Alberta, Canada, 2007.211-220. 被引量：1
6Mika P. Ontologies are us: A unified model of social networks and semantics. Web Semantics: Science, Services and Agents on the World Wide Web, 2007, 5(1): 5-15. 被引量：1
7Heymann P, Garcia-Molina H. Collaborative creation of communal hierarchical taxonomies in social tagging systems. Stanford University: Technical Report: 2006- 10, 2006. 被引量：1
8Schmitz P. Inducing ontology from flickr tags//Proceedings of the Collaborative Web Tagging Workshop (WWW ' 06 ). Edinburgh, Scotland, UK, 2006. 被引量：1
9Schmitz C et al. Mining association rules in folksonomies// Proceedings of the 10th Conference of the International Federation of Classification Societies(IFCS'06). Ljubljana, SIo venia, 2006:261-270. 被引量：1
10Plangprasopchok A, Lerman K. Constructing folksonomies from user-specified relations on flickr//Proceedings of the 18th International Conference on World Wide Web (WWW'09). Madrid, Spain, 2009:781-790. 被引量：1

共引文献16

1贺秋芳,曾启杰,蔡延光.挖掘用户标签的增强型社区网页聚类算法[J].微电子学与计算机,2013,30(2):74-77. 被引量：4
2何金晶,窦永香.社会化标注系统中的本体研究综述[J].现代图书情报技术,2013(6):16-22. 被引量：6
3汪天天,强保华,李巍.Folksonomy中基于主题的标签本体构建方法[J].桂林电子科技大学学报,2013,33(6):487-492.
4刘滨.分布式数据挖掘综述[J].河北科技大学学报,2014,35(1):80-90. 被引量：10
5高克宁,张引,张斌,张聿博.支持Web2.0标签层次体系构建的关系识别及层次组合方法研究[J].电子学报,2014,42(1):58-61. 被引量：2
6石光莲,张敏,郑伟伟.形式概念分析在Folksonomy中的应用研究进展[J].图书情报工作,2014,58(9):136-142. 被引量：4
7莫媛媛,郭剑毅,余正涛,蒋年树,线岩团.基于CCRF的领域本体概念上下位关系抽取[J].计算机工程,2014,40(6):138-141. 被引量：3
8窦永香,王帮金,方倩.基于Web of Science的本体和社会化标签关联研究的进展分析[J].情报杂志,2014,33(6):172-178. 被引量：4
9刘苏祺,白光伟,沈航.基于用户自描述标签的层次分类体系构建方法[J].计算机科学,2016,43(7):224-229. 被引量：9
10李慧宗,周姣,王向前,张宝隆.融合社会关系的用户标签主题模型[J].情报杂志,2017,36(3):165-172. 被引量：2

同被引文献46

1王永韬,刘良明.HDF5格式特点及其对遥感数据格式标准化的几点启示[J].国土资源遥感,2005,17(3):39-43. 被引量：14
2黄春雷,王峰,王建军.基于知识推理的水电智能化在线调度技术[J].电力系统自动化,2010,34(21):50-54. 被引量：9
3刘景方,邹平,张朋柱,齐峰.一种改进的本体概念语义相似度算法研究[J].武汉理工大学学报,2010,32(20):112-117. 被引量：8
4丁烈云,周诚.复杂环境下地铁施工安全风险自动识别与预警研究[J].中国工程科学,2012,14(12):85-93. 被引量：46
5胡群芳,秦家宝.2003—2011年地铁隧道施工事故统计分析[J].地下空间与工程学报,2013,9(3):705-710. 被引量：63
6陈帆,谢洪涛.基于粗糙集和RBF神经网络的地铁施工安全风险评估[J].安全与环境学报,2013,13(4):232-235. 被引量：32
7贺元香,史宝明,张永.基于本体的语义相似度算法研究[J].计算机应用与软件,2013,30(11):312-315. 被引量：12
8吴贤国,丁保军,张立茂,陈跃庆,薛莉敏,宋若昕.基于贝叶斯网络的地铁施工风险管理研究[J].中国安全科学学报,2014,24(1):84-89. 被引量：55
9简兴,陈鸿,邢忠亚,方涛,尹留勇.利用遥感技术提取水体面积时水体类型对阈值的影响[J].科学技术与工程,2014,22(18):267-270. 被引量：10
10杨洪章,张军伟,刘振军,张建刚.Readdir++:一种并行网络文件系统中海量小文件读优化技术[J].小型微型计算机系统,2014,35(11):2402-2409. 被引量：1

引证文献5

1梅江钟,马玉洁,郭建斌.地铁施工风险应急管理研究[J].中国安全生产科学技术,2017,13(9):20-27. 被引量：11
2陆明燕,田素诚.大规模网络线路数据流量并行预测方法仿真[J].计算机仿真,2018,35(8):206-209. 被引量：1
3王喜军.云计算中网络节点流量输出效率预测研究[J].计算机仿真,2018,35(8):393-396. 被引量：2
4崔建平.并行网络中不同标注下的入侵特征阈值确定[J].科学技术与工程,2018,18(7):213-217.
5宋阳,周时强,李成范.基于h5py和mpi4py的HDF5数据并行处理的探索[J].计算机产品与流通,2018,7(10):143-144. 被引量：1

二级引证文献15

1王兴鹏,雷书华,刘文梅.基于CBR的地铁工程事故应急决策方法研究[J].铁道工程学报,2018,35(9):104-109. 被引量：6
2张小博,王婷,秦浩,李晖,徐铁军,佟芳.基于循环神经网络的95598小尺度网络流量预测[J].电力信息与通信技术,2019,17(2):9-14. 被引量：6
3张宇栋,吕淑然.基于信息关联的公共安全风险预控情报分析研究[J].情报杂志,2018,37(9):148-153. 被引量：7
4李彦玲.基于模糊矩阵及集对分析法的地铁施工应急能力评价研究[J].铁道建筑技术,2019(10):29-33. 被引量：2
5李小飞.地铁工程车站施工安全风险分析与预控[J].交通世界,2019,0(34):10-11. 被引量：4
6徐惠云.BIM技术在地铁施工进度风险管理中的应用[J].价值工程,2020,39(6):224-226. 被引量：4
7房大伟.市政地铁车站施工现场安全管理探究[J].建材发展导向,2020,18(9):358-358.
8申子明.云计算环境背景下的流量控制方法[J].宁德师范学院学报（自然科学版）,2020,32(2):151-155.
9闫文周,陈芸茜.油田地面工程施工风险应急管理[J].土木工程与管理学报,2020,37(3):8-12. 被引量：2
10杨云,闫振国.基于卷积网络与支持向量机的云资源预测模型[J].陕西科技大学学报,2020,38(5):165-172. 被引量：4

1王晟,赵壁芳.云计算中MapReduce技术研究[J].通信技术,2011,44(12):159-161. 被引量：9
2方锦明.一种面向云计算的改进的Mapreduce模型[J].计算机测量与控制,2012,20(5):1417-1419. 被引量：4
3窦万春,江澄.大数据应用的技术体系及潜在问题[J].中兴通讯技术,2013,19(4):8-16. 被引量：37
4李锐,王斌.文本处理中的MapReduce技术[J].中文信息学报,2012,26(4):9-20. 被引量：18
5丁智,林治.MapReduce编程模型、方法及应用综述[J].电脑知识与技术,2014,10(10X):7060-7064. 被引量：3
6王海龙,杨岳湘.基于信息熵的大规模网络流量异常检测[J].计算机工程,2007,33(18):130-133. 被引量：14
7杨晨光,马永征.基于Spark的大规模网络流量准实时分类方法[J].科研信息化技术与应用,2016,7(2):25-34. 被引量：5
8王磊,张真,王胤然.实时云计算数据库——数据立方[J].中兴通讯技术,2013,19(4):25-31. 被引量：1
9王秀磊,刘鹏.大数据关键技术[J].中兴通讯技术,2013,19(4):17-21. 被引量：55
10王海龙,杨岳湘,李强.基于子空间方法的大规模网络流量异常检测[J].计算机工程与应用,2007,43(11):153-156. 被引量：3

电子科技大学学报

2016年第3期

浏览历史

内容加载中请稍等...

一种基于本体的并行网络流量分类方法被引量：5

参考文献23

二级参考文献36

共引文献16

同被引文献46

引证文献5

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

一种基于本体的并行网络流量分类方法 被引量：5

参考文献23

二级参考文献36

共引文献16

同被引文献46

引证文献5

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

一种基于本体的并行网络流量分类方法被引量：5