-
题名非平衡网络流量识别方法
被引量:8
- 1
-
-
作者
燕昺昊
韩国栋
黄雅静
王孝龙
-
机构
国家数字交换系统工程技术研究中心
-
出处
《计算机应用》
CSCD
北大核心
2018年第1期20-25,共6页
-
基金
国家科技重大专项(2016ZX01012101)
国家自然科学基金面上项目(61572520)
国家自然科学基金创新群体项目(61521003).
-
文摘
针对网络中存在的对等网络(P2P)流量泛滥导致的流量失衡问题,提出将非平衡数据分类思想应用于流量识别过程。通过引入合成少数类过采样技术(SMOTE)算法并进行改进,提出了均值SMOTE(M-SMOTE)算法,实现对流量数据的平衡化处理。在此基础上分别采用3种机器学习分类器:随机森林(RF)、支持向量机(SVM)、反向传播神经网络(BPNN)对处理后各类流量进行识别。理论分析与仿真结果表明,在不影响P2P流量识别准确率的前提下,与非平衡状态相比,引入SMOTE算法将非P2P流量的识别准确率平均提高了16.5个百分点,将网络流量的整体识别率提高了9.5个百分点;与SMOTE算法相比,M-SMOTE算法将非P2P流量的识别准确率与网络流量的整体识别率分别进一步提高了3.2个百分点和2.6个百分点。实验结果表明,非平衡数据分类思想可有效解决P2P流量过多导致的非P2P流量识别率低的问题,同时所提M-SMOTE算法具有更高的识别准确度。
-
关键词
非平衡数据
P2P流量
流量识别
机器学习
合成少数类过采样技术算法
-
Keywords
imbalanced data
Peer-to-Peer (P2P) traffic
traffic classification
machine learning
synthetic minorityover sampling technique (smote) algorithm
-
分类号
TP393.02
[自动化与计算机技术—计算机应用技术]
-