摘要
当前高速网络数据流分类处理时,忽略了冗余数据对分类结果的影响,使得分类结果 F1值较低。因此,提出了基于谱聚类算法的高速网络数据流快速分类方法。采用主成分分析法对高速网络数据流进行降维处理。对所有数据流相关性特征进行选择,去除冗余特征,保留有效的特征信息。应用支持向量机算法构建网络数据流快速分类模型,结合谱聚类算法对多数类样本进行聚类,组成新的数据集并将其输入到分类模型中得出相关的分类结果。实验结果表明,所提方法的平均F1值为0.95,F1值越大分类结果越准确,说明该方法能够满足高速网络数据流快速准确分类,具有优越的数据分类性能,应用价值更高。
When classifying and processing high-speed network data streams,the impact of redundant data on the classification results is ignored,resulting in a lower F1 value for the classification results.Therefore,a fast classification method for high-speed network data streams based on spectral clustering algorithm is proposed.Using principal component analysis to perform parallel dimensionality reduction processing on high-speed network data streams.Select all data flow correlation features,remove redundant features,and retain effective feature information.Support vector machine algorithm is used to build a fast classification model for network data streams,and spectral clustering algorithm is used to cluster most class samples to form a new dataset and input it into the classification model to obtain relevant classification results.The experimental results show that the average F1 value of the proposed method is 0.95,and the larger the F1 value,the more accurate the classification results.This indicates that the method can meet the requirements of fast and accurate classification of high-speed network data streams,with superior data classification performance and higher application value.
作者
张震
胡贵恒
盖昊宇
任远林
ZHANG Zhen;HU Gui-heng;GAI Hao-yu;REN Yuan-in(School of Application Engineering,Anhui Business and Technology College,Hefei 231131,China)
出处
《齐齐哈尔大学学报(自然科学版)》
2023年第5期24-30,共7页
Journal of Qiqihar University(Natural Science Edition)
基金
教育部高等学校科学研究发展中心“虚拟仿真技术在职业教育教学中的创新应用”专项课题(ZJXF2022196)
安徽省高校科研重点项目(自科类)“基于赛博空间视觉算法定位技术的虚拟现实设备与应用程序内容交互的技术研究”(2022AH052794)
安徽省职业教育创新发展试验区培育库项目“智能制造产教融合协同创新实训基地”(WJ-PTZT-135)
安徽省省级质量工程教学研究项目“产教融合视域下的职业院校‘三教’改革策略与路径研究”(2020jyxm0196)
安徽工商职业学院校级质量工程项目“‘三全育人、五位一体’融合发展的产业学院建设新模式探索与实践”(2021xjjy ZD06)。
关键词
谱聚类算法
网络数据流
分类
特征选择
降维
支持向量机
spectral clustering algorithm
network data flow
classification
feature selection
dimension reduction
SVM