基于三支动态阈值K-means聚类的入侵检测算法被引量：21

An Algorithm of Intrusion Detection Based on Three-way Dynamic Threshold K-means Clustering

下载PDF

导出

摘要 K-means算法以硬聚类划分思想被广泛应用于入侵检测系统,这种严格的边界划分方法在对许多新衍生类入侵数据检测时,易出现检测率低、误检率高的情况。同时,当处理复杂网络访问数据时,采用固定的k值不够灵活,也影响检测的准确性。结合三支决策思想,对传统K-means算法进行了改进,提出了基于三支动态阈值K-means聚类的入侵检测算法。该算法通过动态阈值调整,可以优化聚类的数量,在一定程度上消除了固定k值对入侵检测效果的影响。将离群的不确定性网络数据进行分离和延迟判断,通过二次聚类重新划分后再做决策。在KDD Cup99数据集上实验结果表明,当攻击类型逐渐增多、攻击行为更加复杂时,改进后的K-means算法在检测率和误检率上显著优于传统K-means算法。 K-means algorithm was widely used in intrusion detection system with the idea of hard clustering dividing.Such strict boundary dividing method could lead to low detection rate and high false detection rate when facing kinds of new derived intrusion data.Furthermore,the fixed value k was not flexible enough,to deal with complex network data sets and affected the accuracy of detection.The traditional K-means algorithm was improved.And an algorithm of intrusion detection based on three-way dynamic threshold K-means clustering was proposed.It could improve the performance of clustering and eliminate the influence of the fixed value k on intrusion detection by adjusting threshold dynamically.The withdrawn data were separated and judged by delaying to make accurate divisions after second clustering.The experimental results on KDD Cup99 data sets showed that the improved K-means algorithm outperformed the traditional K-means algorithm significantly in detection rate and false detection rate,while the attack types increased and the attack behaviors became more complex.

作者解滨董新玉梁皓伟 XIE Bin;DONG Xinyu;LIANG Haowei(College of Computer and Cyber Security, Hebei Normal University, Shijiazhuang 050024, China;Hebei Provincial Key Laboratory of Network & Information Security, Shijiazhuang 050024, China;Key Laboratory of Data Science and Intelligence Application, Fujian Province University,Zhangzhou 303000, China)

机构地区河北师范大学计算机与网络空间安全学院河北省网络与信息安全重点实验室数据科学与智能应用福建省高校重点实验室

出处《郑州大学学报（理学版）》 CAS 北大核心 2020年第2期64-70,共7页 Journal of Zhengzhou University:Natural Science Edition

基金国家自然科学基金项目(61573127) 河北省自然科学基金项目(A2018205103)。

关键词入侵检测 K-MEANS算法三支聚类 KDD Cup99 intrusion detection K-means algorithm three-way clustering KDD Cup99

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1钱燕燕,李永忠,余西亚.基于多标记与半监督学习的入侵检测方法研究[J].计算机科学,2015,42(2):134-136. 被引量：15
2刘端阳,郑江帆,沈国江,刘志.基于CUDA的k-means算法并行化研究[J].计算机科学,2018,45(11):292-297. 被引量：2
3郭新,徐明,张众.基于谱聚类的边缘检测算法[J].郑州大学学报（理学版）,2018,50(3):83-86. 被引量：4
4刘强,施虹,王平心,杨习贝.基于ε邻域的三支决策聚类分析[J].计算机工程与应用,2019,55(6):140-144. 被引量：3
5杜强,孙敏.基于改进聚类分析算法的入侵检测系统研究[J].计算机工程与应用,2011,47(11):106-108. 被引量：27
6行小帅,潘进,焦李成.基于免疫规划的K-means聚类算法[J].计算机学报,2003,26(5):605-610. 被引量：81
7陆林花,王波.一种改进的遗传聚类算法[J].计算机工程与应用,2007,43(21):170-172. 被引量：26
8傅涛,孙亚民.基于PSO的k-means算法及其在网络入侵检测中的应用[J].计算机科学,2011,38(5):54-55. 被引量：34
9田大新,刘衍珩,魏达.ARTNIDS:基于自适应谐振理论的网络入侵检测系统[J].计算机学报,2005,28(11):1882-1889. 被引量：8
10于洪,毛传凯.基于k-means的自动三支决策聚类方法[J].计算机应用,2016,36(8):2061-2065. 被引量：16

二级参考文献120

1张亚玲,康立锦.基于数据挖掘的Snort系统改进模型[J].计算机应用,2009,29(2):409-411. 被引量：4
2卿斯汉,蒋建春,马恒太,文伟平,刘雪飞.入侵检测技术研究综述[J].通信学报,2004,25(7):19-29. 被引量：234
3张雷,李人厚.人工免疫C-均值聚类算法[J].西安交通大学学报,2005,39(8):836-839. 被引量：17
4吴庆涛,邵志清.入侵检测研究综述[J].计算机应用研究,2005,22(12):11-14. 被引量：19
5周涓,熊忠阳,张玉芳,任芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006,26(6):1425-1427. 被引量：71
6吴新玲.数据维数消减方法研究[J].计算机工程与设计,2006,27(16):3000-3002. 被引量：2
7陆林花,王波.一种改进的遗传聚类算法[J].计算机工程与应用,2007,43(21):170-172. 被引量：26
8王洁松张小飞.KDDCup99网络入侵检测数据的分析和预处理.科技信息,2008,(15):407-408. 被引量：8
9McQueen J. Some methods for classification and analysis of multivariate observations [C]//Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability. 1967. 被引量：1
10Alsabti K,Ranka S,Singh V. An efficient k means clustering al gorithm[C]//IPPS/SPDP Workshop on High Performance Data Mining. Orlando, Florida, 1998. 被引量：1

共引文献340

1冯建英,石岩,王博,穆维松.基于聚类分析的数据挖掘技术及其农业应用研究进展[J].农业机械学报,2022,53(S01):201-212. 被引量：11
2马新宇,姜春茂,黄春梅.基于三支聚类的云任务优化调度[J].计算机科学,2022,49(S02):875-881. 被引量：2
3陈寿文,李明东.遗传聚类算法及其改进[J].宿州学院学报,2008,23(4):101-102. 被引量：1
4秦亮,张文广,周绍磊,史贤俊.基于Parzen窗估计的核k-means聚类方法[J].计算机工程,2011,37(S1):217-219. 被引量：1
5吴小涛,赵锋.基于遗传算法和梯度下降法的聚类新算法[J].科协论坛（下半月）,2009(4):61-62.
6钟将,吴中福,吴开贵,欧灵.基于人工免疫网络的动态聚类算法[J].电子学报,2004,32(8):1268-1272. 被引量：24
7钟将,吴中福,吴开贵,杨强.基于Tabu搜索的聚类算法研究[J].计算机科学,2005,32(1):172-174.
8吕强,俞金寿.基于混合遗传算法的K-Means最优聚类算法[J].华东理工大学学报（自然科学版）,2005,31(2):219-222. 被引量：7
9杨海东,胡月明,邓飞其.基于DNA编码的人工免疫模型在土壤质量评价中的应用[J].农业工程学报,2005,21(6):40-44. 被引量：2
10陈浩,何婷婷,姬东鸿.基于k-means聚类的无导词义消歧[J].中文信息学报,2005,19(4):10-16. 被引量：16

同被引文献198

1孙洪伟,司唯山,纪兆辉.基于本体的家谱知识图谱构建及信息检索系统的设计实现[J].计算机产品与流通,2020,9(9):156-156. 被引量：3
2杜佳颖,段隆振,段文影,卜秋瑾.基于Spark的改进K-means算法的并行实现[J].计算机应用研究,2020,37(2):434-436. 被引量：12
3肖勇,郑楷洪,余忠忠,周密,李森,马千里.基于三次指数平滑模型与DBSCAN聚类的电量数据异常检测[J].电网技术,2020,44(3):1099-1104. 被引量：61
4关健,刘大昕.基于主成分分析的无监督异常检测[J].计算机研究与发展,2004,41(9):1474-1480. 被引量：7
5汪涛,邵定宏.一种采用统计分析的入侵检测原型系统[J].微计算机信息,2007,23(30):111-112. 被引量：3
6郑超,苗夺谦,王睿智.基于密度加权的粗糙K-均值聚类改进算法[J].计算机科学,2009,36(3):220-222. 被引量：25
7刘君玲,吴小羽,曹岩.采用关联分析改进基于攻击签名的入侵检测的技术[J].吉林工程技术师范学院学报,2004,20(12):1-5. 被引量：3
8王博,贾焰,田李.基于类标号扩展的半监督特征选择算法[J].计算机科学,2009,36(10):189-191. 被引量：6
9李昆仑,曹铮,曹丽苹,张超,刘明.半监督聚类的若干新进展[J].模式识别与人工智能,2009,22(5):735-742. 被引量：50
10熊建斌,李振坤,刘怡俊.半监督聚类算法研究现状[J].现代计算机,2009,15(12):61-64. 被引量：4

引证文献21

1朱恒东,马盈仓,张要,张宁.基于L21范数和回归正则项的半监督聚类算法[J].郑州大学学报（理学版）,2020,52(4):67-74. 被引量：5
2刘吉超,王锋.基于Relief-F的半监督特征选择算法[J].郑州大学学报（理学版）,2021,53(1):42-46. 被引量：6
3吕政权,李朝阳,王海峰,陈怡君,彭道刚.基于GRU-CNN的综合能源网络安全攻击检测方法[J].华电技术,2021,43(2):9-14. 被引量：8
4严南.基于K-means算法的网络入侵信息分层检索系统设计[J].信息与电脑,2021,33(15):38-40. 被引量：3
5季赛花,黄树成.基于改进的K-means入侵检测算法[J].计算机与数字工程,2021,49(11):2184-2188. 被引量：3
6杜浩良,孔飘红,金学奇,黄银强.基于深度学习的电力信息网络流量异常检测[J].浙江电力,2021,40(12):117-123. 被引量：11
7吕广旭,卢加奇,魏先燕,王小英.基于随机森林-聚类混合方法的多分类入侵检测研究[J].现代信息科技,2022,6(16):165-167. 被引量：1
8董新玉,解滨,赵旭升,高新宝.多视角层次聚类下的无线网络入侵检测算法[J].计算机科学与探索,2022,16(12):2752-2764. 被引量：3
9周燕,肖莉.基于改进关联聚类算法的网络异常数据挖掘[J].计算机工程与设计,2023,44(1):108-115. 被引量：12
10刘翔宇,朱诗兵,杨帆.基于主成分分析和深度自编码高斯混合模型的无监督异常数据检测方法研究[J].现代电子技术,2023,46(3):75-80. 被引量：2

二级引证文献73

1张远鹏,蔡可夫,姚敏,姚登福,王理.基于深度堆叠式稀疏回归的癫痫患者脑电信号特征选择[J].南通大学学报（医学版）,2021,41(3):212-216. 被引量：1
2朱恒东,马盈仓.标记判别和局部线性强化的半监督稀疏子空间聚类[J].计算机应用研究,2021,38(10):3014-3018. 被引量：1
3赵静,闫春雨,杨东建,温昱婷,黎文华,鲁力群,兰玉彬.基于无人机多光谱遥感的台风灾后玉米倒伏信息提取[J].农业工程学报,2021,37(24):56-64. 被引量：12
4常杰,刘硕,郭禹伶.基于马尔科夫模型的分布式电网CPS网络攻击动态检测[J].河北电力技术,2022,41(1):20-22. 被引量：3
5刘银.基于元搜索引擎的网络信息智能检索系统设计[J].长江信息通信,2022,35(6):156-158.
6李惠军,陆建强,周霞,解相朋,万磊.面向智慧园区系统的网络攻击关联分析与防护策略研究[J].综合智慧能源,2022,44(7):1-9. 被引量：5
7唐顺田.基于半监督聚类算法的水利枢纽工程设备自适应PID控制系统[J].工业仪表与自动化装置,2022(4):112-117. 被引量：2
8余少锋,钟建栩,朱磊,马一宁.基于云计算的电力系统入侵检测仿真与研究[J].自动化仪表,2022,43(7):12-16. 被引量：2
9王雷,杜亮,周芃,吴鹏.基于自步学习的对称非负矩阵分解算法[J].郑州大学学报（理学版）,2022,54(5):43-48.
10赵辉.入侵检测在机器学习和深度学习中的发展[J].现代计算机,2022,28(13):62-66. 被引量：5

1谭剑.Web网络及应用运维安全策略研究[J].电子制作,2020,28(4):74-76. 被引量：2
2卫亚军.为理解而设计教学——“延迟判断”教学策略[J].教育观察,2020,9(3):21-22.
3黄沙里,郭其一,柳悦,黄世泽,屠旭慰.入侵检测技术在智能配电系统中的应用研究[J].电器与能效管理技术,2020(4):23-29. 被引量：4
4陈文迪,刘桂华,刘慕娴.一种基于烟花算法优化SVM的入侵检测模型[J].科技资讯,2019,17(35):18-19. 被引量：1
5贾洪杰,王良君,宋和平.HMRF半监督近似核k-means算法[J].计算机科学,2019,46(12):31-37. 被引量：1
6张曾,邓小芳.基于信噪比估计的无人机频谱感知算法[J].现代电子技术,2020,43(10):119-123. 被引量：3
7汪洋,伍忠东,朱婧.基于深度序列加权核极限学习的入侵检测算法[J].计算机应用研究,2020,37(3):829-832. 被引量：10
8朱妍静,刘太君,叶焱,张芳杰.基于CNN的泄漏电缆入侵检测定位算法[J].移动通信,2020,44(4):91-96. 被引量：2
9李悦,谢珺,侯文丽,续欣莹.融合用户偏好优化聚类的协同过滤推荐算法[J].郑州大学学报（理学版）,2020,52(2):29-35. 被引量：12
10王志勇.基于k近邻密度峰值聚类混合算法的网络入侵检测[J].自动化技术与应用,2019,38(12):48-52. 被引量：5

郑州大学学报（理学版）

2020年第2期

浏览历史

内容加载中请稍等...

基于三支动态阈值K-means聚类的入侵检测算法被引量：21

参考文献15

二级参考文献120

共引文献340

同被引文献198

引证文献21

二级引证文献73

相关作者

相关机构

相关主题

浏览历史

基于三支动态阈值K-means聚类的入侵检测算法 被引量：21

参考文献15

二级参考文献120

共引文献340

同被引文献198

引证文献21

二级引证文献73

相关作者

相关机构

相关主题

浏览历史

基于三支动态阈值K-means聚类的入侵检测算法被引量：21