基于BiLSTM模型的漏洞检测被引量：3

Vulnerability Detection Using Bidirectional Long Short-term Memory Networks

下载PDF

导出

摘要随着计算机技术应用的不断深化,软件的数量和需求不断增加,开发难度不断升级。代码复用以及代码本身的复杂度,使得软件中不可避免地引入了大量漏洞。这些漏洞隐藏在海量代码中很难被发现,但一旦被人利用,将导致不可挽回的经济损失。为了及时发现软件漏洞,首先从源代码中提取方法体,形成方法集;为方法集中的每个方法构建抽象语法树,借助抽象语法树抽取方法中的语句,形成语句集;替换语句集中程序员自定义的变量名、方法名及字符串,并为每条语句分配一个独立的节点编号,形成节点集。其次,运用数据流和控制流分析提取节点间的数据依赖和控制依赖关系。然后,将从方法体中提取的节点集、节点间的数据依赖关系以及控制依赖关系组合成方法对应的特征表示,并运用one-hot编码进一步将其处理为特征矩阵。最后,为每个矩阵贴上是否含有漏洞的标签以生成训练样本,并利用神经网络训练出相应的漏洞分类模型。为了更好地学习序列的上下文信息,选取了双向长短时记忆网络(Bidirectional Long Short-Term Memory Networks,BiLSTM)神经网络,并在其上增加了Attention层,以进一步提升模型性能。实验中,漏洞检测结果的精确率和召回率分别达到了95.3%和93.5%,证实了所提方法能够较为准确地检测到代码中的安全漏洞。 syntax tree to form a statement set.The customized variable name,method name and string with some uniform identifiers are replaced.A separate node number is assigned to each statement to form a node set.Secondly,data flow and control flow analysis are used to extract data dependencies and control dependencies between nodes.Then,the node set extracted from the method body,the inter-node data dependency relationship and control dependency relationship are combined into a feature representation corresponding to the method,and further processed into a feature matrix by using one-hot encoding.Finally,each matrix is labeled with a vulnerability tag to generate training samples,and a neural network is used to train the corresponding vulnerability classification model.In order to learn the context information of the sequence better,the BiLSTM network is selected and the Attention layer is added to further improve the performance of the model.In the experiment,the accuracy and recall rate of the vulnerability detection results reach 95.3%and 93.5%respectively,which confirmes that the proposed method can detect the security vulnerabilities in the code more accurately.

作者龚扣林周宇丁笠王永超 GONG Kou-lin;ZHOU Yu;DING Li;WANG Yong-chao(School of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 211100,China;Ministry Key Laboratory for Safety-critical Software Development and Verification,Nanjing 211100,China)

机构地区南京航空航天大学计算机科学与技术学院高安全系统的软件开发与验证技术工信部重点实验室

出处《计算机科学》 CSCD 北大核心 2020年第5期295-300,共6页 Computer Science

基金国家自然科学基金(61972197) 中央高校基本科研业务项目(NS2019055)。

关键词漏洞检测特征表示 BiLSTM ATTENTION 分类模型 Vulnerability detection Feature representation BiLSTM Attention Classification model

分类号 TP305 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1李元诚,黄戎,来风刚,毛一凡,蔡力军.基于深度聚类的开源软件漏洞检测方法[J].计算机应用研究,2020,37(4):1107-1110. 被引量：19

二级参考文献6

1李舟军,张俊贤,廖湘科,马金鑫.软件安全漏洞检测技术[J].计算机学报,2015,38(4):717-732. 被引量：76
2蔡军,邹鹏,杨尚飞,何骏.软件漏洞分析中的脆弱点定位方法[J].国防科技大学学报,2015,37(5):141-148. 被引量：11
3原子,于莉莉,刘超.引入缺陷的细粒度软件变更识别方法[J].北京航空航天大学学报,2014,40(9):1231-1238. 被引量：1
4缪旭东,王永春,曹星辰,方峰.基于模式匹配的安全漏洞检测方法[J].计算机科学,2017,44(4):109-113. 被引量：5
5徐威扬,李尧,唐勇,王宝生.一种跨指令架构二进制漏洞搜索技术研究[J].信息网络安全,2017(9):21-25. 被引量：3
6危胜军,何涛,胡昌振,单纯.基于组件依赖图的软件安全漏洞预测方法[J].北京理工大学学报,2018,38(5):525-530. 被引量：10

共引文献18

1段浩杰,张焱,王昺翔.探究安全技术应用于计算机软件开发的对策和进展[J].新一代信息技术,2022,5(5):104-106.
2王栋.基于安全技术应用的计算机软件开发[J].新一代信息技术,2022,5(2):69-71.
3刘嘉华,万明,周晨曦,张攀.基于双向LSTM的Java开源软件漏洞检测[J].计算机应用与软件,2020,37(12):322-327. 被引量：4
4张瑞,王晓菲.基于混合深度学习模型的软件漏洞检测方法[J].电脑知识与技术,2021,17(18):72-73. 被引量：1
5张铁耀,杜晔,黎妹红.基于改进SMOTE算法和位置编码的漏洞检测模型优化研究[J].现代计算机,2021,27(18):3-10. 被引量：2
6许健,陈平华,熊建斌.融合滑动窗口和哈希函数的代码漏洞检测模型[J].计算机应用研究,2021,38(8):2394-2400. 被引量：7
7徐晓君,常会丽.多线程交互学习软件系统安全漏洞自动化检测[J].计算机仿真,2022,39(4):335-340. 被引量：4
8董健,冯莹莹.改进机器学习的软件多类漏洞并行挖掘分析[J].计算机仿真,2022,39(10):386-390. 被引量：1
9吕华辉,刘欣,农彩勤.基于关联规则的终端软件缺陷检测方法研究[J].电子设计工程,2023,31(5):61-64.
10孙俊琳.基于信息流分析的容器内恶意软件漏洞检测方法[J].上海电机学院学报,2023,26(2):105-109.

同被引文献30

1李元诚,崔亚奇,吕俊峰,来风刚,张攀.开源软件漏洞检测的混合深度学习方法[J].计算机工程与应用,2019,55(11):52-59. 被引量：13
2张礼波,雷鸣,周怡君.基于目标跟踪的变电站隔离开关状态图像识别方法[J].机械与电子,2020,38(1):36-39. 被引量：7
3冯跃,吴跃康,任杰,姜定洪.基于无线同步技术的数字化变电站二次系统新型测试方法[J].中国测试,2020,46(1):117-123. 被引量：20
4赵伟,张问银,王九如,王海峰,武传坤.基于符号执行的智能合约漏洞检测方案[J].计算机应用,2020,40(4):947-953. 被引量：15
5李元诚,黄戎,来风刚,毛一凡,蔡力军.基于深度聚类的开源软件漏洞检测方法[J].计算机应用研究,2020,37(4):1107-1110. 被引量：19
6卢帅.基于SVM算法的Struts2-045漏洞检测方法[J].计算机与数字工程,2020,48(4):883-888. 被引量：2
7邱若男,胡岸琪,彭国军,张焕国.基于RASP技术的Java Web框架漏洞通用检测与定位方案[J].武汉大学学报（理学版）,2020,66(3):285-296. 被引量：19
8章思宇,周育玲,刘楚彤.私有云环境下主机安全漏洞高效检测[J].通信技术,2021,54(3):727-731. 被引量：7
9吕志强,薛亚楠,张宁,冯朝雯,金忠峰.WHID Defense:USB HID攻击检测防护技术[J].信息安全学报,2021,6(2):110-128. 被引量：1
10向杰,杨哲慜,周顺帆,杨珉.一种基于运行时信息的以太坊智能合约防御技术[J].计算机研究与发展,2021,58(4):834-848. 被引量：4

引证文献3

1张铁耀,杜晔,黎妹红.基于改进SMOTE算法和位置编码的漏洞检测模型优化研究[J].现代计算机,2021,27(18):3-10. 被引量：2
2王莹,于波涛,张岩.基于状态跟踪的变电站主机运行漏洞检测方法[J].电子设计工程,2023,31(24):168-171.
3郭春霞.基于权限验证图的Web访问控制漏洞检测方法[J].自动化与仪器仪表,2024(6):252-256.

二级引证文献2

1周力.基于机器学习的网络安全漏洞监测系统设计[J].信息与电脑,2022,34(18):232-234.
2邱增烇.基于机器学习的计算机网络节点漏洞检测方法[J].信息与电脑,2022,34(21):111-113.

1金建生.教学能力培养:获得论的困境与生成论的实践[J].教育发展研究,2019,39(18):25-30. 被引量：14
2杨皓然,方贤文.基于概率和时间因素的Petri网业务流程一致性分析[J].计算机科学,2020,47(5):59-63. 被引量：5
3邱智勇,周越德,刘中平.CPU+GPU架构下节点阻抗矩阵生成及节点编号优化方法[J].电力系统自动化,2020,44(2):215-221. 被引量：2
4王吉军,郝子宇,李宏亮.卷积神经网络训练访存优化[J].西安电子科技大学学报,2020,47(2):98-107. 被引量：3
5邱世发.精准扶贫工作中的实践和思考[J].农业开发与装备,2019(12):93-93.
6姜婷.近十年我国公共图书馆阅读推广研究热点分析[J].产业与科技论坛,2019,0(22):128-129. 被引量：1
7古宏鸣.数据一体化驱动企业业财一体化管控研究[J].水电站设计,2020,36(1):36-40. 被引量：6
8叶托.政府购买公共服务的三维治理探讨[J].理论探索,2019,0(6):20-27. 被引量：2
9郭婉婷.计算机网络安全的威胁因素及防范技术[J].黑龙江自然资源,2019,0(10):56-56.
10李美峰,冯勇,李力,肖洪伟,梁明.输电线路铁塔参数化模型的杆件信息拓展研究[J].四川电力技术,2019,42(6):66-70. 被引量：4

计算机科学

2020年第5期

浏览历史

内容加载中请稍等...

基于BiLSTM模型的漏洞检测被引量：3

参考文献1

二级参考文献6

共引文献18

同被引文献30

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于BiLSTM模型的漏洞检测 被引量：3

参考文献1

二级参考文献6

共引文献18

同被引文献30

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于BiLSTM模型的漏洞检测被引量：3