-
题名基于学习的源代码漏洞检测研究与进展
- 1
-
-
作者
苏小红
郑伟宁
蒋远
魏宏巍
万佳元
魏子越
-
机构
哈尔滨工业大学计算学部
-
出处
《计算机学报》
EI
CSCD
北大核心
2024年第2期337-374,共38页
-
基金
国家自然科学基金项目(62272132)资助。
-
文摘
源代码漏洞自动检测是源代码漏洞修复的前提和基础,对于保障软件安全具有重要意义.传统的方法通常是基于安全专家人工制定的规则检测漏洞,但是人工制定规则的难度较大,且可检测的漏洞类型依赖于安全专家预定义的规则.近年来,人工智能技术的快速发展为实现基于学习的源代码漏洞自动检测提供了机遇.基于学习的漏洞检测方法是指使用基于机器学习或深度学习技术来进行漏洞检测的方法,其中基于深度学习的漏洞检测方法由于能够自动提取代码中漏洞相关的语法和语义特征,避免特征工程,在漏洞检测领域表现出了巨大的潜力,并成为近年来的研究热点.本文主要回顾和总结了现有的基于学习的源代码漏洞检测技术,对其研究和进展进行了系统的分析和综述,重点对漏洞数据挖掘与数据集构建、面向漏洞检测任务的程序表示方法、基于机器学习和深度学习的源代码漏洞检测方法、源代码漏洞检测的可解释方法、细粒度的源代码漏洞检测方法等五个方面的研究工作进行了系统的分析和总结.在此基础上,给出了一种结合层次化语义感知、多粒度漏洞分类和辅助漏洞理解的漏洞检测参考框架.最后对基于学习的源代码漏洞检测技术的未来研究方向进行了展望.
-
关键词
软件安全
源代码漏洞检测
漏洞数据挖掘
漏洞特征提取
代码表示学习
深度学习
模型可解释性
漏洞检测
-
Keywords
software security
source code vulnerability detection
vulnerability data mining
vulnerability feature extraction
code representation learning
deep learning
model interpretability
vulnerability detection
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名融合知识的小片段代码相似性比较模型
- 2
-
-
作者
夏冰
周鑫
庞建民
岳峰
单征
-
机构
信息工程大学网络空间安全学院
中原工学院前沿信息技术研究院
信息工程大学嵩山实验室
-
出处
《计算机工程与设计》
北大核心
2023年第8期2360-2366,共7页
-
基金
国家自然科学基金项目(61802435、61802433)
河南省高等学校重点科研基金项目(22B520054)。
-
文摘
二进制小片段代码指令序列较短,基本块逻辑调用图结构简单,有限语义信息影响代码相似性比较结果,为此提出一种融合知识表示学习的二进制代码小片段相似性比较模型(BSM)。分别提取小片段代码的函数知识和函数代码,利用注意力机制和双向长短记忆得到知识嵌入,使用序列学习模型或图神经网络得到函数嵌入,融合知识嵌入和函数嵌入作为小片段代码向量表示。实验结果表明,BSM模型在跨平台比较上优于其它对比模型,说明模型能提升小片段代码比较的准确度。
-
关键词
二进制代码
跨平台
小片段比较
神经网络
自然语言处理
知识表示学习
代码表示学习
-
Keywords
binary code
cross-platform
snippet code similarity
neural network
natural language processing
knowledge representation learning
code representation learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-