期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于图神经网络与深度学习的PDF文档检测模型
1
作者 雷靖玮 伊鹏 陈祥 《计算机工程与设计》 北大核心 2024年第2期356-366,共11页
针对传统PDF文档检测误报率过高的问题,提出一种基于图神经网络与深度学习的检测模型DGNN。通过收集文档运行时各线程产生的系统调用数据生成相应的系统调用图,运用所提基于H指数的图采样策略缩减数据规模;采样后的子图作为模型DGNN的输... 针对传统PDF文档检测误报率过高的问题,提出一种基于图神经网络与深度学习的检测模型DGNN。通过收集文档运行时各线程产生的系统调用数据生成相应的系统调用图,运用所提基于H指数的图采样策略缩减数据规模;采样后的子图作为模型DGNN的输入,借助图卷积网络提取关联关系的同时,利用深度学习提取系统调用对的属性特征并完成特征融合,通过系统调用图的性质判别完成检测。实验结果表明,与其它方法相比,该模型特征提取与训练时间短,有效提高了PDF文档的检测效果。 展开更多
关键词 pdf文档检测 图神经网络 深度学习 图采样 特征分析 性能评价 系统调用
下载PDF
基于混合特征的恶意PDF文档检测 被引量:5
2
作者 杜学绘 林杨东 孙奕 《通信学报》 EI CSCD 北大核心 2019年第2期118-128,共11页
针对现有恶意PDF文档在检测方案存在特征顽健性差、易被逃避检测等问题,提出了一种基于混合特征的恶意PDF文档检测方法,采用动静态混合分析技术从文档中提取出其常规信息、结构信息以及API调用信息,并基于K-means算法设计了特征提取方法... 针对现有恶意PDF文档在检测方案存在特征顽健性差、易被逃避检测等问题,提出了一种基于混合特征的恶意PDF文档检测方法,采用动静态混合分析技术从文档中提取出其常规信息、结构信息以及API调用信息,并基于K-means算法设计了特征提取方法,聚合出表征文档安全性的核心混合特征,从而提高了特征的顽健性。在此基础上,利用随机森林算法构建分类器并设计实验,对所提方案的检测性能以及抵抗模拟攻击的能力进行了探讨。 展开更多
关键词 恶意pdf文档 混合特征 机器学习 检测
下载PDF
基于特征集聚和卷积神经网络的恶意PDF文档检测方法 被引量:3
3
作者 俞远哲 王金双 邹霞 《信息技术与网络安全》 2021年第8期35-41,共7页
针对现有恶意PDF文档检测方法存在特征维度高、数据集样本少导致模型欠拟合等问题,提出了一种基于特征集聚和卷积神经网络的恶意PDF文档检测方法。该方法以词袋模型为基础,从PDF文档中提取常规特征和结构特征。然后以合并后特征簇最小... 针对现有恶意PDF文档检测方法存在特征维度高、数据集样本少导致模型欠拟合等问题,提出了一种基于特征集聚和卷积神经网络的恶意PDF文档检测方法。该方法以词袋模型为基础,从PDF文档中提取常规特征和结构特征。然后以合并后特征簇最小方差为目标,使用Ward最小方差聚类方法实现特征集聚。最后,将聚合特征送入卷积神经网络分类模型进行训练。根据不同聚合特征数下模型性能的好坏,确定最优的聚合特征数。实验结果表明,该方法降低了特征维度,提升了模型的召回率,缓解了模型的欠拟合问题。纵向比较来看,在不同的良性样本和恶意样本比例下,遍历得到最优的聚合特征数,召回率平均提升了53%,F-score平均提升了0.44,运行时间平均缩短了27%;与PJScan、PDFrate、Luxor 3种检测工具横向相比,检测的综合性能平均提升了5%。 展开更多
关键词 恶意pdf文档 特征集聚 静态检测 卷积神经网络
下载PDF
基于系统调用和数据溯源的PDF文档检测模型 被引量:1
4
作者 雷靖玮 伊鹏 +2 位作者 陈祥 王亮 毛明 《计算机应用》 CSCD 北大核心 2022年第12期3831-3840,共10页
针对传统静态检测及动态检测方法无法应对基于大量混淆及未知技术的PDF文档攻击的缺陷,提出了一个基于系统调用和数据溯源技术的新型检测模型NtProvenancer。首先,使用系统调用捕获工具收集文档执行时产生的系统调用记录;其次,利用数据... 针对传统静态检测及动态检测方法无法应对基于大量混淆及未知技术的PDF文档攻击的缺陷,提出了一个基于系统调用和数据溯源技术的新型检测模型NtProvenancer。首先,使用系统调用捕获工具收集文档执行时产生的系统调用记录;其次,利用数据溯源技术构建基于系统调用的数据溯源图;而后,用图的路径筛选算法提取系统调用特征片段进行检测。实验数据集由528个良性PDF文档与320个恶意PDF文档组成。在Adobe Reader上展开测试,并使用词频-逆文档频率(TF-IDF)及PROVDETECTOR稀有度算法替换所提出的图的关键点算法来进行对比实验。结果表明NtProvenancer在精确率和F1分数等多项指标上均优于对比模型。在最佳参数设置下,所提模型的文档训练与检测阶段的平均用时分别为251.51 ms以及60.55 ms,同时误报率低于5.22%,F1分数达到0.989。可见NtProvenancer是一种高效实用的PDF文档检测模型。 展开更多
关键词 pdf文档检测 系统调用 数据溯源 关键点算法 特征片段
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部