期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
中心网页中主题网页链接的自动抽取 被引量:4
1
作者 夏天 《山东大学学报(理学版)》 CAS CSCD 北大核心 2012年第5期25-31,共7页
基于扩展标记树,提出了一种从中心网页中自动抽取主题网页链接的方法。首先构建链接有序表,利用链接前缀树发现主题网页链接拒绝规则,实现对网页链接类型的预判定;其次,通过分组分割和相似分组重新合并,把页面中的链接归入到不同分组之... 基于扩展标记树,提出了一种从中心网页中自动抽取主题网页链接的方法。首先构建链接有序表,利用链接前缀树发现主题网页链接拒绝规则,实现对网页链接类型的预判定;其次,通过分组分割和相似分组重新合并,把页面中的链接归入到不同分组之中,进而识别分组的类型和核心区域所在的分组,最终把链接归入三类链接集合之中。实验结果表明该方法无需训练即可实现中心网页中主题网页链接的高精度抽取。 展开更多
关键词 链接抽取 扩展标记树 链接前缀树
原文传递
基于扩展前缀树的协议格式推断方法 被引量:2
2
作者 洪征 田益凡 +1 位作者 张洪泽 吴礼发 《计算机工程与应用》 CSCD 北大核心 2018年第12期14-20,共7页
对未知网络协议进行协议格式推断在网络安全领域具有重要意义。现有的协议格式推断方法存在时间复杂度高、精确度较低等问题。提出了一种基于扩展前缀树协议格式推断方法。该方法首先通过N-gram分词获取候选协议关键词,使用互信息进行... 对未知网络协议进行协议格式推断在网络安全领域具有重要意义。现有的协议格式推断方法存在时间复杂度高、精确度较低等问题。提出了一种基于扩展前缀树协议格式推断方法。该方法首先通过N-gram分词获取候选协议关键词,使用互信息进行合并得到不同长度的协议关键词。在此基础上,依据与报文相对应的关键词序列构建扩展前缀树,实现对报文样本的初步聚类。而后,在扩展前缀树的基础上采用分段的多序列比对方法获取精确的协议格式。实验结果表明,该协议格式推断方法对于文本协议和二进制协议都能够取得理想的推断效果。 展开更多
关键词 协议格式推断 互信息 扩展前缀树 多序列比对算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部