期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种基于集成学习的钓鱼网站检测方法 被引量:4
1
作者 余恩泽 努尔布力 于清 《计算机工程与应用》 CSCD 北大核心 2019年第18期81-88,200,共9页
针对钓鱼攻击者常用的伪造HTTPS网站以及其他混淆技术,借鉴了目前主流基于机器学习以及规则匹配的检测钓鱼网站的方法RMLR和PhishDef,增加对网页文本关键字和网页子链接等信息进行特征提取的过程,提出了Nmap-RF分类方法。Nmap-RF是基于... 针对钓鱼攻击者常用的伪造HTTPS网站以及其他混淆技术,借鉴了目前主流基于机器学习以及规则匹配的检测钓鱼网站的方法RMLR和PhishDef,增加对网页文本关键字和网页子链接等信息进行特征提取的过程,提出了Nmap-RF分类方法。Nmap-RF是基于规则匹配和随机森林方法的集成钓鱼网站检测方法。根据网页协议对网站进行预过滤,若判定其为钓鱼网站则省略后续特征提取步骤。否则以文本关键字置信度,网页子链接置信度,钓鱼类词汇相似度以及网页PageRank作为关键特征,以常见URL、Whois、DNS信息和网页标签信息作为辅助特征,经过随机森林分类模型判断后给出最终的分类结果。实验证明,Nmap-RF集成方法可以在平均9~10μs的时间内对钓鱼网页进行检测,且可以过滤掉98.4%的不合法页面,平均总精度可达99.6%。 展开更多
关键词 钓鱼网页 集成学习 规则匹配 钓鱼网页混淆技术
下载PDF
网络钓鱼检测研究
2
作者 刘大恒 《信息与电脑》 2024年第10期24-27,共4页
信息技术的发展是一把双刃剑,给用户带来便捷生活方式的同时也给用户带来网络攻击威胁。其中网络钓鱼是比较常见的攻击方式。因此,文章针对此现象提出基于敏感词分词方法的双向长短期记忆(Bidirectional Long Short-Term Memory,BLSTM)... 信息技术的发展是一把双刃剑,给用户带来便捷生活方式的同时也给用户带来网络攻击威胁。其中网络钓鱼是比较常见的攻击方式。因此,文章针对此现象提出基于敏感词分词方法的双向长短期记忆(Bidirectional Long Short-Term Memory,BLSTM)网络模型钓鱼网站检测方案,从不同分词方法出发,对URL地址进行提取、整合,并对网络模型进行训练。实验表明,此方案能够有效检测网络钓鱼攻击。 展开更多
关键词 钓鱼网站 敏感词分词 双向长短期记忆网络
下载PDF
基于Logistic回归和XGBoost的钓鱼网站检测方法 被引量:4
3
作者 杨鹏 曾朋 +1 位作者 赵广振 吕培培 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第2期207-212,共6页
为兼顾钓鱼网站检测的速度和准确率,提出一种基于Logistic回归和XGBoost的钓鱼网站检测方法.根据网页的URL提取HTML特征、URL特征和基于TF-IDF的文本向量特征,结合Logistic回归将高维和稀疏的文本特征转换为概率特征.基于以上融合特征,... 为兼顾钓鱼网站检测的速度和准确率,提出一种基于Logistic回归和XGBoost的钓鱼网站检测方法.根据网页的URL提取HTML特征、URL特征和基于TF-IDF的文本向量特征,结合Logistic回归将高维和稀疏的文本特征转换为概率特征.基于以上融合特征,构建了XGBoost分类模型,给出了方法的时间复杂度分析,采集了真实数据作为实验数据集.实验结果表明,Logistic回归方法降低了融合特征的维度,检测速度优于直接融合方法;融合特征方法比单方面特征方法含有更多有效的信息,可供分类器进行学习,检测精度高于单方面特征方法,精确度达到96.67%,召回率为96.6%. 展开更多
关键词 钓鱼网站 LOGISTIC回归 集成学习 XGBoost
下载PDF
基于Bi-LSMT结合注意力机制的钓鱼网站识别
4
作者 尚培文 李东帅 《现代计算机》 2024年第6期50-55,共6页
随着互联网的普及,钓鱼网站是人们接触到最常见的网络犯罪类型之一,造成了巨大的经济损失、信息泄漏等危害。鉴于此,提出了一种基于双向长短记忆神经网络(Bi-LSTM)结合注意力机制模型来识别钓鱼网站。预处理之后的数据,采用Word2Vec模... 随着互联网的普及,钓鱼网站是人们接触到最常见的网络犯罪类型之一,造成了巨大的经济损失、信息泄漏等危害。鉴于此,提出了一种基于双向长短记忆神经网络(Bi-LSTM)结合注意力机制模型来识别钓鱼网站。预处理之后的数据,采用Word2Vec模型构建词向量,通过Bi-LSTM进行特征提取,并使用注意力机制计算注意力权重,生成最终的特征向量,通过Sigmoid函数对网站类别分类。实验结果表明,所提出的模型在对钓鱼网站检测效果达到98.3%,能够有效应对此类攻击威胁,有助于维护网络空间安全体系。 展开更多
关键词 钓鱼网站 Bi-LSTM Word2Vec 注意力机制
下载PDF
基于特征筛选的轻量级层次化钓鱼网站的检测方法研究
5
作者 易治林 李焕洲 +2 位作者 张健 唐彰国 田伟政 《四川师范大学学报(自然科学版)》 CAS 2024年第6期804-811,共8页
针对传统方法难以对大规模钓鱼网站进行批量检测的问题,提出基于特征筛选的轻量级层次化检测方法(lightweight hierarchical detection method based on feature filtering,LHFF).该方法首先使用互信息对原始特征集进行筛选,剔除冗余特... 针对传统方法难以对大规模钓鱼网站进行批量检测的问题,提出基于特征筛选的轻量级层次化检测方法(lightweight hierarchical detection method based on feature filtering,LHFF).该方法首先使用互信息对原始特征集进行筛选,剔除冗余特征,并将筛选后的特征按照提取特征耗时长短划分为URL特征和网站特征,然后根据划分后的特征,使用轻量级层次化检测框架对钓鱼网站进行检测.实验结果表明,LHFF能够在保障良好检测性能的前提下,减少网站检测所需要的时间,满足对大规模钓鱼网站进行批量检测的需求. 展开更多
关键词 钓鱼网站 批量检测 互信息 轻量级 层次化
下载PDF
基于决策树的钓鱼网站识别研究 被引量:2
6
作者 何禹德 刘铭 《通化师范学院学报》 2015年第12期60-62,共3页
在现代社会中,网上交易变得越来越流行,但是也带来了一些值得深思的问题,例如旨在窃取个人信息,如密码、银行账户和信用卡信息的网络钓鱼变得猖獗起来.面对这种境况,研究人员提出了多种网络钓鱼网站的检测方法,例如,以黑名单为基础的技... 在现代社会中,网上交易变得越来越流行,但是也带来了一些值得深思的问题,例如旨在窃取个人信息,如密码、银行账户和信用卡信息的网络钓鱼变得猖獗起来.面对这种境况,研究人员提出了多种网络钓鱼网站的检测方法,例如,以黑名单为基础的技术、启发式的搜索技术等.然而,由于保护技术低效,受害者的数量一直在增加.该文分析了钓鱼网站的主要特征并分别利用两种决策树算法对钓鱼网站进行了识别研究.其中随机森林算法的分类正确率达到了96.5%,达到了钓鱼网站识别的要求. 展开更多
关键词 决策树 随机森林 钓鱼网站 识别
下载PDF
网站可信评价指标体系研究 被引量:1
7
作者 陈月华 《信息网络安全》 2013年第5期79-82,共4页
伴随着钓鱼欺诈网站的爆发式增长,辨识钓鱼网站和可信网站从而保障互联网用户的权益等问题,引起了国内外各方的高度关注。解决该问题的措施之一就是加强网站可信评价。为推动国内网站可信评价工作,文章提出建立了一套具有可操作性的、... 伴随着钓鱼欺诈网站的爆发式增长,辨识钓鱼网站和可信网站从而保障互联网用户的权益等问题,引起了国内外各方的高度关注。解决该问题的措施之一就是加强网站可信评价。为推动国内网站可信评价工作,文章提出建立了一套具有可操作性的、动态的网站可信评价指标和评估模型,包括指标评分规则和评分算法,并对网站可信评价工作提出了几点建议,以期对衡量和反映网站可信状况提供借鉴和参考。 展开更多
关键词 可信网站 钓鱼网站 评价指标
下载PDF
钓鱼网站的鉴别方法与防范策略研究
8
作者 郭萍 《浙江纺织服装职业技术学院学报》 2012年第3期64-69,共6页
文章从钓鱼网站的种类和传播途径入手,重点分析了钓鱼网站的鉴别方法和防范措施,最后指出了打击钓鱼网站的难度。
关键词 钓鱼网站 网络安全 将别方法 防范策略
下载PDF
融合多源网络评估数据及URL特征的钓鱼网站识别技术研究 被引量:6
9
作者 胡忠义 王超群 吴江 《数据分析与知识发现》 CSSCI CSCD 2017年第6期47-55,共9页
【目的】充分利用多源网络评估数据和URL异常特征数据,研究提高钓鱼网站识别准确性的可行性方案。【方法】采用8种机器学习技术,对比研究网络评估数据与传统的URL异常特征数据在钓鱼网站识别中的性能,并融合两类数据研究进一步提高钓鱼... 【目的】充分利用多源网络评估数据和URL异常特征数据,研究提高钓鱼网站识别准确性的可行性方案。【方法】采用8种机器学习技术,对比研究网络评估数据与传统的URL异常特征数据在钓鱼网站识别中的性能,并融合两类数据研究进一步提高钓鱼网站识别准确性的可行性方案。【结果】在钓鱼网站识别中,相比于传统的URL异常特征,利用网络评估数据可以取得更好的识别效果。融合两类数据对于提高识别准确性有一定帮助。【局限】未考虑钓鱼网站与正常网站的数量存在严重的不均衡问题。【结论】充分利用多源网络评估数据和URL异常特征数据识别钓鱼网站的方法是比较合理和有效的,对后续相关研究具有一定的借鉴意义。 展开更多
关键词 数据挖掘 钓鱼网站识别 机器学习
原文传递
基于URL多粒度特征融合的钓鱼网站识别 被引量:4
10
作者 胡忠义 张硕果 吴江 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第11期103-110,共8页
【目的】缓解钓鱼网站识别中URL表征不充分的问题,构建一种基于URL多粒度特征融合的识别模型。【方法】分别基于独热编码和BERT深度表征URL的字符级和单词级特征,进而通过融合两种粒度的深度特征构建钓鱼网站识别模型。【结果】所构建... 【目的】缓解钓鱼网站识别中URL表征不充分的问题,构建一种基于URL多粒度特征融合的识别模型。【方法】分别基于独热编码和BERT深度表征URL的字符级和单词级特征,进而通过融合两种粒度的深度特征构建钓鱼网站识别模型。【结果】所构建的融合多粒度URL特征的识别模型在实验数据集上的准确率、召回率、F1值以及AUC值分别达到0.96、0.98、0.97、0.97,比单一粒度的表征模型、基准分类器和以往模型具有更好的识别性能。【局限】除了URL特征表征,有待进一步融合包括URL页面内容在内的更多源特征。【结论】构建的模型可以更全面地深度表征URL特征,有效提升了钓鱼网站的识别准确性。 展开更多
关键词 钓鱼网站识别 特征融合 BERT Word2Vec CNN LSTM
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部