摘要
用户访问Web应用时通常触发页面跳转,生成大量网络流量。现有技术大都针对单个网页建模,忽略页面间的跳转信息。提出一种利用报文长度分布信息描述网络流量序列的自适应符号化算法,利用隐马尔可夫模型(Profile Hidden Markov Model, PHMM)从页面跳转信息中挖掘用户与Web应用的交互模式,识别用户行为,进而应用于诈骗类网站识别。实验证明,自适应符号化算法与传统的等间距和K-means符号化算法相比能最大限度保留网络流量序列的信息且耗时较少,基于PHMM的用户行为识别方法有效。
作者
杨雪
李国军
徐博
YANG Xue;LI Guojun;XU Bo
出处
《浙江警察学院学报》
2023年第6期97-114,共18页
Journal of Zhejiang Police College
基金
浙江省基础公益研究计划项目“电信网络诈骗犯罪威胁情报平台关键技术研究”(No.LGF20G030001)
浙江警察学院2023年校级大学生创新创业训练计划项目“基于机器学习的QUIC恶意流量分类研究”(X202311483109)。