-
题名基于访问行为序列相似度的加权聚类算法
被引量:2
- 1
-
-
作者
李维娜
吴晨
-
机构
清华同方光盘电子出版社中国知网
-
出处
《计算机工程与设计》
北大核心
2017年第2期430-436,共7页
-
基金
"十二五"国家科技支撑计划基金项目(2013BAH47F02)
-
文摘
传统算法很少有研究用户行为的聚类,用户访问关键词、访问时间、访问次数等行为都能够反应出其兴趣,从用户行为日志出发,考虑到其访问量、关键词序列以及关键词之间的时间间隔权重,对k-means进行改进,提出一种基于行为序列相似度的加权聚类算法K-Similar,重要的用户群体聚到一类,挖掘出这一类用户的内容需求。该算法已在中国知网的行为日志数据上进行了验证,验证结果表明,该算法在效率和精度上较k-means都有一定程度的提高,得到了兴趣度更高的用户群体,展现了群体的需求特点。
-
关键词
加权聚类
用户访问行为
访问量
关键词序列
时间间隔
序列相似度
-
Keywords
weighted clustering
users’ access behavior
visit volume
keywords sequence
time interval
sequence similarity
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名网络用户角色辨识及其恶意访问行为的发现方法
被引量:1
- 2
-
-
作者
王建
张仰森
陈若愚
蒋玉茹
尤建清
-
机构
北京信息科技大学智能信息处理研究所
-
出处
《计算机科学》
CSCD
北大核心
2018年第10期160-165,201,共7页
-
基金
国家自然科学基金(61370139
61602044)资助
-
文摘
随着互联网络技术的快速发展,各种恶意访问行为危及到网络的信息安全,因此辨识访问用户的角色并识别用户的恶意访问行为对于网络安全具有十分重要的理论意义和实用价值。首先,以网络日志数据为基础,通过建立IP辅助数据库,构建IP用户的日角色模型,在此基础上,引入滑动时间窗技术,将时间的变化动态地融入用户角色辨识,建立了基于滑动时间窗的用户角色动态辨识模型。然后,在分析用户恶意访问流量特征的基础上,将用户访问流量特征和用户信息熵特征进行加权,构建基于多特征的用户恶意访问行为的辨识模型。该模型能够对爆发性和高持续性的恶意访问行为以及少量但大规模分散访问的恶意行为进行识别。最后,采用大数据存储和Spark内存计算技术,对所建立的模型进行实现。实验结果表明,在网络流量产生异常时,所提出的模型能够发现具有恶意访问行为的用户,并准确且高效地辨别出该用户的角色,从而验证了其有效性。
-
关键词
网络用户
数据挖掘
角色辨识
恶意访问行为
滑动时间窗
-
Keywords
Web users
Data mining
Identification of use’s role
Malicious access behavior
Sliding time window
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-