-
题名基于web日志的连续频繁路径挖掘算法
被引量:3
- 1
-
-
作者
任永功
付玉
张亮
-
机构
辽宁师范大学计算机与信息技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2008年第12期2272-2276,共5页
-
基金
国家自然科学基金项目(60603047)
辽宁省教育厅高等学校科研基金(2008341)
+1 种基金
大连市优秀青年科技人才基金(2008J23JH026)
辽宁省自然科学基金
-
文摘
频繁模式挖掘已成为web使用挖掘的研究热点,本文基于web日志提出一种新的频繁路径的挖掘算法.首先以线性回归方法求解兴趣度,其次将此兴趣度和页面名称作为最基本要素,建立的web浏览树,此浏览树可以完整地表现出web日志中连续、重复的浏览路径,最后在web浏览树上进行分析挖掘频繁浏览路径.该算法经实验证明能更全面地反映用户兴趣所在,挖掘的频繁浏览路径准确、合理.
-
关键词
WEB日志
浏览兴趣度
多元线性回归
频繁浏览路径
-
Keywords
web log
browsing interest
multivariation linear regressive
frequent browsing paths
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于Web-log的频繁浏览路径挖掘
- 2
-
-
作者
罗超
-
机构
辽宁工程技术大学
-
出处
《信息技术》
2004年第11期4-7,共4页
-
文摘
利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点优化和个性化服务等。
-
关键词
数据挖掘
网页日志挖掘
频繁浏览路径
-
Keywords
data mining
Web-log mining
frequent browsing paths
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-