摘要
Web使用数据挖掘是为网站经营管理和结构调整提供决策支持的主要手段。其中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出了一个预处理工具模型WUMPA。并针对预处理过程中动态页面跟踪、站点结构表示和会话管理等难点问题进行了进一步分析,提出了一个网站结构数据模型SITEDM和一个高效的会话管理算法session_manager。
Web usage mining is the main method for management and structure adjustment of Web site.This paper studies the data preprocessing phase of Web usage mining,which is the key to get good results.Also,it presents a well-designed preprocessing model named WUMPA.Besides,this paper takes a deep insight into those hard problems such as trading of dynamic pages,presentation of site structure and management of sessions.As a result,it also presents a site structure data model—SITEDM and an efficient algorithm—session_manager.
出处
《计算机工程与应用》
CSCD
北大核心
2003年第24期154-157,共4页
Computer Engineering and Applications