期刊文献+

Web使用数据挖掘中数据预处理的研究 被引量:11

Data Preparation in Web Usage Mining
下载PDF
导出
摘要 Web使用数据挖掘是为网站经营管理和结构调整提供决策支持的主要手段。其中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出了一个预处理工具模型WUMPA。并针对预处理过程中动态页面跟踪、站点结构表示和会话管理等难点问题进行了进一步分析,提出了一个网站结构数据模型SITEDM和一个高效的会话管理算法session_manager。 Web usage mining is the main method for management and structure adjustment of Web site.This paper studies the data preprocessing phase of Web usage mining,which is the key to get good results.Also,it presents a well-designed preprocessing model named WUMPA.Besides,this paper takes a deep insight into those hard problems such as trading of dynamic pages,presentation of site structure and management of sessions.As a result,it also presents a site structure data model—SITEDM and an efficient algorithm—session_manager.
出处 《计算机工程与应用》 CSCD 北大核心 2003年第24期154-157,共4页 Computer Engineering and Applications
关键词 WEB 数据挖掘 数据预处理 会话 网站结构数据模型 Web usage mining,Data preparation,Session,Site structure data model
  • 相关文献

参考文献5

  • 1陈滢,徐宏炳,王能斌.WWW分布数据源研究——数据模型和查询语言[J].软件学报,1998,9(8):566-573. 被引量:11
  • 2张娥..Web用户访问日志数据挖掘方法研究与实践[D].西安交通大学,2001:
  • 3J Srivastava,R Cooley,M Deshpande et al.Web Usage Mining:Discovery and Applications of Usage Patterns from Web Data[J].SIGKDD Explorations, 2000; (1). 被引量:1
  • 4J Pitkow.Summary of www eharaeterizations[C].In:7th International World Wide Web Conference,1998. 被引量:1
  • 5John R Punin,Mukkai S Lrishnamoorthy ,Mohammed J Zaki.Logml: log markup language for Web usage mining[C].In:Web KDD Workshop, 2001. 被引量:1

二级参考文献1

  • 1王宁,数据库进展97’——全国第10界数据库会议论文集,1997年 被引量:1

共引文献10

同被引文献63

引证文献11

二级引证文献24

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部