摘要
在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。
An improved model of data preparation in WUM and an advanced time-referer-based heuristic algorithm in session distinguishing are proposed. Existing model of data preparation in WUM and methods in session distinguishing are analyzed and their disadvantages are pointed out. Experiments show that the proposed model and algorithm are adaptable to data preparation in WUM with agent.
出处
《广西师范大学学报(自然科学版)》
CAS
北大核心
2007年第2期69-73,共5页
Journal of Guangxi Normal University:Natural Science Edition
基金
浙江省教育厅基金资助项目(0404121-F)
浙江理工大学科学基金资助项目(111251A4Y04002)