期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
Web数据挖掘中的数据预处理 被引量:25
1
作者 陈宝树 党齐民 《计算机工程》 CAS CSCD 北大核心 2002年第7期125-127,共3页
WLP数据挖掘是分析网络应用的主要手段。其数据源一般是网络服务器日志,然而日志记录的是杂乱的、不完整的、不准确的并且Web是非结构化的数据,必须进行数据预处理。文章将预处理过程分为个阶段—数据清洗、区分使用者、会话识别,并提... WLP数据挖掘是分析网络应用的主要手段。其数据源一般是网络服务器日志,然而日志记录的是杂乱的、不完整的、不准确的并且Web是非结构化的数据,必须进行数据预处理。文章将预处理过程分为个阶段—数据清洗、区分使用者、会话识别,并提出了一个高效的3Web数据挖掘预处理结构和相应的算法。 展开更多
关键词 WEB数据挖掘 数据预处理 结构化数据 数据库
下载PDF
一种Web访问者行为取向量化模型
2
作者 党齐民 陈宝树 《计算机工程》 CAS CSCD 北大核心 2002年第8期114-116,共3页
提出了一种基于页视图同现率、独立与数据量、以访问者数据为中心的向量空间描述模型,每个页视图对应向量空间中的一个点。由于页视图在不同的会话中含有的行为取向的语义信息不同,先将会话进行向量描述,然后将会话向量聚类为用户行为类... 提出了一种基于页视图同现率、独立与数据量、以访问者数据为中心的向量空间描述模型,每个页视图对应向量空间中的一个点。由于页视图在不同的会话中含有的行为取向的语义信息不同,先将会话进行向量描述,然后将会话向量聚类为用户行为类,得到代表不同的行为取向的行为语义向量。最后将量化的行为取向信息用于指导访问者行为。 展开更多
关键词 量化模型 访问者 行为取向 WEB 网络服务器 网站 计算机网络 页视图向量 会话向量 行为取向 行为语义向量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部