期刊文献+
共找到325篇文章
< 1 2 17 >
每页显示 20 50 100
Web日志挖掘中的数据预处理技术研究 被引量:62
1
作者 赵伟 何丕廉 +1 位作者 陈霞 谢振亮 《计算机应用》 CSCD 北大核心 2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词 数据挖掘 web日志挖掘 数据预处理
下载PDF
网络日志规模分析和用户兴趣挖掘 被引量:62
2
作者 郭岩 白硕 +1 位作者 杨志峰 张凯 《计算机学报》 EI CSCD 北大核心 2005年第9期1483-1496,共14页
文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴... 文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴趣;利用日志中蕴含的用户稳定兴趣,提出了一个基于用户行为的相关文档检索模型和搜索引擎系统SISI.SISI的实际检索性能与分析检索模型所得结论一致:检索准确率和检索时间主要依赖于用户数,检索返回的记录数主要依赖于文档数. 展开更多
关键词 web日志挖掘 日志规模 兴趣 用户行为
下载PDF
基于Hadoop的Web日志挖掘 被引量:64
3
作者 程苗 陈华平 《计算机工程》 CAS CSCD 北大核心 2011年第11期37-39,共3页
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。... 基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。为进一步验证该平台的高效性,在该平台上利用改进后的算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,在集群中运用分布式算法处理大量的Web日志文件,可以明显提高Web数据挖掘的效率。 展开更多
关键词 云计算 Hadoop架构 Map/Reduce编程模式 web日志挖掘 遗传算法 偏爱访问路径
下载PDF
一个简单的Web日志挖掘系统 被引量:22
4
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 web日志挖掘 序列模式识别 SWLMS
下载PDF
Web日志挖掘技术的研究与应用 被引量:21
5
作者 肖立英 李建华 谭立球 《计算机工程》 CAS CSCD 北大核心 2002年第7期276-277,284,共3页
介绍了目前世界上两种主要的日志挖掘技术基于事务和基于数据立方体。同时,提出了一个基于日志挖掘技术的应Web (Web)Web用,即用户自适应的站点,介绍了这一系统的实现方法和主要特色。
关键词 web日志挖掘 数据挖掘 数据库 数据立方体
下载PDF
Web日志挖掘技术进展 被引量:17
6
作者 陈新中 李岩 +2 位作者 杨炳儒 谢永红 张运涛 《系统工程与电子技术》 EI CSCD 北大核心 2003年第4期492-495,共4页
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方... 用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。 展开更多
关键词 AI 万维网 web挖掘 web日志挖掘
下载PDF
Web数据挖掘与高校数字图书馆个性化服务 被引量:31
7
作者 欧阳烽 《现代情报》 北大核心 2008年第1期103-104,107,共3页
针对高校数字图书馆个性化服务的实现,首先介绍Web数据挖掘和个性化服务的相关概念及特点,再详细叙述Web日志挖掘的相关算法及过程,最后指出Web数据挖掘是高校数字图书馆进行个性化服务的主要途径。
关键词 web数据挖掘 个性化服务 web日志挖掘 数字图书馆
下载PDF
一种Web日志会话识别的优化方法 被引量:18
8
作者 陈子军 王鑫昱 李伟 《计算机工程》 CAS CSCD 北大核心 2007年第1期95-97,共3页
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。该文对此提出优化算法,并对最常用的Timeout方法识别的会话进行优化,通过实验证明会话质量得到了提高。
关键词 web日志挖掘 数据预处理 会话识别
下载PDF
Web日志挖掘数据预处理过程技术研究 被引量:17
9
作者 姚洪波 杨炳儒 《微计算机信息》 北大核心 2006年第06X期234-236,共3页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。本文介绍了面向Web日志的数据挖掘预处理的一般过程并给出了用户识别的算法实现。
关键词 web日志挖掘 数据预处理 用户识别
下载PDF
Web日志挖掘中数据预处理的研究 被引量:20
10
作者 赵红玲 宋瀚涛 +1 位作者 牛振东 刘桂山 《计算机应用研究》 CSCD 北大核心 2005年第6期67-69,共3页
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词 数据挖掘 web日志挖掘 数据预处理
下载PDF
Web访问挖掘的预处理技术的研究 被引量:19
11
作者 熊忠阳 周亚峰 《计算机技术与发展》 2007年第8期11-14,18,共5页
Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进... Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进行了形式化描述,然后在分析目前会话构造算法的基础上,提出了基于时间和引用的启发式方法来构造会话。 展开更多
关键词 web挖掘 web日志挖掘 数据预处理 用户会话 会话识别
下载PDF
Web日志挖掘的预处理及路径补全算法的研究 被引量:11
12
作者 王岚 翟正军 《微电子学与计算机》 CSCD 北大核心 2006年第8期113-116,共4页
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的... Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的算法实现。 展开更多
关键词 web日志挖掘 数据预处理 路径补全 算法
下载PDF
WEB日志挖掘在个性化网络教育中的应用 被引量:18
13
作者 黄茜 《现代教育技术》 2004年第5期52-55,共4页
本文介绍了Web日志挖掘的基本概念和过程,通过对学习者在网络教育中留下的日志信息进行挖掘,以实现个性化的网络教育,更好的满足不同类别学习者的需求。
关键词 web日志挖掘 网络教育 远程教育网站 个性化教学 页面结构 教育资源
下载PDF
结合网站内容和结构进行的Web日志挖掘 被引量:9
14
作者 江宝林 申展 +2 位作者 张川 葛家翔 胡运发 《计算机工程》 CAS CSCD 北大核心 2004年第16期30-32,共3页
提出一种以聚类为基础的Web日志挖掘方法:从Web日志事务、Web站点内容和Web站点结构3个不同方面来聚类页面集合,并通过将用户的访问记录和页面聚集进行匹配和相关度计算,来预测用户感兴趣的页面。
关键词 web日志挖掘 web日志事务 访问模式 聚类
下载PDF
Web日志挖掘中的数据预处理技术 被引量:22
15
作者 李燕 冯博琴 鲁晓锋 《计算机工程》 CAS CSCD 北大核心 2009年第22期44-46,49,共4页
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中... 数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。 展开更多
关键词 web日志挖掘 数据预处理 用户会话识别 路径补充
下载PDF
基于Web日志的用户访问模式挖掘 被引量:15
16
作者 王新 马万青 潘文林 《计算机工程与应用》 CSCD 北大核心 2006年第21期156-158,共3页
Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。
关键词 web日志挖掘 访问模式 粗糙集 聚类
下载PDF
Web日志挖掘中数据预处理技术的研究 被引量:19
17
作者 马瑞民 李向云 《计算机工程与设计》 CSCD 北大核心 2007年第10期2358-2360,共3页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访... 在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。 展开更多
关键词 web日志挖掘 数据预处理 路径补充 访问序列 访问事务
下载PDF
基于用户日志的移动搜索行为分析 被引量:23
18
作者 王继民 李雷明子 +1 位作者 孟凡 郑玉凤 《图书情报工作》 CSSCI 北大核心 2013年第19期102-106,120,共6页
认为移动搜索用户行为特征与规律的发现,对移动搜索服务的改进具有重要的参考价值。基于国内某大型学术类网站一批包含300余万条有效记录的日志数据,分析查询串、搜索时间的分布、搜索会话、移动搜索设备终端等我国移动搜索用户行为的... 认为移动搜索用户行为特征与规律的发现,对移动搜索服务的改进具有重要的参考价值。基于国内某大型学术类网站一批包含300余万条有效记录的日志数据,分析查询串、搜索时间的分布、搜索会话、移动搜索设备终端等我国移动搜索用户行为的基本特征指标。研究结果显示:与传统PC搜索相比,移动用户的查询时间分布更均匀,会话更短,使用查询推荐比例更少,移动智能终端设备用户搜索更频繁。 展开更多
关键词 移动搜索 用户行为分析 web日志挖掘
原文传递
Web日志挖掘的数据预处理研究 被引量:12
19
作者 方成效 袁可风 《计算机与现代化》 2006年第4期79-81,84,共4页
分析了Web日志挖掘的数据预处理过程,提出了基于日志引用页的用户识别算法,并对其性能进行分析,最后给出了应用实例。
关键词 web日志挖掘 数据预处理 用户识别算法
下载PDF
基于模糊聚类的Web日志挖掘 被引量:13
20
作者 李桂英 李吉桂 《计算机科学》 CSCD 北大核心 2004年第12期130-131,153,共3页
本文使用模糊聚类的方法对Web日志进行数据挖掘,实现用户聚类和页面聚类,并设计与实现了一个基于模糊聚类的Web日志挖掘系统。
关键词 web日志挖掘 行数据 页面 模糊聚类 用户 系统 设计
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部