期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
325
篇文章
<
1
2
…
17
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Web日志挖掘中的数据预处理技术研究
被引量:
62
1
作者
赵伟
何丕廉
+1 位作者
陈霞
谢振亮
《计算机应用》
CSCD
北大核心
2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词
数据
挖掘
web
日志
挖掘
数据预处理
下载PDF
职称材料
网络日志规模分析和用户兴趣挖掘
被引量:
62
2
作者
郭岩
白硕
+1 位作者
杨志峰
张凯
《计算机学报》
EI
CSCD
北大核心
2005年第9期1483-1496,共14页
文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴...
文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴趣;利用日志中蕴含的用户稳定兴趣,提出了一个基于用户行为的相关文档检索模型和搜索引擎系统SISI.SISI的实际检索性能与分析检索模型所得结论一致:检索准确率和检索时间主要依赖于用户数,检索返回的记录数主要依赖于文档数.
展开更多
关键词
web
日志
挖掘
日志
规模
兴趣
用户行为
下载PDF
职称材料
基于Hadoop的Web日志挖掘
被引量:
64
3
作者
程苗
陈华平
《计算机工程》
CAS
CSCD
北大核心
2011年第11期37-39,共3页
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。...
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。为进一步验证该平台的高效性,在该平台上利用改进后的算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,在集群中运用分布式算法处理大量的Web日志文件,可以明显提高Web数据挖掘的效率。
展开更多
关键词
云计算
Hadoop架构
Map/Reduce编程模式
web
日志
挖掘
遗传算法
偏爱访问路径
下载PDF
职称材料
一个简单的Web日志挖掘系统
被引量:
22
4
作者
杨怡玲
管旭东
+1 位作者
陆丽娜
尤晋元
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序...
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。
展开更多
关键词
数据
挖掘
web
日志
挖掘
序列模式识别
SWLMS
下载PDF
职称材料
Web日志挖掘技术的研究与应用
被引量:
21
5
作者
肖立英
李建华
谭立球
《计算机工程》
CAS
CSCD
北大核心
2002年第7期276-277,284,共3页
介绍了目前世界上两种主要的日志挖掘技术基于事务和基于数据立方体。同时,提出了一个基于日志挖掘技术的应Web (Web)Web用,即用户自适应的站点,介绍了这一系统的实现方法和主要特色。
关键词
web
日志
挖掘
数据
挖掘
数据库
数据立方体
下载PDF
职称材料
Web日志挖掘技术进展
被引量:
17
6
作者
陈新中
李岩
+2 位作者
杨炳儒
谢永红
张运涛
《系统工程与电子技术》
EI
CSCD
北大核心
2003年第4期492-495,共4页
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方...
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。
展开更多
关键词
AI
万维网
web
挖掘
web
日志
挖掘
下载PDF
职称材料
Web数据挖掘与高校数字图书馆个性化服务
被引量:
31
7
作者
欧阳烽
《现代情报》
北大核心
2008年第1期103-104,107,共3页
针对高校数字图书馆个性化服务的实现,首先介绍Web数据挖掘和个性化服务的相关概念及特点,再详细叙述Web日志挖掘的相关算法及过程,最后指出Web数据挖掘是高校数字图书馆进行个性化服务的主要途径。
关键词
web
数据
挖掘
个性化服务
web
日志
挖掘
数字图书馆
下载PDF
职称材料
一种Web日志会话识别的优化方法
被引量:
18
8
作者
陈子军
王鑫昱
李伟
《计算机工程》
CAS
CSCD
北大核心
2007年第1期95-97,共3页
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。该文对此提出优化算法,并对最常用的Timeout方法识别的会话进行优化,通过实验证明会话质量得到了提高。
关键词
web
日志
挖掘
数据预处理
会话识别
下载PDF
职称材料
Web日志挖掘数据预处理过程技术研究
被引量:
17
9
作者
姚洪波
杨炳儒
《微计算机信息》
北大核心
2006年第06X期234-236,共3页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。本文介绍了面向Web日志的数据挖掘预处理的一般过程并给出了用户识别的算法实现。
关键词
web
日志
挖掘
数据预处理
用户识别
下载PDF
职称材料
Web日志挖掘中数据预处理的研究
被引量:
20
10
作者
赵红玲
宋瀚涛
+1 位作者
牛振东
刘桂山
《计算机应用研究》
CSCD
北大核心
2005年第6期67-69,共3页
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词
数据
挖掘
web
日志
挖掘
数据预处理
下载PDF
职称材料
Web访问挖掘的预处理技术的研究
被引量:
19
11
作者
熊忠阳
周亚峰
《计算机技术与发展》
2007年第8期11-14,18,共5页
Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进...
Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进行了形式化描述,然后在分析目前会话构造算法的基础上,提出了基于时间和引用的启发式方法来构造会话。
展开更多
关键词
web
挖掘
web
日志
挖掘
数据预处理
用户会话
会话识别
下载PDF
职称材料
Web日志挖掘的预处理及路径补全算法的研究
被引量:
11
12
作者
王岚
翟正军
《微电子学与计算机》
CSCD
北大核心
2006年第8期113-116,共4页
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的...
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的算法实现。
展开更多
关键词
web
日志
挖掘
数据预处理
路径补全
算法
下载PDF
职称材料
WEB日志挖掘在个性化网络教育中的应用
被引量:
18
13
作者
黄茜
《现代教育技术》
2004年第5期52-55,共4页
本文介绍了Web日志挖掘的基本概念和过程,通过对学习者在网络教育中留下的日志信息进行挖掘,以实现个性化的网络教育,更好的满足不同类别学习者的需求。
关键词
web
日志
挖掘
网络教育
远程教育网站
个性化教学
页面结构
教育资源
下载PDF
职称材料
结合网站内容和结构进行的Web日志挖掘
被引量:
9
14
作者
江宝林
申展
+2 位作者
张川
葛家翔
胡运发
《计算机工程》
CAS
CSCD
北大核心
2004年第16期30-32,共3页
提出一种以聚类为基础的Web日志挖掘方法:从Web日志事务、Web站点内容和Web站点结构3个不同方面来聚类页面集合,并通过将用户的访问记录和页面聚集进行匹配和相关度计算,来预测用户感兴趣的页面。
关键词
web
日志
挖掘
web
日志
事务
访问模式
聚类
下载PDF
职称材料
Web日志挖掘中的数据预处理技术
被引量:
22
15
作者
李燕
冯博琴
鲁晓锋
《计算机工程》
CAS
CSCD
北大核心
2009年第22期44-46,49,共4页
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中...
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。
展开更多
关键词
web
日志
挖掘
数据预处理
用户会话识别
路径补充
下载PDF
职称材料
基于Web日志的用户访问模式挖掘
被引量:
15
16
作者
王新
马万青
潘文林
《计算机工程与应用》
CSCD
北大核心
2006年第21期156-158,共3页
Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。
关键词
web
日志
挖掘
访问模式
粗糙集
聚类
下载PDF
职称材料
Web日志挖掘中数据预处理技术的研究
被引量:
19
17
作者
马瑞民
李向云
《计算机工程与设计》
CSCD
北大核心
2007年第10期2358-2360,共3页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访...
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。
展开更多
关键词
web
日志
挖掘
数据预处理
路径补充
访问序列
访问事务
下载PDF
职称材料
基于用户日志的移动搜索行为分析
被引量:
23
18
作者
王继民
李雷明子
+1 位作者
孟凡
郑玉凤
《图书情报工作》
CSSCI
北大核心
2013年第19期102-106,120,共6页
认为移动搜索用户行为特征与规律的发现,对移动搜索服务的改进具有重要的参考价值。基于国内某大型学术类网站一批包含300余万条有效记录的日志数据,分析查询串、搜索时间的分布、搜索会话、移动搜索设备终端等我国移动搜索用户行为的...
认为移动搜索用户行为特征与规律的发现,对移动搜索服务的改进具有重要的参考价值。基于国内某大型学术类网站一批包含300余万条有效记录的日志数据,分析查询串、搜索时间的分布、搜索会话、移动搜索设备终端等我国移动搜索用户行为的基本特征指标。研究结果显示:与传统PC搜索相比,移动用户的查询时间分布更均匀,会话更短,使用查询推荐比例更少,移动智能终端设备用户搜索更频繁。
展开更多
关键词
移动搜索
用户行为分析
web
日志
挖掘
原文传递
Web日志挖掘的数据预处理研究
被引量:
12
19
作者
方成效
袁可风
《计算机与现代化》
2006年第4期79-81,84,共4页
分析了Web日志挖掘的数据预处理过程,提出了基于日志引用页的用户识别算法,并对其性能进行分析,最后给出了应用实例。
关键词
web
日志
挖掘
数据预处理
用户识别算法
下载PDF
职称材料
基于模糊聚类的Web日志挖掘
被引量:
13
20
作者
李桂英
李吉桂
《计算机科学》
CSCD
北大核心
2004年第12期130-131,153,共3页
本文使用模糊聚类的方法对Web日志进行数据挖掘,实现用户聚类和页面聚类,并设计与实现了一个基于模糊聚类的Web日志挖掘系统。
关键词
web
日志
挖掘
行数据
页面
模糊聚类
用户
系统
设计
下载PDF
职称材料
题名
Web日志挖掘中的数据预处理技术研究
被引量:
62
1
作者
赵伟
何丕廉
陈霞
谢振亮
机构
天津大学计算机科学与技术系
出处
《计算机应用》
CSCD
北大核心
2003年第5期62-64,67,共4页
基金
天津市科技发展计划项目 (0 2 3 1 0 0 51 1 )
文摘
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词
数据
挖掘
web
日志
挖掘
数据预处理
Keywords
data mining
web
log mining
data preprocessing
分类号
TP311.138 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
网络日志规模分析和用户兴趣挖掘
被引量:
62
2
作者
郭岩
白硕
杨志峰
张凯
机构
中国科学院计算技术研究所软件研究室
出处
《计算机学报》
EI
CSCD
北大核心
2005年第9期1483-1496,共14页
基金
中国科学院计算技术研究所领域前沿青年基金(2002618024)资助
文摘
文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴趣;利用日志中蕴含的用户稳定兴趣,提出了一个基于用户行为的相关文档检索模型和搜索引擎系统SISI.SISI的实际检索性能与分析检索模型所得结论一致:检索准确率和检索时间主要依赖于用户数,检索返回的记录数主要依赖于文档数.
关键词
web
日志
挖掘
日志
规模
兴趣
用户行为
Keywords
web
-log mining
scale of
web
logs
interest
users action
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Hadoop的Web日志挖掘
被引量:
64
3
作者
程苗
陈华平
机构
中国科学技术大学管理学院
中国科学技术大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第11期37-39,共3页
基金
博士点基金资助项目(200803580024)
创新研究群体科学基金资助项目(70821001)
文摘
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。为进一步验证该平台的高效性,在该平台上利用改进后的算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,在集群中运用分布式算法处理大量的Web日志文件,可以明显提高Web数据挖掘的效率。
关键词
云计算
Hadoop架构
Map/Reduce编程模式
web
日志
挖掘
遗传算法
偏爱访问路径
Keywords
cloud computing
Hadoop frame
Map/Reduce
web
log mining
genetic algorithm
preferred browsing path
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一个简单的Web日志挖掘系统
被引量:
22
4
作者
杨怡玲
管旭东
陆丽娜
尤晋元
机构
上海交通大学计算机科学与工程系
西安交通大学计算机科学与工程系
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2000年第7期932-935,共4页
文摘
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。
关键词
数据
挖掘
web
日志
挖掘
序列模式识别
SWLMS
Keywords
data mining
web
log mining
sequential pattern recognition
maximum forward path
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘技术的研究与应用
被引量:
21
5
作者
肖立英
李建华
谭立球
机构
中南大学铁道校区信息技术研究中心
出处
《计算机工程》
CAS
CSCD
北大核心
2002年第7期276-277,284,共3页
文摘
介绍了目前世界上两种主要的日志挖掘技术基于事务和基于数据立方体。同时,提出了一个基于日志挖掘技术的应Web (Web)Web用,即用户自适应的站点,介绍了这一系统的实现方法和主要特色。
关键词
web
日志
挖掘
数据
挖掘
数据库
数据立方体
Keywords
Data mining
web
mining
web
log miningAdaptive
web
site
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘技术进展
被引量:
17
6
作者
陈新中
李岩
杨炳儒
谢永红
张运涛
机构
北京科技大学信息工程学院
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2003年第4期492-495,共4页
基金
国家自然科学基金(698350010)
教育部科技重点项目(教技司[2000]175)资助课题
文摘
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。
关键词
AI
万维网
web
挖掘
web
日志
挖掘
Keywords
AI
World-wide
web
web
mining
web
log mining
分类号
TP393.07 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web数据挖掘与高校数字图书馆个性化服务
被引量:
31
7
作者
欧阳烽
机构
湖南师范大学树达学院
出处
《现代情报》
北大核心
2008年第1期103-104,107,共3页
文摘
针对高校数字图书馆个性化服务的实现,首先介绍Web数据挖掘和个性化服务的相关概念及特点,再详细叙述Web日志挖掘的相关算法及过程,最后指出Web数据挖掘是高校数字图书馆进行个性化服务的主要途径。
关键词
web
数据
挖掘
个性化服务
web
日志
挖掘
数字图书馆
Keywords
web
Data Mining
Personality Services
web
Log Mining
Digital Library
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种Web日志会话识别的优化方法
被引量:
18
8
作者
陈子军
王鑫昱
李伟
机构
燕山大学信息学院计算机科学与工程系
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第1期95-97,共3页
基金
燕山大学博士基金资助项目
文摘
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。该文对此提出优化算法,并对最常用的Timeout方法识别的会话进行优化,通过实验证明会话质量得到了提高。
关键词
web
日志
挖掘
数据预处理
会话识别
Keywords
web
log mining
Data preprocessing
Sessions reconstruction
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘数据预处理过程技术研究
被引量:
17
9
作者
姚洪波
杨炳儒
机构
北京科技大学计算机系
北京科技大学知识工程研究所
出处
《微计算机信息》
北大核心
2006年第06X期234-236,共3页
基金
国家科技成果重点推广项目基金编号:2003EC000001
文摘
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。本文介绍了面向Web日志的数据挖掘预处理的一般过程并给出了用户识别的算法实现。
关键词
web
日志
挖掘
数据预处理
用户识别
Keywords
web
Log,Data Preprocessing,User Identification
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘中数据预处理的研究
被引量:
20
10
作者
赵红玲
宋瀚涛
牛振东
刘桂山
机构
北京理工大学计算机系
北京理工大学软件学院
出处
《计算机应用研究》
CSCD
北大核心
2005年第6期67-69,共3页
基金
霍英东教育基金会高等院校青年教师基金资助项目(91101)
文摘
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词
数据
挖掘
web
日志
挖掘
数据预处理
Keywords
Data Mining
web
Log
Data Preprocessing
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web访问挖掘的预处理技术的研究
被引量:
19
11
作者
熊忠阳
周亚峰
机构
重庆大学计算机学院
出处
《计算机技术与发展》
2007年第8期11-14,18,共5页
文摘
Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进行了形式化描述,然后在分析目前会话构造算法的基础上,提出了基于时间和引用的启发式方法来构造会话。
关键词
web
挖掘
web
日志
挖掘
数据预处理
用户会话
会话识别
Keywords
web
mining
web
log mining
data preprocessing
user session
session identification
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘的预处理及路径补全算法的研究
被引量:
11
12
作者
王岚
翟正军
机构
西北工业大学计算机学院
洛阳师范学院计算机科学系
出处
《微电子学与计算机》
CSCD
北大核心
2006年第8期113-116,共4页
文摘
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的算法实现。
关键词
web
日志
挖掘
数据预处理
路径补全
算法
Keywords
web
log mining, Data preprocess, Path supplement, Algorithm
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
WEB日志挖掘在个性化网络教育中的应用
被引量:
18
13
作者
黄茜
机构
华东师范大学教育信息技术系
出处
《现代教育技术》
2004年第5期52-55,共4页
文摘
本文介绍了Web日志挖掘的基本概念和过程,通过对学习者在网络教育中留下的日志信息进行挖掘,以实现个性化的网络教育,更好的满足不同类别学习者的需求。
关键词
web
日志
挖掘
网络教育
远程教育网站
个性化教学
页面结构
教育资源
Keywords
web
Usage Mining,Data Mining,
web
-based Education, Personalization
分类号
G434 [文化科学—教育学]
下载PDF
职称材料
题名
结合网站内容和结构进行的Web日志挖掘
被引量:
9
14
作者
江宝林
申展
张川
葛家翔
胡运发
机构
复旦大学计算机与信息技术系
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第16期30-32,共3页
基金
国家自然科学基金资助项目(60173027)
文摘
提出一种以聚类为基础的Web日志挖掘方法:从Web日志事务、Web站点内容和Web站点结构3个不同方面来聚类页面集合,并通过将用户的访问记录和页面聚集进行匹配和相关度计算,来预测用户感兴趣的页面。
关键词
web
日志
挖掘
web
日志
事务
访问模式
聚类
Keywords
web
log mining
web
log transaction
Visiting pattern
Cluster
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘中的数据预处理技术
被引量:
22
15
作者
李燕
冯博琴
鲁晓锋
机构
西安交通大学电子与信息工程学院
西安理工大学计算机科学与工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第22期44-46,49,共4页
基金
国家"863"计划基金资助项目(2008AA01Z131)
文摘
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。
关键词
web
日志
挖掘
数据预处理
用户会话识别
路径补充
Keywords
web
log mining
data preprocessing
user-session identification
path completion
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Web日志的用户访问模式挖掘
被引量:
15
16
作者
王新
马万青
潘文林
机构
云南民族大学数学与计算机科学学院
出处
《计算机工程与应用》
CSCD
北大核心
2006年第21期156-158,共3页
基金
云南省教育厅科研基金资助项目(编号:03Z5331)
文摘
Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。
关键词
web
日志
挖掘
访问模式
粗糙集
聚类
Keywords
web
log mining, access patterns, rough set, clustering
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘中数据预处理技术的研究
被引量:
19
17
作者
马瑞民
李向云
机构
大庆石油学院计算机与信息技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2007年第10期2358-2360,共3页
文摘
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。
关键词
web
日志
挖掘
数据预处理
路径补充
访问序列
访问事务
Keywords
web
log mining
data preprocessing
path completion
accessed session
accessed transaction
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
TP393 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
基于用户日志的移动搜索行为分析
被引量:
23
18
作者
王继民
李雷明子
孟凡
郑玉凤
机构
北京大学信息管理系
中国科学院大学管理学院
出处
《图书情报工作》
CSSCI
北大核心
2013年第19期102-106,120,共6页
基金
国家社会科学基金项目"互联网用户查询日志挖掘技术及其应用研究"(项目编号:10BTQ050)研究成果之一
文摘
认为移动搜索用户行为特征与规律的发现,对移动搜索服务的改进具有重要的参考价值。基于国内某大型学术类网站一批包含300余万条有效记录的日志数据,分析查询串、搜索时间的分布、搜索会话、移动搜索设备终端等我国移动搜索用户行为的基本特征指标。研究结果显示:与传统PC搜索相比,移动用户的查询时间分布更均匀,会话更短,使用查询推荐比例更少,移动智能终端设备用户搜索更频繁。
关键词
移动搜索
用户行为分析
web
日志
挖掘
Keywords
mobile search
user behavior analysis
web
log mining
分类号
G354 [文化科学—情报学]
原文传递
题名
Web日志挖掘的数据预处理研究
被引量:
12
19
作者
方成效
袁可风
机构
华东交通大学信息工程学院
出处
《计算机与现代化》
2006年第4期79-81,84,共4页
文摘
分析了Web日志挖掘的数据预处理过程,提出了基于日志引用页的用户识别算法,并对其性能进行分析,最后给出了应用实例。
关键词
web
日志
挖掘
数据预处理
用户识别算法
Keywords
web
log mining
data preprocessing
user identification arithmetic
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于模糊聚类的Web日志挖掘
被引量:
13
20
作者
李桂英
李吉桂
机构
华南师范大学
出处
《计算机科学》
CSCD
北大核心
2004年第12期130-131,153,共3页
文摘
本文使用模糊聚类的方法对Web日志进行数据挖掘,实现用户聚类和页面聚类,并设计与实现了一个基于模糊聚类的Web日志挖掘系统。
关键词
web
日志
挖掘
行数据
页面
模糊聚类
用户
系统
设计
Keywords
Fuzzy clastering, Data mining,
web
log mining, Customers clustering,
web
pages clastering
分类号
TP393 [自动化与计算机技术—计算机应用技术]
TP311 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Web日志挖掘中的数据预处理技术研究
赵伟
何丕廉
陈霞
谢振亮
《计算机应用》
CSCD
北大核心
2003
62
下载PDF
职称材料
2
网络日志规模分析和用户兴趣挖掘
郭岩
白硕
杨志峰
张凯
《计算机学报》
EI
CSCD
北大核心
2005
62
下载PDF
职称材料
3
基于Hadoop的Web日志挖掘
程苗
陈华平
《计算机工程》
CAS
CSCD
北大核心
2011
64
下载PDF
职称材料
4
一个简单的Web日志挖掘系统
杨怡玲
管旭东
陆丽娜
尤晋元
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2000
22
下载PDF
职称材料
5
Web日志挖掘技术的研究与应用
肖立英
李建华
谭立球
《计算机工程》
CAS
CSCD
北大核心
2002
21
下载PDF
职称材料
6
Web日志挖掘技术进展
陈新中
李岩
杨炳儒
谢永红
张运涛
《系统工程与电子技术》
EI
CSCD
北大核心
2003
17
下载PDF
职称材料
7
Web数据挖掘与高校数字图书馆个性化服务
欧阳烽
《现代情报》
北大核心
2008
31
下载PDF
职称材料
8
一种Web日志会话识别的优化方法
陈子军
王鑫昱
李伟
《计算机工程》
CAS
CSCD
北大核心
2007
18
下载PDF
职称材料
9
Web日志挖掘数据预处理过程技术研究
姚洪波
杨炳儒
《微计算机信息》
北大核心
2006
17
下载PDF
职称材料
10
Web日志挖掘中数据预处理的研究
赵红玲
宋瀚涛
牛振东
刘桂山
《计算机应用研究》
CSCD
北大核心
2005
20
下载PDF
职称材料
11
Web访问挖掘的预处理技术的研究
熊忠阳
周亚峰
《计算机技术与发展》
2007
19
下载PDF
职称材料
12
Web日志挖掘的预处理及路径补全算法的研究
王岚
翟正军
《微电子学与计算机》
CSCD
北大核心
2006
11
下载PDF
职称材料
13
WEB日志挖掘在个性化网络教育中的应用
黄茜
《现代教育技术》
2004
18
下载PDF
职称材料
14
结合网站内容和结构进行的Web日志挖掘
江宝林
申展
张川
葛家翔
胡运发
《计算机工程》
CAS
CSCD
北大核心
2004
9
下载PDF
职称材料
15
Web日志挖掘中的数据预处理技术
李燕
冯博琴
鲁晓锋
《计算机工程》
CAS
CSCD
北大核心
2009
22
下载PDF
职称材料
16
基于Web日志的用户访问模式挖掘
王新
马万青
潘文林
《计算机工程与应用》
CSCD
北大核心
2006
15
下载PDF
职称材料
17
Web日志挖掘中数据预处理技术的研究
马瑞民
李向云
《计算机工程与设计》
CSCD
北大核心
2007
19
下载PDF
职称材料
18
基于用户日志的移动搜索行为分析
王继民
李雷明子
孟凡
郑玉凤
《图书情报工作》
CSSCI
北大核心
2013
23
原文传递
19
Web日志挖掘的数据预处理研究
方成效
袁可风
《计算机与现代化》
2006
12
下载PDF
职称材料
20
基于模糊聚类的Web日志挖掘
李桂英
李吉桂
《计算机科学》
CSCD
北大核心
2004
13
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
17
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部