期刊文献+
共找到621篇文章
< 1 2 32 >
每页显示 20 50 100
基于数据挖掘的个性化学习导航系统的设计与实现 被引量:29
1
作者 曲红亭 申瑞民 《计算机工程》 CAS CSCD 北大核心 2003年第8期59-61,共3页
介绍了在远程教育系统中引入自适应机制,针对远程教育系统的学习者的学习特点,提供不同的学习资源,即个性化学习导航系统。个性化的基础是对用户的已有数据进行数据挖掘,分析出用户的知识架构。根据已有的全局知识空间,与用户知识... 介绍了在远程教育系统中引入自适应机制,针对远程教育系统的学习者的学习特点,提供不同的学习资源,即个性化学习导航系统。个性化的基础是对用户的已有数据进行数据挖掘,分析出用户的知识架构。根据已有的全局知识空间,与用户知识架构作补操作,向用户提供其应学习的资源。 展开更多
关键词 自适应网站 个性化 知识架构 神经网络 网络日志
下载PDF
网络环境下科研人员的信息行为分析 被引量:36
2
作者 沙勇忠 阎劲松 苏云 《情报科学》 CSSCI 北大核心 2006年第4期485-491,共7页
本文使用网络计量工具WebTrends对特定科研机构网站的Web日志文件进行处理,通过提取有关科研人员信息行为的量化指标并进行实证分析,揭示了网络环境下科研人员一些具有重要意义的信息行为特征,为优化科研机构的网络信息服务提供定量依... 本文使用网络计量工具WebTrends对特定科研机构网站的Web日志文件进行处理,通过提取有关科研人员信息行为的量化指标并进行实证分析,揭示了网络环境下科研人员一些具有重要意义的信息行为特征,为优化科研机构的网络信息服务提供定量依据和帮助。 展开更多
关键词 科研人员 信息行为 web日志 用户研究
下载PDF
基于神经网络的Web用户行为聚类分析 被引量:16
3
作者 徐涌 陈恩红 王煦法 《小型微型计算机系统》 CSCD 北大核心 2001年第6期699-702,共4页
本文提供了一种用神经网络对 Web用户的行为进行分析的方法 .首先对 WWW服务器的日志文件进行分析 ,再进行会话划分 ,并从会话向量中找出频繁数据集 ,以便选取合适的会话向量 .进行规一化处理后生成模式向量 ,并采用 Kohonen的 SOFM模... 本文提供了一种用神经网络对 Web用户的行为进行分析的方法 .首先对 WWW服务器的日志文件进行分析 ,再进行会话划分 ,并从会话向量中找出频繁数据集 ,以便选取合适的会话向量 .进行规一化处理后生成模式向量 ,并采用 Kohonen的 SOFM模型进行聚类 ,最后生成用户聚类 .实验结果及对比分析表明用神经网络方法能有效地对用户行为进行聚类分析 . 展开更多
关键词 日志文件 聚类分析 用户行为 web 神经网络 WWW Internet
下载PDF
基于Web日志的Webshell检测方法研究 被引量:33
4
作者 石刘洋 方勇 《信息安全研究》 2016年第1期66-73,共8页
提出了一种基于Web日志的轻量级的Webshell检测方法,通过对服务器日志文本文件进行分析,从文本特征、统计特征和页面关联特征3个角度检测Webshell,并通过实验对方法的可行性进行了验证.文本特征方面主要是对文件访问路径和提交的参数进... 提出了一种基于Web日志的轻量级的Webshell检测方法,通过对服务器日志文本文件进行分析,从文本特征、统计特征和页面关联特征3个角度检测Webshell,并通过实验对方法的可行性进行了验证.文本特征方面主要是对文件访问路径和提交的参数进行特征匹配,实验证明正常网页文件和Webshell文件在文件访问路径特征和提交的参数特征上有明显区别.在统计特征方面,首先是对比网页文件的访问频率,实验证明通过统计网页文件访问频率,结合网页文件目录深度、起始时间段和单位时间独立访客数,可准确识别异常文件.页面关联特征是通过计算网页文件的出入度找出孤立文件,实验表明,Webshell通常为孤立文件,和正常网页文件区分明显. 展开更多
关键词 网站后门 webSHELL web日志 web安全 入侵检测
下载PDF
一种基于Web日志文件的信息挖掘方法 被引量:24
5
作者 费爱国 王新辉 《计算机应用》 CSCD 北大核心 2004年第6期57-59,共3页
数据预处理和日志挖掘算法是Web日志挖掘中的关键技术。文中根据Web访问模式的用户特征,提出了一种基于Web日志文件的信息挖掘系统的体系结构。在此基础上,分析了其数据挖掘过程和信息挖掘算法。
关键词 web日志 信息挖掘 算法
下载PDF
Web挖掘技术研究 被引量:21
6
作者 张蓉 《计算机工程》 EI CAS CSCD 北大核心 2006年第15期4-6,共3页
随着互联网的飞速发展,Web挖掘技术已成为数据挖掘技术的一个研究热点。该文对Web挖掘的特点、方法进行了讨论,设计了一种快速有效的Web文档聚类方法,给出了实际测试结果,验证了Web挖掘技术的有效性。提出的Web挖掘技术有效地提高了该... 随着互联网的飞速发展,Web挖掘技术已成为数据挖掘技术的一个研究热点。该文对Web挖掘的特点、方法进行了讨论,设计了一种快速有效的Web文档聚类方法,给出了实际测试结果,验证了Web挖掘技术的有效性。提出的Web挖掘技术有效地提高了该系统的协作能力。 展开更多
关键词 web挖掘 日志文件 文档聚类 矢量空间模型 关联规则
下载PDF
OLAP和数据挖掘技术在Web日志上的应用 被引量:15
7
作者 李绍华 《现代计算机》 1999年第3期16-18,32,共4页
随着WWW网络用户的日益增多,为了改善信息服务的质量,以及从中发掘出电子商务方面的商业机会,有必要对网络用户的行为规律加以分析。本文针对Web日志上的信息,就数据的过滤和转化、多维Web日志数据库的建立、OLAP和DM技术的应用等... 随着WWW网络用户的日益增多,为了改善信息服务的质量,以及从中发掘出电子商务方面的商业机会,有必要对网络用户的行为规律加以分析。本文针对Web日志上的信息,就数据的过滤和转化、多维Web日志数据库的建立、OLAP和DM技术的应用等方面问题作了初步的探讨。 展开更多
关键词 联机分析处理 数据挖掘 web 日志 电子商务
下载PDF
一种Web用户行为聚类算法 被引量:20
8
作者 业宁 李威 +1 位作者 梁作鹏 董逸生 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1364-1367,共4页
提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法... 提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 . 展开更多
关键词 web日志 数据挖掘 聚类 相似度
下载PDF
Web挖掘技术在电子商务中的应用研究 被引量:23
9
作者 刘培刚 《情报学报》 CSSCI 北大核心 2002年第6期680-685,共6页
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从... 本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。 展开更多
关键词 电子商务 web 挖掘 日志 页面聚类 客户群体聚类
下载PDF
Web日志挖掘数据预处理过程技术研究 被引量:17
10
作者 姚洪波 杨炳儒 《微计算机信息》 北大核心 2006年第06X期234-236,共3页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。本文介绍了面向Web日志的数据挖掘预处理的一般过程并给出了用户识别的算法实现。
关键词 web日志挖掘 数据预处理 用户识别
下载PDF
个性化服务技术研究 被引量:20
11
作者 吴辉娟 袁方 《计算机技术与发展》 2006年第2期32-34,37,共4页
对个性化服务技术中的用户识别、用户描述文件、个性化推荐技术、个性化服务系统的体系结构及目前的研究方向进行了概述。从实现角度详细讨论了3种个性化推荐技术。个性化服务具有针对性,它的目的就是为了使用户更好地找到需要的信息,... 对个性化服务技术中的用户识别、用户描述文件、个性化推荐技术、个性化服务系统的体系结构及目前的研究方向进行了概述。从实现角度详细讨论了3种个性化推荐技术。个性化服务具有针对性,它的目的就是为了使用户更好地找到需要的信息,通过从用户访问网站的历史记录中得到用户的个人信息,利用个性化推荐的方法将信息推荐给用户。个性化推荐避免用户陷入信息的海洋,提高用户查询效率,使得用户可以得到他们真正想得到的信息,避免繁多的人工搜索。 展开更多
关键词 个性化 内容过滤 web日志 协作过滤
下载PDF
Web日志挖掘中数据预处理的研究 被引量:20
12
作者 赵红玲 宋瀚涛 +1 位作者 牛振东 刘桂山 《计算机应用研究》 CSCD 北大核心 2005年第6期67-69,共3页
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词 数据挖掘 web日志挖掘 数据预处理
下载PDF
WEB日志挖掘及其实现 被引量:13
13
作者 胡建武 何贞铭 张贻权 《计算机工程与应用》 CSCD 北大核心 2004年第14期156-158,共3页
Web日志中积累了大量的有用信息,从Web日志中发现有用的信息是非常必要的。该文研究了Web日志挖掘的机理,提出了通过访问路径挖掘来分析用户浏览模式的方法,并实现了一种有效的访问路径模式挖掘算法。
关键词 数据挖掘 web日志 访问路径模式
下载PDF
基于Hadoop/Hive的web日志分析系统的设计 被引量:24
14
作者 刘永增 张晓景 李先毅 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第A01期314-317,共4页
互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的... 互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的各个计算节点上,从而完成大规模数据的存储和运算。Hadoop是一个用于构建云计算平台的流行的开源框架,广泛应用于海量数据的处理。但利用Hadoop处理数据,用户必须自己开发Map/Reduce程序。这种程序处于比较低的层次,用户不容易掌握,而且难于维护。Hive是一个基于Hadoop的开源数据仓库工具,它能够将文件映射成数据表,并提供类SQL语句,简化了用户的开发。利用Hadoop、Hive设计了一个用于处理web日志分析的系统,既充分利用了Hadoop的海量数据处理的能力,又降低了开发的难度。通过与单机实验的对比,证明系统是有效的和有价值的。 展开更多
关键词 web日志 云计算 HADOOP Hive
下载PDF
基于Web日志挖掘的网站结构优化方法 被引量:12
15
作者 鲍钰 黄国兴 张召 《计算机工程》 CAS CSCD 北大核心 2003年第12期82-84,共3页
通过对Web日志信息的分析挖掘,以及辅助适量编程和两个算法:GTPFWLP(Get True Path From Web Log Path )和CBP(Confirm Backtrack Point),实现了回溯点和目标页的确定,并最终实现了网站物理结构的调整和再组织。
关键词 web日志 GTPFWLP CBP 支持度
下载PDF
一个可以准确反映Web浏览兴趣的度量值——偏爱度 被引量:10
16
作者 邢东山 沈钧毅 《控制与决策》 EI CSCD 北大核心 2004年第3期307-310,共4页
在分析如何准确反映Web浏览兴趣的基础上提出偏爱度的概念,并依据这个概念设计了基于用户浏览偏爱树的偏爱路径挖掘算法.首先用Web日志构筑用户浏览偏爱树(PNT);然后利用PNT树进行用户浏览兴趣模式的挖掘,发现用户浏览偏爱路径.该算法... 在分析如何准确反映Web浏览兴趣的基础上提出偏爱度的概念,并依据这个概念设计了基于用户浏览偏爱树的偏爱路径挖掘算法.首先用Web日志构筑用户浏览偏爱树(PNT);然后利用PNT树进行用户浏览兴趣模式的挖掘,发现用户浏览偏爱路径.该算法可广泛应用于电子商务领域. 展开更多
关键词 浏览偏爱树 web使用挖掘 数据挖掘 web日志 电子商务
下载PDF
一种从Web日志中挖掘访问模式的新算法 被引量:7
17
作者 肖国强 肖轶 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第5期70-72,共3页
提出了一种用于从Web日志中高效挖掘Web访问模式的新算法 .设计了一个新的数据结构WAS树(WebAccessSequence树 )来记录Web访问序列和它的计数 ,避免冗长的支持度计算 ;开发出一个高效的递归算法 ,从WAS树中枚举出所有的访问模式 ,最后... 提出了一种用于从Web日志中高效挖掘Web访问模式的新算法 .设计了一个新的数据结构WAS树(WebAccessSequence树 )来记录Web访问序列和它的计数 ,避免冗长的支持度计算 ;开发出一个高效的递归算法 ,从WAS树中枚举出所有的访问模式 ,最后对算法的性能进行了分析并给出试验数据加以佐证 .这个算法的特点是不需要产生候选模式而直接挖掘出所有的访问模式 . 展开更多
关键词 web访问模式 web日志 WSA树
下载PDF
基于IIS和web日志的关联关系的挖掘 被引量:7
18
作者 张静 田忠和 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第8期37-39,共3页
针对隐藏在web日志的大量记录中的规律性开展研究 ,提出了一种基于微软的IIS合理构建web日志并进行数据预处理的方案 ,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系 .将数据预处理过程提前到web日志的建立过程中 ,可极大... 针对隐藏在web日志的大量记录中的规律性开展研究 ,提出了一种基于微软的IIS合理构建web日志并进行数据预处理的方案 ,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系 .将数据预处理过程提前到web日志的建立过程中 ,可极大地降低数据准备的复杂性 ;将日志数据导入关系数据库中进行净化处理 ,大幅度减少了工作量 . 展开更多
关键词 web日志 数据挖掘 关联规则 电子商务 web挖掘
下载PDF
政府网络舆情日志大数据挖掘实证研究 被引量:19
19
作者 李祝启 陆和建 申林 《情报科学》 CSSCI 北大核心 2014年第11期58-61,132,共5页
以合肥市政府网站舆情日志为例,采用日志分析法和统计分析法,利用Awstats软件大数据挖掘技术处理相关日志文件,利用SPSS软件对处理后的数据进行描述性以及推断性分析,得出政府网络舆情日志大数据挖掘的相关研究结果可以应用到用户行为... 以合肥市政府网站舆情日志为例,采用日志分析法和统计分析法,利用Awstats软件大数据挖掘技术处理相关日志文件,利用SPSS软件对处理后的数据进行描述性以及推断性分析,得出政府网络舆情日志大数据挖掘的相关研究结果可以应用到用户行为规律以及优化政府决策方式等相关研究中的结论。 展开更多
关键词 网络舆情 web日志 大数据 日志挖掘
原文传递
Web日志序列模式挖掘 被引量:6
20
作者 赵畅 杨冬青 唐世渭 《计算机应用》 CSCD 2000年第9期13-16,共4页
从Web日志中挖掘出的序列模式可以用于改善Web信息服务。本文分析了Web日志序列模式挖掘过程中的一些难点及相应的解决方案 ,并在此基础上设计了一个Web日志序列模式挖掘工具SPMiner。
关键词 web日志 序列模式 网上医疗信息服务
下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部