期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
Web访问挖掘的预处理技术的研究 被引量:19
1
作者 熊忠阳 周亚峰 《计算机技术与发展》 2007年第8期11-14,18,共5页
Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进... Web日志挖掘就是运用数据挖掘技术从Web日志中发现和抽取信息的过程。数据预处理是Web日志挖掘的一个关键环节。对数据预处理的各个环节进行研究,并介绍各个环节中的一些特殊处理方法,根据对Web服务期日志数据格式的分析,对会话概念进行了形式化描述,然后在分析目前会话构造算法的基础上,提出了基于时间和引用的启发式方法来构造会话。 展开更多
关键词 WEB挖掘 WEB日志挖掘 数据预处理 用户会话 会话识别
下载PDF
Web应用的负载测试策略研究 被引量:5
2
作者 张江河 葛玮 董云卫 《微机发展》 2005年第2期35-37,129,共4页
Web应用设计的复杂性和用户使用的不可预测性给如何准确地预测它的性能带来了很大的挑战,而且随着Web应用的规模越来越大、用户越来越多,这个挑战变得更加严重。文中就如何准确地设计负载测试进行了深入研究,提出了对用户导航、用户延... Web应用设计的复杂性和用户使用的不可预测性给如何准确地预测它的性能带来了很大的挑战,而且随着Web应用的规模越来越大、用户越来越多,这个挑战变得更加严重。文中就如何准确地设计负载测试进行了深入研究,提出了对用户导航、用户延迟以及用户放弃进行建模的方法来设计负载测试,以使负载测试能够准确地模拟现实用户环境和预测Web应用的性能。 展开更多
关键词 WEB应用 负载测试 虚拟测试者 测试脚本 用户会话
下载PDF
Web使用挖掘中数据预处理算法的设计与实现 被引量:2
3
作者 李超锋 《中南民族大学学报(自然科学版)》 CAS 2007年第1期56-60,共5页
指出了数据预处理在Web使用挖掘中的重要性,详细分析了Web使用挖掘数据预处理过程,在每个数据预处理的每个阶段给出了一些规则并针对这些规则设计和实现了相应的预处理算法.实验结果证明这些算法是有效的.
关键词 WEB使用挖掘 WEB日志 数据预处理 用户会话
下载PDF
Web使用挖掘中数据预处理过程研究 被引量:6
4
作者 李超锋 杨殿生 许云 《电子测量技术》 2007年第3期3-5,共3页
Web使用挖掘是将数据挖掘技术应用于用户浏览Web时交互作用的二次数据以发现使用模式,从而达到更好地理解和服务基于Web应用的需要的目的。在将数据挖掘算法应用于从服务器日志收集来的数据之前必须要进行一些预处理工作。数据预处理就... Web使用挖掘是将数据挖掘技术应用于用户浏览Web时交互作用的二次数据以发现使用模式,从而达到更好地理解和服务基于Web应用的需要的目的。在将数据挖掘算法应用于从服务器日志收集来的数据之前必须要进行一些预处理工作。数据预处理就是把源数据转换为下一步应用数据挖掘算法所必须的数据抽象的过程。作为模式发现的数据源,数据预处理结果的质量直接影响着模式发现的最终结果。本文提出了几种可用于提高数据预处理性能的技术和方法。实验证明,这些技术和方法是有效的。最后,总结全文并提出了进一步的研究方向。 展开更多
关键词 WEB使用挖掘 WEB日志 数据预处理 用户会话
下载PDF
基于Web日志的频繁偏爱路径挖掘算法 被引量:3
5
作者 蔡俊 宋顺林 《计算机工程与设计》 CSCD 北大核心 2009年第24期5615-5617,5621,共4页
为了挖掘出更能如实反映Web用户兴趣偏好的使用模式,充分考虑了用户在页面的停留时间和点击次数两个因素,给出了频繁偏爱路径的定义,并提出了频繁偏爱路径的挖掘算法,该方法在求得最大向前路径的基础上,迭代产生更长的候选频繁偏爱路径... 为了挖掘出更能如实反映Web用户兴趣偏好的使用模式,充分考虑了用户在页面的停留时间和点击次数两个因素,给出了频繁偏爱路径的定义,并提出了频繁偏爱路径的挖掘算法,该方法在求得最大向前路径的基础上,迭代产生更长的候选频繁偏爱路径,通过计算候选路径的频繁偏爱支持度来判断其是否为频繁偏爱路径。利用真实日志数据进行实验,实验结果表明,该算法具有较高的覆盖率和准确性。 展开更多
关键词 数据挖掘 用户会话 频繁偏爱支持度 最大向前路径 频繁偏爱路径
下载PDF
基于概念分析的用户会话约减技术研究 被引量:3
6
作者 李心科 张磊磊 《计算机工程》 CAS CSCD 北大核心 2009年第7期61-63,共3页
基于用户会话的测试技术依赖于收集的用户会话数据集,数据集规模越大,测试效力就越强,但用于收集、储存和分析数据的成本也会迅速增加。该文提出一种在Web应用测试中对用户会话数据集进行约减的方法。运用概念分析技术聚类用户会话,从... 基于用户会话的测试技术依赖于收集的用户会话数据集,数据集规模越大,测试效力就越强,但用于收集、储存和分析数据的成本也会迅速增加。该文提出一种在Web应用测试中对用户会话数据集进行约减的方法。运用概念分析技术聚类用户会话,从中选取数据,再利用增量式的概念分析算法更新数据集。设计一个试验原型框架用于评估新方法的实际效果。 展开更多
关键词 用户会话 WEB应用测试 约减 概念分析
下载PDF
一种基于会话聚类算法的Web使用挖掘方法 被引量:4
7
作者 陈富赞 刘青 +1 位作者 李敏强 寇纪淞 《系统工程学报》 CSCD 北大核心 2012年第1期129-136,共8页
Web使用挖掘作为数据挖掘的一个重要任务,有助于了解用户群体的特征,从而为其提供个性化服务.提出了一种基于用户会话聚类的Web使用挖掘算法.首先,对Web日志预处理采用基于时间窗的用户会话识别方法,提出了一种基于三元组的用户会话表... Web使用挖掘作为数据挖掘的一个重要任务,有助于了解用户群体的特征,从而为其提供个性化服务.提出了一种基于用户会话聚类的Web使用挖掘算法.首先,对Web日志预处理采用基于时间窗的用户会话识别方法,提出了一种基于三元组的用户会话表示方法,并在此基础上给出了基于网页语义相似性的会话处理方法,该方法能够在保持用户兴趣不变的情况下有效降低会话维度;其次,提出了一种基于时间及频次的用户会话相似性度量方法;最后,设计了一种两阶段PS-KM会话聚类算法,先用PSO方法进行全局搜索再转入基于K-means方法的局部聚类过程.仿真表明了算法的有效性. 展开更多
关键词 WEB使用挖掘 WEB日志 用户会话 聚类
下载PDF
基于用户相似度计算的导航类意图分类研究 被引量:3
8
作者 任豪栋 贾年 《西华大学学报(自然科学版)》 CAS 2011年第3期101-106,共6页
针对用户会话相似度计算中,忽视了用户在某会话中对页面感兴趣的程度这一问题,提出了用户会话系数AvgI(p),并结合雅可比相似系数、CM系数给出了一种新的用户会话兴趣度的计算方法。在此基础之上,结合W eb内容、格式进一步对导航类查询... 针对用户会话相似度计算中,忽视了用户在某会话中对页面感兴趣的程度这一问题,提出了用户会话系数AvgI(p),并结合雅可比相似系数、CM系数给出了一种新的用户会话兴趣度的计算方法。在此基础之上,结合W eb内容、格式进一步对导航类查询用户意图的信息需求进行分析,并分类为直接导航和间接导航2类,给出了具体算法。实验结果表明,该算法不仅能很好地自动分类导航类用户意图,而且能基于该意图提供相关搜索结果以及进一步的搜索导航。 展开更多
关键词 WEB日志 数据挖掘 用户会话 相似度 导航意图
下载PDF
基于免疫聚类的Web日志挖掘 被引量:3
9
作者 吕佳 《重庆师范大学学报(自然科学版)》 CAS 2007年第2期32-35,共4页
Web日志挖掘旨在使用数据挖掘技术从Web服务器日志文件中挖掘出有用的规律和模式,以此改进网站结构以及实现Web个性化服务。本文提出基于免疫聚类的Web日志挖掘算法,利用人工免疫系统的基本原理来进行用户聚类分析,从而发现相似客户群... Web日志挖掘旨在使用数据挖掘技术从Web服务器日志文件中挖掘出有用的规律和模式,以此改进网站结构以及实现Web个性化服务。本文提出基于免疫聚类的Web日志挖掘算法,利用人工免疫系统的基本原理来进行用户聚类分析,从而发现相似客户群体、挖掘潜在客户。免疫聚类通过模拟免疫系统体液免疫应答的基本过程,提取出数据的基本特征,以此概括数据的分布特征,从而实现Web日志数据的无监督自组织聚类。通过在真实数据集上的实验证明了该算法的可行性和有效性。 展开更多
关键词 WEB日志挖掘 数据预处理 用户会话 免疫系统 免疫聚类
下载PDF
一种新的Web日志聚类算法的研究与实现 被引量:2
10
作者 王羽婷 徐维祥 +1 位作者 张翼 李华华 《现代电子技术》 2007年第24期139-142,共4页
传统的用于Web日志聚类的算法大都需要用户指定聚类个数。提出了一种新的自适应聚类算法并对Web日志用户会话进行聚类。该算法基于凝聚聚类思想和划分聚类思想,用初始数据集中每2个会话之间的相异度作为距离的度量,合并距离小于一定阈... 传统的用于Web日志聚类的算法大都需要用户指定聚类个数。提出了一种新的自适应聚类算法并对Web日志用户会话进行聚类。该算法基于凝聚聚类思想和划分聚类思想,用初始数据集中每2个会话之间的相异度作为距离的度量,合并距离小于一定阈值的两个会话以产生初始聚类,再根据一定的规则动态地合并距离最小的会话类或会话,算法的结果是产生自然的聚类。最后,通过比较会话聚类的内部距离和类间距离来验证算法的有效性。这种聚类算法的最大优点在于,他能够产生自动的聚类,而不需要用户事先指定需要产生的聚类个数,并且能有效识别孤立点。实验表明,这种聚类能够产生较高质量的聚类效果。 展开更多
关键词 相异度 凝聚聚类算法 自适应聚类算法 用户会话
下载PDF
基于全序列比对相似度的用户会话自动谱聚类 被引量:2
11
作者 姜大庆 周勇 《计算机科学》 CSCD 北大核心 2012年第11期142-144,148,共4页
针对现有个性化推荐服务系统中用户会话聚类算法存在相似性度量准确性低和需要事先确定聚类数目的问题,对序化的用户访问页面和对应的访问时间信息进行整合,提出一种基于动态规划算法的全序列比对方法来度量用户会话的相似性。在此基础... 针对现有个性化推荐服务系统中用户会话聚类算法存在相似性度量准确性低和需要事先确定聚类数目的问题,对序化的用户访问页面和对应的访问时间信息进行整合,提出一种基于动态规划算法的全序列比对方法来度量用户会话的相似性。在此基础上,运用改进的NJW谱聚类算法对用户会话进行自动谱聚类。实验结果表明,算法充分考虑了用户会话的整体特征和局部信息,较相关比对算法具有更高的聚类性能,可以提高网站个性化推荐服务的效率。 展开更多
关键词 全序列比对 相似度 用户会话 谱聚类 自动聚类
下载PDF
基于校园网的用户行为数据分析系统的设计
12
作者 严楠 刘涛 《计算机技术与发展》 2007年第1期239-241,244,共4页
数据分析系统是Web日志挖掘系统的一个重要组成部分,是模式分析的前序步骤,主要包括数据预处理和模式挖掘两个过程。数据预处理包括数据净化、用户会话识别和路径补充;模式挖掘包括事务识别、关联规则分析、序列模式分析、分类分析和聚... 数据分析系统是Web日志挖掘系统的一个重要组成部分,是模式分析的前序步骤,主要包括数据预处理和模式挖掘两个过程。数据预处理包括数据净化、用户会话识别和路径补充;模式挖掘包括事务识别、关联规则分析、序列模式分析、分类分析和聚类分析。在研究传统的分析方法的基础上,结合了一种改进的路径补充算法,经验证表明分析效率显著提高。 展开更多
关键词 数据预处理 用户会话 事务 关联规则 模式挖掘
下载PDF
基于Web日志的数据预处理研究 被引量:2
13
作者 金述强 蒋外文 《现代计算机》 2008年第10期64-66,98,共4页
详细介绍Web日志挖掘的数据预处理过程。通过对预处理的结果用户会话文件进行处理,构造出扩展有向树模型,并从每个用户会话文件中发现该用户所有的最大向前引用路径,为实施Web日志挖掘算法提供数据基础。
关键词 数据预处理 用户会话 扩展有向树 最大向前引用路径
下载PDF
基于用户会话的Web应用性能测试方法的研究 被引量:2
14
作者 梁力图 陆璐 《计算机科学》 CSCD 北大核心 2014年第11期46-49,68,共5页
近年来,Web应用成为互联网时代基础设施中最重要的组成部分。随着互联网技术的不断进步以及使用用户数量的不断增长,Web应用也越发变得复杂。为了保证Web应用性能测试的有效性和真实性,提出一种利用服务器日志中的用户会话信息、结合经... 近年来,Web应用成为互联网时代基础设施中最重要的组成部分。随着互联网技术的不断进步以及使用用户数量的不断增长,Web应用也越发变得复杂。为了保证Web应用性能测试的有效性和真实性,提出一种利用服务器日志中的用户会话信息、结合经过序列匹配算法改进的层次凝聚算法来自动产生Web应用性能测试脚本的方法。提出的方法通过从服务器日志中提取出用户会话信息,分析用户真实的访问模式,通过聚类算法将同类型的用户访问模式进行聚集,自动产生相应的测试请求序列,生成测试集。相比于传统的基于录制/回访的测试方法,基于用户会话的性能测试方法通过对用户会话进行聚类分析,还原实际的用户访问模式,减少了设计测试用例时的人工参与,保证了测试结果的有效性和真实性。 展开更多
关键词 用户会话 层次聚类 性能测试 有效性
下载PDF
基于用户访问模式的Web预取算法
15
作者 张晓丽 壮志剑 史明 《计算机工程与设计》 CSCD 北大核心 2009年第22期5109-5111,共3页
缩短Web访问中的用户感知时间,是Web应用中的一个重要问题,服务器需要预测用户未来的HTTP请求和处理当前的网页以提高Web服务器的响应速度,为此提出了一种基于用户访问模式的Web预取算法。该算法根据Web日志信息分析了用户的访问模式,... 缩短Web访问中的用户感知时间,是Web应用中的一个重要问题,服务器需要预测用户未来的HTTP请求和处理当前的网页以提高Web服务器的响应速度,为此提出了一种基于用户访问模式的Web预取算法。该算法根据Web日志信息分析了用户的访问模式,并计算出Web页面间的转移概率,以此作为对用户未来请求预取的依据。实验结果表明,该预取算法能有效提高预测精度和命中率,有效地缩短了用户的感知时间。 展开更多
关键词 用户感知时间 访问模式 预取 WEB日志 用户会话
下载PDF
User Session-Based Test Case Generation and Optimization Using Genetic Algorithm
16
作者 Zhongsheng Qian 《Journal of Software Engineering and Applications》 2010年第6期541-547,共7页
An approach to generating and optimizing test cases is proposed for Web application testing based on user sessions using genetic algorithm. A large volume of meaningful user sessions are obtained after purging their i... An approach to generating and optimizing test cases is proposed for Web application testing based on user sessions using genetic algorithm. A large volume of meaningful user sessions are obtained after purging their irrelevant information by analyzing user logs on the Web server. Most of the redundant user sessions are also removed by the reduction process. For test reuse and test concurrency, it divides the user sessions obtained into different groups, each of which is called a test suite, and then prioritizes the test suites and the test cases of each test suite. So, the initial test suites and test cases, and their initial executing sequences are achieved. However, the test scheme generated by the elementary prioritization is not much approximate to the best one. Therefore, genetic algorithm is employed to optimize the results of grouping and prioritization. Meanwhile, an approach to generating new test cases is presented using crossover. The new test cases can detect faults caused by the use of possible conflicting data shared by different users. 展开更多
关键词 user session GENETIC Algorithm TEST Case TEST SUITE Reduction PRIORITIZATION
下载PDF
基于用户会话Web应用程序测试的新方法 被引量:1
17
作者 李英 李劲华 《青岛大学学报(自然科学版)》 CAS 2015年第4期61-65,共5页
通过Web日志挖掘中的预处理对用户会话数据进行分析。采用基于URL迹的约减算法对基于用户会话的Web应用测试集进行约减,提出了一种对约减后的测试用例集的执行顺序进行优先排序再组合的测试方法。通过设计小型Web应用系统,证明执行经过... 通过Web日志挖掘中的预处理对用户会话数据进行分析。采用基于URL迹的约减算法对基于用户会话的Web应用测试集进行约减,提出了一种对约减后的测试用例集的执行顺序进行优先排序再组合的测试方法。通过设计小型Web应用系统,证明执行经过优先排序的测试用例集,能较快发现错误,再考虑多用户的交互进行组合,减少了测试用例数目,提高了故障检测率,测试效率大大提高。 展开更多
关键词 用户会话 WEB应用 数据预处理 约减 优先排序 组合
下载PDF
一种新的可扩展用户浏览兴趣表示模型
18
作者 鲜学丰 杨雪 《计算机工程与应用》 CSCD 北大核心 2007年第20期184-186,232,共4页
在分析Web使用挖掘中现有用户浏览兴趣表示方法的特点和不足基础上,针对现有方法表示用户浏览兴趣准确性不高的缺点,提出了一种新的可扩展用户浏览兴趣表示模型(SIM),并且给出了SIM的数据结构、SIM表示用户浏览兴趣的方法。以真实数据... 在分析Web使用挖掘中现有用户浏览兴趣表示方法的特点和不足基础上,针对现有方法表示用户浏览兴趣准确性不高的缺点,提出了一种新的可扩展用户浏览兴趣表示模型(SIM),并且给出了SIM的数据结构、SIM表示用户浏览兴趣的方法。以真实数据进行了实验分析,实验结果表明,SIM与现有方法相比有效地提高了表示用户浏览兴趣的准确性。 展开更多
关键词 WEB使用挖掘 用户浏览兴趣 用户会话
下载PDF
测试用例集的双优排序研究
19
作者 陈欣 高建华 《计算机研究与发展》 EI CSCD 北大核心 2010年第S1期311-315,共5页
Web测试集排序技术是在满足一定的测试覆盖标准下,对测试用例进行择优排序,从而快速获取最优符合测试目的的测试用例,大大提高测试检错效率.提出了一种双优排序策略,对基于用户会话的Web测试集进行排序,并提出了相应的评估方法以及双优... Web测试集排序技术是在满足一定的测试覆盖标准下,对测试用例进行择优排序,从而快速获取最优符合测试目的的测试用例,大大提高测试检错效率.提出了一种双优排序策略,对基于用户会话的Web测试集进行排序,并提出了相应的评估方法以及双优排序算法.最后,通过一个小型Web程序,证明算法的有效性. 展开更多
关键词 用户会话 WEB测试 双优排序
下载PDF
基于用户会话的Web测试集约简
20
作者 陈欣 高建华 《计算机工程》 CAS CSCD 北大核心 2011年第6期35-37,40,共4页
采用概念分析法对基于用户会话的Web应用测试集进行约简提出一种K层节点测试约简技术,设计测试用例的增量更新算法。该算法通过比较新增节点与概念分析中原来存在节点的内涵元素,对原概念格图进行节点更新或补充。通过设计的小型Web注... 采用概念分析法对基于用户会话的Web应用测试集进行约简提出一种K层节点测试约简技术,设计测试用例的增量更新算法。该算法通过比较新增节点与概念分析中原来存在节点的内涵元素,对原概念格图进行节点更新或补充。通过设计的小型Web注册系统,证明了该方法的有效性。 展开更多
关键词 用户会话 概念分析 WEB应用 测试集约简 增量更新
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部