期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于移动互联网日志的搜索引擎用户行为研究 被引量:15
1
作者 万飞 赵溪 +2 位作者 梁循 潘登 倪志豪 《中文信息学报》 CSCD 北大核心 2014年第2期144-150,共7页
随着移动互联网的迅速发展,移动搜索用户大规模增加,移动搜索引擎用户行为分析对改进搜索引擎性能,提高用户体验具有重要意义。该文选取某移动搜索引擎2011年6月第一周的日志,对移动互联网用户搜索行为进行分析和研究。我们从查询词分... 随着移动互联网的迅速发展,移动搜索用户大规模增加,移动搜索引擎用户行为分析对改进搜索引擎性能,提高用户体验具有重要意义。该文选取某移动搜索引擎2011年6月第一周的日志,对移动互联网用户搜索行为进行分析和研究。我们从查询词分析、会话分析以及用户点击分析3个角度出发,对查询词长度和频度、问题式查询和网址查询比例、会话内查询个数、查询词修改方式以及用户点击位置进行研究,并与互联网搜索引擎相应指标进行对比。相关分析结论对于移动搜索引擎算法改进与系统优化具有一定参考意义。 展开更多
关键词 移动搜索引擎 搜索引擎日志 用户行为分析
下载PDF
基于搜索引擎日志分析的网络舆情监测方法研究 被引量:10
2
作者 唐涛 《情报杂志》 CSSCI 北大核心 2012年第8期27-30,26,共5页
通过分析搜索引擎的日志,可以发现用户感兴趣的查询内容,进而发现网络舆情。提出了基于搜索引擎日志分析的网络舆情监测方法的模型,研究了该模型的关键技术。这是对传统的网络舆情监测方法的补充。
关键词 舆情 舆情监测 网络舆情 日志分析 搜索引擎日志 网络挖掘
下载PDF
基于搜索日志的用户行为分析 被引量:6
3
作者 童国平 孙建军 《现代图书情报技术》 CSSCI 2015年第7期80-88,共9页
【目的】利用搜索引擎日志数据对用户查询行为特征进行分析。【方法】采用分词、统计分析、聚类分析、可视化等方法,分别从用户的查询串、查询方式、查询主题、查询点击行为和用户类型5个方面对用户使用搜索引擎时的行为特征进行分析。... 【目的】利用搜索引擎日志数据对用户查询行为特征进行分析。【方法】采用分词、统计分析、聚类分析、可视化等方法,分别从用户的查询串、查询方式、查询主题、查询点击行为和用户类型5个方面对用户使用搜索引擎时的行为特征进行分析。【结果】发现搜索用户偏好使用2-5个中文名词短语组成的查询串;更少使用口语化查询,不爱使用高级检索功能;查询用词变得多样化;查询时间存在高峰低谷;再次证实存在"翘尾现象"。【局限】使用的数据量不够大,没有结合用户详细信息进行分析。【结论】使用搜索引擎日志可以获得用户行为特征,并能为改善搜索引擎提供一些建议。 展开更多
关键词 搜索引擎日志 查询日志 用户行为分析 日志挖掘
原文传递
基于搜索引擎日志的中文纠错方法研究 被引量:4
4
作者 杨苏稳 张晓如 《软件导刊》 2020年第6期182-187,共6页
针对用户使用搜索引擎输入关键词查询信息时,由于输入法的原因或者不小心输入错误关键词等,致使搜索结果不符合用户预期的问题,提出基于搜索引擎日志的中文纠错方法。首先对用户网络日志展开研究,对数据进行预处理,将用户常见错误分为... 针对用户使用搜索引擎输入关键词查询信息时,由于输入法的原因或者不小心输入错误关键词等,致使搜索结果不符合用户预期的问题,提出基于搜索引擎日志的中文纠错方法。首先对用户网络日志展开研究,对数据进行预处理,将用户常见错误分为两大类:一类为拼音引起的错误,针对该类错误,参考并改进了基于拼音索引的中文模糊匹配算法进行纠错;另一类为多字、少字、异位及别字引起的错误,针对该类错误,设计了模糊匹配方法结合最小编辑距离方法进行纠错。经过实验验证,证明了该纠错方法的有效性,该方法能够一定程度上提升用户体验,满足实际工程需要。 展开更多
关键词 搜索引擎日志 中文纠错 模糊匹配 最小编辑距离
下载PDF
搜索引擎日志中“N_1+N_2+V”型名词短语研究 被引量:3
5
作者 肖诗斌 赵红改 +1 位作者 王洪俊 吕学强 《广西师范大学学报(自然科学版)》 CAS 北大核心 2011年第1期116-122,共7页
"N1+N2+V"结构是组成名词短语的一种基本形式。本文基于搜狗日志语料,对搜索引擎日志中的"N1+N2+V"型名词短语进行研究。针对语料自身的特点,从句法特征、短语的层次切分与拆分、句法功能和语义关系4方面,对这类短... "N1+N2+V"结构是组成名词短语的一种基本形式。本文基于搜狗日志语料,对搜索引擎日志中的"N1+N2+V"型名词短语进行研究。针对语料自身的特点,从句法特征、短语的层次切分与拆分、句法功能和语义关系4方面,对这类短语进行了考察,着重分析了N1与N2、N2与V的语义关系。文中对搜狗日志的查询内容进行了深入分析和实证,为搜索引擎用短语词典的构建研究提供理论依据。 展开更多
关键词 “N1+N2+V”结构 搜索引擎日志 句法特征 句法功能 语义关系
下载PDF
基于用户浏览时间的点击模型 被引量:3
6
作者 何靖 袁文清 闫宏飞 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第4期26-31,37,共7页
用户的点击行为会受到用户的浏览行为、周围文档的特征等因素的影响,故在分析用户点击日志时不能直接将用户点击解释为文档相关性.为了更加准确地获得文档的相关性特征,文中提出了基于用户浏览时间的点击模型.假设文档原文的相关性会影... 用户的点击行为会受到用户的浏览行为、周围文档的特征等因素的影响,故在分析用户点击日志时不能直接将用户点击解释为文档相关性.为了更加准确地获得文档的相关性特征,文中提出了基于用户浏览时间的点击模型.假设文档原文的相关性会影响用户浏览该文档原文的时间,即文档越相关用户浏览文档的耗时越长,这样便可利用用户浏览文档的时间来推测文档的相关程度;经过分析,确定使用指数分布来描述浏览时间;最后通过实验验证了该模型的有效性.结果表明,所提出的模型能够比较好地估计文档的相关性,更加准确地预测用户的点击情况,其性能优于现有的点击模型. 展开更多
关键词 搜索引擎日志 点击模型 文档相关性特征 浏览时间
下载PDF
一种搜索引擎日志分析的网络舆情监测探究 被引量:2
7
作者 邓双祥 《网络安全技术与应用》 2014年第7期177-177,179,共2页
近几年来,随着互联网信息技术的不断发展,电脑已得到广泛普及。而网民逐渐开始应用网络论坛、博客、微博纷纷对社会事务发表看法,由此而形成网络舆情,已成为社会舆情的重要表现形式。由于网络舆情具有传播速度快、范围广且突发的特点,... 近几年来,随着互联网信息技术的不断发展,电脑已得到广泛普及。而网民逐渐开始应用网络论坛、博客、微博纷纷对社会事务发表看法,由此而形成网络舆情,已成为社会舆情的重要表现形式。由于网络舆情具有传播速度快、范围广且突发的特点,加强其监测已受到政府部门的重视。本文特提出一种搜索引擎日志分析的网络舆情监测方法,以望对后期网络舆情监测工作提供参考借鉴。 展开更多
关键词 搜索引擎日志 网络舆情 监测
原文传递
搜索引擎日志中“N+V”和“N_1+N_2+V”型短语自动识别 被引量:2
8
作者 赵红改 吕学强 +1 位作者 施水才 郑丽 《中文信息学报》 CSCD 北大核心 2012年第5期20-25,共6页
正确识别搜索引擎日志中的短语,对搜索引擎用短语词典构建和提高搜索引擎性能具有重要的作用。该文提出一种应用条件随机场实现对搜狗日志语料中"N+V"和"N1+N2+V"型短语自动识别的方法。模型的特征集包含词、词性... 正确识别搜索引擎日志中的短语,对搜索引擎用短语词典构建和提高搜索引擎性能具有重要的作用。该文提出一种应用条件随机场实现对搜狗日志语料中"N+V"和"N1+N2+V"型短语自动识别的方法。模型的特征集包含词、词性和词语长度。由人工设计候选特征集,从中选择有效的特征构成特征模板,训练生成用于短语自动识别的条件随机场模型。封闭测试和开放测试的实验结果表明,模型能够实现对这两种短语的有效识别。 展开更多
关键词 条件随机场模型 搜索引擎日志 “N+V”型短语 "N1+N2+V"型短语 特征模板
下载PDF
基于用户行为分析的校园网搜索引擎排序方法 被引量:2
9
作者 杨岳湘 苏国荣 邓劲生 《计算机工程》 CAS CSCD 北大核心 2010年第24期275-277,共3页
为提高校园网搜索引擎的查准率,提出一种新的校园网搜索引擎排序方法。该方法基于用户查询主题、用户浏览时间和页面点击等用户行为特征,计算新的页面相关度得分,改进搜索引擎的排序结果,为用户提供更准确的查询服务。实验结果表明,在... 为提高校园网搜索引擎的查准率,提出一种新的校园网搜索引擎排序方法。该方法基于用户查询主题、用户浏览时间和页面点击等用户行为特征,计算新的页面相关度得分,改进搜索引擎的排序结果,为用户提供更准确的查询服务。实验结果表明,在不降低查全率的情况下,应用该排序方法的查准率有明显提高。 展开更多
关键词 校园网 搜索引擎日志 用户行为
下载PDF
搜索引擎日志中“N+V+N”、“V+N+N”型短语识别 被引量:1
10
作者 郑丽 吕学强 《计算机工程与应用》 CSCD 2013年第6期143-147,155,共6页
短语识别是进行短语分析的前期准备工作。针对搜索引擎日志中"N+V+N"、"V+N+N"型短语特点,采用最大熵方法,按词信息、词性信息、音节数及前位标记信息提取特征构建训练集,得到最大熵方法进行短语识别的机器学习模... 短语识别是进行短语分析的前期准备工作。针对搜索引擎日志中"N+V+N"、"V+N+N"型短语特点,采用最大熵方法,按词信息、词性信息、音节数及前位标记信息提取特征构建训练集,得到最大熵方法进行短语识别的机器学习模型。实验结果显示,利用最大熵方法对两种短语进行开放性测试,两种短语的识别F值分别达到85.78%和76.47%,取得了较好的自动识别效果,在半开放性测试中,其识别结果更佳。 展开更多
关键词 短语识别 搜索引擎日志 N+V+N”“ V+N+N” 最大熵方法
下载PDF
搜索引擎日志中“N+V+N”和“V+N+N”型短语功能类别识别
11
作者 郑丽 吕学强 施水才 《计算机应用与软件》 CSCD 北大核心 2012年第9期112-116,125,共6页
采用支持向量机(SVM)方法实现搜索引擎日志中"N+V+N"、"V+N+N"型短语功能类别识别。通过选取不同特征,构建多特征模板,实现对"N+V+N"、"V+N+N"型短语中名词短语、动词短语、主谓短语三种功能... 采用支持向量机(SVM)方法实现搜索引擎日志中"N+V+N"、"V+N+N"型短语功能类别识别。通过选取不同特征,构建多特征模板,实现对"N+V+N"、"V+N+N"型短语中名词短语、动词短语、主谓短语三种功能短语的自动识别,并且针对不同词性标注集对实验结果是否有影响进行了实验。实验结果显示,SVM在搜索引擎日志短语识别中有很高的识别率。 展开更多
关键词 支持向量机 搜索引擎日志 “N+V+N” “V+N+N” 功能类别
下载PDF
高校网络舆情监测方法:一种基于搜索引擎查询日志的研究 被引量:10
12
作者 殷姿 《黑龙江高教研究》 CSSCI 北大核心 2014年第6期64-67,共4页
网络舆情监测已经成为国内外学术研究的热点,然而聚焦于高校网络舆情监测的研究还处于起步阶段。通过相关文献研究发现,网络舆情走向与网民利用搜索引擎的搜索行为有着相互影响的关系。因此,文章提出了一种基于搜索引擎查询日志的高校... 网络舆情监测已经成为国内外学术研究的热点,然而聚焦于高校网络舆情监测的研究还处于起步阶段。通过相关文献研究发现,网络舆情走向与网民利用搜索引擎的搜索行为有着相互影响的关系。因此,文章提出了一种基于搜索引擎查询日志的高校网络舆情监测方法,并阐述了其实现的基本步骤,以期为高校网络舆情监测提供了一种新的思路。 展开更多
关键词 高校网络舆情 搜索引擎查询日志 舆情监测
下载PDF
搜索引擎查询日志的聚类 被引量:5
13
作者 张玉连 李彦威 +1 位作者 王权 原福永 《计算机工程》 CAS CSCD 北大核心 2009年第1期43-45,48,共4页
随着搜索引擎技术和网络数据挖掘技术的发展,怎样从搜索引擎查询日志中找到有用的信息成为研究热点。该文在讨论Beeferman提出的算法及Chan对其改进的算法的优缺点后,提出一个基于用户网页兴趣度的改进算法。该算法能进一步减小噪声数... 随着搜索引擎技术和网络数据挖掘技术的发展,怎样从搜索引擎查询日志中找到有用的信息成为研究热点。该文在讨论Beeferman提出的算法及Chan对其改进的算法的优缺点后,提出一个基于用户网页兴趣度的改进算法。该算法能进一步减小噪声数据的影响,并通过模拟实验对3种不同的算法进行了对比。 展开更多
关键词 用户兴趣 搜索引擎查询日志 数据挖掘
下载PDF
搜索引擎查询日志中的聚类算法研究 被引量:1
14
作者 勾海波 欧阳为民 徐春荣 《计算机应用与软件》 CSCD 北大核心 2007年第3期145-147,共3页
近年来,随着网络数据挖掘技术的迅猛发展,如何从搜索引擎查询日志中找到有用的信息成为一个重要的研究方向。首先详细讨论了Beeferman提出的针对搜索引擎查询日志的凝聚式聚类算法以及噪声数据对该算法的影响,指出了Chan的改进算法中的... 近年来,随着网络数据挖掘技术的迅猛发展,如何从搜索引擎查询日志中找到有用的信息成为一个重要的研究方向。首先详细讨论了Beeferman提出的针对搜索引擎查询日志的凝聚式聚类算法以及噪声数据对该算法的影响,指出了Chan的改进算法中的一个错误,最后提出一个新的改进算法,并且通过模拟实验对几种不同的算法进行了对比。 展开更多
关键词 网络数据挖掘 搜索引擎查询日志 聚合式聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部