期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
基于OPTICS可达图的自动识别簇方法 被引量:7
1
作者 党秋月 陆月明 《计算机应用》 CSCD 北大核心 2012年第A02期19-21,47,共4页
针对主题特征不明显的搜索结果聚类的问题,提出了基于OPTICS(Ordering Points To Identify theClustering Structure)可达图的自动识别簇的Smooth方法。首先利用OPTICS算法得到搜索结果的可达图,然后采用移动平均法平滑掉可达图曲线中... 针对主题特征不明显的搜索结果聚类的问题,提出了基于OPTICS(Ordering Points To Identify theClustering Structure)可达图的自动识别簇的Smooth方法。首先利用OPTICS算法得到搜索结果的可达图,然后采用移动平均法平滑掉可达图曲线中的毛刺,最后识别其中的峰值以划分各个凹陷区域,即得到聚类结果。在搜索结果数据集上的实验结果表明,Smooth方法的准确率较已有的方法平均提高了100%左右。Smooth方法能够与OPTICS算法结合应用于搜索引擎中,对搜索结果进行聚类处理,有效地提高其可浏览性。 展开更多
关键词 0VIICS 聚类 搜索结果 可达图
下载PDF
基于搜索结果的预取技术研究 被引量:2
2
作者 尹春天 古志民 廖祥文 《计算机应用》 CSCD 北大核心 2004年第1期48-50,共3页
搜索引擎往往返回给用户一个包含大量文档片段的列表 ,用户从中筛选出自己所需要的文档。文中提出一种预取代理的方法 :对搜索引擎返回的结果进行聚类分析 ,使得用户以主题的方式来查看结果 ,满足用户搜索请求的个性化服务 ;同时对聚类... 搜索引擎往往返回给用户一个包含大量文档片段的列表 ,用户从中筛选出自己所需要的文档。文中提出一种预取代理的方法 :对搜索引擎返回的结果进行聚类分析 ,使得用户以主题的方式来查看结果 ,满足用户搜索请求的个性化服务 ;同时对聚类进行评价 ,推测出用户可能感兴趣的文档 ,并将它们预取过来 ,从而减少网络延迟。 展开更多
关键词 搜索结果 聚类 预取
下载PDF
一个基于搜索结果的个性化推荐系统 被引量:3
3
作者 杨海涛 石磊 卫琳 《计算机工程与应用》 CSCD 北大核心 2006年第32期150-153,共4页
搜索引擎返回的结果太多且不能根据用户的兴趣提供检索结果是当前较受关注的问题。把用户兴趣模型和STC聚类算法相结合,提出了改进的STC算法,并提出个性化推荐的策略和兴趣描述更新的方法,实现了一个基于搜索结果的个性化推荐系统(SRPRS... 搜索引擎返回的结果太多且不能根据用户的兴趣提供检索结果是当前较受关注的问题。把用户兴趣模型和STC聚类算法相结合,提出了改进的STC算法,并提出个性化推荐的策略和兴趣描述更新的方法,实现了一个基于搜索结果的个性化推荐系统(SRPRS)。SRPRS基于改进的STC算法自动组织搜索结果,帮助用户利用主题的方式发现所需的资源。通过实验,分析了SRPRS系统的聚类特性和时间特性。针对搜索引擎的列表显示结果,SRPRS系统在快速查找用户感兴趣的文档上有较好的性能。 展开更多
关键词 搜索结果 聚类 兴趣描述 个性化推荐
下载PDF
基于搜索结果的个性化推荐系统研究 被引量:3
4
作者 卫琳 《计算机技术与发展》 2007年第9期65-67,70,共4页
搜索引擎返回的信息太多且不能根据用户的兴趣提供检索结果,使得用户使用搜索引擎难以用简便的方式找到感兴趣的文档。个性化推荐是一种旨在减轻用户在信息检索方面负担的有效方法。文中把内容过滤技术和文档聚类技术相结合,实现了一个... 搜索引擎返回的信息太多且不能根据用户的兴趣提供检索结果,使得用户使用搜索引擎难以用简便的方式找到感兴趣的文档。个性化推荐是一种旨在减轻用户在信息检索方面负担的有效方法。文中把内容过滤技术和文档聚类技术相结合,实现了一个基于搜索结果的个性化推荐系统,以聚类的方法自动组织搜索结果,主动推荐用户感兴趣的文档。通过建立用户概率兴趣模型,对搜索结果STC聚类的基础上进行内容过滤。实验表明,概率模型比矢量空间模型更好地表达了用户的兴趣和变化。 展开更多
关键词 搜索结果 聚类 个性化推荐 概率模型
下载PDF
元数据描述对搜索引擎排序结果影响研究 被引量:3
5
作者 邢博 《现代情报》 CSSCI 2010年第5期163-166,共4页
基于元数据描述在搜索引擎排序算法中权重及对排序结果的影响越来越小这一问题,本文首先分析了元数据标签的存在价值及其对检索结果优化本应起到的作用,并对如何优化元数据标签,使其更好的揭示网页内容与特定主题的相关度这一问题进行... 基于元数据描述在搜索引擎排序算法中权重及对排序结果的影响越来越小这一问题,本文首先分析了元数据标签的存在价值及其对检索结果优化本应起到的作用,并对如何优化元数据标签,使其更好的揭示网页内容与特定主题的相关度这一问题进行了讨论。其次,在分析的基础上,通过实证研究的方法,利用不同主题范围的检索词在搜索引擎检索的结果,对元数据在搜索引擎当中的实际使用和优化情况进行了统计调查和建模分析,借此,考察元数据描述对搜索引擎排序结果的实际影响和意义,并提出了未来元数据描述在网页编写及搜索结果排序中应注意的问题。 展开更多
关键词 元数据标签 搜索引擎 HTML 搜索结果 信息组织
下载PDF
基于网页聚类的搜索结果优化算法研究 被引量:3
6
作者 沈盈洪 丰翔龙 黄荣游 《计算机应用》 CSCD 北大核心 2010年第A01期51-53,共3页
针对目前搜索引擎搜索结果中普遍存在大量重复网页的现象,提出了一种基于聚类算法DBSCAN的搜索结果优化算法。该算法选取源搜索结果中排名靠前的部分网页,对这部分网页根据网页相似度进行DBSCAN聚类,最大限度剔除冗余网页,实现搜索结果... 针对目前搜索引擎搜索结果中普遍存在大量重复网页的现象,提出了一种基于聚类算法DBSCAN的搜索结果优化算法。该算法选取源搜索结果中排名靠前的部分网页,对这部分网页根据网页相似度进行DBSCAN聚类,最大限度剔除冗余网页,实现搜索结果的优化。实验结果表明本算法可以提高搜索结果的全面性和准确性,提升用户使用搜索引擎的满意度。 展开更多
关键词 网页相似度 聚类 搜索结果 DBSCAN算法 重复网页
下载PDF
搜索引擎的Linkflux技术
7
作者 陈志新 肖明 《数字图书馆论坛》 2006年第6期50-51,61,共3页
Linkflux技术是Pagerank的重要修正参数,体现搜索引擎高度重视用户体验的发展倾向,Linkflux通过链系分析、Toolbar产品和搜索结果计数器三种方式实现,能够帮助搜索引擎实现个性化搜索和检索结果二次验证等功能。
关键词 Linkflux技术 搜索引擎 用户体验
下载PDF
BP神经网络在查询结果排名中的应用
8
作者 刘晓 《微型机与应用》 2012年第5期87-88,共2页
介绍了利用BP神经网络对查询结果进行排名,通过了解人们在得到搜索结果以后都点了哪些链接,BP神经网络会将搜索过程与搜索结果关联起来,利用这些信息来改变搜索结果的排列顺序,让用户得到更好的搜索体验。
关键词 神经网络 BP算法 搜索结果 排名
下载PDF
搜索引擎的排序技术研究 被引量:23
9
作者 杨思洛 《现代图书情报技术》 CSSCI 北大核心 2005年第1期43-47,共5页
提出按搜索引擎的排序技术把搜索引擎分为三代,介绍了主要的几种搜索引擎排序技术,并对第 三代搜索引擎的发展进行了分析。
关键词 搜索引擎 排序 词频和位置统计 PAGERANK HillTop 竞价排名 智能化排序
下载PDF
一种层次化的检索结果聚类方法 被引量:15
10
作者 张刚 刘悦 +1 位作者 郭嘉丰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2008年第3期542-547,共6页
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别... 检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高. 展开更多
关键词 信息检索 检索结果聚类 层次化聚类 文本聚类 聚类
下载PDF
大学生生涯适应力、求职自我效能感与求职行为和求职结果的关系 被引量:9
11
作者 张芳 《中国大学生就业》 2018年第6期34-41,共8页
本研究将大学毕业生的求职行为以及求职结果作为重点关注变量,从生涯适应力入手,探讨大学生的生涯适应力水平与求职行为和求职结果之间的关系,以及求职行为在生涯适应力水平与求职结果之间所起到的作用,从求职自我效能感的角度,探讨求... 本研究将大学毕业生的求职行为以及求职结果作为重点关注变量,从生涯适应力入手,探讨大学生的生涯适应力水平与求职行为和求职结果之间的关系,以及求职行为在生涯适应力水平与求职结果之间所起到的作用,从求职自我效能感的角度,探讨求职自我效能感在生涯适应力与求职行为间发挥的调节作用。 展开更多
关键词 生涯适应力 求职行为 求职结果 求职自我效能感
原文传递
医疗类社会化搜索答案质量用户满意度模型及实证研究 被引量:5
12
作者 韩文婷 朱庆华 白玫 《现代情报》 CSSCI 2018年第7期12-18,53,共8页
社会化搜索是一种新兴的、基于Web2.0框架的搜索模式,在此模式基础上的医疗类社会化搜索平台目前已成为缓解医疗资源紧张的重要手段之一。本文基于健康信念模型和顾客满意度模型,以用户为中心,结合当前的时代背景,构建医疗类社会化搜索... 社会化搜索是一种新兴的、基于Web2.0框架的搜索模式,在此模式基础上的医疗类社会化搜索平台目前已成为缓解医疗资源紧张的重要手段之一。本文基于健康信念模型和顾客满意度模型,以用户为中心,结合当前的时代背景,构建医疗类社会化搜索答案质量用户满意度模型,并通过问卷调研修正模型。研究发现:医疗类社会化搜索平台答案的来源质量对健康行为期望和健康威胁感知均有显著影响,是最具影响力的一个质量维度;情感质量对用户的自我效能影响显著;健康行为期望和健康威胁感知对感知价值的影响高于对满意度的影响;而感知价值和自我效能是影响用户满意度的关键指标。 展开更多
关键词 社会化搜索 医疗类社会化搜索平台 搜索答案质量 用户满意度模型 健康信念模型
下载PDF
基于潜在语义索引和自组织映射网的检索结果聚类方法 被引量:4
13
作者 陈毅恒 秦兵 +2 位作者 刘挺 王平 李生 《计算机研究与发展》 EI CSCD 北大核心 2009年第7期1176-1183,共8页
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检... 随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高. 展开更多
关键词 检索结果聚类 潜在语义索引 自组织映射网 标签 边界划分
下载PDF
基于Word2Vec模型特征扩展的Web搜索结果聚类性能的改进 被引量:5
14
作者 杨楠 李亚平 《计算机应用》 CSCD 北大核心 2019年第6期1701-1706,共6页
对于用户泛化和模糊的查询,将Web搜索引擎返回的列表内容聚类处理,便于用户有效查找感兴趣的内容。由于返回的列表由称为片段(snippet)的短文本组成,而传统的单词频率-逆文档频率(TF-IDF)特征选择模型不能适用于稀疏的短文本,使得聚类... 对于用户泛化和模糊的查询,将Web搜索引擎返回的列表内容聚类处理,便于用户有效查找感兴趣的内容。由于返回的列表由称为片段(snippet)的短文本组成,而传统的单词频率-逆文档频率(TF-IDF)特征选择模型不能适用于稀疏的短文本,使得聚类性能下降。一个有效的方法就是通过一个外部的知识库对短文本进行扩展。受到基于神经网络词表示方法的启发,提出了通过词嵌入技术的Word2Vec模型对短文本扩展,即采用Word2Vec模型的TopN个最相似的单词用于对片段(snippet)的扩展,扩展文档使得TF-IDF模型特征选择得到聚类性能的提高。同时考虑到通用性单词造成的噪声引入,对扩展文档的TF-IDF矩阵进行了词频权重修正。实验在两个公开数据集ODP239和SearchSnippets上完成,将所提方法和纯snippet无扩展的方法、基于Wordnet的特征扩展方法和基于Wikipedia的特征扩展方法进行了对比。实验结果表明,所提方法在聚类性能方面优于对比方法。 展开更多
关键词 特征扩展 片段 词嵌入技术 搜索结果聚类
下载PDF
数据融合在搜索结果多元化上的应用 被引量:4
15
作者 黄春兰 吴胜利 《山东大学学报(理学版)》 CAS CSCD 北大核心 2015年第1期31-36,共6页
信息检索系统不仅需要考虑文档的相关性,还要考虑文档的多样性和新颖性。针对信息检索结果的多元化问题,探讨了数据融合方法在搜索结果多元化上的适用性。针对线性组合方法,重新考察了成员系统的权重分配策略。通过考虑成员检索系统的... 信息检索系统不仅需要考虑文档的相关性,还要考虑文档的多样性和新颖性。针对信息检索结果的多元化问题,探讨了数据融合方法在搜索结果多元化上的适用性。针对线性组合方法,重新考察了成员系统的权重分配策略。通过考虑成员检索系统的有效性和成员检索系统之间的差异性,提出了一种比较简单方便的基于集合覆盖率的方法,使得采用这种权重分配方式的线性组合方法在结果的多样性上能够有所改善。实验采用了3组来自于TREC文本检索会议的针对Web检索多样化任务的数据,实验结果表明在多样性方面,所提出的数据融合方法均能提高检索结果的性能,优于最佳的成员检索系统。 展开更多
关键词 数据融合 检索结果多元化 线性组合 权重分配
原文传递
使用超链分析技术的搜索引擎 被引量:2
16
作者 吴江 《图书情报工作》 CSSCI 北大核心 2004年第7期78-81,共4页
论述使用超链分析技术的搜索引擎的工作原理;以Google为例分析如何提高网站在搜索结果中的排名;最后介绍国 内使用超链分析技术的搜索引擎。
关键词 搜索引擎 超链分析技术 网站排名 PAGERANK
原文传递
基于词间语义相关度的搜索结果聚类算法 被引量:2
17
作者 沙芸 张国英 《郑州大学学报(理学版)》 CAS 北大核心 2009年第1期73-76,共4页
将查询结果根据内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统聚类方法难以准确计算其相似度.提出了一种基于词间语义相关度的搜索结果聚类算法,该算法以词为聚类的核... 将查询结果根据内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统聚类方法难以准确计算其相似度.提出了一种基于词间语义相关度的搜索结果聚类算法,该算法以词为聚类的核心,词所出现的文档为词的属性,根据词在搜索结果文档中共现的情况来划分类别.该方法可以充分利用词间的语义相关性,类别划分后即可确定类名.实验结果表明,对搜索结果聚类时与K-Means和STC算法相比,质量上有所提高. 展开更多
关键词 搜索结果聚类 词间语义相关度 文档相似度
下载PDF
Search Result Diversification Based on Query Facets
18
作者 胡莎 窦志成 +1 位作者 王晓捷 文继荣 《Journal of Computer Science & Technology》 SCIE EI CSCD 2015年第4期888-901,共14页
In search engines, different users may search for different information by issuing the same query. To satisfy more users with limited search results, search result diversification re-ranks the results to cover as many... In search engines, different users may search for different information by issuing the same query. To satisfy more users with limited search results, search result diversification re-ranks the results to cover as many user intents as possible. Most existing intent-aware diversification algorithms recognize user intents as subtopics, each of which is usually a word, a phrase, or a piece of description. In this paper, we leverage query facets to understand user intents in diversification, where each facet contains a group of words or phrases that explain an underlying intent of a query. We generate subtopics based on query facets and propose faceted diversification approaches. Experimental results on the public TREC 2009 dataset show that our faceted approaches outperform state-of-the-art diversification models. 展开更多
关键词 query intent query facet search result diversification
原文传递
2002~2007年国外对搜索引擎检索结果研究综述 被引量:1
19
作者 曹超 《图书情报知识》 CSSCI 北大核心 2009年第1期90-96,共7页
本文通过文献调查,对2002~2007年国外关于搜索引擎检索结果研究的文献进行了概述与分析,从搜索引擎检索结果覆盖面、重叠性、相关性三个方面,对搜索引擎检索结果覆盖面的评价、影响因素及改进方法,搜索引擎检索结果重叠性的评价,搜索... 本文通过文献调查,对2002~2007年国外关于搜索引擎检索结果研究的文献进行了概述与分析,从搜索引擎检索结果覆盖面、重叠性、相关性三个方面,对搜索引擎检索结果覆盖面的评价、影响因素及改进方法,搜索引擎检索结果重叠性的评价,搜索引擎检索结果相关性的评价、页面排序算法及文本分析方法对搜索引擎检索结果相关性的影响及改进作用、搜索引擎检索结果相关性的其他影响因素作一个综述,以期了解国外的研究态势,供国内的后续研究参考。 展开更多
关键词 国外 搜索引擎 检索结果 综述
下载PDF
基于关键名词短语聚类的中文搜索结果聚类 被引量:1
20
作者 麻雪云 肖诗斌 +1 位作者 王弘蔚 施水才 《计算机工程与应用》 CSCD 北大核心 2009年第31期118-121,共4页
目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,... 目前,搜索结果聚类方法大多数采用基于文档的方法,不能生成有意义的聚类标签。为了解决这个问题,提出一种基于关键名词短语聚类的中文搜索结果聚类方法,该方法将名词短语、相关搜索词作为候选聚类标签,利用C-Value算法、IDF值筛选标签,然后使用Chameleon算法将标签聚类,最后将搜索结果划分到最相关的聚类簇。实验证明,该方法把关键名词短语和相关搜索词作为聚类标签,有效地提高了标签的描述性,降低了聚类算法的时间复杂度。 展开更多
关键词 搜索结果聚类 关键名词短语抽取 C-Value算法 CHAMELEON算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部