期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
数据融合在搜索结果多元化上的应用 被引量:4
1
作者 黄春兰 吴胜利 《山东大学学报(理学版)》 CAS CSCD 北大核心 2015年第1期31-36,共6页
信息检索系统不仅需要考虑文档的相关性,还要考虑文档的多样性和新颖性。针对信息检索结果的多元化问题,探讨了数据融合方法在搜索结果多元化上的适用性。针对线性组合方法,重新考察了成员系统的权重分配策略。通过考虑成员检索系统的... 信息检索系统不仅需要考虑文档的相关性,还要考虑文档的多样性和新颖性。针对信息检索结果的多元化问题,探讨了数据融合方法在搜索结果多元化上的适用性。针对线性组合方法,重新考察了成员系统的权重分配策略。通过考虑成员检索系统的有效性和成员检索系统之间的差异性,提出了一种比较简单方便的基于集合覆盖率的方法,使得采用这种权重分配方式的线性组合方法在结果的多样性上能够有所改善。实验采用了3组来自于TREC文本检索会议的针对Web检索多样化任务的数据,实验结果表明在多样性方面,所提出的数据融合方法均能提高检索结果的性能,优于最佳的成员检索系统。 展开更多
关键词 数据融合 检索结果多元化 线性组合 权重分配
原文传递
Search Result Diversification Based on Query Facets
2
作者 胡莎 窦志成 +1 位作者 王晓捷 文继荣 《Journal of Computer Science & Technology》 SCIE EI CSCD 2015年第4期888-901,共14页
In search engines, different users may search for different information by issuing the same query. To satisfy more users with limited search results, search result diversification re-ranks the results to cover as many... In search engines, different users may search for different information by issuing the same query. To satisfy more users with limited search results, search result diversification re-ranks the results to cover as many user intents as possible. Most existing intent-aware diversification algorithms recognize user intents as subtopics, each of which is usually a word, a phrase, or a piece of description. In this paper, we leverage query facets to understand user intents in diversification, where each facet contains a group of words or phrases that explain an underlying intent of a query. We generate subtopics based on query facets and propose faceted diversification approaches. Experimental results on the public TREC 2009 dataset show that our faceted approaches outperform state-of-the-art diversification models. 展开更多
关键词 query intent query facet search result diversification
原文传递
论子话题粒度对搜索结果多样化算法的影响 被引量:1
3
作者 胡莎 窦志成 文继荣 《中文信息学报》 CSCD 北大核心 2017年第4期165-173,共9页
随着生活节奏的加快,用户习惯将简短的查询提交给搜索引擎,并希望搜索引擎能体贴地将自己需要的结果返回在靠前的结果中。面对大量有歧义的或者意义广泛的查询,搜索引擎努力地识别用户意图,并试图用有限的结果取悦更多的用户。为了解决... 随着生活节奏的加快,用户习惯将简短的查询提交给搜索引擎,并希望搜索引擎能体贴地将自己需要的结果返回在靠前的结果中。面对大量有歧义的或者意义广泛的查询,搜索引擎努力地识别用户意图,并试图用有限的结果取悦更多的用户。为了解决这个问题,搜索结果多样化技术应运而生,其任务是是对搜索结果进行重排序,在有限的搜索结果中满足尽可能多的用户意图。该文重点关注多样化算法中子话题的粒度问题。利用传统方法生成了不同粒度的子话题,并比较了使用不同粒度的子话题对搜索结果多样化算法的影响。实验结果表明,经典多样化算法使用细粒度的子话题时表现更好。 展开更多
关键词 搜索结果多样化 查询意图 子话题
下载PDF
支持搜索结果多样化的排名算法比较研究 被引量:1
4
作者 陈婷婷 黄春兰 吴胜利 《计算机工程》 CAS CSCD 北大核心 2016年第10期45-50,共6页
近年来在信息检索领域研究人员提出了多种支持结果多样化的排名算法,但还没有相关文献对这些算法的性能进行系统的分析和比较。为此,在数据融合排名算法Comb Sum的基础上,提出一种同时考虑文档相关性和多样性的排名算法Comb Sum Div,并... 近年来在信息检索领域研究人员提出了多种支持结果多样化的排名算法,但还没有相关文献对这些算法的性能进行系统的分析和比较。为此,在数据融合排名算法Comb Sum的基础上,提出一种同时考虑文档相关性和多样性的排名算法Comb Sum Div,并将其与x Qu AD和PM2这2种显式排名算法进行性能比较。在TREC多样性任务提供的查询数据集和Clue Web09B数据集上的实验结果表明,Comb Sum Div查询性能较优、x Qu AD次之、PM2较差,且3种算法均具有较强的稳定性及抗干扰能力。 展开更多
关键词 数据融合 搜索结果多样化 重排 稳定性 检索评价
下载PDF
检索结果多样化的性能预测
5
作者 陈佳伟 《信息技术》 2018年第1期124-129,共6页
目前查询性能预测的研究,主要集中在查询结果相关性性能的评估上,而搜索引擎正不断提高检索结果的多样化性能,因此预测其多样化性能是一项有意义的工作。在多样化性能的预测上,传统基于得分分布算法的有效性较低。为此,提出了预测查询... 目前查询性能预测的研究,主要集中在查询结果相关性性能的评估上,而搜索引擎正不断提高检索结果的多样化性能,因此预测其多样化性能是一项有意义的工作。在多样化性能的预测上,传统基于得分分布算法的有效性较低。为此,提出了预测查询结果多样化性能的算法,并在运行结果上检验了提出的算法的有效性。实验结果显示,提出的预测算法是有价值的。 展开更多
关键词 查询性能预测 查询性能预测算法 检索结果多样化 多样化性能预测
下载PDF
基于主题向量模型的多样化资源选择算法
6
作者 李亮 张芳 《信息技术》 2018年第9期79-83,共5页
检索结果多样化任务下的资源选择是联邦检索的重要研究内容。针对现有显式方法的信息依赖和隐式方法的多样化性能不高,提出在α相关度筛选后得到的相关文档集上,构建子主题向量模型。从文中语义层提取数据源内容特征,提升资源相似度计... 检索结果多样化任务下的资源选择是联邦检索的重要研究内容。针对现有显式方法的信息依赖和隐式方法的多样化性能不高,提出在α相关度筛选后得到的相关文档集上,构建子主题向量模型。从文中语义层提取数据源内容特征,提升资源相似度计算准确度,实现多样化的资源选择。实验显示,基于主题向量模型的资源选择方法表现出更好的性能。 展开更多
关键词 主题向量模型 资源相似度 联邦检索 资源选择 检索结果多样化
下载PDF
信息检索中支持结果多样化的查询性能预测
7
作者 张忠敏 吴胜利 《软件工程》 2019年第2期5-10,共6页
对支持检索结果多样化任务的查询性能预测进行了研究。分析了现有性能预测算法的不足,考虑利用不同方式衡量最终检索结果列表的多样性,并在此基础上提出同时考察查询结果的相关性性能与多样性性能的三种方法。采用TREC Clue Web09B数据... 对支持检索结果多样化任务的查询性能预测进行了研究。分析了现有性能预测算法的不足,考虑利用不同方式衡量最终检索结果列表的多样性,并在此基础上提出同时考察查询结果的相关性性能与多样性性能的三种方法。采用TREC Clue Web09B数据集、Web Track任务的查询集及开源的Indri搜索引擎构建实验平台并进行实验。基于Spearman、Pearson和Kendall相关系数的评价结果表明,所提出的三种方法与传统方法相比更适用于预测多样化检索结果,且在不同条件下性能稳定。 展开更多
关键词 信息检索 查询性能预测 检索结果多样化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部