题名 文本检索的查询性能预测
被引量:8
1
作者
郎皓
王斌
李锦涛
丁凡
机构
中国科学院计算技术研究所
出处
《软件学报》
EI
CSCD
北大核心
2008年第2期291-300,共10页
基金
Supported by the National Natural Science Foundation of China under Grant No.60603094 (国家自然科学基金)
the National Basic Research Program of China under Grant No.2004CB318109 (国家重点基础研究发展计划(973))
the Beijing Science and Technology Planning Program of China under Grant No.D0106008040291 (北京市科技计划)
文摘
目前,查询性能预测(predicting query performance,简称PQP)已经被认为是检索系统最重要的功能之一.近几年的研究和实验表明,PQP技术在文本检索领域有着广阔的发展前景和拓展空间.对文本检索中的PQP进行综述,重点论述其主要方法和关键技术.首先介绍了常用的实验语料和评价体系;然后介绍了影响查询性能的各方面因素;之后,按照基于检索前和检索后的分类体系概述了目前主要的PQP方法;简介了PQP在几个方面的应用;最后讨论了PQP所面临的一些挑战.
关键词
信息检索
查询 性能 预测
Keywords
information retrieval
query performance prediction
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 查询性能预测方法的性能评测研究(英文)
被引量:2
2
作者
徐嬴
刘屹
阴红志
崔斌
机构
北京大学信息科学技术学院
微软亚洲研究院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第S1期70-79,共10页
基金
国家自然科学基金项目(61073019,61272155)
文摘
目前的查询性能预测方法一般都是利用查询的特征、文档集合的特征以及结果列表的特征预测查询结果的平均精度(AP).一种性能预测方法与其他方法比较时,通常采用预测的AP和查询真实AP之间的皮尔森线性相关系数或是肯德尔等级相关系数来进行衡量.然而,这种简单比较方法往往不能准确评估预测方法的性能.深入探讨了查询性能预测方法性能评测中存在的问题,发现了影响比较公平性的4个因素:预测所基于的排序器、预测目标、评估指标以及实验的数据集合大小.并通过定量实验证明:1)排序器的检索性能越好,预测方法的预测性能也越好;2)不同的预测目标会影响预测性能,衡量搜索引擎质量指标(DCG)比AP更容易预测;3)相关性评估指标受数据分布影响严重,在相同的数据分布下,比较两种预测方法才公平;4)实验中查询集合过小会使得比较结果冲突,影响比较结果的可信度.本工作对查询性能预测方法的性能评测具有重要意义.
关键词
查询 性能 预测
性能 评测
信息检索
排序特征
预测 器对比
Keywords
query performance prediction
performance evaluation
information retrieval
rank-time features
predictor comparison
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 查询语义图辅助的信息检索性能预测模型
被引量:2
3
作者
乔亚男
齐勇
机构
西安交通大学电子与信息工程学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2011年第A03期158-162,共5页
基金
国家自然科学基金重点项目(No.60933003)
文摘
查询性能预测技术试图在进行费时的实际信息检索之前对特定查询的性能进行预测,以便根据预测结果在不影响查询所代表的信息需求的基础上对查询进行调整,提高最终检索结果的精确度.针对传统查询性能预测模型没有考虑查询词间语义关系的问题,本文提出了一种查询语义图辅助的信息检索性能预测模型,该模型将表征查询词间语义关系的查询语义图引入性能预测的过程中,使查询性能预测模型避免了查询词独立性假设.实验结果表明,经过查询语义图加权的性能预测模型的预测精确度明显高于传统的性能预测模型,预测结果与实际检索结果的相关度最高提升了约46.32%.
关键词
信息检索
查询 性能 预测
查询 语义图
核心词
Keywords
information retrieval
query performance predicting
semantic chart
core term
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 检索结果多样化的性能预测
4
作者
陈佳伟
机构
江苏大学计算机科学与通信工程学院
出处
《信息技术》
2018年第1期124-129,共6页
文摘
目前查询性能预测的研究,主要集中在查询结果相关性性能的评估上,而搜索引擎正不断提高检索结果的多样化性能,因此预测其多样化性能是一项有意义的工作。在多样化性能的预测上,传统基于得分分布算法的有效性较低。为此,提出了预测查询结果多样化性能的算法,并在运行结果上检验了提出的算法的有效性。实验结果显示,提出的预测算法是有价值的。
关键词
查询 性能 预测
查询 性能 预测 算法
检索结果多样化
多样化性能 预测
Keywords
query performance prediction
query performance predictor
search result diversification
diversification performance prediction
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于查询性能预测的案例库维护策略
被引量:1
5
作者
李锴
机构
新奥燃气
出处
《山西电子技术》
2010年第2期68-70,共3页
文摘
案例库维护是基于案例推理系统的重要组成部分。针对此将查询性能预测思想应用于基于案例推理系统的案例库维护中,设计了案例增加策略及案例删除策略,分析了基于异构案例的组织方式,重点论述了案例检索日志的构建方法。实验结果表明,该方法能够使案例库维护具有较好的自适应性。
关键词
目标案例
案例检索日志
案例增加
查询 性能 预测
案例库维护
Keywords
target case
case retrieval log
case adding
query performance prediction
case base maintenance
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于一种改进离散度的检索前查询性能预测
6
作者
陶永全
机构
江苏大学计算机科学与通信工程学院
出处
《软件导刊》
2015年第9期37-39,共3页
文摘
在缺少相关性判断信息条件下,查询性能预测是为评估检索系统针对特定查询返回结果的有效性。针对检索前预测算法σ1、σ2和σ3只考虑查询词项在各文档间权重差异度不足的问题,提出综合考虑查询词项在各文档间权重大小和差异度大小的检索前预测算法κ1,κ2和κ3。实验结果表明,κ1,κ2和κ3预测算法性能优于σ1,σ2和σ3。
关键词
查询 困难
查询 性能 预测
检索前预测 方法
分类号
TP302
[自动化与计算机技术—计算机系统结构]
题名 文本检索的查询性能预测
7
作者
郎皓
王斌
刘宜轩
机构
中国科学院计算技术研究所信息检索组
出处
《数字图书馆论坛》
2008年第7期18-26,共9页
文摘
在利用Baidu、Google等搜索引擎进行检索时,可以发现,对某些查询,搜索引擎能够准确快速地返回需要的答案,但对另一些查询,搜索引擎返回的结果却不尽如人意,需要反复修改所提交的查询.由此可以看出,查询本身的优劣和查询结果的好坏是直接相关的,如果能很好地预测查询性能,针对查询性能差的查询,有的放矢地改进检索系统,便能提高检索系统的性能了.那么,究竟什么是查询性能预测?影响查询性能的因素有哪些?怎样预测查询性能?查询性能预测的应用前景怎样?怎样评价预测查询性能方法的好坏?文章将一一回答这些问题.该文为2008年第七期本期话题<用户查询的理解>的文章之一.
关键词
信息检索
查询 性能 预测
查询
文本检索
数字图书馆
分类号
G2
[文化科学]
题名 基于查询性能预测的鲁棒检索排序研究
8
作者
薛源海
俞晓明
刘悦
关峰
程学旗
机构
中国科学院网络数据科学与技术重点实验室
中国科学院计算技术研究所
中国科学院大学
出处
《中文信息学报》
CSCD
北大核心
2016年第5期169-175,186,共8页
基金
国家自然科学基金(61232010
61173008)
+5 种基金
国家"863"高技术研究发展计划(2012AA011003
2013AA01A213)
国家"973"重点基础研究发展规划(2012CB316303
2013CB329602)
国家科技部"十一五"科技计划(2012BAH39B02
2012BAH46B04)
文摘
信息检索技术致力于从海量的信息资源中为用户获取所需的信息。相较于传统的简单模型,近些年来的大量研究工作在提升了检索结果平均质量的同时,往往忽略了鲁棒性的问题,即造成了很多查询的性能下降,导致用户满意度的显著下降。本文提出了一种基于排序学习的查询性能预测方法,针对每一个查询,对多种模型得到的检索结果列表进行预测,将其中预测性能最优的检索结果列表展示给用户。在LETOR的三个标准数据集OHSUMED、MQ2008和MSLR-WEB10K上的一系列对比实验表明,在以经典的BM25模型作为基准的情况下,与当前最好的检索模型之一LambdaMART相比,该方法在提升了检索结果平均质量的同时,显著地减少了性能下降的查询的数量,具备较好的鲁棒性。
关键词
查询 性能 预测
排序学习
鲁棒检索排序
Keywords
query performance prediction
learning to rank
robust ranking
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 信息检索中支持结果多样化的查询性能预测
9
作者
张忠敏
吴胜利
机构
江苏大学
出处
《软件工程》
2019年第2期5-10,共6页
基金
江苏省自然科学基金(BK20171303:大数据环境下支持检索结果多样化的联邦搜索引擎技术)资助
文摘
对支持检索结果多样化任务的查询性能预测进行了研究。分析了现有性能预测算法的不足,考虑利用不同方式衡量最终检索结果列表的多样性,并在此基础上提出同时考察查询结果的相关性性能与多样性性能的三种方法。采用TREC Clue Web09B数据集、Web Track任务的查询集及开源的Indri搜索引擎构建实验平台并进行实验。基于Spearman、Pearson和Kendall相关系数的评价结果表明,所提出的三种方法与传统方法相比更适用于预测多样化检索结果,且在不同条件下性能稳定。
关键词
信息检索
查询 性能 预测
检索结果多样化
Keywords
information retrieval
query performance prediction
search result diversification
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]