题名 融合文献多元特征的学术搜索策略优化研究
1
作者
梁柱
汤斌
沈思
机构
南京农业大学信息管理学院
南京理工大学经济管理学院
出处
《情报理论与实践》
CSSCI
北大核心
2022年第7期29-35,17,共8页
基金
国家自然科学基金面上项目“基于深度学习的学术全文本知识图谱构建及检索研究”的成果,项目编号:71974094。
文摘
[目的/意义]在学术资源搜索领域中,用户存在使用语义宽泛的查询式进行搜索的行为,该行为导致搜索结果的冗余性,降低了用户的搜索效率。通过搜索结果多样化的方法,可以优化搜索结果排序,提高用户的搜索效率。[方法/过程]结合江苏省科学技术情报研究所的文献搜索平台日志数据,探讨了学术文献特有的分类组织方法在学术搜索中的作用,并在传统搜索结果多样化方法的基础上,提出了一种融合文献多元特征的学术搜索排序优化方法。[结果/结论]实验结果显示,学术文献特有的分类组织方法能在一定程度上提高用户搜索效果,而融合文献多元特征的排序优化方法,能有效提高用户的搜索效率。
关键词
学术搜索
搜索 结果 多样化
文献多元特征
策略优化
Keywords
academic search
search results diversification
multiple features of documents
strategy optimization
分类号
G252.7
[文化科学—图书馆学]
题名 支持搜索结果多样化的排名算法比较研究
被引量:1
2
作者
陈婷婷
黄春兰
吴胜利
机构
江苏大学计算机科学与通信工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第10期45-50,共6页
基金
江苏大学特聘教授启动基金资助项目(13JDG002)
文摘
近年来在信息检索领域研究人员提出了多种支持结果多样化的排名算法,但还没有相关文献对这些算法的性能进行系统的分析和比较。为此,在数据融合排名算法Comb Sum的基础上,提出一种同时考虑文档相关性和多样性的排名算法Comb Sum Div,并将其与x Qu AD和PM2这2种显式排名算法进行性能比较。在TREC多样性任务提供的查询数据集和Clue Web09B数据集上的实验结果表明,Comb Sum Div查询性能较优、x Qu AD次之、PM2较差,且3种算法均具有较强的稳定性及抗干扰能力。
关键词
数据融合
搜索 结果 多样化
重排
稳定性
检索评价
Keywords
data fusion
search result diversification
re-ranking
stability
retrieval evaluation
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 论子话题粒度对搜索结果多样化算法的影响
被引量:1
3
作者
胡莎
窦志成
文继荣
机构
西南大学计算机与信息科学学院
中国人民大学信息学院
大数据管理与分析方法研究北京市重点实验室
出处
《中文信息学报》
CSCD
北大核心
2017年第4期165-173,共9页
基金
国家重点基础研究发展计划/973计划(2014CB340403)
国家自然科学基金(61502501)
文摘
随着生活节奏的加快,用户习惯将简短的查询提交给搜索引擎,并希望搜索引擎能体贴地将自己需要的结果返回在靠前的结果中。面对大量有歧义的或者意义广泛的查询,搜索引擎努力地识别用户意图,并试图用有限的结果取悦更多的用户。为了解决这个问题,搜索结果多样化技术应运而生,其任务是是对搜索结果进行重排序,在有限的搜索结果中满足尽可能多的用户意图。该文重点关注多样化算法中子话题的粒度问题。利用传统方法生成了不同粒度的子话题,并比较了使用不同粒度的子话题对搜索结果多样化算法的影响。实验结果表明,经典多样化算法使用细粒度的子话题时表现更好。
关键词
搜索 结果 多样化
查询意图
子话题
Keywords
search result diversification
query intents
subtopics
分类号
TP311
[自动化与计算机技术—计算机软件与理论]