期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于语义扩展的复合贝叶斯网络检索模型 被引量:9
1
作者 白彦霞 程杰 莫德举 《控制工程》 CSCD 北大核心 2019年第3期602-607,共6页
用户查询与文档之间语义相似或相关,但是词法不匹配是影响信息检索性能的重要原因之一。挖掘术语间的同义词关系,实现查询术语的语义扩展,同时归并简单贝叶斯网络检索模型的检索结果,构造一个复合的贝叶斯网络检索模型。给出复合模型的... 用户查询与文档之间语义相似或相关,但是词法不匹配是影响信息检索性能的重要原因之一。挖掘术语间的同义词关系,实现查询术语的语义扩展,同时归并简单贝叶斯网络检索模型的检索结果,构造一个复合的贝叶斯网络检索模型。给出复合模型的网络拓扑、检索流程以及相应的检索算法。实验结果表明该模型可以在实现语义检索的基础上,进一步优化检索性能。 展开更多
关键词 用户查询 查询术语 相关文档 贝叶斯网络 归并 同义词 信息检索
下载PDF
基于查询术语同义词的扩展信念网络检索模型 被引量:4
2
作者 徐建民 唐万生 《计算机工程》 CAS CSCD 北大核心 2007年第10期28-30,共3页
针对信念网络模型没有考虑术语之间关系的缺陷,引入了查询同义词的概念,提出了一个基于查询术语同义词的扩展信念网络检索模型。给出了模型的拓扑结构,讨论了利用新模型进行信息检索的方法,并给出了一个实用案例。新模型同时考虑了用户... 针对信念网络模型没有考虑术语之间关系的缺陷,引入了查询同义词的概念,提出了一个基于查询术语同义词的扩展信念网络检索模型。给出了模型的拓扑结构,讨论了利用新模型进行信息检索的方法,并给出了一个实用案例。新模型同时考虑了用户查询术语及其同义词的作用,提高了检索性能。 展开更多
关键词 查询术语 同义词 信息检索 信念网络
下载PDF
贝叶斯网络查询语义扩展的专家发现方法 被引量:1
3
作者 郑伟 侯宏旭 班志杰 《计算机工程与应用》 CSCD 北大核心 2020年第13期194-198,共5页
专家发现是实体检索领域的一个研究热点,针对经典专家发现模型存在索引术语独立性假设与检索性能低的缺陷,提出一种基于贝叶斯网络模型的专家发现方法。该方法模型采用四层网络结构,能够实现图形化的概率推理,同时运用词向量技术能够实... 专家发现是实体检索领域的一个研究热点,针对经典专家发现模型存在索引术语独立性假设与检索性能低的缺陷,提出一种基于贝叶斯网络模型的专家发现方法。该方法模型采用四层网络结构,能够实现图形化的概率推理,同时运用词向量技术能够实现查询术语的语义扩展。实验结果显示该模型在多个评价指标上均优于经典专家发现模型,能够有效实现查询术语语义扩展,提高专家检索性能。 展开更多
关键词 专家发现方法 贝叶斯网络 查询术语
下载PDF
一种基于分词距离改进的 Lucene 排序算法
4
作者 徐茂军 王红 《山东师范大学学报(自然科学版)》 CAS 2016年第1期66-72,共7页
排序算法是全文检索引擎 Lucene 的核心部件。针对 Lucene 内置的排序算法只考虑查询词条在文档中的词频,而忽视查询词条在文档中的距离特征这一缺陷,提出了一种基于分词距离特征的句子相似度计算模型用于改进 Lucene 评分机制。首先... 排序算法是全文检索引擎 Lucene 的核心部件。针对 Lucene 内置的排序算法只考虑查询词条在文档中的词频,而忽视查询词条在文档中的距离特征这一缺陷,提出了一种基于分词距离特征的句子相似度计算模型用于改进 Lucene 评分机制。首先,对查询串和文档进行数据预处理。其次,通过在文档中标识“关键词”和“查询词条”的位置,从而实现查询词条与关键词之间分词距离的计算,进而得出查询串和整篇文档的相似性评分。最后,将本文提出的算法融合到 Lucene 默认的相似性评分算法中,并使用MAP,P@ n 等指标进行评估。 展开更多
关键词 排序算法 查询词条 词频 分词距离 MAP P@n
下载PDF
信息搜索用户检索式行为研究综述 被引量:11
5
作者 刘畅 宋筱璇 《图书情报工作》 CSSCI 北大核心 2017年第16期122-134,共13页
[目的 /意义]用户的检索式行为是用户信息搜索的重要环节,本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。[方法/过程]通过对国内外相关文献的梳理,将检索式构建行为划分为检索词、检索式和会话层三个层面,以及词汇、语... [目的 /意义]用户的检索式行为是用户信息搜索的重要环节,本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。[方法/过程]通过对国内外相关文献的梳理,将检索式构建行为划分为检索词、检索式和会话层三个层面,以及词汇、语法和语义三个维度,对每个维度及不同维度之间的研究的区别与联系进行讨论,并对检索式的重构行为、检索式的质量和效果评估、以及影响用户检索式行为的要素等几个方面的相关研究进行总结。[结果 /结论]已有研究对于检索式行为中的检索词和检索式的词汇研究较为丰富,未来需要增加对检索式的语法和语义的研究,以便深入理解用户的检索式构成特征。另外,关于检索式重构的类别和模式的自动识别的探索有所不足。在检索式的质量和效果评估方面,还需结合多种情境因素,更深入地研究易于用户理解和利于其搜索的检索式推荐模式。 展开更多
关键词 检索式 检索词 重构 搜索行为 情境
原文传递
查询词相似度加权的邻近性检索方法 被引量:2
6
作者 乔亚男 刘跃虎 齐勇 《模式识别与人工智能》 CSCD 北大核心 2013年第2期189-194,共6页
传统的邻近性检索模型同等地看待所有查询词,不加区分地考虑所有查询词的邻近性,造成"平行概念效应",影响邻近性检索方法的性能.文中提出一种查询词相似度加权的邻近性检索方法.该方法根据查询词之间的语义相似度对查询词邻... 传统的邻近性检索模型同等地看待所有查询词,不加区分地考虑所有查询词的邻近性,造成"平行概念效应",影响邻近性检索方法的性能.文中提出一种查询词相似度加权的邻近性检索方法.该方法根据查询词之间的语义相似度对查询词邻近性统计量加权,可进一步推断用户的实际信息需求,挖掘查询中蕴含的更深层次的信息.实验结果表明,在短查询较多的应用环境下,文中方法可较显著提升传统邻近性检索模型的性能,有效规避查询词邻近性的平行概念效应. 展开更多
关键词 信息检索 语义相似度 查询词邻近性(QTP) 信息需求
下载PDF
具有孤立项过滤的信息检索查询词的分析方法
7
作者 乔亚男 齐勇 侯迪 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第8期6-10,63,共6页
针对传统查询词临近性(QTP)分析方法无法有效提高查准率的问题,提出了一种孤立项过滤的信息检索查询词分析方法.该方法根据词汇相似度较高的查询词对之间具有强可替代性这一事实,从查询词及其实例中分解出查询内的孤立项和文档内的孤立... 针对传统查询词临近性(QTP)分析方法无法有效提高查准率的问题,提出了一种孤立项过滤的信息检索查询词分析方法.该方法根据词汇相似度较高的查询词对之间具有强可替代性这一事实,从查询词及其实例中分解出查询内的孤立项和文档内的孤立项,在分析查询词临近性之前预先进行孤立项过滤,使之不参与QTP统计量的计算,由此减小了过分强调临近性对查准率的影响.实验结果表明,对于词汇相似度差异比较显著的查询,进行孤立项过滤的查询词临近性分析方法的平均检索精确度比传统分析方法提高14%. 展开更多
关键词 信息检索 查询词临近性 孤立项 词汇相似度
下载PDF
与自然语言查询表述相关的词语分析 被引量:1
8
作者 熊文新 《图书情报工作》 CSSCI 北大核心 2012年第17期115-121,共7页
考察在信息检索过程中用户以自然语言表述的查询语句中的词语使用情况。以一个信息需求描述颗粒度不等的查询表述语料库为素材,辅以汉语通用语料作为对照,通过词频以及词语的文本覆盖率等统计数据,按照是否需要在目标文本中直接或以其... 考察在信息检索过程中用户以自然语言表述的查询语句中的词语使用情况。以一个信息需求描述颗粒度不等的查询表述语料库为素材,辅以汉语通用语料作为对照,通过词频以及词语的文本覆盖率等统计数据,按照是否需要在目标文本中直接或以其他形式出现,将查询表述语句中的词语区分为对汉语文本处理具有普遍意义的通用停用词、服务于信息检索表述用的专用停用词和与特定需求相关的信息内容词语。区分词语使用的不同性质,能为信息系统前端的自然语言查询处理增加一道剥离工序,防止将整个查询语句的分词结果全部作为检索项所造成的效率和准确率的退化。 展开更多
关键词 查询语句 检索项 语料库 词语分布 信息检索
原文传递
Geeking:基于胜者表的体育新闻搜索引擎系统
9
作者 林裕杰 陈新荃 +3 位作者 高妍 肖卡飞 胡红祥 花强 《集成技术》 2016年第2期97-108,共12页
文章介绍了体育新闻搜索引擎系统Geeking的框架结构和各项功能,其结构分为网页爬取、胜者表构建、检索处理、用户界面4个部分,其主要功能包含查询词校正、自动补全、检索结果排序、相似新闻聚类以及显示页面中关键词高亮并提供网页快照... 文章介绍了体育新闻搜索引擎系统Geeking的框架结构和各项功能,其结构分为网页爬取、胜者表构建、检索处理、用户界面4个部分,其主要功能包含查询词校正、自动补全、检索结果排序、相似新闻聚类以及显示页面中关键词高亮并提供网页快照。输入查询请求时,系统根据搜索日志和新闻热词自动补全查询词,搜索不到相关结果时校正查询,给出推荐的查询词。检索新闻文档时,使用胜者表快速查找查询词项的相关文档,综合tf-idf权重和新闻标题、发布时间等因素计算文档的相关性并按得分排序。在相似新闻聚类中,结合最长公共子序列和编辑距离衡量新闻标题之间的相似度,以新闻标题相似度代表新闻文档的相似度。测试结果表明,基于胜者表的Geeking搜索引擎系统各项功能协调效果好,检索响应速度快。 展开更多
关键词 搜索引擎 体育新闻 胜者表 编辑距离 聚类 查询词校正
下载PDF
用户同步协作检索的活动策略
10
作者 楚艳萍 徐树维 《河南大学学报(自然科学版)》 CAS 北大核心 2012年第6期752-756,共5页
用户同步协作检索是通过用户的直接参与来体现检索过程中同一信息需求的不同用户的观点、检索经验、检索技能和与检索任务情景相关的信息.文章提出了协作查询构建和协作相关性判断两个阶段的用户检索活动策略,研究了协作查询术语生成和... 用户同步协作检索是通过用户的直接参与来体现检索过程中同一信息需求的不同用户的观点、检索经验、检索技能和与检索任务情景相关的信息.文章提出了协作查询构建和协作相关性判断两个阶段的用户检索活动策略,研究了协作查询术语生成和检索结果协作相关性判断的理论与方法,旨在为同步协作检索系统的设计提供借鉴. 展开更多
关键词 同步协作检索 协作查询术语构建 协作相关性判断
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部