期刊文献+
共找到352篇文章
< 1 2 18 >
每页显示 20 50 100
基于用户日志的查询扩展统计模型 被引量:61
1
作者 崔航 文继荣 李敏强 《软件学报》 EI CSCD 北大核心 2003年第9期1593-1599,共7页
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联... 信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度. 展开更多
关键词 信息检索 查询扩展 用户日志 日志挖掘
下载PDF
基于矩阵加权关联规则挖掘的伪相关反馈查询扩展 被引量:70
2
作者 黄名选 严小卫 张师超 《软件学报》 EI CSCD 北大核心 2009年第7期1854-1865,共12页
提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘... 提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘技术应用于查询扩展,提出新的查询扩展模型和更合理的扩展词权重计算方法.在此基础上提出一种伪相关反馈查询扩展算法——基于矩阵加权关联规则挖掘的伪相关反馈查询扩展算法,该算法能够自动地从前列n篇初检文档中挖掘与原查询相关的矩阵加权关联规则,构建规则库,从中提取与原查询相关的扩展词,实现查询扩展.实验结果表明,该算法的检索性能确实得到了很好的改善.与现有查询扩展算法相比,在相同的查全率水平级下,其平均查准率有了明显的提高. 展开更多
关键词 信息检索 伪相关反馈 查询扩展 关联规则 矩阵加权
下载PDF
一种基于局部共现的查询扩展方法 被引量:43
3
作者 丁国栋 白硕 王斌 《中文信息学报》 CSCD 北大核心 2006年第3期84-91,共8页
针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC。LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词... 针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC。LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词与初始查询所表征的主题或概念具有更好的相关性。实验结果表明:与未进行查询扩展时相比,采用LOCOOC方法进行扩展后,平均准确率提高40%以上;与传统的局部反馈方法以及局部上下文分析方法(LCA,Local ContextAnalysis)相比,LOCOOC不仅具有更优的检索性能,而且有着更好的鲁棒性。 展开更多
关键词 计算机应用 中文信息处理 信息检索 局部共现 查询扩展 LOCOOC
下载PDF
一种基于上下文的中文信息检索查询扩展 被引量:25
4
作者 贺宏朝 何丕廉 +1 位作者 高剑峰 黄昌宁 《中文信息学报》 CSCD 北大核心 2002年第6期32-37,45,共7页
在中文信息检索的研究和实践中 ,由于查询中所使用的词可能与文件集中使用的词不匹配而导致一些相关的文件不能被成功地检索出来 ,这是影响检索效果的一个很关键的问题。查询扩展可以在一定程度上解决这种词的不匹配现象 ,然而 ,实验表... 在中文信息检索的研究和实践中 ,由于查询中所使用的词可能与文件集中使用的词不匹配而导致一些相关的文件不能被成功地检索出来 ,这是影响检索效果的一个很关键的问题。查询扩展可以在一定程度上解决这种词的不匹配现象 ,然而 ,实验表明 ,通常简单的查询扩展并不能稳定地提高中文信息检索的检索效果。本论文中提出并实现了一种基于上下文的查询扩展方法 ,可以根据查询的上下文对扩展词进行选择 ,是一种相对“智能”的查询扩展方法。在TREC - 9中文信息检索测试集上进行的实验表明 ,相对于通常简单的查询扩展 ,基于上下文的查询扩展方法取得了具有统计意义提高的检索效果。 展开更多
关键词 查询扩展 上下文 中文信息检索 测试集 扩展方法 信息检索系统
下载PDF
基于上下文的查询扩展 被引量:32
5
作者 李卫疆 赵铁军 王宪刚 《计算机研究与发展》 EI CSCD 北大核心 2010年第2期300-304,共5页
针对信息检索查询所使用的词可能与文档集中使用的词不匹配从而影响检索效果这一信息检索关键问题,提出了一种基于上下文的查询扩展方法,该方法根据查询的上下文信息对扩展词进行选择,同时考虑到扩展词与整个查询句以及与查询词的位置关... 针对信息检索查询所使用的词可能与文档集中使用的词不匹配从而影响检索效果这一信息检索关键问题,提出了一种基于上下文的查询扩展方法,该方法根据查询的上下文信息对扩展词进行选择,同时考虑到扩展词与整个查询句以及与查询词的位置关系.在TREC信息检索测试集上进行的实验表明,相对于通常简单的语言模型,方法取得了5%~19%的提高.与流行的基于伪反馈的查询扩展方法相比,提出的方法也具有相当的平均准确率. 展开更多
关键词 信息检索 查询扩展 上下文 语言模型 伪反馈
下载PDF
基于本体的教育资源语义检索系统研究 被引量:34
6
作者 于超 王璐 程道文 《吉林大学学报(信息科学版)》 CAS 2018年第2期207-212,共6页
为提高信息检索的准确率和全面性,在对语义检索技术和领域本体的构建进行充分研究的基础上,在网络教育资源的检索工作中应用了本体语义的概念,提出对用户输入的查询条件进行基于本体的查询扩展算法,设计实现了使用Lucene对扩展后的查询... 为提高信息检索的准确率和全面性,在对语义检索技术和领域本体的构建进行充分研究的基础上,在网络教育资源的检索工作中应用了本体语义的概念,提出对用户输入的查询条件进行基于本体的查询扩展算法,设计实现了使用Lucene对扩展后的查询条件进行检索的语义检索模型。实验结果表明,该检索模型的综合查全率为81.5%,综合查准率为83.1%,这两项指标均优于传统的关键字检索方法。 展开更多
关键词 教育资源 本体 语义检索 查询扩展
下载PDF
一种基于概念的信息检索查询扩展 被引量:13
7
作者 张选平 蒋宇 +2 位作者 袁明轩 马琮 梁平 《微电子学与计算机》 CSCD 北大核心 2006年第4期110-114,共5页
文章针对信息检索中存在的查询词“表达差异”问题,提出一种基于概念的查询扩展方法。一方面将用户查询中使用的词或短语与文档中抽出的概念相连接加入原查询,同时将作为扩展词的概念进行分类查询并采用整合排序算法调整结果;另一方面... 文章针对信息检索中存在的查询词“表达差异”问题,提出一种基于概念的查询扩展方法。一方面将用户查询中使用的词或短语与文档中抽出的概念相连接加入原查询,同时将作为扩展词的概念进行分类查询并采用整合排序算法调整结果;另一方面引入概念图供用户手动调节来进行查询扩展,以达到查询优化的目的。试验结果表明,该方法适宜改进Web上的信息检索,相对没有扩展的查询可以大幅度提高查询精度。 展开更多
关键词 信息检索 查询扩展 概念 概念图
下载PDF
基于聚类的文本过滤模型 被引量:9
8
作者 林鸿飞 马雅彬 《大连理工大学学报》 CAS CSCD 北大核心 2002年第2期249-252,共4页
为了帮助用户在因特网上搜索感兴趣的在线文本 ,提出了基于聚类的文本过滤模型 .其基本思想是 :在预定的层次目录之下 ,根据用户给出的过滤模板进行动态扩张 ,以便于全面地反映用户信息需求 .然后 ,通过对扩张模板的聚类分析 ,使得每一... 为了帮助用户在因特网上搜索感兴趣的在线文本 ,提出了基于聚类的文本过滤模型 .其基本思想是 :在预定的层次目录之下 ,根据用户给出的过滤模板进行动态扩张 ,以便于全面地反映用户信息需求 .然后 ,通过对扩张模板的聚类分析 ,使得每一类由表达相同或相近兴趣的用户模板组成 .匹配时 ,先将文本推送到相应的模板类中 ,再计算与具体模板的相似度 ,获得最终的匹配结果 。 展开更多
关键词 语言处理 聚类分析 文本过滤模型 用户模板 查询扩张 模板扩张
下载PDF
基于领域本体和Lucene的语义检索系统研究 被引量:20
9
作者 王欢 孙瑞志 《计算机应用》 CSCD 北大核心 2010年第6期1655-1657,1660,共4页
语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系... 语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系统,该系统对提交的关键词组进行查询扩展后,将扩展关键词组导入文本检索引擎Lucene中,并把语义相似度作为检索结果排序算法的关键因素。实验结果表明,该语义相似度模型得出的相似度值更加接近专家经验值,系统的查询准确率与未加入查询扩展的Lucene系统相比有较大的提高。 展开更多
关键词 查询扩展 本体 LUCENE 语义相似度 语义检索
下载PDF
基于伪相关反馈的跨语言查询扩展 被引量:19
10
作者 吴丹 何大庆 王惠临 《情报学报》 CSSCI 北大核心 2010年第2期232-239,共8页
相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨... 相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨语言信息检索,提出了翻译前查询扩展、翻译后查询扩展、翻译前与翻译后相结合的查询扩展三种方法。最后,本文通过伪相关反馈实验对这三种方法进行了比较,实验结果显示,三种跨语言查询扩展方法都能够有效地提高检索结果的精度,其中翻译后查询扩展方法相对更优越。此外,查询式的长度对不同跨语言查询扩展方法产生着不同程度的影响。 展开更多
关键词 相关反馈 伪相关反馈 跨语言信息检索 查询扩展
下载PDF
基于查询扩展和分类的信息检索算法 被引量:10
11
作者 岳文 陈治平 林亚平 《系统仿真学报》 EI CAS CSCD 北大核心 2006年第7期1926-1929,1934,共5页
文本信息检索是处理海量文本的重要手段之一,针对短查询串中出现的查全率高但查准率低的问题,引入一种基于查询扩展和分类的信息检索算法。该算法在检索的第一阶段利用自动相关反馈方法扩展用户递交的短查询串增加查询信息,在第二阶段... 文本信息检索是处理海量文本的重要手段之一,针对短查询串中出现的查全率高但查准率低的问题,引入一种基于查询扩展和分类的信息检索算法。该算法在检索的第一阶段利用自动相关反馈方法扩展用户递交的短查询串增加查询信息,在第二阶段使用文本分类技术辅助检索。分析和实验结果表明:新的算法比传统的查询扩展检索算法具有更好的查准率和查询效率。 展开更多
关键词 向量空间模型 短查询串 查询扩展 文本分类 查准率
下载PDF
中医药信息智能检索系统构建方法研究 被引量:14
12
作者 瞿海斌 王祥君 程翼宇 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2002年第4期460-462,472,共4页
针对现有中医药信息检索中存在的某些问题 ,将基于词表的扩展检索、相似性检索等方法与数据挖掘技术相结合 ,提出了一类智能化中医药信息检索系统的构建思想 ,据此建立了相应的智能检索系统 .该系统提供文献间的相似性检索 ,实现了数据... 针对现有中医药信息检索中存在的某些问题 ,将基于词表的扩展检索、相似性检索等方法与数据挖掘技术相结合 ,提出了一类智能化中医药信息检索系统的构建思想 ,据此建立了相应的智能检索系统 .该系统提供文献间的相似性检索 ,实现了数据的关联分析 ,提高了中医药文献的查全率 .经实际应用表明 ,本文方法具有查全率高 ,使用方便等优点 ,为建立新型中医药信息检索系统提供了有效途径 . 展开更多
关键词 中医药信息智能检索系统 构建方法 扩展检索 相似性检索 数据挖掘 数据关联分析
下载PDF
一种基于潜在语义分析的查询扩展算法 被引量:8
13
作者 顾榕 王小平 曹立明 《计算机工程与应用》 CSCD 北大核心 2004年第18期23-25,63,共4页
该文提出一种新的查询扩展算法。通过对文本进行潜在语义分析,引入计算词语间语义相似度的方法,将文本聚类应用到检索的交互过程中,以提高信息检索的质量。实验结果表明该算法对于提高检索的准确率是十分有效的。
关键词 查询扩展 潜在语义分析 语义相似度
下载PDF
万维网信息检索客户端处理技术 被引量:10
14
作者 何骥 张惠惠 刁倩 《情报学报》 CSSCI 北大核心 1999年第3期219-224,共6页
传统的基于分类和关键词的检索方式难以满足万维网上高质量的检索需求。本文就如何提高万维网信息检索的质量,探讨在检索客户端的处理技术,包括自然语言理解、查询扩展、查询域修整、群集检索以及智能检索代理等。文中还提出了综合运... 传统的基于分类和关键词的检索方式难以满足万维网上高质量的检索需求。本文就如何提高万维网信息检索的质量,探讨在检索客户端的处理技术,包括自然语言理解、查询扩展、查询域修整、群集检索以及智能检索代理等。文中还提出了综合运用这些技术的一个万维网信息智能检索系统的原型。 展开更多
关键词 万维网 智能检索代理 信息检索 客户端处理技术
下载PDF
基于客户本体的客户特征提取 被引量:11
15
作者 路晓伟 蒋馥 侯立文 《计算机工程》 EI CAS CSCD 北大核心 2005年第5期31-33,121,共4页
首先介绍了本体及客户本体的概念,然后提出了基于客户本体的客户信息集成框架,接着提出了利用基于客户本体的查询扩展和查询重构进行客户特征提取的方法和步骤,最后用一个实例说明了基于客户本体的客户特征提取方法。
关键词 客户关系管理 客户本体 客户特征提取 查询扩展 查询诹构
下载PDF
基于拼音索引的中文模糊匹配算法 被引量:14
16
作者 曹犟 邬晓钧 +1 位作者 夏云庆 郑方 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第S1期1328-1332,共5页
主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化... 主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化为多个精确匹配,对精确匹配的结果按与查询串的相似程度进行排序。在实验中,将该方法应用于网页文本语料库中。在使用基于拼音改良的编辑距离度量方式时,在时间和空间复杂度增长不大的情况下,该方法取得了60.42%的准确率与50.41%召回率。 展开更多
关键词 文件信息处理 拼音索引 模糊匹配 查询扩展
原文传递
混合P2P环境下有效的查询扩展及其搜索算法 被引量:9
17
作者 张骞 张霞 +3 位作者 刘积仁 孙雨 文学志 刘铮 《软件学报》 EI CSCD 北大核心 2006年第4期782-793,共12页
查询扩展是解决信息获取领域中用词歧义性问题的关键技术,并被广泛应用于搜索引擎中,获得了巨大的成功.然而,由于P2P(peer-to-peer)系统是一个分散的、动态的系统,在P2P环境下进行有效的查询扩展具有一定的挑战性.首先,利用查询与文档... 查询扩展是解决信息获取领域中用词歧义性问题的关键技术,并被广泛应用于搜索引擎中,获得了巨大的成功.然而,由于P2P(peer-to-peer)系统是一个分散的、动态的系统,在P2P环境下进行有效的查询扩展具有一定的挑战性.首先,利用查询与文档的关联关系构建了LEM(localexpansionmethod)查询扩展方法;然后,基于查询与文档用词的直接关联,提出了HEM(history_basedexpansionmethod)查询扩展方法.在此基础上,提出了一种基于查询扩展的混合P2P环境下的搜索算法.实验及分析结果表明,查询扩展及其搜索算法能够极大地提高搜索的效果. 展开更多
关键词 查询扩展 查询记录 相关度 搜索 P2P
下载PDF
基于潜在语义分析的个性化查询扩展模型 被引量:13
18
作者 王卫国 徐炜民 《计算机工程》 CAS CSCD 北大核心 2010年第21期43-45,共3页
为在信息检索系统中获得更好的查询效果,提出一种混合的个性化查询扩展模型。通过潜在语义分析建立潜在语义空间,并在潜在语义空间中计算得到查询的概念相关扩展词和兴趣相关扩展词,不但有效解决了词典问题,而且满足了不同用户需求多样... 为在信息检索系统中获得更好的查询效果,提出一种混合的个性化查询扩展模型。通过潜在语义分析建立潜在语义空间,并在潜在语义空间中计算得到查询的概念相关扩展词和兴趣相关扩展词,不但有效解决了词典问题,而且满足了不同用户需求多样性和用户多兴趣点的需求。实验表明,该算法能够较好地提高搜索引擎系统的查全率、查准率,以及信息检索效率。 展开更多
关键词 潜在语义分析 用户兴趣 查询扩展 个性化推荐 信息检索
下载PDF
基于Markov网络的信息检索扩展模型 被引量:9
19
作者 左家莉 王明文 王希 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第S1期1847-1852,共6页
为了解决信息检索性能较差的问题,查询扩展将索引项之间的关系以及文档之间的相似度引入到检索中,这个过程可以通过构造知识网络来进行。M arkov网络是一种有效的知识关联图形表示方法,可以从实例数据训练获得。本研究提出并实现了基于M... 为了解决信息检索性能较差的问题,查询扩展将索引项之间的关系以及文档之间的相似度引入到检索中,这个过程可以通过构造知识网络来进行。M arkov网络是一种有效的知识关联图形表示方法,可以从实例数据训练获得。本研究提出并实现了基于M arkov网络的信息检索扩展模型,通过对文档集的学习,构造了关于索引项和文档的M arkov网络,将有利于检索的信息加入到检索中。实验表明,基于M arkov网络的信息检索扩展模型优于BM 25模型。 展开更多
关键词 查询扩展 MARKOV网络 信息检索
原文传递
信息检索中的相关反馈技术综述 被引量:12
20
作者 严华云 刘其平 肖良军 《计算机应用研究》 CSCD 北大核心 2009年第1期11-14,共4页
论述了信息检索中的向量空间模型、概率模型以及语言模型中所采用的相关反馈技术。其中主要介绍检索词的权重调整、查询扩展、文档相关反馈,以及语言模型中的查询语言模型和文档语言模型的调整。针对最近反馈方面的最新成果——基于ter... 论述了信息检索中的向量空间模型、概率模型以及语言模型中所采用的相关反馈技术。其中主要介绍检索词的权重调整、查询扩展、文档相关反馈,以及语言模型中的查询语言模型和文档语言模型的调整。针对最近反馈方面的最新成果——基于term的反馈技术进行了探讨,指出了相关反馈在今后研究的方向,即提供个性化的如分层反馈和利用日志进行反馈,并讨论了相关反馈技术对检索性能的影响。 展开更多
关键词 信息检索 相关反馈 查询扩展
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部