期刊文献+
共找到360篇文章
< 1 2 18 >
每页显示 20 50 100
基于用户日志的查询扩展统计模型 被引量:61
1
作者 崔航 文继荣 李敏强 《软件学报》 EI CSCD 北大核心 2003年第9期1593-1599,共7页
信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联... 信息检索长期存在着用词歧义性问题,在Web搜索上的表现更加突出.提出了一种基于用户查询日志的查询扩展统计模型,将用户查询中使用的词或短语与文档中出现的相应词或短语以条件概率的形式连接,利用贝叶斯公式挑选出文档中与该查询关联最紧密的词加入原查询,以达到扩展优化的目的.实验结果表明,该方法更适宜改进Web上的信息检索,相对传统的查询扩展算法可以大幅度提高查询精度. 展开更多
关键词 信息检索 查询扩展 用户日志 日志挖掘
下载PDF
基于矩阵加权关联规则挖掘的伪相关反馈查询扩展 被引量:70
2
作者 黄名选 严小卫 张师超 《软件学报》 EI CSCD 北大核心 2009年第7期1854-1865,共12页
提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘... 提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘技术应用于查询扩展,提出新的查询扩展模型和更合理的扩展词权重计算方法.在此基础上提出一种伪相关反馈查询扩展算法——基于矩阵加权关联规则挖掘的伪相关反馈查询扩展算法,该算法能够自动地从前列n篇初检文档中挖掘与原查询相关的矩阵加权关联规则,构建规则库,从中提取与原查询相关的扩展词,实现查询扩展.实验结果表明,该算法的检索性能确实得到了很好的改善.与现有查询扩展算法相比,在相同的查全率水平级下,其平均查准率有了明显的提高. 展开更多
关键词 信息检索 伪相关反馈 查询扩展 关联规则 矩阵加权
下载PDF
一种基于局部共现的查询扩展方法 被引量:43
3
作者 丁国栋 白硕 王斌 《中文信息学报》 CSCD 北大核心 2006年第3期84-91,共8页
针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC。LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词... 针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC。LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词与初始查询所表征的主题或概念具有更好的相关性。实验结果表明:与未进行查询扩展时相比,采用LOCOOC方法进行扩展后,平均准确率提高40%以上;与传统的局部反馈方法以及局部上下文分析方法(LCA,Local ContextAnalysis)相比,LOCOOC不仅具有更优的检索性能,而且有着更好的鲁棒性。 展开更多
关键词 计算机应用 中文信息处理 信息检索 局部共现 查询扩展 LOCOOC
下载PDF
基于区域划分的XML结构连接 被引量:35
4
作者 王静 孟小峰 王珊 《软件学报》 EI CSCD 北大核心 2004年第5期720-729,共10页
结构连接是XML查询处理的核心操作,受到了研究界的关注.高效的算法是高效查询处理的关键.目前已经提出了许多结构连接的算法,它们中的大多数都基于如下的前提条件之一:输入元素集合存在索引或者有序.当这些条件不成立时,由于对输入数据... 结构连接是XML查询处理的核心操作,受到了研究界的关注.高效的算法是高效查询处理的关键.目前已经提出了许多结构连接的算法,它们中的大多数都基于如下的前提条件之一:输入元素集合存在索引或者有序.当这些条件不成立时,由于对输入数据临时排序或建索引的代价,这些算法的性能会大大下降.基于这样的观察,提出了一种基于区域划分的结构连接算法.该算法基于任务分解的思想,利用区域编码的特点对输入集合进行划分.给出了详细的算法设计,并对算法的I/O复杂性进行了分析.大量的实验结果显示,该算法具有良好的性能,在输入数据无序或没有索引的情况下优于现有的排序合并算法,可以为查询计划提供更多的选择. 展开更多
关键词 XML查询处理 路径表达式 编码方法 结构连接
下载PDF
滑动窗口规模的动态调整算法 被引量:22
5
作者 李建中 张冬冬 《软件学报》 EI CSCD 北大核心 2004年第12期1800-1814,共15页
讨论当数据流系统的数据流流速或连续查询发生变化时,滑动窗口规模的动态调整问题.根据可用内存空间大小和连续查询需求,提出了3类动态调整滑动窗口规模的算法,实现了对连续查询3种服务质量级别的支持,提高了连续查询处理的效率和效果.... 讨论当数据流系统的数据流流速或连续查询发生变化时,滑动窗口规模的动态调整问题.根据可用内存空间大小和连续查询需求,提出了3类动态调整滑动窗口规模的算法,实现了对连续查询3种服务质量级别的支持,提高了连续查询处理的效率和效果.理论分析与实验结果表明,提出的算法可以有效地应用于数据流 系统. 展开更多
关键词 数据流 滑动窗口 连续查询 滑动窗口规模调整
下载PDF
基于上下文的查询扩展 被引量:32
6
作者 李卫疆 赵铁军 王宪刚 《计算机研究与发展》 EI CSCD 北大核心 2010年第2期300-304,共5页
针对信息检索查询所使用的词可能与文档集中使用的词不匹配从而影响检索效果这一信息检索关键问题,提出了一种基于上下文的查询扩展方法,该方法根据查询的上下文信息对扩展词进行选择,同时考虑到扩展词与整个查询句以及与查询词的位置关... 针对信息检索查询所使用的词可能与文档集中使用的词不匹配从而影响检索效果这一信息检索关键问题,提出了一种基于上下文的查询扩展方法,该方法根据查询的上下文信息对扩展词进行选择,同时考虑到扩展词与整个查询句以及与查询词的位置关系.在TREC信息检索测试集上进行的实验表明,相对于通常简单的语言模型,方法取得了5%~19%的提高.与流行的基于伪反馈的查询扩展方法相比,提出的方法也具有相当的平均准确率. 展开更多
关键词 信息检索 查询扩展 上下文 语言模型 伪反馈
下载PDF
基于本体的教育资源语义检索系统研究 被引量:34
7
作者 于超 王璐 程道文 《吉林大学学报(信息科学版)》 CAS 2018年第2期207-212,共6页
为提高信息检索的准确率和全面性,在对语义检索技术和领域本体的构建进行充分研究的基础上,在网络教育资源的检索工作中应用了本体语义的概念,提出对用户输入的查询条件进行基于本体的查询扩展算法,设计实现了使用Lucene对扩展后的查询... 为提高信息检索的准确率和全面性,在对语义检索技术和领域本体的构建进行充分研究的基础上,在网络教育资源的检索工作中应用了本体语义的概念,提出对用户输入的查询条件进行基于本体的查询扩展算法,设计实现了使用Lucene对扩展后的查询条件进行检索的语义检索模型。实验结果表明,该检索模型的综合查全率为81.5%,综合查准率为83.1%,这两项指标均优于传统的关键字检索方法。 展开更多
关键词 教育资源 本体 语义检索 查询扩展
下载PDF
基于标记树对象抽取技术的Hidden Web获取研究 被引量:9
8
作者 宋晖 张岭 +1 位作者 叶允明 马范援 《计算机工程与应用》 CSCD 北大核心 2002年第23期9-12,24,共5页
目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该... 目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该文提出了一套检索HiddenWeb信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术。系统采用新的基于标记树的对象抽取(Tag-Tree-basedObjectExtraction)方法自动地从Web页面中抽取HiddenWeb信息,然后在此基础上给出了结构化的HiddenWeb信息查询算法。文章最后对实验结果进行了讨论。 展开更多
关键词 标记树 对象抽取 HiddenWeb 互联网 搜索引擎 信息检索 结构化查询 数据库
下载PDF
一种基于概念的信息检索查询扩展 被引量:13
9
作者 张选平 蒋宇 +2 位作者 袁明轩 马琮 梁平 《微电子学与计算机》 CSCD 北大核心 2006年第4期110-114,共5页
文章针对信息检索中存在的查询词“表达差异”问题,提出一种基于概念的查询扩展方法。一方面将用户查询中使用的词或短语与文档中抽出的概念相连接加入原查询,同时将作为扩展词的概念进行分类查询并采用整合排序算法调整结果;另一方面... 文章针对信息检索中存在的查询词“表达差异”问题,提出一种基于概念的查询扩展方法。一方面将用户查询中使用的词或短语与文档中抽出的概念相连接加入原查询,同时将作为扩展词的概念进行分类查询并采用整合排序算法调整结果;另一方面引入概念图供用户手动调节来进行查询扩展,以达到查询优化的目的。试验结果表明,该方法适宜改进Web上的信息检索,相对没有扩展的查询可以大幅度提高查询精度。 展开更多
关键词 信息检索 查询扩展 概念 概念图
下载PDF
基于搜索引擎的词汇语义相似度计算方法 被引量:21
10
作者 陈海燕 《计算机科学》 CSCD 北大核心 2015年第1期261-267,共7页
词汇语义相似度的计算在网页浏览和查询推荐等网络相关工作中起着重要的作用。传统的基于分类的方法不能处理持续出现的新词。由于网络数据中隐藏着大量的噪音和冗余,鲁棒性和准确性仍然是一个挑战,因此提出了一种基于搜索引擎的词汇语... 词汇语义相似度的计算在网页浏览和查询推荐等网络相关工作中起着重要的作用。传统的基于分类的方法不能处理持续出现的新词。由于网络数据中隐藏着大量的噪音和冗余,鲁棒性和准确性仍然是一个挑战,因此提出了一种基于搜索引擎的词汇语义相似度计算方法。语义片段和检索结果的页数被用来去除词汇语义相似度计算过程中的噪音和冗余。此外,还提出了一种方法来整合查询结果页数、语义片段和显示的搜索结果的数量,该方法不需要任何先验知识与本体。实验结果显示,所提出的方法在Rubenstein-Goodenough测试集的相关系数为0.851,优于现有的基于网络的词汇语义相似度计算方法,同时在搜索引擎的查询扩展任务中具有较为良好的应用效果。 展开更多
关键词 语义相似度 信息检索 查询建议 网络检索
下载PDF
语义视频检索的现状和研究进展 被引量:14
11
作者 余卫宇 谢胜利 +1 位作者 余英林 潘晓舟 《计算机应用研究》 CSCD 北大核心 2005年第5期1-7,共7页
概述了图像的可视化特征如颜色、纹理、形状和运动信息,时空关系分析,以及多特征目标提取和相似度量度;分析了视频语义的提取,语义查询、检索;探讨了视频语义检索的性能评估,存在的问题和发展方向。
关键词 特征提取 图像检索 时空分析 视频语义物体 视频查询 语义检索
下载PDF
中文信息检索中的相关反馈 被引量:11
12
作者 战学刚 林鸿飞 姚天顺 《计算机科学》 CSCD 北大核心 2000年第7期39-42,共4页
一、引言对于基于统计的信息检索系统,影响其性能的主要环节有:1.特征项的选择、2.权重的计算方法、3.查询的表示形式、4.查询的调整(修改)、5.相似度的计算方法。当系统确定了其索引形式和相似度的计算方法后,系统性能的提高。
关键词 中文信息检索 查准率 查全率
下载PDF
多媒体信息检索中的查询与反馈技术 被引量:16
13
作者 查正军 郑晓菊 《计算机研究与发展》 EI CSCD 北大核心 2017年第6期1267-1280,共14页
历经几十年的发展,多媒体检索取得了长足的进步,然而检索性能的提升依然受到"意图鸿沟"与"语义鸿沟"的制约.针对此问题,学术界提出了一系列查询技术帮助用户清楚地表达检索意图以及反馈技术帮助系统准确地理解用户... 历经几十年的发展,多媒体检索取得了长足的进步,然而检索性能的提升依然受到"意图鸿沟"与"语义鸿沟"的制约.针对此问题,学术界提出了一系列查询技术帮助用户清楚地表达检索意图以及反馈技术帮助系统准确地理解用户意图与媒体数据,有效提升了检索性能.对多媒体检索中的查询与反馈技术进行了分析与讨论.分析了查询方式的演变与反馈技术的发展,综述了面向PC机、移动智能终端、触屏设备的查询技术,介绍了不同时期的反馈技术,探讨了探索式搜索中的交互问题,最后分析了该领域的未来研究趋势. 展开更多
关键词 多媒体信息检索 检索意图 内容理解 查询 反馈
下载PDF
基于Lucene的语义检索系统 被引量:12
14
作者 郑廷 郑诚 《计算机工程》 CAS CSCD 北大核心 2008年第16期92-94,共3页
在一种基于LUCENE的传统文本检索引擎之上,采用C/S架构模式的语义检索实验系统。用户可以根据需要,从客户端向服务器提交相应的查询信息配置,服务器根据此配置,通过本体导航与同义词查询2种查询扩展优化技术,对提交的查询关键词组进行... 在一种基于LUCENE的传统文本检索引擎之上,采用C/S架构模式的语义检索实验系统。用户可以根据需要,从客户端向服务器提交相应的查询信息配置,服务器根据此配置,通过本体导航与同义词查询2种查询扩展优化技术,对提交的查询关键词组进行查询、扩展等优化处理后,将经优化处理过的查询关键词组导入传统的文本检索引擎中,对文档资源进行匹配,将查询结果根据用户要求的排列,并依次返回给用户。通过用户与服务器的信息交互与对查询语句的查询扩展,该系统提高了查准率与查全率。 展开更多
关键词 文本检索 本体 同义词 查询扩展 C/S架构 语义
下载PDF
Web查询技术研究 被引量:12
15
作者 孟小峰 曹巍 王珊 《计算机科学》 CSCD 北大核心 2001年第2期1-5,共5页
一、引言 WWW的迅速发展,使其成为全球信息传递与共享的日益重要和最具潜力的资源,如何管理WWW上的大量信息,以满足用户不断增长的高质量的信息需求?WWW作为一种新的环境资源,为新技术的产生开辟了新的领域,同时也为传统技术(如数据库。
关键词 信息检索系统 数据库 WEB 数据查询 WWW
下载PDF
基于地理空间本体的语义检索相关度研究 被引量:14
16
作者 宋佳 王卷乐 +1 位作者 诸云强 冯敏 《计算机工程与应用》 CSCD 北大核心 2011年第5期114-117,共4页
以地理信息领域为应用背景,面向地理空间语义检索,基于地球信息科学中的空间拓扑理论,以空间本体为语义检索的概念空间,提出了一种语义相关度的算法。其特点是考虑了传统字面匹配相关度与语义关系相关度两部分的融合,同时引入了本体关... 以地理信息领域为应用背景,面向地理空间语义检索,基于地球信息科学中的空间拓扑理论,以空间本体为语义检索的概念空间,提出了一种语义相关度的算法。其特点是考虑了传统字面匹配相关度与语义关系相关度两部分的融合,同时引入了本体关系权值的机制控制在不同语义检索应用中本体的关联程度,并体现了其与语义距离的反比关系。通过所作的相关实验,验证了该语义相关度算法在地理空间语义检索应用中可以达到良好的效果,并且也为其他领域应用提供了较好的参考和借鉴价值。 展开更多
关键词 语义相关度 语义检索 本体 空间查询 语义距离
下载PDF
信息检索中的相关反馈技术综述 被引量:12
17
作者 严华云 刘其平 肖良军 《计算机应用研究》 CSCD 北大核心 2009年第1期11-14,共4页
论述了信息检索中的向量空间模型、概率模型以及语言模型中所采用的相关反馈技术。其中主要介绍检索词的权重调整、查询扩展、文档相关反馈,以及语言模型中的查询语言模型和文档语言模型的调整。针对最近反馈方面的最新成果——基于ter... 论述了信息检索中的向量空间模型、概率模型以及语言模型中所采用的相关反馈技术。其中主要介绍检索词的权重调整、查询扩展、文档相关反馈,以及语言模型中的查询语言模型和文档语言模型的调整。针对最近反馈方面的最新成果——基于term的反馈技术进行了探讨,指出了相关反馈在今后研究的方向,即提供个性化的如分层反馈和利用日志进行反馈,并讨论了相关反馈技术对检索性能的影响。 展开更多
关键词 信息检索 相关反馈 查询扩展
下载PDF
专利查询扩展的词向量方法研究 被引量:12
18
作者 许侃 林原 +2 位作者 曲忱 徐博 林鸿飞 《计算机科学与探索》 CSCD 北大核心 2018年第6期972-980,共9页
查询扩展技术被广泛地应用于信息检索系统中。为提高专利检索的结果,采用查询扩展方法进行优化,利用相关专利文本训练词向量,并选择与原始查询相似度高的候选词作为查询扩展词,加入原始查询中。提出4种方法运用词向量获取查询扩展词,并... 查询扩展技术被广泛地应用于信息检索系统中。为提高专利检索的结果,采用查询扩展方法进行优化,利用相关专利文本训练词向量,并选择与原始查询相似度高的候选词作为查询扩展词,加入原始查询中。提出4种方法运用词向量获取查询扩展词,并提出两种方法进行扩展词相关性排序,改进已有的查询扩展词选择方法。在TREC数据集上的实验显示,将词向量模型进行扩展词选择的方法与传统的TF-IDF扩展词选择方法相融合,可以有效提高查询扩展模型的性能,对于理解用户的查询意图有着很好的促进作用。 展开更多
关键词 信息检索 查询扩展 排序学习 专利检索
下载PDF
基于相关文档池建模的查询扩展 被引量:7
19
作者 吕碧波 赵军 《中文信息学报》 CSCD 北大核心 2006年第3期78-83,共6页
在信息检索领域,相关反馈是提高检索性能的有效方法之一。所谓相关反馈,指用户按照一定策略从查找到的相关文档中选择一些和主题相关的词进行查询扩展的技术。本文介绍了概率模型和向量空间模型下的常用查询扩展方法,并提出了一种基于... 在信息检索领域,相关反馈是提高检索性能的有效方法之一。所谓相关反馈,指用户按照一定策略从查找到的相关文档中选择一些和主题相关的词进行查询扩展的技术。本文介绍了概率模型和向量空间模型下的常用查询扩展方法,并提出了一种基于语言模型的相关反馈方法,该方法同时考虑了扩展词应该具备的两个特征,即相关性和覆盖性。在TREC测试集上对这些算法进行了比较,结果表明这种新算法在平均准确率上比传统方法有所提高。 展开更多
关键词 计算机应用 中文信息处理 信息检索 相关反馈 查询扩展
下载PDF
基于深度学习的查询扩展研究 被引量:12
20
作者 余传明 蔡林 +1 位作者 胡莎莎 安璐 《情报学报》 CSSCI CSCD 北大核心 2019年第10期1066-1077,共12页
通过在查询扩展中引入深度学习框架,并结合局部和全局查询扩展模型,从而解决查询扩展中伪相关反馈引起的查询漂移问题。选择eBay于2017年发布的查询短语和商品名称作为实验数据,在伪相关反馈的基础上提出基于深度学习的查询扩展模型(dee... 通过在查询扩展中引入深度学习框架,并结合局部和全局查询扩展模型,从而解决查询扩展中伪相关反馈引起的查询漂移问题。选择eBay于2017年发布的查询短语和商品名称作为实验数据,在伪相关反馈的基础上提出基于深度学习的查询扩展模型(deep learning based query expansion model,DLQEM),以实现更准确有效的查询扩展,并将其应用到信息检索任务中。实验结果表明,DLQEM的precision@10值在伪相关反馈(PRF)的基础上分别提高了3.5%和3.7%,验证了本文所提出假设(通过概念相关扩展词与反馈信息扩展词取交集能够有效地控制反馈相关扩展词造成的查询漂移)的有效性。深度学习能够解决监督学习在短文本集上难以获得好的分类效果的问题,将其与传统查询扩展模型进行结合,解决了传统查询扩展中需要用户参与和检索速度迟缓两大弊端,控制了查询漂移。 展开更多
关键词 信息检索 查询扩展 深度学习 伪相关反馈
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部