期刊文献+
共找到94篇文章
< 1 2 5 >
每页显示 20 50 100
Lucene的全文检索的研究与应用 被引量:55
1
作者 李永春 丁华福 《计算机技术与发展》 2010年第2期12-15,共4页
为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型... 为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型的全文检索系统的实现,同时可基于此模型开发定制个性化的搜索引擎。最后通过实验对比了其与传统检索方式的响应时间,利用Lucene的全文检索具有更快的响应速度。 展开更多
关键词 全文检索 LUCENE 索引
下载PDF
基于Lucene的中文倒排索引技术的研究 被引量:50
2
作者 郑榕增 林世平 《计算机技术与发展》 2010年第3期80-83,共4页
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引... 索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引模式,分析了Lucene索引文件的结构、索引过程以及相关排序算法,讨论了Lucene的压缩算法,并且通过设计一个中文模块实现了基于正向减字最大匹配分词方式的中文索引。实验表明新的分词算法比Lucene自带的分词算法性能有了很大的提高。 展开更多
关键词 全文检索 倒排索引 索引压缩Lucene
下载PDF
面向网络的全文检索中索引文件的组织 被引量:12
3
作者 颜维龙 盖杰 +1 位作者 武港山 袁春风 《计算机应用研究》 CSCD 北大核心 2002年第11期124-126,146,共4页
为了提高网络中全文检索的效率 ,需要对Web页面中内容进行分析、建立全文索引 ,并对索引的结构进行高效率的组织。讨论了索引的组织结构及其实现方法 ,并分析了不同的组织方法的性能。
关键词 全文检索 字表 正排表 倒排表 索引
下载PDF
一种基于Lucene的中文全文检索系统 被引量:22
4
作者 苏潭英 郭宪勇 金鑫 《计算机工程》 CAS CSCD 北大核心 2007年第23期94-96,共3页
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检... 在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检索效率。该系统增加了加密模块,实现对建立的全文索引进行加密处理,增强了信息的安全性。 展开更多
关键词 全文检索 LUCENE 倒排索引
下载PDF
一种高效的全文检索索引技术 被引量:7
5
作者 陈玮 陈玉鹏 +1 位作者 石晶 陆达 《计算机应用研究》 CSCD 北大核心 2004年第7期35-37,40,共4页
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析 。
关键词 全文检索 词索引 内存缓存 索引压缩
下载PDF
一个中英文全文搜索引擎的设计与实现 被引量:4
6
作者 陈华辉 《计算机应用研究》 CSCD 北大核心 2001年第3期131-133,共3页
介绍了一个中英文全文搜索引擎的设计与实现。探讨了该搜索引擎的设计思想,讨论了其中全文索引的组织及压缩方法和全文检索算法,并给出了在英语教学语料库管理系统中的应用实例。
关键词 中英文全文搜索引擎 语料库管理系统 信息检索 INTERNET 信息处理
下载PDF
一种全新的全文索引模型——后继数组模型 被引量:11
7
作者 刘学文 陶晓鹏 +1 位作者 于玉 胡运发 《软件学报》 EI CSCD 北大核心 2002年第1期150-158,共9页
提出了一种新的全文索引模型——后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关键词 全文索引模型 后继数组模型 文本数据库 数据模型
下载PDF
B-树/B+树的批量插入算法 被引量:11
8
作者 魏小亮 蔡弘 《中央民族大学学报(自然科学版)》 2001年第1期57-61,共5页
本文对传统的B -树 /B +树插入算法进行改进 ,提出了B -树 /B +树的批量插入的算法 ,在理论上估计了该算法的复杂度 ,并进行了比较实验 .实验结果表明 :本算法在对大批量的关键字建立索引时 ,大大提高了B -树 /B +树的插入效率 。
关键词 B+树 插入 算法 批量 索引 关键字 复杂度 比较实验 实验结果 更新
下载PDF
一种基于可扩展散列表的倒排索引更新策略 被引量:6
9
作者 吴恒山 刘兴宇 左琼 《计算机工程》 CAS CSCD 北大核心 2004年第8期83-84,F003,共3页
该文提出一种新的基于可扩展散列表的倒排索引更新策略,使倒排索引具有良好的可扩展性。它既支持文档的插入、删除操作,又具有较高的查询效率和空间利用率。并在它的基础上,实现了倒排索引的增量更新和实时更新。
关键词 全文检索 倒排索引 增量更新 可扩展散列表
下载PDF
基于全文本分析的引文指标研究——以F1000推荐论文为例 被引量:11
10
作者 彭秋茹 阎素兰 黄水清 《信息资源管理学报》 CSSCI 2019年第4期82-88,共7页
利用全文本分析法探讨更细粒度的引文指标计算方式,有利于更好地反映真实的引用情况,为引文指标的选择和改进提供参考。本文通过施引文献全文数据的获取、引用语境识别、引用信息识别、引文指标计算等步骤来讨论基于全文本分析的引文指... 利用全文本分析法探讨更细粒度的引文指标计算方式,有利于更好地反映真实的引用情况,为引文指标的选择和改进提供参考。本文通过施引文献全文数据的获取、引用语境识别、引用信息识别、引文指标计算等步骤来讨论基于全文本分析的引文指标的获取和计算问题,再以F1000平台上的57篇论文为例,获取相关施引文献数据,基于引用强度、引用位置、引用情感等信息计算引文指标,对引用价值进行深入的分析,研究结果表明,学术论文在同一篇施引文献中存在多次被引,传统基于参考文献列表的被引次数计算方式不能真实反映学术论文的被引情况,对实证论文的引用多为不带明显情感倾向的中性引用,负面引用极少;实证论文被引超过半数发生在施引文献的结果位置,且在结果位置发生被引的比例越高,论文越受到领域专家的偏好。 展开更多
关键词 全文本分析 引文指标 引用位置 引用情感 引用强度 F1000
下载PDF
一个中文全文检索系统的设计与实现 被引量:3
11
作者 曾元鉴 李孝明 《计算机与数字工程》 2004年第3期12-15,共4页
本文主要分析了中文全文检索技术中有关内容 ,并根据此内容设计实现了一个中文全文检索系统。在此系统中 ,提出了相应的数据采集方案、数据存储格式、数据压缩和信息检索机制。
关键词 全文检索 数据采集 索引 压缩 数据检索
下载PDF
基于Lucene的全文检索系统的研究与实现 被引量:10
12
作者 周锦程 王丹 +1 位作者 余泉 张维 《计算机技术与发展》 2011年第3期67-71,共5页
Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,... Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,介绍了全文检索系统的概念并分析了Lucene的系统结构和实现机制,最后结合实际应用背景从系统设计、文挡抽取、索引的建立及执行检索等方面介绍了全文检索系统的实现过程。实践证明,该系统的查准率、查询速度等均达到了设计要求。 展开更多
关键词 全文检索 索引 信息检索
下载PDF
轻量级缓存策略的关系型数据库全文搜索加强与扩展 被引量:4
13
作者 杨婷 莫若玉 +1 位作者 张秀娟 朱洲森 《计算机应用》 CSCD 北大核心 2023年第8期2431-2438,共8页
针对关系型数据库(RDB)现有的全文搜索方案存在的效率低下、资源占用高的问题,提出一种具有增强式辅助缓存的轻量级关系型数据库全文搜索模型。首先,该模型构建基于Redis的倒排索引,并利用缓存索引缩小搜索范围,从而用内存高效的数据处... 针对关系型数据库(RDB)现有的全文搜索方案存在的效率低下、资源占用高的问题,提出一种具有增强式辅助缓存的轻量级关系型数据库全文搜索模型。首先,该模型构建基于Redis的倒排索引,并利用缓存索引缩小搜索范围,从而用内存高效的数据处理能力解决关系型数据库I/O瓶颈,并提升系统整体性能;其次,为保证搜索结果的准确性和时效性,进一步提出索引同步策略,而且设计并实现了增量索引组件来隐藏索引处理细节,从而提高模型的易用性和通用性;最后,对于热点数据提供一种基于访问热度的索引更新机制,以降低倒排索引的内存占用。实验结果表明,所提模型在保证关系型数据库全文搜索响应速度和准确度的前提下,空间资源消耗比MySQL全文索引降低了48.8%~60.9%,比Elasticsearch降低了85.2%~96.2%,证明所提模型在实际应用中可行且有效。 展开更多
关键词 MYSQL REDIS 全文搜索 倒排索引 一致性
下载PDF
基于Lucene对文件全文检索的研究与应用 被引量:8
14
作者 郭永利 卢颖颖 《微型电脑应用》 2014年第1期51-54,共4页
分析了Lucene的原理,针对Lucene的IndexReader、IndexSearcher、IndexWriter、Directory的各种不足,研究了不同优化方案,并通过重写源码中的QueryParser限制效率低下的通配符查询及模糊查询,提高了搜索响应速度,最后,文章研究了Lucene... 分析了Lucene的原理,针对Lucene的IndexReader、IndexSearcher、IndexWriter、Directory的各种不足,研究了不同优化方案,并通过重写源码中的QueryParser限制效率低下的通配符查询及模糊查询,提高了搜索响应速度,最后,文章研究了Lucene的多个应用领域。 展开更多
关键词 搜索引擎 全文搜索 分词 索引 优化
下载PDF
Unicode全文检索技术的研究与实现 被引量:5
15
作者 付哲 王晓波 杨秀霞 《计算机工程》 CAS CSCD 北大核心 2001年第10期110-113,共4页
根据实际的开发经验,详细阐述了一个全文检索系统中采用的主要技术,并提出了具体实现,基本构造了一个使用的基于Unicode和词表的全文检索系统。
关键词 UNICODE 全文检索 高速缓存 索引库 INTERNET
下载PDF
全文检索系统的数据预处理研究 被引量:3
16
作者 韩升 刘广志 《计算机技术与发展》 2006年第3期208-210,共3页
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索... 全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。 展开更多
关键词 全文检索 预处理 文本标引 索引数据库
下载PDF
基于Lucene的全文检索系统模型的研究及应用 被引量:6
17
作者 梁弼 王光琼 邓小清 《微型机与应用》 2011年第1期44-46,共3页
分析了Lucene的系统结构及检索原理,设计了一个基于Lucene的全文检索系统模型,并将该系统模型应用到自动答疑系统中进行实验。实验结果表明,以Lucene作为核心的检索系统不仅建立索引的效率高,而且检索速度也较快。
关键词 LUCENE 全文检索 索引 搜索速度
下载PDF
后缀数组创建算法的分析和比较 被引量:4
18
作者 杨笑天 陶晓鹏 《计算机工程》 CAS CSCD 北大核心 2007年第3期186-188,199,共4页
后缀数组构建算法的时间和空间开销是它在实际应用中的瓶颈。该文介绍了两种较好的构建算法,对它们的性能作了评估和分析,指出了各自的适用范围,给出并比较了两种算法在不同情况下的实验结果。
关键词 全文检索 后缀数组 后缀树 线性时间
下载PDF
基于B+树的文本信息检索技术 被引量:6
19
作者 张华 顾红飞 刘涛 《皖西学院学报》 2010年第2期31-35,共5页
随着人类步入信息时代,网上庞大的数字化信息与人们获取所需信息能力之间的矛盾日益突出,怎样快速地检索相关信息已经成为研究热点。阐述了全文检索系统的原理,分析了基于字表结构的索引组织方法和索引库的建立。通过和B-树的对比,提出... 随着人类步入信息时代,网上庞大的数字化信息与人们获取所需信息能力之间的矛盾日益突出,怎样快速地检索相关信息已经成为研究热点。阐述了全文检索系统的原理,分析了基于字表结构的索引组织方法和索引库的建立。通过和B-树的对比,提出了基于B+树的索引存储方法及其算法思想,对提高索引的存储效率和查找速度具有一定意义。 展开更多
关键词 B+树 全文索引 B-树 倒排索引
下载PDF
全文检索技术在图书检索中的应用
20
作者 高霞 《中原工学院学报》 CAS 2024年第2期85-89,共5页
现有的图书检索方法多是对馆藏图书进行编目、分类、标注等处理后形成书目数据库,用户根据书名、作者和出版社等信息来检索图书。这种方式不能满足用户根据任意关键词来检索图书的需求,效率较低。全文检索是基于倒排索引技术对文本中的... 现有的图书检索方法多是对馆藏图书进行编目、分类、标注等处理后形成书目数据库,用户根据书名、作者和出版社等信息来检索图书。这种方式不能满足用户根据任意关键词来检索图书的需求,效率较低。全文检索是基于倒排索引技术对文本中的所有词组和关键词进行索引,支持快速检索到文本中任何一个单词和关键词。若将全文检索技术应用于图书检索中,可使用户根据任意关键词检索图书,可根据检索量和用户习惯推荐热门图书。文章介绍了如何在图书检索过程中应用全文检索技术,分析了全文检索引擎选择、图书文本解析、图书文本分词、图书索引设计、图书文档提交等主要过程,并给出了全文检索技术的最终实现效果,以期对提升图书检索系统的易用性提供一定借鉴。 展开更多
关键词 图书检索系统 全文检索 分词器 索引结构 推荐算法 检索命中率
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部