期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
94
篇文章
<
1
2
…
5
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Lucene的全文检索的研究与应用
被引量:
55
1
作者
李永春
丁华福
《计算机技术与发展》
2010年第2期12-15,共4页
为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型...
为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型的全文检索系统的实现,同时可基于此模型开发定制个性化的搜索引擎。最后通过实验对比了其与传统检索方式的响应时间,利用Lucene的全文检索具有更快的响应速度。
展开更多
关键词
全文检索
LUCENE
索引
下载PDF
职称材料
基于Lucene的中文倒排索引技术的研究
被引量:
50
2
作者
郑榕增
林世平
《计算机技术与发展》
2010年第3期80-83,共4页
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引...
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引模式,分析了Lucene索引文件的结构、索引过程以及相关排序算法,讨论了Lucene的压缩算法,并且通过设计一个中文模块实现了基于正向减字最大匹配分词方式的中文索引。实验表明新的分词算法比Lucene自带的分词算法性能有了很大的提高。
展开更多
关键词
全文检索
倒排索引
索引压缩Lucene
下载PDF
职称材料
面向网络的全文检索中索引文件的组织
被引量:
12
3
作者
颜维龙
盖杰
+1 位作者
武港山
袁春风
《计算机应用研究》
CSCD
北大核心
2002年第11期124-126,146,共4页
为了提高网络中全文检索的效率 ,需要对Web页面中内容进行分析、建立全文索引 ,并对索引的结构进行高效率的组织。讨论了索引的组织结构及其实现方法 ,并分析了不同的组织方法的性能。
关键词
全文检索
字表
正排表
倒排表
索引
下载PDF
职称材料
一种基于Lucene的中文全文检索系统
被引量:
22
4
作者
苏潭英
郭宪勇
金鑫
《计算机工程》
CAS
CSCD
北大核心
2007年第23期94-96,共3页
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检...
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检索效率。该系统增加了加密模块,实现对建立的全文索引进行加密处理,增强了信息的安全性。
展开更多
关键词
全文检索
LUCENE
倒排索引
下载PDF
职称材料
一种高效的全文检索索引技术
被引量:
7
5
作者
陈玮
陈玉鹏
+1 位作者
石晶
陆达
《计算机应用研究》
CSCD
北大核心
2004年第7期35-37,40,共4页
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析 。
关键词
全文检索
词索引
内存缓存
索引压缩
下载PDF
职称材料
一个中英文全文搜索引擎的设计与实现
被引量:
4
6
作者
陈华辉
《计算机应用研究》
CSCD
北大核心
2001年第3期131-133,共3页
介绍了一个中英文全文搜索引擎的设计与实现。探讨了该搜索引擎的设计思想,讨论了其中全文索引的组织及压缩方法和全文检索算法,并给出了在英语教学语料库管理系统中的应用实例。
关键词
中英文全文搜索引擎
语料库管理系统
信息检索
INTERNET
信息处理
下载PDF
职称材料
一种全新的全文索引模型——后继数组模型
被引量:
11
7
作者
刘学文
陶晓鹏
+1 位作者
于玉
胡运发
《软件学报》
EI
CSCD
北大核心
2002年第1期150-158,共9页
提出了一种新的全文索引模型——后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关键词
全文索引模型
后继数组模型
文本数据库
数据模型
下载PDF
职称材料
B-树/B+树的批量插入算法
被引量:
11
8
作者
魏小亮
蔡弘
《中央民族大学学报(自然科学版)》
2001年第1期57-61,共5页
本文对传统的B -树 /B +树插入算法进行改进 ,提出了B -树 /B +树的批量插入的算法 ,在理论上估计了该算法的复杂度 ,并进行了比较实验 .实验结果表明 :本算法在对大批量的关键字建立索引时 ,大大提高了B -树 /B +树的插入效率 。
关键词
B+树
插入
算法
批量
索引
关键字
复杂度
比较实验
实验结果
更新
下载PDF
职称材料
一种基于可扩展散列表的倒排索引更新策略
被引量:
6
9
作者
吴恒山
刘兴宇
左琼
《计算机工程》
CAS
CSCD
北大核心
2004年第8期83-84,F003,共3页
该文提出一种新的基于可扩展散列表的倒排索引更新策略,使倒排索引具有良好的可扩展性。它既支持文档的插入、删除操作,又具有较高的查询效率和空间利用率。并在它的基础上,实现了倒排索引的增量更新和实时更新。
关键词
全文检索
倒排索引
增量更新
可扩展散列表
下载PDF
职称材料
基于全文本分析的引文指标研究——以F1000推荐论文为例
被引量:
11
10
作者
彭秋茹
阎素兰
黄水清
《信息资源管理学报》
CSSCI
2019年第4期82-88,共7页
利用全文本分析法探讨更细粒度的引文指标计算方式,有利于更好地反映真实的引用情况,为引文指标的选择和改进提供参考。本文通过施引文献全文数据的获取、引用语境识别、引用信息识别、引文指标计算等步骤来讨论基于全文本分析的引文指...
利用全文本分析法探讨更细粒度的引文指标计算方式,有利于更好地反映真实的引用情况,为引文指标的选择和改进提供参考。本文通过施引文献全文数据的获取、引用语境识别、引用信息识别、引文指标计算等步骤来讨论基于全文本分析的引文指标的获取和计算问题,再以F1000平台上的57篇论文为例,获取相关施引文献数据,基于引用强度、引用位置、引用情感等信息计算引文指标,对引用价值进行深入的分析,研究结果表明,学术论文在同一篇施引文献中存在多次被引,传统基于参考文献列表的被引次数计算方式不能真实反映学术论文的被引情况,对实证论文的引用多为不带明显情感倾向的中性引用,负面引用极少;实证论文被引超过半数发生在施引文献的结果位置,且在结果位置发生被引的比例越高,论文越受到领域专家的偏好。
展开更多
关键词
全文本分析
引文指标
引用位置
引用情感
引用强度
F1000
下载PDF
职称材料
一个中文全文检索系统的设计与实现
被引量:
3
11
作者
曾元鉴
李孝明
《计算机与数字工程》
2004年第3期12-15,共4页
本文主要分析了中文全文检索技术中有关内容 ,并根据此内容设计实现了一个中文全文检索系统。在此系统中 ,提出了相应的数据采集方案、数据存储格式、数据压缩和信息检索机制。
关键词
全文检索
数据采集
索引
压缩
数据检索
下载PDF
职称材料
基于Lucene的全文检索系统的研究与实现
被引量:
10
12
作者
周锦程
王丹
+1 位作者
余泉
张维
《计算机技术与发展》
2011年第3期67-71,共5页
Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,...
Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,介绍了全文检索系统的概念并分析了Lucene的系统结构和实现机制,最后结合实际应用背景从系统设计、文挡抽取、索引的建立及执行检索等方面介绍了全文检索系统的实现过程。实践证明,该系统的查准率、查询速度等均达到了设计要求。
展开更多
关键词
全文检索
索引
信息检索
下载PDF
职称材料
轻量级缓存策略的关系型数据库全文搜索加强与扩展
被引量:
4
13
作者
杨婷
莫若玉
+1 位作者
张秀娟
朱洲森
《计算机应用》
CSCD
北大核心
2023年第8期2431-2438,共8页
针对关系型数据库(RDB)现有的全文搜索方案存在的效率低下、资源占用高的问题,提出一种具有增强式辅助缓存的轻量级关系型数据库全文搜索模型。首先,该模型构建基于Redis的倒排索引,并利用缓存索引缩小搜索范围,从而用内存高效的数据处...
针对关系型数据库(RDB)现有的全文搜索方案存在的效率低下、资源占用高的问题,提出一种具有增强式辅助缓存的轻量级关系型数据库全文搜索模型。首先,该模型构建基于Redis的倒排索引,并利用缓存索引缩小搜索范围,从而用内存高效的数据处理能力解决关系型数据库I/O瓶颈,并提升系统整体性能;其次,为保证搜索结果的准确性和时效性,进一步提出索引同步策略,而且设计并实现了增量索引组件来隐藏索引处理细节,从而提高模型的易用性和通用性;最后,对于热点数据提供一种基于访问热度的索引更新机制,以降低倒排索引的内存占用。实验结果表明,所提模型在保证关系型数据库全文搜索响应速度和准确度的前提下,空间资源消耗比MySQL全文索引降低了48.8%~60.9%,比Elasticsearch降低了85.2%~96.2%,证明所提模型在实际应用中可行且有效。
展开更多
关键词
MYSQL
REDIS
全文搜索
倒排索引
一致性
下载PDF
职称材料
基于Lucene对文件全文检索的研究与应用
被引量:
8
14
作者
郭永利
卢颖颖
《微型电脑应用》
2014年第1期51-54,共4页
分析了Lucene的原理,针对Lucene的IndexReader、IndexSearcher、IndexWriter、Directory的各种不足,研究了不同优化方案,并通过重写源码中的QueryParser限制效率低下的通配符查询及模糊查询,提高了搜索响应速度,最后,文章研究了Lucene...
分析了Lucene的原理,针对Lucene的IndexReader、IndexSearcher、IndexWriter、Directory的各种不足,研究了不同优化方案,并通过重写源码中的QueryParser限制效率低下的通配符查询及模糊查询,提高了搜索响应速度,最后,文章研究了Lucene的多个应用领域。
展开更多
关键词
搜索引擎
全文搜索
分词
索引
优化
下载PDF
职称材料
Unicode全文检索技术的研究与实现
被引量:
5
15
作者
付哲
王晓波
杨秀霞
《计算机工程》
CAS
CSCD
北大核心
2001年第10期110-113,共4页
根据实际的开发经验,详细阐述了一个全文检索系统中采用的主要技术,并提出了具体实现,基本构造了一个使用的基于Unicode和词表的全文检索系统。
关键词
UNICODE
全文检索
高速缓存
索引库
INTERNET
下载PDF
职称材料
全文检索系统的数据预处理研究
被引量:
3
16
作者
韩升
刘广志
《计算机技术与发展》
2006年第3期208-210,共3页
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索...
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。
展开更多
关键词
全文检索
预处理
文本标引
索引数据库
下载PDF
职称材料
基于Lucene的全文检索系统模型的研究及应用
被引量:
6
17
作者
梁弼
王光琼
邓小清
《微型机与应用》
2011年第1期44-46,共3页
分析了Lucene的系统结构及检索原理,设计了一个基于Lucene的全文检索系统模型,并将该系统模型应用到自动答疑系统中进行实验。实验结果表明,以Lucene作为核心的检索系统不仅建立索引的效率高,而且检索速度也较快。
关键词
LUCENE
全文检索
索引
搜索速度
下载PDF
职称材料
后缀数组创建算法的分析和比较
被引量:
4
18
作者
杨笑天
陶晓鹏
《计算机工程》
CAS
CSCD
北大核心
2007年第3期186-188,199,共4页
后缀数组构建算法的时间和空间开销是它在实际应用中的瓶颈。该文介绍了两种较好的构建算法,对它们的性能作了评估和分析,指出了各自的适用范围,给出并比较了两种算法在不同情况下的实验结果。
关键词
全文检索
后缀数组
后缀树
线性时间
下载PDF
职称材料
基于B+树的文本信息检索技术
被引量:
6
19
作者
张华
顾红飞
刘涛
《皖西学院学报》
2010年第2期31-35,共5页
随着人类步入信息时代,网上庞大的数字化信息与人们获取所需信息能力之间的矛盾日益突出,怎样快速地检索相关信息已经成为研究热点。阐述了全文检索系统的原理,分析了基于字表结构的索引组织方法和索引库的建立。通过和B-树的对比,提出...
随着人类步入信息时代,网上庞大的数字化信息与人们获取所需信息能力之间的矛盾日益突出,怎样快速地检索相关信息已经成为研究热点。阐述了全文检索系统的原理,分析了基于字表结构的索引组织方法和索引库的建立。通过和B-树的对比,提出了基于B+树的索引存储方法及其算法思想,对提高索引的存储效率和查找速度具有一定意义。
展开更多
关键词
B+树
全文索引
B-树
倒排索引
下载PDF
职称材料
全文检索技术在图书检索中的应用
20
作者
高霞
《中原工学院学报》
CAS
2024年第2期85-89,共5页
现有的图书检索方法多是对馆藏图书进行编目、分类、标注等处理后形成书目数据库,用户根据书名、作者和出版社等信息来检索图书。这种方式不能满足用户根据任意关键词来检索图书的需求,效率较低。全文检索是基于倒排索引技术对文本中的...
现有的图书检索方法多是对馆藏图书进行编目、分类、标注等处理后形成书目数据库,用户根据书名、作者和出版社等信息来检索图书。这种方式不能满足用户根据任意关键词来检索图书的需求,效率较低。全文检索是基于倒排索引技术对文本中的所有词组和关键词进行索引,支持快速检索到文本中任何一个单词和关键词。若将全文检索技术应用于图书检索中,可使用户根据任意关键词检索图书,可根据检索量和用户习惯推荐热门图书。文章介绍了如何在图书检索过程中应用全文检索技术,分析了全文检索引擎选择、图书文本解析、图书文本分词、图书索引设计、图书文档提交等主要过程,并给出了全文检索技术的最终实现效果,以期对提升图书检索系统的易用性提供一定借鉴。
展开更多
关键词
图书检索系统
全文检索
分词器
索引结构
推荐算法
检索命中率
下载PDF
职称材料
题名
Lucene的全文检索的研究与应用
被引量:
55
1
作者
李永春
丁华福
机构
哈尔滨理工大学计算机学院
哈尔滨工业大学计算机学院
出处
《计算机技术与发展》
2010年第2期12-15,共4页
基金
国家自然科学基金资助项目(60736014)
文摘
为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型的全文检索系统的实现,同时可基于此模型开发定制个性化的搜索引擎。最后通过实验对比了其与传统检索方式的响应时间,利用Lucene的全文检索具有更快的响应速度。
关键词
全文检索
LUCENE
索引
Keywords
full
text
retrieval
Lueene
index
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Lucene的中文倒排索引技术的研究
被引量:
50
2
作者
郑榕增
林世平
机构
福州大学数学与计算机科学学院
出处
《计算机技术与发展》
2010年第3期80-83,共4页
文摘
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引模式,分析了Lucene索引文件的结构、索引过程以及相关排序算法,讨论了Lucene的压缩算法,并且通过设计一个中文模块实现了基于正向减字最大匹配分词方式的中文索引。实验表明新的分词算法比Lucene自带的分词算法性能有了很大的提高。
关键词
全文检索
倒排索引
索引压缩Lucene
Keywords
full
-
text
retrieval
inverted
index
index
compression
Lucene
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向网络的全文检索中索引文件的组织
被引量:
12
3
作者
颜维龙
盖杰
武港山
袁春风
机构
软件技术研究所国家重点实验室南京大学计算机科学与技术系
出处
《计算机应用研究》
CSCD
北大核心
2002年第11期124-126,146,共4页
基金
国家自然科学基金资助项目 (6 0 0 730 30 )
国家"86 3"项目资助 (2 0 0 1AA110 334)
文摘
为了提高网络中全文检索的效率 ,需要对Web页面中内容进行分析、建立全文索引 ,并对索引的结构进行高效率的组织。讨论了索引的组织结构及其实现方法 ,并分析了不同的组织方法的性能。
关键词
全文检索
字表
正排表
倒排表
索引
Keywords
full
text
Search
Word
Lists
Forward
Lists
Inverted
Lists
index
分类号
TP393.03 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于Lucene的中文全文检索系统
被引量:
22
4
作者
苏潭英
郭宪勇
金鑫
机构
解放军信息工程大学电子技术学院
北京飞燕技术公司
解放军通信指挥学院
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第23期94-96,共3页
文摘
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检索效率。该系统增加了加密模块,实现对建立的全文索引进行加密处理,增强了信息的安全性。
关键词
全文检索
LUCENE
倒排索引
Keywords
full
-
text
retrieval
Lucene
inverse
index
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种高效的全文检索索引技术
被引量:
7
5
作者
陈玮
陈玉鹏
石晶
陆达
机构
清华大学光盘国家工程研究中心
出处
《计算机应用研究》
CSCD
北大核心
2004年第7期35-37,40,共4页
基金
国家"973"重点基础研究发展规划项目 (G19990 330 )
文摘
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析 。
关键词
全文检索
词索引
内存缓存
索引压缩
Keywords
full
-
text
Retrieval
Word-based
index
Memory
Cache
index
Compression
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一个中英文全文搜索引擎的设计与实现
被引量:
4
6
作者
陈华辉
机构
宁波大学信息科学与工程学院
出处
《计算机应用研究》
CSCD
北大核心
2001年第3期131-133,共3页
文摘
介绍了一个中英文全文搜索引擎的设计与实现。探讨了该搜索引擎的设计思想,讨论了其中全文索引的组织及压缩方法和全文检索算法,并给出了在英语教学语料库管理系统中的应用实例。
关键词
中英文全文搜索引擎
语料库管理系统
信息检索
INTERNET
信息处理
Keywords
Search
Engine
full
-
text
Retrieval
index
Corpus
分类号
TP391 [自动化与计算机技术—计算机应用技术]
G354.4 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
一种全新的全文索引模型——后继数组模型
被引量:
11
7
作者
刘学文
陶晓鹏
于玉
胡运发
机构
复旦大学
出处
《软件学报》
EI
CSCD
北大核心
2002年第1期150-158,共9页
文摘
提出了一种新的全文索引模型——后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关键词
全文索引模型
后继数组模型
文本数据库
数据模型
Keywords
full
-
text
index
inverted
list
Pat
array
subsequence
array
分类号
TP311.135 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
B-树/B+树的批量插入算法
被引量:
11
8
作者
魏小亮
蔡弘
机构
清华大学计算机系
IBM中国研究中心
出处
《中央民族大学学报(自然科学版)》
2001年第1期57-61,共5页
文摘
本文对传统的B -树 /B +树插入算法进行改进 ,提出了B -树 /B +树的批量插入的算法 ,在理论上估计了该算法的复杂度 ,并进行了比较实验 .实验结果表明 :本算法在对大批量的关键字建立索引时 ,大大提高了B -树 /B +树的插入效率 。
关键词
B+树
插入
算法
批量
索引
关键字
复杂度
比较实验
实验结果
更新
Keywords
B-Tree
B+Tree
index
Database
full
-
text
-
index
分类号
N941.1 [自然科学总论—系统科学]
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种基于可扩展散列表的倒排索引更新策略
被引量:
6
9
作者
吴恒山
刘兴宇
左琼
机构
华中科技大学计算机学院数据库与多媒体技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第8期83-84,F003,共3页
基金
国家"863"计划基金资助项目(2002AA423110)
文摘
该文提出一种新的基于可扩展散列表的倒排索引更新策略,使倒排索引具有良好的可扩展性。它既支持文档的插入、删除操作,又具有较高的查询效率和空间利用率。并在它的基础上,实现了倒排索引的增量更新和实时更新。
关键词
全文检索
倒排索引
增量更新
可扩展散列表
Keywords
full
-
text
retrieval
Inverted
index
Incremental
update
Extendible
hashing
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于全文本分析的引文指标研究——以F1000推荐论文为例
被引量:
11
10
作者
彭秋茹
阎素兰
黄水清
机构
南京农业大学信息科学技术学院
南京农业大学领域知识关联研究中心
出处
《信息资源管理学报》
CSSCI
2019年第4期82-88,共7页
基金
国家哲学社会科学基金项目“融合Altmetrics的科研影响力综合评价方法及实证研究”(15BTQ060)
南京农业大学中央高校科研业务费项目(SKPT2015011)的研究成果之一
文摘
利用全文本分析法探讨更细粒度的引文指标计算方式,有利于更好地反映真实的引用情况,为引文指标的选择和改进提供参考。本文通过施引文献全文数据的获取、引用语境识别、引用信息识别、引文指标计算等步骤来讨论基于全文本分析的引文指标的获取和计算问题,再以F1000平台上的57篇论文为例,获取相关施引文献数据,基于引用强度、引用位置、引用情感等信息计算引文指标,对引用价值进行深入的分析,研究结果表明,学术论文在同一篇施引文献中存在多次被引,传统基于参考文献列表的被引次数计算方式不能真实反映学术论文的被引情况,对实证论文的引用多为不带明显情感倾向的中性引用,负面引用极少;实证论文被引超过半数发生在施引文献的结果位置,且在结果位置发生被引的比例越高,论文越受到领域专家的偏好。
关键词
全文本分析
引文指标
引用位置
引用情感
引用强度
F1000
Keywords
full
-
text
analysis
Citation
index
Citation
location
Citation
emotion
Citation
frequency
F1000
分类号
G353.1 [文化科学—情报学]
下载PDF
职称材料
题名
一个中文全文检索系统的设计与实现
被引量:
3
11
作者
曾元鉴
李孝明
机构
驻广州
武汉数字工程研究所
出处
《计算机与数字工程》
2004年第3期12-15,共4页
文摘
本文主要分析了中文全文检索技术中有关内容 ,并根据此内容设计实现了一个中文全文检索系统。在此系统中 ,提出了相应的数据采集方案、数据存储格式、数据压缩和信息检索机制。
关键词
全文检索
数据采集
索引
压缩
数据检索
Keywords
full
-
text
Retrieval,Data
Collection,
index
,Compress,Data
Retrieval
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Lucene的全文检索系统的研究与实现
被引量:
10
12
作者
周锦程
王丹
余泉
张维
机构
黔南民族师范学院数学系
中山大学信息科学与技术学院
出处
《计算机技术与发展》
2011年第3期67-71,共5页
基金
贵州省自然科学基金资助项目(黔教科2008090)
文摘
Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,介绍了全文检索系统的概念并分析了Lucene的系统结构和实现机制,最后结合实际应用背景从系统设计、文挡抽取、索引的建立及执行检索等方面介绍了全文检索系统的实现过程。实践证明,该系统的查准率、查询速度等均达到了设计要求。
关键词
全文检索
索引
信息检索
Keywords
full
-
text
retrieval
index
information
retrieval
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
轻量级缓存策略的关系型数据库全文搜索加强与扩展
被引量:
4
13
作者
杨婷
莫若玉
张秀娟
朱洲森
机构
四川师范大学物理与电子工程学院
出处
《计算机应用》
CSCD
北大核心
2023年第8期2431-2438,共8页
基金
国家社会科学基金资助项目(20BMZ092)。
文摘
针对关系型数据库(RDB)现有的全文搜索方案存在的效率低下、资源占用高的问题,提出一种具有增强式辅助缓存的轻量级关系型数据库全文搜索模型。首先,该模型构建基于Redis的倒排索引,并利用缓存索引缩小搜索范围,从而用内存高效的数据处理能力解决关系型数据库I/O瓶颈,并提升系统整体性能;其次,为保证搜索结果的准确性和时效性,进一步提出索引同步策略,而且设计并实现了增量索引组件来隐藏索引处理细节,从而提高模型的易用性和通用性;最后,对于热点数据提供一种基于访问热度的索引更新机制,以降低倒排索引的内存占用。实验结果表明,所提模型在保证关系型数据库全文搜索响应速度和准确度的前提下,空间资源消耗比MySQL全文索引降低了48.8%~60.9%,比Elasticsearch降低了85.2%~96.2%,证明所提模型在实际应用中可行且有效。
关键词
MYSQL
REDIS
全文搜索
倒排索引
一致性
Keywords
MySQL
Redis
full
-
text
search
inverted
index
consistency
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Lucene对文件全文检索的研究与应用
被引量:
8
14
作者
郭永利
卢颖颖
机构
南阳电视广播大学
出处
《微型电脑应用》
2014年第1期51-54,共4页
文摘
分析了Lucene的原理,针对Lucene的IndexReader、IndexSearcher、IndexWriter、Directory的各种不足,研究了不同优化方案,并通过重写源码中的QueryParser限制效率低下的通配符查询及模糊查询,提高了搜索响应速度,最后,文章研究了Lucene的多个应用领域。
关键词
搜索引擎
全文搜索
分词
索引
优化
Keywords
Search
Engine
full
-
text
Search
Word
Segmentation
index
Optimize
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Unicode全文检索技术的研究与实现
被引量:
5
15
作者
付哲
王晓波
杨秀霞
机构
中国科学院软件研究所
书同文数字化技术有限公司
出处
《计算机工程》
CAS
CSCD
北大核心
2001年第10期110-113,共4页
文摘
根据实际的开发经验,详细阐述了一个全文检索系统中采用的主要技术,并提出了具体实现,基本构造了一个使用的基于Unicode和词表的全文检索系统。
关键词
UNICODE
全文检索
高速缓存
索引库
INTERNET
Keywords
Unicode
full
text
retrieval
index
Cache
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
G354.45 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
全文检索系统的数据预处理研究
被引量:
3
16
作者
韩升
刘广志
机构
北京交通大学软件学院
出处
《计算机技术与发展》
2006年第3期208-210,共3页
文摘
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。
关键词
全文检索
预处理
文本标引
索引数据库
Keywords
full
-
text
search
pretreatment
document
index
ing
index
database
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Lucene的全文检索系统模型的研究及应用
被引量:
6
17
作者
梁弼
王光琼
邓小清
机构
四川文理学院计算机科学系
出处
《微型机与应用》
2011年第1期44-46,共3页
基金
四川文理学院2009年科研项目(2009B02Z)
文摘
分析了Lucene的系统结构及检索原理,设计了一个基于Lucene的全文检索系统模型,并将该系统模型应用到自动答疑系统中进行实验。实验结果表明,以Lucene作为核心的检索系统不仅建立索引的效率高,而且检索速度也较快。
关键词
LUCENE
全文检索
索引
搜索速度
Keywords
Lucene
full
-
text
retrieval
index
search
speed
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
后缀数组创建算法的分析和比较
被引量:
4
18
作者
杨笑天
陶晓鹏
机构
复旦大学软件学院
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第3期186-188,199,共4页
文摘
后缀数组构建算法的时间和空间开销是它在实际应用中的瓶颈。该文介绍了两种较好的构建算法,对它们的性能作了评估和分析,指出了各自的适用范围,给出并比较了两种算法在不同情况下的实验结果。
关键词
全文检索
后缀数组
后缀树
线性时间
Keywords
full
text
index
Suffix
array
Suffix
tree
Linear
time
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于B+树的文本信息检索技术
被引量:
6
19
作者
张华
顾红飞
刘涛
机构
阜阳职业技术学院工程科技学院
出处
《皖西学院学报》
2010年第2期31-35,共5页
基金
安徽省优秀青年人才基金资助项目(2009SQRZ216)
文摘
随着人类步入信息时代,网上庞大的数字化信息与人们获取所需信息能力之间的矛盾日益突出,怎样快速地检索相关信息已经成为研究热点。阐述了全文检索系统的原理,分析了基于字表结构的索引组织方法和索引库的建立。通过和B-树的对比,提出了基于B+树的索引存储方法及其算法思想,对提高索引的存储效率和查找速度具有一定意义。
关键词
B+树
全文索引
B-树
倒排索引
Keywords
B+Tree
full
-
text
-
index
B-Tree
inverted
index
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
全文检索技术在图书检索中的应用
20
作者
高霞
机构
中原工学院图书馆
出处
《中原工学院学报》
CAS
2024年第2期85-89,共5页
文摘
现有的图书检索方法多是对馆藏图书进行编目、分类、标注等处理后形成书目数据库,用户根据书名、作者和出版社等信息来检索图书。这种方式不能满足用户根据任意关键词来检索图书的需求,效率较低。全文检索是基于倒排索引技术对文本中的所有词组和关键词进行索引,支持快速检索到文本中任何一个单词和关键词。若将全文检索技术应用于图书检索中,可使用户根据任意关键词检索图书,可根据检索量和用户习惯推荐热门图书。文章介绍了如何在图书检索过程中应用全文检索技术,分析了全文检索引擎选择、图书文本解析、图书文本分词、图书索引设计、图书文档提交等主要过程,并给出了全文检索技术的最终实现效果,以期对提升图书检索系统的易用性提供一定借鉴。
关键词
图书检索系统
全文检索
分词器
索引结构
推荐算法
检索命中率
Keywords
book
retrieval
system
full
-
text
retrieval
segmenter
index
structure
recommendation
algorithm
retrieval
hit
rate
分类号
TP39 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Lucene的全文检索的研究与应用
李永春
丁华福
《计算机技术与发展》
2010
55
下载PDF
职称材料
2
基于Lucene的中文倒排索引技术的研究
郑榕增
林世平
《计算机技术与发展》
2010
50
下载PDF
职称材料
3
面向网络的全文检索中索引文件的组织
颜维龙
盖杰
武港山
袁春风
《计算机应用研究》
CSCD
北大核心
2002
12
下载PDF
职称材料
4
一种基于Lucene的中文全文检索系统
苏潭英
郭宪勇
金鑫
《计算机工程》
CAS
CSCD
北大核心
2007
22
下载PDF
职称材料
5
一种高效的全文检索索引技术
陈玮
陈玉鹏
石晶
陆达
《计算机应用研究》
CSCD
北大核心
2004
7
下载PDF
职称材料
6
一个中英文全文搜索引擎的设计与实现
陈华辉
《计算机应用研究》
CSCD
北大核心
2001
4
下载PDF
职称材料
7
一种全新的全文索引模型——后继数组模型
刘学文
陶晓鹏
于玉
胡运发
《软件学报》
EI
CSCD
北大核心
2002
11
下载PDF
职称材料
8
B-树/B+树的批量插入算法
魏小亮
蔡弘
《中央民族大学学报(自然科学版)》
2001
11
下载PDF
职称材料
9
一种基于可扩展散列表的倒排索引更新策略
吴恒山
刘兴宇
左琼
《计算机工程》
CAS
CSCD
北大核心
2004
6
下载PDF
职称材料
10
基于全文本分析的引文指标研究——以F1000推荐论文为例
彭秋茹
阎素兰
黄水清
《信息资源管理学报》
CSSCI
2019
11
下载PDF
职称材料
11
一个中文全文检索系统的设计与实现
曾元鉴
李孝明
《计算机与数字工程》
2004
3
下载PDF
职称材料
12
基于Lucene的全文检索系统的研究与实现
周锦程
王丹
余泉
张维
《计算机技术与发展》
2011
10
下载PDF
职称材料
13
轻量级缓存策略的关系型数据库全文搜索加强与扩展
杨婷
莫若玉
张秀娟
朱洲森
《计算机应用》
CSCD
北大核心
2023
4
下载PDF
职称材料
14
基于Lucene对文件全文检索的研究与应用
郭永利
卢颖颖
《微型电脑应用》
2014
8
下载PDF
职称材料
15
Unicode全文检索技术的研究与实现
付哲
王晓波
杨秀霞
《计算机工程》
CAS
CSCD
北大核心
2001
5
下载PDF
职称材料
16
全文检索系统的数据预处理研究
韩升
刘广志
《计算机技术与发展》
2006
3
下载PDF
职称材料
17
基于Lucene的全文检索系统模型的研究及应用
梁弼
王光琼
邓小清
《微型机与应用》
2011
6
下载PDF
职称材料
18
后缀数组创建算法的分析和比较
杨笑天
陶晓鹏
《计算机工程》
CAS
CSCD
北大核心
2007
4
下载PDF
职称材料
19
基于B+树的文本信息检索技术
张华
顾红飞
刘涛
《皖西学院学报》
2010
6
下载PDF
职称材料
20
全文检索技术在图书检索中的应用
高霞
《中原工学院学报》
CAS
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
5
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部