期刊文献+
共找到351篇文章
< 1 2 18 >
每页显示 20 50 100
Lucene的全文检索的研究与应用 被引量:55
1
作者 李永春 丁华福 《计算机技术与发展》 2010年第2期12-15,共4页
为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型... 为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型的全文检索系统的实现,同时可基于此模型开发定制个性化的搜索引擎。最后通过实验对比了其与传统检索方式的响应时间,利用Lucene的全文检索具有更快的响应速度。 展开更多
关键词 全文检索 LUCENE 索引
下载PDF
基于Lucene的中文倒排索引技术的研究 被引量:50
2
作者 郑榕增 林世平 《计算机技术与发展》 2010年第3期80-83,共4页
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引... 索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引模式,分析了Lucene索引文件的结构、索引过程以及相关排序算法,讨论了Lucene的压缩算法,并且通过设计一个中文模块实现了基于正向减字最大匹配分词方式的中文索引。实验表明新的分词算法比Lucene自带的分词算法性能有了很大的提高。 展开更多
关键词 全文检索 倒排索引 索引压缩Lucene
下载PDF
全文检索字索引技术的研究与实现 被引量:26
3
作者 曹元大 贺海军 +1 位作者 涂哲明 王琴 《计算机工程》 CAS CSCD 北大核心 2002年第6期260-262,共3页
针对中文全文检索字表法检索索引的创建,提出了快速的建立方法,并根据中文文本的特点,提出了有效的索引压缩方法。实验表明,使用虚拟内存技术可以大大节省索引的建立时间;采用字节对齐的索引压缩技术,不但可以有效地减少索引占用的磁盘... 针对中文全文检索字表法检索索引的创建,提出了快速的建立方法,并根据中文文本的特点,提出了有效的索引压缩方法。实验表明,使用虚拟内存技术可以大大节省索引的建立时间;采用字节对齐的索引压缩技术,不但可以有效地减少索引占用的磁盘空间,而且可以加快检索时间,索引的空间和时间效率都得以提高。 展开更多
关键词 全文检索 字索引 虚拟内存 互联网
下载PDF
全文数据库建库原理与应用技术 被引量:28
4
作者 王兰成 蒋丹 刘庆辉 《情报学报》 CSSCI 北大核心 1999年第4期321-328,共8页
全文数据库是处理文献信息中知识与数据的有力工具,近年来得到迅猛发展。本文首先详细分析了全文数据库的特点,提出了建立全文数据库的各种数据结构,系统介绍全文数据库的开发步骤。然后论述全文数据库的标引和检索技术,提出一些新... 全文数据库是处理文献信息中知识与数据的有力工具,近年来得到迅猛发展。本文首先详细分析了全文数据库的特点,提出了建立全文数据库的各种数据结构,系统介绍全文数据库的开发步骤。然后论述全文数据库的标引和检索技术,提出一些新的处理技术。最后就全文数据库实际应用中的一些问题,提供了解决方案。 展开更多
关键词 全文数据库 软件开发 文献标引 全文检索
下载PDF
文本信息检索技术 被引量:31
5
作者 邹涛 王继成 +1 位作者 杨文清 张福炎 《计算机科学》 CSCD 北大核心 1999年第9期72-75,共4页
1.引言随着信息技术的发展,人们已经从信息缺乏的时代过渡到了信息极大丰富的时代,于是也就出现了“富数据穷信息”的问题。如何迅速、有效地从大量数据中找到所需的信息已经成为信息服务领域中的重要的、亟待解决的问题,信息检索技术... 1.引言随着信息技术的发展,人们已经从信息缺乏的时代过渡到了信息极大丰富的时代,于是也就出现了“富数据穷信息”的问题。如何迅速、有效地从大量数据中找到所需的信息已经成为信息服务领域中的重要的、亟待解决的问题,信息检索技术就是针对这一问题所发展起来的。尽管与多媒体信息相比,文本信息显得比较平凡,但它是人们用于信息记载和信息传播的最重要的媒体之一,也是人们最熟悉。 展开更多
关键词 文本信息检索 全文检索系统 字表法 字符串
下载PDF
中文Web文档全文检索系统的设计及实现 被引量:15
6
作者 曹元大 贺海军 涂哲明 《北京理工大学学报》 EI CAS CSCD 北大核心 2002年第1期68-71,共4页
为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结... 为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结构和实现 .测试表明 ,该系统在响应时间和查准率方面性能均比较好 。 展开更多
关键词 全文检索 WEB文档 字索引 压缩算法 索引库 中文检索系统 系统设计
下载PDF
一种基于Lucene的中文全文检索系统 被引量:22
7
作者 苏潭英 郭宪勇 金鑫 《计算机工程》 CAS CSCD 北大核心 2007年第23期94-96,共3页
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检... 在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检索效率。该系统增加了加密模块,实现对建立的全文索引进行加密处理,增强了信息的安全性。 展开更多
关键词 全文检索 LUCENE 倒排索引
下载PDF
基于全文搜索的中文搜索引擎设计技术 被引量:10
8
作者 陈燕娜 邵志清 《计算机工程与应用》 CSCD 北大核心 2002年第17期196-198,共3页
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对... 随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对信息处理中的关键技术进行了探讨。 展开更多
关键词 全文搜索 中文搜索引擎设计 技术 WWW 中文分词技术 文档相关性 Internet
下载PDF
具有三级索引词库结构的中文分词方法研究 被引量:16
9
作者 肖红 许少华 李欣 《计算机应用研究》 CSCD 北大核心 2006年第8期49-51,共3页
提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文... 提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。 展开更多
关键词 中文切词 正向最大匹配 词库 索引密度 全文检索
下载PDF
全文检索模型综述 被引量:12
10
作者 申展 江宝林 +2 位作者 陈祎 唐磊 胡运发 《计算机科学》 CSCD 北大核心 2004年第5期61-64,共4页
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全... 全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全文检索模型构建中一些关键问题进行了分析。 展开更多
关键词 信息检索 文档数据库 全文检索模型 倒排表 Pat-树 互关联后继树 位图 署名文件
下载PDF
基于单汉字索引的全文检索系统的优化研究 被引量:11
11
作者 余海燕 张仲义 《中文信息学报》 CSCD 北大核心 2001年第4期14-19,27,共7页
对于按照单汉字建立倒排索引的全文检索系统 ,最需要解决的问题是如何提高其存储效率和运算速度。本文针对此问题提出了以下优化方法 :一是利用参数化的Golomb编码对倒排文件进行压缩 ;二是对求集合交集的逻辑乘算法进行改进 ;三是运用... 对于按照单汉字建立倒排索引的全文检索系统 ,最需要解决的问题是如何提高其存储效率和运算速度。本文针对此问题提出了以下优化方法 :一是利用参数化的Golomb编码对倒排文件进行压缩 ;二是对求集合交集的逻辑乘算法进行改进 ;三是运用并行计算和双缓冲技术。实验结果表明 ,经过优化后的单汉字全文检索系统已达到实用化的程度。 展开更多
关键词 单汉字标引 倒排文件 Golomb编码 全文检索系统 倒排索引 单汉字索引
下载PDF
一种改进的Wu-Manber多模式匹配算法及应用 被引量:10
12
作者 孙晓山 王强 +1 位作者 关毅 王晓龙 《中文信息学报》 CSCD 北大核心 2006年第2期47-52,共6页
本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manbe... 本文针对Wu-Manber多模式匹配算法在处理后缀模式情况下的不足,给出了一种改进的后缀模式处理算法,减少了匹配过程中字符比较的次数,提高了算法的运行效率。本文在随机选择的TREC2000的52,067篇文档上进行了全文检索实验,对比了Wu-Manber算法、使用后缀模式的改进算法、不使用后缀模式的简单改进等三种算法的匹配过程中字符比较的次数。实验结果说明,本文的改进能够比较稳定的减少匹配过程中字符比较的次数,提高匹配的速度和效率。 展开更多
关键词 计算机应用 中文信息处理 多模式匹配 后缀模式 字符串匹配 全文检索 信息检索
下载PDF
一种全文检索系统的设计与实现 被引量:13
13
作者 涂新辉 何婷婷 罗景 《计算机工程》 EI CAS CSCD 北大核心 2005年第17期55-57,共3页
在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统... 在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统核心接口层。最后给出了该系统的一种分布式部署方案。 展开更多
关键词 全文检索 全文索引 倒排文件 分布式
下载PDF
一种高效的全文检索索引技术 被引量:7
14
作者 陈玮 陈玉鹏 +1 位作者 石晶 陆达 《计算机应用研究》 CSCD 北大核心 2004年第7期35-37,40,共4页
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析 。
关键词 全文检索 词索引 内存缓存 索引压缩
下载PDF
一个中英文全文搜索引擎的设计与实现 被引量:4
15
作者 陈华辉 《计算机应用研究》 CSCD 北大核心 2001年第3期131-133,共3页
介绍了一个中英文全文搜索引擎的设计与实现。探讨了该搜索引擎的设计思想,讨论了其中全文索引的组织及压缩方法和全文检索算法,并给出了在英语教学语料库管理系统中的应用实例。
关键词 中英文全文搜索引擎 语料库管理系统 信息检索 INTERNET 信息处理
下载PDF
全文检索研究 被引量:13
16
作者 杨建林 《情报理论与实践》 CSSCI 北大核心 2000年第1期12-13,共2页
A new algorithm for automatic segmentation of Chinese word with the stop word list and post controlled thesaurus,that has absorbed the ideas from the single Chinese character method and the thesaurus method,is given.B... A new algorithm for automatic segmentation of Chinese word with the stop word list and post controlled thesaurus,that has absorbed the ideas from the single Chinese character method and the thesaurus method,is given.Based on this algorithm,a new full text retrieval mode is 展开更多
关键词 全文检索 检索 西文信息
下载PDF
网络环境下信息存储与检索技术的发展 被引量:10
17
作者 吴慰慈 《四川图书馆学报》 2003年第1期3-6,共4页
信息存储与检索技术是信息传递中的重要环节。检索语言和检索效率密切相关 ,它在信息检索过程中起着语言保障的作用。为满足不同用户能够检索到所需要的信息 ,检索语言必然朝着自然语言、用户界面友好的方向发展。
关键词 搜索引擎 信息检索 检索语言 人工语言 自然语言 多媒体 全文检索
下载PDF
90年代我国全文数据库及检索研究综述 被引量:10
18
作者 徐建华 杨毓丽 《情报理论与实践》 CSSCI 北大核心 2000年第5期392-394,共3页
The present situation of researches on full text databases and their retrieval method in China since 1990s are described.To have a better understanding of the development process of full text databases and their retri... The present situation of researches on full text databases and their retrieval method in China since 1990s are described.To have a better understanding of the development process of full text databases and their retrieval method,the focus and trend of the researches are discussed so as to provide references for their future development. 展开更多
关键词 全文数据库 数据库开发 检索技术 自动标引技术
下载PDF
自然语言处理技术在中文全文检索中的应用 被引量:9
19
作者 熊回香 夏立新 《情报理论与实践》 CSSCI 北大核心 2008年第3期432-435,共4页
自然语言处理技术是中文全文检索的基础。首先介绍了全文检索技术及自然语言处理技术,接着详细地阐述了自然语言处理技术在中文全文检索中的应用,并对目前基于自然语言处理技术的中文全文检索技术的局限性进行了分析,探讨了中文全文检... 自然语言处理技术是中文全文检索的基础。首先介绍了全文检索技术及自然语言处理技术,接着详细地阐述了自然语言处理技术在中文全文检索中的应用,并对目前基于自然语言处理技术的中文全文检索技术的局限性进行了分析,探讨了中文全文检索技术的未来发展方向。 展开更多
关键词 自然语言处理 全文检索 智能检索
下载PDF
一种基于可扩展散列表的倒排索引更新策略 被引量:6
20
作者 吴恒山 刘兴宇 左琼 《计算机工程》 CAS CSCD 北大核心 2004年第8期83-84,F003,共3页
该文提出一种新的基于可扩展散列表的倒排索引更新策略,使倒排索引具有良好的可扩展性。它既支持文档的插入、删除操作,又具有较高的查询效率和空间利用率。并在它的基础上,实现了倒排索引的增量更新和实时更新。
关键词 全文检索 倒排索引 增量更新 可扩展散列表
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部