期刊文献+
共找到350篇文章
< 1 2 18 >
每页显示 20 50 100
基于Lucene的中文倒排索引技术的研究 被引量:50
1
作者 郑榕增 林世平 《计算机技术与发展》 2010年第3期80-83,共4页
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引... 索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引模式,分析了Lucene索引文件的结构、索引过程以及相关排序算法,讨论了Lucene的压缩算法,并且通过设计一个中文模块实现了基于正向减字最大匹配分词方式的中文索引。实验表明新的分词算法比Lucene自带的分词算法性能有了很大的提高。 展开更多
关键词 全文检索 倒排索引 索引压缩Lucene
下载PDF
全文检索字索引技术的研究与实现 被引量:26
2
作者 曹元大 贺海军 +1 位作者 涂哲明 王琴 《计算机工程》 CAS CSCD 北大核心 2002年第6期260-262,共3页
针对中文全文检索字表法检索索引的创建,提出了快速的建立方法,并根据中文文本的特点,提出了有效的索引压缩方法。实验表明,使用虚拟内存技术可以大大节省索引的建立时间;采用字节对齐的索引压缩技术,不但可以有效地减少索引占用的磁盘... 针对中文全文检索字表法检索索引的创建,提出了快速的建立方法,并根据中文文本的特点,提出了有效的索引压缩方法。实验表明,使用虚拟内存技术可以大大节省索引的建立时间;采用字节对齐的索引压缩技术,不但可以有效地减少索引占用的磁盘空间,而且可以加快检索时间,索引的空间和时间效率都得以提高。 展开更多
关键词 全文检索 字索引 虚拟内存 互联网
下载PDF
一种基于Lucene的中文全文检索系统 被引量:22
3
作者 苏潭英 郭宪勇 金鑫 《计算机工程》 CAS CSCD 北大核心 2007年第23期94-96,共3页
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检... 在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检索效率。该系统增加了加密模块,实现对建立的全文索引进行加密处理,增强了信息的安全性。 展开更多
关键词 全文检索 LUCENE 倒排索引
下载PDF
基于全文搜索的中文搜索引擎设计技术 被引量:10
4
作者 陈燕娜 邵志清 《计算机工程与应用》 CSCD 北大核心 2002年第17期196-198,共3页
随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对... 随着Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但由于中文信息处理的复杂性和特殊性,中文搜索引擎的功能仍不够完善。该文提出了一个基于全文搜索的中文搜索引擎的实现方案,并对信息处理中的关键技术进行了探讨。 展开更多
关键词 全文搜索 中文搜索引擎设计 技术 WWW 中文分词技术 文档相关性 Internet
下载PDF
具有三级索引词库结构的中文分词方法研究 被引量:16
5
作者 肖红 许少华 李欣 《计算机应用研究》 CSCD 北大核心 2006年第8期49-51,共3页
提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文... 提出了一种分组并具有三级索引结构的词库组织体系,给出了合适的索引密度间隔;针对系统基本词库的扩充问题,考虑了一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法。大量仿真实验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。 展开更多
关键词 中文切词 正向最大匹配 词库 索引密度 全文检索
下载PDF
全文检索模型综述 被引量:12
6
作者 申展 江宝林 +2 位作者 陈祎 唐磊 胡运发 《计算机科学》 CSCD 北大核心 2004年第5期61-64,共4页
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全... 全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前国内外主要的全文拴索模型,总结了全文检索模型的评价标准,按照此标准对各种模型进行了分析比较,并对全文检索模型构建中一些关键问题进行了分析。 展开更多
关键词 信息检索 文档数据库 全文检索模型 倒排表 Pat-树 互关联后继树 位图 署名文件
下载PDF
一种全文检索系统的设计与实现 被引量:13
7
作者 涂新辉 何婷婷 罗景 《计算机工程》 EI CAS CSCD 北大核心 2005年第17期55-57,共3页
在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统... 在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统核心接口层。最后给出了该系统的一种分布式部署方案。 展开更多
关键词 全文检索 全文索引 倒排文件 分布式
下载PDF
一种高效的全文检索索引技术 被引量:7
8
作者 陈玮 陈玉鹏 +1 位作者 石晶 陆达 《计算机应用研究》 CSCD 北大核心 2004年第7期35-37,40,共4页
针对目前比较流行的基于词的倒排文档索引模型 ,结合全文检索数据的特点 ,提出了变长编码的索引压缩算法。利用该压缩编码 ,研究了基于内存缓存的快速创建索引的流程。通过实验 ,对索引膨胀率、创建时间和检索响应速度进行了对比分析 。
关键词 全文检索 词索引 内存缓存 索引压缩
下载PDF
一个中英文全文搜索引擎的设计与实现 被引量:4
9
作者 陈华辉 《计算机应用研究》 CSCD 北大核心 2001年第3期131-133,共3页
介绍了一个中英文全文搜索引擎的设计与实现。探讨了该搜索引擎的设计思想,讨论了其中全文索引的组织及压缩方法和全文检索算法,并给出了在英语教学语料库管理系统中的应用实例。
关键词 中英文全文搜索引擎 语料库管理系统 信息检索 INTERNET 信息处理
下载PDF
一种基于可扩展散列表的倒排索引更新策略 被引量:6
10
作者 吴恒山 刘兴宇 左琼 《计算机工程》 CAS CSCD 北大核心 2004年第8期83-84,F003,共3页
该文提出一种新的基于可扩展散列表的倒排索引更新策略,使倒排索引具有良好的可扩展性。它既支持文档的插入、删除操作,又具有较高的查询效率和空间利用率。并在它的基础上,实现了倒排索引的增量更新和实时更新。
关键词 全文检索 倒排索引 增量更新 可扩展散列表
下载PDF
中文期刊全文数据库检索方法与技巧 被引量:12
11
作者 鄢百其 金晓祥 《大学图书情报学刊》 2004年第2期56-58,共3页
在人类迈入信息时代的今天,掌握计算机信息检索技能,已成为各类专业人员的基本功。目前,无论是普通信息用户,还是专职检索人员,均存在着检索经验不足,检索水平不高的问题。为此,文章以国内影响最大、用户最多的2个全文数据库为例,对其... 在人类迈入信息时代的今天,掌握计算机信息检索技能,已成为各类专业人员的基本功。目前,无论是普通信息用户,还是专职检索人员,均存在着检索经验不足,检索水平不高的问题。为此,文章以国内影响最大、用户最多的2个全文数据库为例,对其检索功能及特点进行分析比较,并就如何制定、优化检索策略进行了探讨。 展开更多
关键词 中文期刊 全文数据库 检索方法 检索技巧 计算机检索 检索策略 检索效果
下载PDF
基于Lucene的Web站点站内全文检索系统的设计与实现 被引量:10
12
作者 曹强 《图书情报工作》 CSSCI 北大核心 2007年第9期124-126,144,共4页
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和... 设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和查准率方面的比较。 展开更多
关键词 LUCENE 全文检索 搜索引擎
原文传递
面向领域的个性化智能检索系统MySpy的研究与开发 被引量:5
13
作者 陈世平 周福华 俞海 《小型微型计算机系统》 CSCD 北大核心 2002年第11期1336-1339,共4页
针对互联网上的“Rich Data Poor Information”问题 ,进行了面向领域的个性化智能检索系统的开发与研究 .系统采用多 Agent技术实现对 web文档索引数据库管理 ;实现基于智能代理的信息过滤和个性化服务 ;利用辅助词典、同义词词典和蕴... 针对互联网上的“Rich Data Poor Information”问题 ,进行了面向领域的个性化智能检索系统的开发与研究 .系统采用多 Agent技术实现对 web文档索引数据库管理 ;实现基于智能代理的信息过滤和个性化服务 ;利用辅助词典、同义词词典和蕴含词词典 ,对查询词进行概念扩检 ,使检索结果能返回与查询需求相似的文档 . 展开更多
关键词 个性化 智能检索系统 MySpy 智能代理 信息检索 分词 向量空间模型 全文检索 因特网
下载PDF
基于文本聚类与分布式Lucene的知识检索 被引量:10
14
作者 冯汝伟 谢强 丁秋林 《计算机应用》 CSCD 北大核心 2013年第1期186-188,共3页
针对传统集中式索引处理大规模数据的性能和效率问题,提出了一种基于文本聚类的检索算法。利用文本聚类算法改进现有的索引划分方案,根据查询与聚类结果的距离计算判断查询意图,缩减查询范围。实验结果表明,所提方案能够有效地缓解大规... 针对传统集中式索引处理大规模数据的性能和效率问题,提出了一种基于文本聚类的检索算法。利用文本聚类算法改进现有的索引划分方案,根据查询与聚类结果的距离计算判断查询意图,缩减查询范围。实验结果表明,所提方案能够有效地缓解大规模数据建索引和检索的压力,大幅提高分布式检索性能,同时保持着较高的准确率和查全率。 展开更多
关键词 非结构化知识 分布式索引 文本聚类 全文检索 并行检索
下载PDF
全文检索搜索引擎中文信息处理技术研究 被引量:5
15
作者 唐培丽 胡明 +1 位作者 解飞 刘钢 《情报科学》 CSSCI 北大核心 2006年第6期895-899,909,共6页
本文深入分析了全文检索中文搜索引擎的关键技术,提出了一种适用于全文检索搜索引擎的中文分词方案,既提高了分词的准确性,又能识别文中的未登录词。针对向量空间信息检索模型,本文设计了一个综合考虑中文词在Web文本中的位置、长度以... 本文深入分析了全文检索中文搜索引擎的关键技术,提出了一种适用于全文检索搜索引擎的中文分词方案,既提高了分词的准确性,又能识别文中的未登录词。针对向量空间信息检索模型,本文设计了一个综合考虑中文词在Web文本中的位置、长度以及频率等重要因素的词条权重计算函数,并且用量化的方法表示出其重要性,能够较准确地反映出词条在Web文档中的重要程度。最后对分词算法进行了测试,测试表明该方法能够提高分词准确度满足实用的要求。 展开更多
关键词 全文检索 搜索引擎 中文分词 信息检索
下载PDF
一个中文全文检索系统的设计与实现 被引量:3
16
作者 曾元鉴 李孝明 《计算机与数字工程》 2004年第3期12-15,共4页
本文主要分析了中文全文检索技术中有关内容 ,并根据此内容设计实现了一个中文全文检索系统。在此系统中 ,提出了相应的数据采集方案、数据存储格式、数据压缩和信息检索机制。
关键词 全文检索 数据采集 索引 压缩 数据检索
下载PDF
基于Lucene的全文检索系统的研究与实现 被引量:10
17
作者 周锦程 王丹 +1 位作者 余泉 张维 《计算机技术与发展》 2011年第3期67-71,共5页
Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,... Lucene是一个优秀的开源全文搜索技术框架,Lucene全文检索技术是信息检索领域广泛使用的基本技术。它能非常方便地为各种应用程序加入全文索引和搜索功能,快速有效地索引企业累积的大量信息资源。文中阐述了建立全文检索系统的必要性,介绍了全文检索系统的概念并分析了Lucene的系统结构和实现机制,最后结合实际应用背景从系统设计、文挡抽取、索引的建立及执行检索等方面介绍了全文检索系统的实现过程。实践证明,该系统的查准率、查询速度等均达到了设计要求。 展开更多
关键词 全文检索 索引 信息检索
下载PDF
全文索引技术在办公自动化系统中的应用研究 被引量:7
18
作者 陈慧萍 于国政 王建东 《计算机应用研究》 CSCD 北大核心 2007年第2期222-224,共3页
基于内容的全文检索技术广泛用于全文数据库中,为解决办公自动化系统中大量文档的快速检索问题,将SQL Server全文索引技术运用于办公自动化系统开发中。首先介绍SQL Server全文检索流程,然后将其运用于办公自动化系统文档管理模块公文... 基于内容的全文检索技术广泛用于全文数据库中,为解决办公自动化系统中大量文档的快速检索问题,将SQL Server全文索引技术运用于办公自动化系统开发中。首先介绍SQL Server全文检索流程,然后将其运用于办公自动化系统文档管理模块公文搜索的实现中,全文检索用户界面层采用ASP.NET开发,应用业务层采用C#语言。 展开更多
关键词 全文索引 全文检索 办公自动化 B/S结构
下载PDF
EBSCO和Springer Link外文期刊数据库比较研究 被引量:10
19
作者 聂应高 《晋图学刊》 2005年第1期20-22,73,共4页
文章对EBSCO和SpringerLink外文期刊数据库的收录范围、标引质量、检索功能、输出形式等进行了比较分析,并指出了它们各自的使用特点与不足。
关键词 外文期刊 全文数据库 数据库检索
下载PDF
一个改进的互关联后继树数据模型 被引量:6
20
作者 马科 胡运发 《计算机工程》 CAS CSCD 北大核心 2003年第21期70-72,共3页
介绍了一种新型的全文数据库模型——互关联后继树,阐述它与其它全文数据库 模型相比在呈现非结构化信息的存储和检索中的巨大优势,并探讨了面对呈现指数增长的非 结构化的海量信息时如何提高其性能。
关键词 互关联后继树 全文检索 海量存储
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部