期刊文献+
共找到1,728篇文章
< 1 2 87 >
每页显示 20 50 100
国外图书馆自动化系统的现状与趋势 被引量:57
1
作者 李广建 张智雄 黄永文 《现代图书情报技术》 CSSCI 北大核心 2003年第3期33-36,共4页
回顾了国外图书馆自动化系统发展的历史 ,分析了国外主要的图书馆自动化系统厂商及其相关产品 ,总结了国外主流图书馆自动化系统的主要发展趋势 ,提出国内图书馆自动化系统的研发还任重而道远。
关键词 外国 图书馆自动化系统 生产商 产品 发展趋势 体系结构 全文检索
下载PDF
Lucene的全文检索的研究与应用 被引量:55
2
作者 李永春 丁华福 《计算机技术与发展》 2010年第2期12-15,共4页
为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型... 为了改善传统全文检索方法在检索效率上的不足,结合Lucene构建了一个全文检索系统模型。介绍了全文检索的基本过程、Lucene源码结构和逻辑结构,分析了Lucene的索引组成,对比了Lucene全文检索和其它全文检索的区别。该模型可用于中小型的全文检索系统的实现,同时可基于此模型开发定制个性化的搜索引擎。最后通过实验对比了其与传统检索方式的响应时间,利用Lucene的全文检索具有更快的响应速度。 展开更多
关键词 全文检索 LUCENE 索引
下载PDF
基于Lucene的中文倒排索引技术的研究 被引量:50
3
作者 郑榕增 林世平 《计算机技术与发展》 2010年第3期80-83,共4页
索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引... 索引是所有搜索引擎的核心概念,为了进行快速查找,就需要把数据处理成一种高效的、可交叉引用的组织格式。倒排索引是一种高效的索引组织模式,其组织模式和存储结构对检索系统的性能起着至关重要的作用,文中探讨了基于Lucene的倒排索引模式,分析了Lucene索引文件的结构、索引过程以及相关排序算法,讨论了Lucene的压缩算法,并且通过设计一个中文模块实现了基于正向减字最大匹配分词方式的中文索引。实验表明新的分词算法比Lucene自带的分词算法性能有了很大的提高。 展开更多
关键词 全文检索 倒排索引 索引压缩Lucene
下载PDF
一种基于Lucene检索引擎的全文数据库的研究与实现 被引量:30
4
作者 张校乾 金玉玲 侯丽波 《现代图书情报技术》 CSSCI 北大核心 2005年第2期40-43,48,共5页
在对数据库有关技术分析的基础上,分析对比了全文数据库的特点和关键所在。介绍了实现全 文检索的工具包Lucene搜索引擎,并将其引入具体应用,对全文数据库索引和查找技术进行研究,提出并实现 了无需后台数据库的全文数据库组织方式,事... 在对数据库有关技术分析的基础上,分析对比了全文数据库的特点和关键所在。介绍了实现全 文检索的工具包Lucene搜索引擎,并将其引入具体应用,对全文数据库索引和查找技术进行研究,提出并实现 了无需后台数据库的全文数据库组织方式,事实表明,索引和查找的时空效率都很高。 展开更多
关键词 全文数据库 LUCENE 全文检索 文件系统
下载PDF
中文分词算法概述 被引量:39
5
作者 龙树全 赵正文 唐华 《电脑知识与技术》 2009年第4期2605-2607,共3页
当前搜索引擎技术被广泛地应用,这使得全文检索技术和中文分词技术的研究逐渐深入.中文分词是中文信息的关键技术之一.其质量高低直接影响中文信息处理效率。文章致力于研究中文分词算法,对多种中文分词算法、自动分词系统的理论模... 当前搜索引擎技术被广泛地应用,这使得全文检索技术和中文分词技术的研究逐渐深入.中文分词是中文信息的关键技术之一.其质量高低直接影响中文信息处理效率。文章致力于研究中文分词算法,对多种中文分词算法、自动分词系统的理论模型进行了详细的阐述和讨论.为中文分词的进一步发展提供基础和方向。 展开更多
关键词 中文分词 全文检索 算法 搜索引擎 歧义切分
下载PDF
《高校图书馆工作》近期载文、引文分析及影响因子研究 被引量:45
6
作者 夏旭 张春晖 《高校图书馆工作》 2001年第4期14-28,共15页
目的 探讨该刊 1 0年载文、发文、引文分布、论文被引、出版时滞等方面的规律 ,确定核心著者、机构、地区 ,高被引论文及作者 ,对 1 994~ 2 0 0 0年该刊影响因子进行研究。方法 文献计量分析载文及引文。利用《中国期刊网专题全文数... 目的 探讨该刊 1 0年载文、发文、引文分布、论文被引、出版时滞等方面的规律 ,确定核心著者、机构、地区 ,高被引论文及作者 ,对 1 994~ 2 0 0 0年该刊影响因子进行研究。方法 文献计量分析载文及引文。利用《中国期刊网专题全文数据库》引文检索途径获得相关数据计算影响因子并确定高被引论文与高被引作者。结果 该刊近十年载文量呈增—减—增的趋势 ;栏目稳中有变 ;1 998年开始作者发文以中级职称人员为主 ,占 45% ( 2 0 0 /4 4 8) ,核心作者群尚未形成 ;引文以中文期刊为主 ,34种核心期刊覆盖该刊引文的 70 % ;地区发文以湖南省 6 33篇 ( 48.8% )居第一 ,核心发文机构也以湖南省高校为重点 ,湖南、广东等 6个地区为发文核心 ( 74% ) ;发文 1 0篇以上的高产机构共2 1个 ;论文发表时滞平均为 6个月 ;该刊论文被引 487次 ,高被引作者 2 0人( 4次及以上 )、高被引论文 1 4篇 ( 4次及以上 )。该刊影响因子逐年上升 ( 0 .2以上 )。结论 该刊编辑出版日趋规范化 ,栏目设置合理 ;编辑质量和水平较高 ;论文研究的深度和论文质量有明显提高。被引用频次目前已稳居高校系统图书馆学期刊的第三位 ,为发表图书馆学研究成果作出了较大的贡献 ,在全国高校图书馆工作者以及图书馆工作者中产生了较大的影响。对? 展开更多
关键词 《高校图书馆工作》 载文分析 引文分析 影响因子 被引分析 全文数据库 全文检索
下载PDF
中文搜索引擎现状与展望 被引量:25
7
作者 都云程 卢献华 《中文信息学报》 CSCD 北大核心 1999年第3期61-64,F003,共5页
本文介绍了中文搜索引擎的发展现状,分析了中文搜索引擎中存在的问题,以及与国外先进的搜索引擎的差距,提出了中文搜索引擎的发展方向。
关键词 中文搜索引擎 全文检索 中文自动分词 搜索引擎
下载PDF
全文检索字索引技术的研究与实现 被引量:26
8
作者 曹元大 贺海军 +1 位作者 涂哲明 王琴 《计算机工程》 CAS CSCD 北大核心 2002年第6期260-262,共3页
针对中文全文检索字表法检索索引的创建,提出了快速的建立方法,并根据中文文本的特点,提出了有效的索引压缩方法。实验表明,使用虚拟内存技术可以大大节省索引的建立时间;采用字节对齐的索引压缩技术,不但可以有效地减少索引占用的磁盘... 针对中文全文检索字表法检索索引的创建,提出了快速的建立方法,并根据中文文本的特点,提出了有效的索引压缩方法。实验表明,使用虚拟内存技术可以大大节省索引的建立时间;采用字节对齐的索引压缩技术,不但可以有效地减少索引占用的磁盘空间,而且可以加快检索时间,索引的空间和时间效率都得以提高。 展开更多
关键词 全文检索 字索引 虚拟内存 互联网
下载PDF
关于搜索引擎与元搜索引擎的讨论 被引量:24
9
作者 张俭恭 陈定权 吴振新 《现代图书情报技术》 CSSCI 北大核心 2002年第2期36-38,共3页
首先探讨了搜索引擎的一般原理以及结构 ,然后介绍了元搜索引擎的概念及其框架。在最后 ,提出了一种将一般搜索引擎和基于 OPAC的图书目录检索系统集成于一体的元搜索引擎的构想 。
关键词 搜索引擎 元搜索引擎 OPAC 全文检索 图书目录检索系统
下载PDF
全文数据库建库原理与应用技术 被引量:28
10
作者 王兰成 蒋丹 刘庆辉 《情报学报》 CSSCI 北大核心 1999年第4期321-328,共8页
全文数据库是处理文献信息中知识与数据的有力工具,近年来得到迅猛发展。本文首先详细分析了全文数据库的特点,提出了建立全文数据库的各种数据结构,系统介绍全文数据库的开发步骤。然后论述全文数据库的标引和检索技术,提出一些新... 全文数据库是处理文献信息中知识与数据的有力工具,近年来得到迅猛发展。本文首先详细分析了全文数据库的特点,提出了建立全文数据库的各种数据结构,系统介绍全文数据库的开发步骤。然后论述全文数据库的标引和检索技术,提出一些新的处理技术。最后就全文数据库实际应用中的一些问题,提供了解决方案。 展开更多
关键词 全文数据库 软件开发 文献标引 全文检索
下载PDF
基于LUCENEAPI的中文全文数据库设计与实现 被引量:24
11
作者 赵汀 孟祥武 《计算机工程与应用》 CSCD 北大核心 2003年第20期179-181,197,共4页
实现了中文单字切分模块,并在LuceneAPI基础上建立支持中英文混合检索的全文数据库。在地质公园及地质遗迹全文数据库项目中作为全文检索工具。Lucene中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除... 实现了中文单字切分模块,并在LuceneAPI基础上建立支持中英文混合检索的全文数据库。在地质公园及地质遗迹全文数据库项目中作为全文检索工具。Lucene中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除一篇文档索引;采用多线程设计,能承受大量的访问请求;支持跨平台运行;提供命令行直接查询方式和基于WEB的查询方式;易学通用的检索表达式;系统可扩展性强。 展开更多
关键词 中文信息处理 全文数据库 全文检索
下载PDF
中文Web文档全文检索系统的设计及实现 被引量:15
12
作者 曹元大 贺海军 涂哲明 《北京理工大学学报》 EI CAS CSCD 北大核心 2002年第1期68-71,共4页
为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结... 为解决在检索某些词时发生漏检或错检 ,以及查全率和查准率不高的问题 ,研究字索引技术在中文 Web文档检索中的应用 .着重讨论字索引组织结构和检索方法 ,并引入了字节对齐的索引压缩方法 ,最后描述了一个中文 Web文档全文检索系统的结构和实现 .测试表明 ,该系统在响应时间和查准率方面性能均比较好 。 展开更多
关键词 全文检索 WEB文档 字索引 压缩算法 索引库 中文检索系统 系统设计
下载PDF
汉语文本特征词的抽取方法 被引量:21
13
作者 薛翠芳 郭炳炎 《情报学报》 CSSCI 北大核心 2000年第3期242-247,共6页
本文从自动文摘的需求出发 ,探讨特征词自动抽取的方法和技术 ,设计并实现了两种不同的特征词自动抽取算法。这些方法对文本的自动分类和全文检索也有一定的借鉴意义。
关键词 汉语文本 特征词 加权函数 自动文摘 自动分类 全文检索 自动抽取 自动抽取算法
下载PDF
NLPIR-Parser:大数据语义智能分析平台 被引量:36
14
作者 张华平 商建云 《语料库语言学》 2019年第1期87-104,共18页
随着社交网络等新型网络的迅猛发展,文本大数据呈几何级数增长,语料库的加工处理一般都是由文科背景的研究人员完成,因此,急需快速简便的大数据内容批处理平台。NLPIR-Parser大数据语义智能分析平台历时20余年的积累,融合了网络数据采... 随着社交网络等新型网络的迅猛发展,文本大数据呈几何级数增长,语料库的加工处理一般都是由文科背景的研究人员完成,因此,急需快速简便的大数据内容批处理平台。NLPIR-Parser大数据语义智能分析平台历时20余年的积累,融合了网络数据采集、自然语言处理、文本挖掘与文本检索等核心技术。平台为一般用户提供了本地化部署的客户端实现语义智能分析的全链条一站式服务,也为软件工程师提供了二次开发接口。NLPIR-Parser平台包含精准采集,文档格式转换、新词发现、批量分词、语言统计、文本聚类、文本分类、摘要实体、智能过滤、情感分析、文档去重、全文检索和编码转换十三项独立功能,涵盖了从数据的采集预处理、自然语言处理到文本挖掘、信息检索再到可视化呈现、结果导出等全链条各个环节的语义分析工具,服务了全球40万家机构用户和百余家高校科研院所,为自然语言的研究者与工程应用提供了便利的技术支持。 展开更多
关键词 语义智能分析 汉语分词 新词发现 全文检索 语料库处理
下载PDF
中文Web文档库全文检索技术研究与实现 被引量:20
15
作者 杨文清 黄宜华 张福炎 《中文信息学报》 CSCD 北大核心 1999年第4期49-56,共8页
全文检索是一种非常有效的信息检索技术,本文结合国家863项目《WWW文档协同写作系统》的设计与开发,研究对中文Web文档库实现全文检索的主要技术,着重讨论了字表法全文检索技术细节,最后介绍了一个实用的全文检索系统的实现。
关键词 全文检索 Web文档库 索引库 信息检索
下载PDF
面向网络的全文检索中索引文件的组织 被引量:12
16
作者 颜维龙 盖杰 +1 位作者 武港山 袁春风 《计算机应用研究》 CSCD 北大核心 2002年第11期124-126,146,共4页
为了提高网络中全文检索的效率 ,需要对Web页面中内容进行分析、建立全文索引 ,并对索引的结构进行高效率的组织。讨论了索引的组织结构及其实现方法 ,并分析了不同的组织方法的性能。
关键词 全文检索 字表 正排表 倒排表 索引
下载PDF
一种基于Lucene的中文全文检索系统 被引量:22
17
作者 苏潭英 郭宪勇 金鑫 《计算机工程》 CAS CSCD 北大核心 2007年第23期94-96,共3页
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检... 在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检索效率。该系统增加了加密模块,实现对建立的全文索引进行加密处理,增强了信息的安全性。 展开更多
关键词 全文检索 LUCENE 倒排索引
下载PDF
中文分词算法研究 被引量:25
18
作者 刘件 魏程 《微计算机应用》 2008年第8期11-16,共6页
当前搜索引擎技术被广泛的应用,这使得全文检索技术和中文分词技术的研究逐渐深入。本论文致力于研究中文分词算法,通过实验对分词原理做出比较,对分词算法、词典对分词质量的影响做出判断和评估,并设计了分词原型比较实验,比较测评了... 当前搜索引擎技术被广泛的应用,这使得全文检索技术和中文分词技术的研究逐渐深入。本论文致力于研究中文分词算法,通过实验对分词原理做出比较,对分词算法、词典对分词质量的影响做出判断和评估,并设计了分词原型比较实验,比较测评了当前流行的中文分词方式:中科院分词模块和最大正向匹配法模块。 展开更多
关键词 全文检索 中文分词 查准率查 全率 F1参数
下载PDF
全文检索算法设计及全文检索系统概述 被引量:17
19
作者 钱爱兵 《现代图书情报技术》 CSSCI 北大核心 2003年第2期42-44,98,共4页
该文首先介绍了全文检索在我国的研究历程 ,然后阐释了三种全文检索算法 ,比较了彼此的优缺点 ,最后对国内的全文检索系统做了一个概要的介绍。
关键词 全文检索 算法设计 全文检索系统
下载PDF
汉字全文检索系统的关键技术与实现 被引量:19
20
作者 张俭恭 陈定权 《现代图书情报技术》 CSSCI 北大核心 2001年第2期16-18,共3页
全文检索作为一种发展迅速的情报检索技术 ,在近年来已得到广泛的关注并走向市场。本文在对中西文全文检索系统进行分析比较的基础上 ,做出了新的尝试 ,提出了一种新的索引建立方式 ,并在此基础上实现了支持模糊提问的全文检索。同时独... 全文检索作为一种发展迅速的情报检索技术 ,在近年来已得到广泛的关注并走向市场。本文在对中西文全文检索系统进行分析比较的基础上 ,做出了新的尝试 ,提出了一种新的索引建立方式 ,并在此基础上实现了支持模糊提问的全文检索。同时独立设计了自己的数据结构和算法 ,以及利用 Visual C+ +在 Windows环境下加以实现。最后 。 展开更多
关键词 全文检索 算法研究 数据结构 索引 单汉字索引 情报检索
下载PDF
上一页 1 2 87 下一页 到第
使用帮助 返回顶部