期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
一种全文检索系统的设计与实现 被引量:13
1
作者 涂新辉 何婷婷 罗景 《计算机工程》 EI CAS CSCD 北大核心 2005年第17期55-57,共3页
在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统... 在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统核心接口层。最后给出了该系统的一种分布式部署方案。 展开更多
关键词 全文检索 全文索引 倒排文件 分布式
下载PDF
基于邻接矩阵的全文索引模型(英文) 被引量:10
2
作者 周水庚 胡运发 关佶红 《软件学报》 EI CSCD 北大核心 2002年第10期1933-1942,共10页
文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻接矩阵;采用两种不... 文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻接矩阵;采用两种不同的方式实现文本串邻接矩阵,导出了两种基于邻接矩阵的新型全文索引模型,即基于邻接矩阵的倒排文件和基于邻接矩阵的PAT数组.给出了基于新模型的文本查询算法;分析了新模型的存储空间和查询时间的开销,并分别与两种传统索引模型进行了比较.对实际文本库进行了测试以证实新模型的效能.新模型能够以相对于原文较小的空间代价获得较大幅度的查询效率的提高,因此适合于在大规模文本检索系统中应用. 展开更多
关键词 邻接矩阵 全文索引模型 倒排文 PAT数组 信息检索系统
下载PDF
全文索引技术在办公自动化系统中的应用研究 被引量:7
3
作者 陈慧萍 于国政 王建东 《计算机应用研究》 CSCD 北大核心 2007年第2期222-224,共3页
基于内容的全文检索技术广泛用于全文数据库中,为解决办公自动化系统中大量文档的快速检索问题,将SQL Server全文索引技术运用于办公自动化系统开发中。首先介绍SQL Server全文检索流程,然后将其运用于办公自动化系统文档管理模块公文... 基于内容的全文检索技术广泛用于全文数据库中,为解决办公自动化系统中大量文档的快速检索问题,将SQL Server全文索引技术运用于办公自动化系统开发中。首先介绍SQL Server全文检索流程,然后将其运用于办公自动化系统文档管理模块公文搜索的实现中,全文检索用户界面层采用ASP.NET开发,应用业务层采用C#语言。 展开更多
关键词 全文索引 全文检索 办公自动化 B/S结构
下载PDF
数据清洗中重复记录清洗算法的研究 被引量:6
4
作者 谢文阁 佟玉军 +1 位作者 贾丹 梅红岩 《软件工程师》 2015年第9期61-62,共2页
介绍了数据清洗中的SNM算法和全文索引技术,通过引入全文索引技术对SNM算法进行了改进,以此提高了重复记录查找的速度和准确率,从而较好地提升了SNM算法的性能。
关键词 数据清洗 全文索引 重复记录 清洗算法
下载PDF
基于元数据的海量试验数据管理系统研究与设计 被引量:5
5
作者 刘斌 《微电子学与计算机》 CSCD 北大核心 2012年第4期158-161,共4页
分析了试验数据管理发展现状及存在的不足,提出了基于RDF元数据模型的试验数据描述语言(Testda-ta Description Language,TDL),给出面向海量试验数据管理的系统平台设计思路和架构、以及具体试验数据解析算法.通过对设计架构的分析,表... 分析了试验数据管理发展现状及存在的不足,提出了基于RDF元数据模型的试验数据描述语言(Testda-ta Description Language,TDL),给出面向海量试验数据管理的系统平台设计思路和架构、以及具体试验数据解析算法.通过对设计架构的分析,表明该设计架构能够有效满足试验数据管理的系统平台化需求,提高了科研产品研发效率,降低了试验成本,同时为数据管理平台化建设积累了经验. 展开更多
关键词 试验数据管理 元数据 全文索引 TDL
下载PDF
科技信息资源内容监测与分析服务平台概况 被引量:3
6
作者 徐硕 乔晓东 +1 位作者 朱礼军 张运良 《数字图书馆论坛》 2011年第11期38-44,共7页
为了方便研究者分析领域的研究动态,了解领域内研究的重要研究者和重要文献,并对科技文献和科技工作者的工作进行准确的评价,作者借助国家科技图书文献中心(NSTL)雄厚的资源优势,联合清华大学等有关优势单位,共同开发了面向西文... 为了方便研究者分析领域的研究动态,了解领域内研究的重要研究者和重要文献,并对科技文献和科技工作者的工作进行准确的评价,作者借助国家科技图书文献中心(NSTL)雄厚的资源优势,联合清华大学等有关优势单位,共同开发了面向西文资源的科技信息资源内容监测与分析服务平台,该平台具有专家、期刊/会议和关键词统一检索功能,具有研究者关联路径发现、主题发现等功能,并且内嵌了专家和论文排名功能。 展开更多
关键词 知识服务 话题模型 关联路径 排名 全文索引
下载PDF
基于全文索引与余弦公式医学文本相似性分析 被引量:1
7
作者 谢翠萍 陈家益 白金山 《微型电脑应用》 2014年第1期25-27,共3页
医学文本相似性问题是医学文本挖掘中的重要内容,如何能够快速计算出大数据量下的医学文本的相似性情况是医学文本相似性计算的重点。针对基于传统余弦公式医学文本相似性分析算法在性能上的缺陷,提出了一种基于全文索引技术与余弦公式... 医学文本相似性问题是医学文本挖掘中的重要内容,如何能够快速计算出大数据量下的医学文本的相似性情况是医学文本相似性计算的重点。针对基于传统余弦公式医学文本相似性分析算法在性能上的缺陷,提出了一种基于全文索引技术与余弦公式医学文本相似性分析算法,对医学文本相似性进行分析。采用全文索引技术对医学文本数据相关关键词进行索引,并根据若干关键词在索引中检索出部分数据,从而减少计算复杂度,提高效率。实验表明,该方法比基于传统余弦公式医学文本相似性分析算法具有更优的性能。 展开更多
关键词 医学文本相似性 余弦公式 全文索引 文本挖掘 向量空间模型
下载PDF
基于全球剖分网格的空间数据全文检索方法 被引量:1
8
作者 褚福林 濮国梁 +1 位作者 程承旗 冯洋 《地理信息世界》 2015年第2期40-43,共4页
目前,国内外不同部门的空间数据管理系统彼此独立,数据共享检索效率低。针对此问题,本文提出了一种基于全球剖分网格的空间数据全文检索方法。该方法描述了基于全球剖分网格原理,根据地理空间实体的区位信息建立全球唯一的空间区位标识... 目前,国内外不同部门的空间数据管理系统彼此独立,数据共享检索效率低。针对此问题,本文提出了一种基于全球剖分网格的空间数据全文检索方法。该方法描述了基于全球剖分网格原理,根据地理空间实体的区位信息建立全球唯一的空间区位标识编码,通过全文索引引擎对空间区位标识编码建立全文索引,实现对地理空间数据的检索。通过对比试验可知,在大数据量的时候,基于全球剖分网格的空间数据全文检索方法比基于B+树的传统关系型数据库检索效率高,在海量空间数据的检索上具有一定应用价值。 展开更多
关键词 GEO SOT 全文检索 空间区位编码 剖分编码 全球剖分网格
下载PDF
基于三维特征索引空间的分布式全文索引模型
9
作者 谭舜泉 陈有青 《计算机应用》 CSCD 北大核心 2004年第5期151-153,157,共4页
文中根据分布式全文数据库的特点,提出一种新的全文索引模型———基于三维特征索引空间的分布式全文索引模型。在理论上的推导和对实际全文数据库的测试都证实新模型在分布式环境下,能以相对较小的空间代价获得较大幅度的查询效率的提高。
关键词 全文索引 分布式全文数据库 Pat数组 三维特征索引空间
下载PDF
借用外存构造后缀数组的优化算法
10
作者 曹军 肖建田 刘霞 《南华大学学报(自然科学版)》 2005年第1期76-79,共4页
为一个巨大的文本集合构造后缀数组是目前搜索引擎领域中的一个热点问题.对已存在的后缀数组的外存构造算法加以优化.优化后的算法仍然遵循原有方法的基本原则,但采用不同的实现策略,保证了算法在最坏情况下的较好的时间复杂度.
关键词 后缀数组 外存构造模型 全文索引 优化算法 搜索引擎 时间复杂度
下载PDF
企业MIS中全文检索技术的应用研究
11
作者 林晶 《怀化学院学报》 2010年第2期75-77,共3页
为了将信息检索技术融入到企业数据库管理系统中,同时增强企业MIS系统的鲁棒性与可移植性,构建了一个企业MIS中的全文检索系统.实验表明,全文检索技术的引入弥补了数据库系统在检索能力上的不足,并且该检索系统具有数据源无关性.
关键词 全文索引 全文检索 站内搜索
下载PDF
一个基于本体论全文自动标引方案 被引量:7
12
作者 王泰森 《情报科学》 CSSCI 北大核心 2003年第9期950-952,共3页
本文为支持数字图书馆全文检索精度的提高 ,提出了一个基于本体论全文自动标引方案。该方案利用本体论的方法 ,强调词与词之间的内在概念联系 ,着重解决传统的人工标引不能全面概括全文 ,而且词与词之间缺乏概念性的连接 ,很难反映文件... 本文为支持数字图书馆全文检索精度的提高 ,提出了一个基于本体论全文自动标引方案。该方案利用本体论的方法 ,强调词与词之间的内在概念联系 ,着重解决传统的人工标引不能全面概括全文 ,而且词与词之间缺乏概念性的连接 ,很难反映文件主题的全面内容及由于多义词、同义词等的原因造成漏检或检索结果返回信息太多 ,失去检索意义 ,达不到理想效果的问题。 展开更多
关键词 数字图书馆 本体论 全文标引 自动标引 全文检索 检索质量 主题标引 全文数据库 分词系统
下载PDF
基于Lucene.Net具有用户权限的全文检索系统的应用 被引量:3
13
作者 祝伟华 刘期勇 《云南民族大学学报(自然科学版)》 CAS 2009年第1期73-76,共4页
阐述和分析了全文检索系统的概念及其特点,研究了Lucene.Net架构及其主要模块,在此基础上,实现了具有用户权限的全文检索系统.
关键词 全文检索系统 LUCENE.NET 用户权限
下载PDF
自然资源政务信息网上公开水平监测评估系统设计与实现 被引量:2
14
作者 张垚垚 王颖 周舟 《国土资源信息化》 2019年第2期3-6,共4页
为解决全国自然资源政务信息网上公开检查工作持续时间长、人工测评任务繁重、统计分析繁琐等问题,本文设计并实现了自然资源政务信息网上公开水平监测评估系统。系统设计采用微服务架构,基于全文索引技术对部分指标进行自动评分,借助GI... 为解决全国自然资源政务信息网上公开检查工作持续时间长、人工测评任务繁重、统计分析繁琐等问题,本文设计并实现了自然资源政务信息网上公开水平监测评估系统。系统设计采用微服务架构,基于全文索引技术对部分指标进行自动评分,借助GIS图形服务直观展示测评结果。实践表明,系统有效支撑了政务信息网上公开检查工作,提高了工作效率、降低了工作成本。 展开更多
关键词 自然资源政务信息网上公开 微服务架构 全文索引技术 GIS图形
下载PDF
一种全新的全文索引模型——后继数组模型 被引量:11
15
作者 刘学文 陶晓鹏 +1 位作者 于玉 胡运发 《软件学报》 EI CSCD 北大核心 2002年第1期150-158,共9页
提出了一种新的全文索引模型——后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关键词 全文索引模型 后继数组模型 文本数据库 数据模型
下载PDF
Pat数组创建算法的研究 被引量:2
16
作者 陶晓鹏 胡运发 张锦 《计算机研究与发展》 EI CSCD 北大核心 2000年第7期783-788,共6页
Pat数组是目前比较新的全文索引结构 ,有广阔、良好的应用前景 .详细研究了 Pat数组的创建算法 ,提出了新算法——双边二分比较法 .首先从理论上分析了算法的高效性 ,然后用实验结果证实了分析 ,初步的研究表明 ,Pat数组用于中文文本的... Pat数组是目前比较新的全文索引结构 ,有广阔、良好的应用前景 .详细研究了 Pat数组的创建算法 ,提出了新算法——双边二分比较法 .首先从理论上分析了算法的高效性 ,然后用实验结果证实了分析 ,初步的研究表明 ,Pat数组用于中文文本的全文索引是可行的 . 展开更多
关键词 全文索引 Pat数组 全文检索 双边二分比较算法
下载PDF
基于改进哈夫曼编码的全文索引结构压缩算法 被引量:4
17
作者 阚君满 《吉林大学学报(信息科学版)》 CAS 2011年第5期473-476,共4页
为解决全文索引的索引结构压缩问题,提出了文本的基于正规哈夫曼编码小波树形式,并将该结构与后缀数组结合,实现了基于正规哈夫曼编码的小波树和高效构造算法。实验结果表明,在不降低运行效率的前提下,存储空间得到有效的压缩,从而证明... 为解决全文索引的索引结构压缩问题,提出了文本的基于正规哈夫曼编码小波树形式,并将该结构与后缀数组结合,实现了基于正规哈夫曼编码的小波树和高效构造算法。实验结果表明,在不降低运行效率的前提下,存储空间得到有效的压缩,从而证明了改进方法的有效性。 展开更多
关键词 全文索引 压缩 正规哈夫曼编码
下载PDF
AS-Index: A Structure for String Search Using n-Grams and Algebraic Signatures 被引量:1
18
作者 Camelia Constantin Cedric du Mouza +2 位作者 Witold Litwin Philippe Rigaux Thomas Schwarz 《Journal of Computer Science & Technology》 SCIE EI CSCD 2016年第1期147-166,共20页
We present the AS-Index, a new index structure for exact string search in disk resident databases. AS-Index relies on a classical inverted file structure, whose main innovation is a probabilistic search based on the p... We present the AS-Index, a new index structure for exact string search in disk resident databases. AS-Index relies on a classical inverted file structure, whose main innovation is a probabilistic search based on the properties of algebraic signatures used for both n-grams hashing and pattern search. Specifically, the properties of our signatures allow to carry out a search by inspecting only two of the posting lists. The algorithm thus enjoys the unique feature of requiring a constant number of disk accesses, independently from both the pattern size and the database size. We conduct extensive experiments on large datasets to evaluate our index behavior. They confirm that it steadily provides a search performance proportional to the two disk accesses necessary to obtain the posting lists. This makes our structure a choice of interest for the class of applications that require very fast lookups in large textual databases. We describe the index structure, our use of algebraic signatures, and the search algorithm. We discuss the operational trade-offs based on the parameters that affect the behavior of our structure, and present the theoretical and experimental performance analysis. We next compare the AS-Index with the state-of-the-art alternatives and show that 1) its construction time matches that of its competitors, due to the similarity of structures, 2) as for search time, it constantly outperforms the standard approach, thanks to the economical access to data complemented by signature calculations, which is at the core of our search method. 展开更多
关键词 full text indexing large-scale indexing algebraic signature
原文传递
中文文本检索系统的设计与实现 被引量:2
19
作者 左伟明 朱永娇 《湖南城市学院学报(自然科学版)》 CAS 2011年第1期49-53,共5页
中文检索是信息产业中发展较快且很重要的领域,在对全文索引进行深入的理论分析基础上,设计实现了基于倒排索引结构的中文文本检索系统.该系统采用词库匹配法对文本文档进行关键词的切分,并对关键词建立索引,最后通过索引实现对关键词... 中文检索是信息产业中发展较快且很重要的领域,在对全文索引进行深入的理论分析基础上,设计实现了基于倒排索引结构的中文文本检索系统.该系统采用词库匹配法对文本文档进行关键词的切分,并对关键词建立索引,最后通过索引实现对关键词的检索. 展开更多
关键词 全文检索 全文索引 倒排索引 中文 分词
下载PDF
基于大数据分析的技术转移平台 被引量:3
20
作者 张颖 管震 蒋浩 《计算机系统应用》 2020年第7期110-116,共7页
随着国家对技术转移工作的大力支持,越来越多的技术转移平台开始涌现.但是当前的大部分技术转移平台对供需数据无法做到很好的匹配,所以平台对于技术转化成功率的提升效果受到一定限制.为了解决这个问题,本文提出一种新颖的技术转移平... 随着国家对技术转移工作的大力支持,越来越多的技术转移平台开始涌现.但是当前的大部分技术转移平台对供需数据无法做到很好的匹配,所以平台对于技术转化成功率的提升效果受到一定限制.为了解决这个问题,本文提出一种新颖的技术转移平台实现方法,它主要利用大数据挖掘技术来整理和分析平台数据,在此基础上,我们结合全文检索、数据采集、RESTful接口等其他技术,共同提升数据的匹配度,扩大数据的展示范围,从而提升技术转化率.目前平台已在江苏省部署运行,通过平台促成了大批技术成果转移落地. 展开更多
关键词 大数据 技术转移 数据采集 全文检索 RESTful接口
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部