期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于Lucene的信息检索的研究与应用 被引量:20
1
作者 孙西全 马瑞芳 李燕灵 《情报理论与实践》 CSSCI 北大核心 2006年第1期125-128,共4页
快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。本文研究了Lucene和中文切分词技术,分析了Lucene的索引原理,实现了... 快速有效地索引企业累积的大量的信息资源,是提供高质量检索服务的基础。Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。本文研究了Lucene和中文切分词技术,分析了Lucene的索引原理,实现了一个基于Lucene并支持中英文文档检索的应用实例。 展开更多
关键词 索引 信息检索 应用研究/lucene
下载PDF
Lucene搜索引擎 被引量:23
2
作者 周登朋 谢康林 《计算机工程》 CAS CSCD 北大核心 2007年第18期95-96,118,共3页
Lucene是一个高性能、易扩展的基于Java技术的全文信息检索工具包,它能非常方便地为各种应用程序加入全文索引和搜索功能。该文探讨了Lucene中使用的向量空间模型,分析了Lucene索引文件的结构以及搜索排序算法,讨论了Lucene的压缩算法... Lucene是一个高性能、易扩展的基于Java技术的全文信息检索工具包,它能非常方便地为各种应用程序加入全文索引和搜索功能。该文探讨了Lucene中使用的向量空间模型,分析了Lucene索引文件的结构以及搜索排序算法,讨论了Lucene的压缩算法并且通过实验验证了Lucene的建立索引的过程。 展开更多
关键词 lucene 向量空间模型 排序算法 信息检索
下载PDF
一种基于Lucene的Web全文信息检索系统的设计与实现 被引量:6
3
作者 张晓卫 朱巧明 《计算机与现代化》 2006年第12期111-115,共5页
详细描述了利用Lucene全文索引工具包设计与实现的一个Web全文信息检索系统,给出了系统的设计框架和各个组成模块的实现技术,介绍了系统实现中的检索策略和算法。为了提高系统的检索性能,本文提出并实现了利用链入锚文本和链接分析对检... 详细描述了利用Lucene全文索引工具包设计与实现的一个Web全文信息检索系统,给出了系统的设计框架和各个组成模块的实现技术,介绍了系统实现中的检索策略和算法。为了提高系统的检索性能,本文提出并实现了利用链入锚文本和链接分析对检索结果进行重新排序,有效提高了检索的准确率。 展开更多
关键词 信息检索 锚文本 链接分析 lucene
下载PDF
用户兴趣分类在个性化搜索引擎中的应用 被引量:9
4
作者 李银松 施水才 +1 位作者 张玉杰 吕学强 《情报学报》 CSSCI 北大核心 2008年第4期535-540,共6页
个性化搜索引擎是指在普通搜索引擎的基础上,根据用户的背景,兴趣等调整排序算法,针对不同的用户提供不同的服务。本文对搜索引擎的排序算法和用户行为进行了深入细致的研究,通过隐性方法收集用户行为信息,统计并构建用户长期兴趣... 个性化搜索引擎是指在普通搜索引擎的基础上,根据用户的背景,兴趣等调整排序算法,针对不同的用户提供不同的服务。本文对搜索引擎的排序算法和用户行为进行了深入细致的研究,通过隐性方法收集用户行为信息,统计并构建用户长期兴趣模型,短期兴趣模型,时段兴趣模型等,利用向量相似度计算获取最适合用户当前状态的兴趣模型,最后将该兴趣模型结合到搜索引擎的排序算法中,影响文档得分,实现结果集的个性化排序。实验证明,该方法简单有效,可以增加搜索引擎对用户兴趣的应变能力。 展开更多
关键词 信息检索 个性化搜索引擎 用户兴趣分类 lucene
下载PDF
高校网络舆情监测系统构建及应对机制研究 被引量:9
5
作者 宋光慧 聂琰 郭建康 《计算机与现代化》 2011年第11期120-122,128,共4页
针对高校网络舆情监测工作的不足,结合高校舆情信息的传播特点,提出构建舆情监测系统的整体方案。在校园网内基于Nutch搜索引擎技术进行信息检索,互联网范围内采用元搜索引擎技术获取相关信息,采用关键词特征库匹配方式自动进行网络舆... 针对高校网络舆情监测工作的不足,结合高校舆情信息的传播特点,提出构建舆情监测系统的整体方案。在校园网内基于Nutch搜索引擎技术进行信息检索,互联网范围内采用元搜索引擎技术获取相关信息,采用关键词特征库匹配方式自动进行网络舆情监测,实现对舆情信息及时准确的发现,并探讨高校面对网络舆情在监测、分析、引导和反馈等环节的处理方法,从而形成完善的应对机制。 展开更多
关键词 网络舆情 元搜索引擎 信息检索 lucene NUTCH
下载PDF
基于Lucene的垂直搜索引擎研究与实现 被引量:6
6
作者 周海松 刘建明 李龙 《桂林电子科技大学学报》 2014年第3期226-229,共4页
为保证信息的准确性和实时性,提高局部特定信息检索的效率,设计了基于Lucene的垂直搜索引擎系统,并与通用搜索引擎系统的检索效率做了对比。实验结果表明,垂直搜索引擎系统检索特定领域信息具有更高的检索效率。
关键词 信息检索 垂直搜索引擎
下载PDF
基于Lucene的搜索引擎研究 被引量:1
7
作者 詹自熬 陶斌 《河南工程学院学报(自然科学版)》 2008年第4期40-43,共4页
Lucene是一个纯Java实现的高性能、可扩展的全文信息检索工具库,可以很方便地把它融入到应用程序中来增加索引和搜索功能.分析了Lucene的索引文件结构和搜索排序算法,探讨了Lucene中计算文档与查询项相关度的向量空间模型(VSM).最后,通... Lucene是一个纯Java实现的高性能、可扩展的全文信息检索工具库,可以很方便地把它融入到应用程序中来增加索引和搜索功能.分析了Lucene的索引文件结构和搜索排序算法,探讨了Lucene中计算文档与查询项相关度的向量空间模型(VSM).最后,通过实验验证了索引过程的建立以及如何提高索引性能. 展开更多
关键词 lucene 向量空间模型 相关度 信息检索
下载PDF
基于Lucene的互联网文献信息检索系统的研究 被引量:2
8
作者 王正 陆余良 +1 位作者 刘金红 施凡 《安徽大学学报(自然科学版)》 CAS 北大核心 2009年第5期32-35,共4页
论文详述了利用Lucene索引工具包设计和实现的一个互联网文献信息检索系统,给出了系统的设计框架和各个模块的实现技术,并介绍了系统的检索算法.为了使系统支持中英文和各种格式文献检索,论文扩展了Lucene的分词接口和文件分析接口.
关键词 文献信息检索 信息抽取 lucene
下载PDF
农业知识检索系统的设计与实现 被引量:2
9
作者 李永可 李悦 +1 位作者 陈燕红 朱静 《电脑知识与技术(过刊)》 2014年第8X期5449-5452,共4页
通过对农业信息分类技术的研究,依据农业信息分类标准,设计农业信息知识库;在农业信息知识库基础上,对倒排索引技术进行研究,利用lucene构建倒排索引,开发设计农业科技知识检索系统,为坐席人员提供信息检索支持。坐席人员通过该检索系统... 通过对农业信息分类技术的研究,依据农业信息分类标准,设计农业信息知识库;在农业信息知识库基础上,对倒排索引技术进行研究,利用lucene构建倒排索引,开发设计农业科技知识检索系统,为坐席人员提供信息检索支持。坐席人员通过该检索系统,解答农牧民生产过程中遇到的实际问题,充分发挥农业科技知识对农牧民生产的指导作用。 展开更多
关键词 农业知识库 信息检索 倒排索引 lucene
下载PDF
基于BERT的手术名称标准化重排序算法 被引量:2
10
作者 陈漠沙 仇伟 谭传奇 《中文信息学报》 CSCD 北大核心 2021年第3期88-93,共6页
临床术语标准化是医学文本信息抽取中不可或缺的一项任务。临床上对于同一种诊断、手术、药品、检查、化验、症状等,往往会有多种不同的写法,术语标准化(归一)要解决的问题就是为临床上各种不同的说法找到对应的标准名称。在检索技术生... 临床术语标准化是医学文本信息抽取中不可或缺的一项任务。临床上对于同一种诊断、手术、药品、检查、化验、症状等,往往会有多种不同的写法,术语标准化(归一)要解决的问题就是为临床上各种不同的说法找到对应的标准名称。在检索技术生成候选答案的基础上,该文提出了基于BERT(bidirectional encoder representation from transformers)对候选答案进行重排序的方法。实验表明,该方法在CHIP2019手术名称标准化数据集上单模型准确率达到89.1%、融合模型准确率达到92.8%,基本满足实际应用标准。同时该方法具备较好的泛化能力,可应用到其他医学种类术语的标准化任务上。 展开更多
关键词 手术名称标准化 lucene检索 BERT
下载PDF
基于倒排索引的高校图书检索系统的研究与实现 被引量:1
11
作者 封俊 《太原学院学报(自然科学版)》 2017年第1期65-68,共4页
倒排索引技术是从海量数据中获取所需信息的有效手段,而Lucene是其技术原理的开源实现框架。文章在对倒排索引原理介绍的基础上,将Lucene应用于高校图书检索系统中,详细论述了如何使用Lucene来创建一个集索引生成和信息检索于一体的系统... 倒排索引技术是从海量数据中获取所需信息的有效手段,而Lucene是其技术原理的开源实现框架。文章在对倒排索引原理介绍的基础上,将Lucene应用于高校图书检索系统中,详细论述了如何使用Lucene来创建一个集索引生成和信息检索于一体的系统,并通过对比测试分析了此系统的优缺点。 展开更多
关键词 倒排索引 lucene 数据库 信息检索
下载PDF
基于一种文档表示模型的站内搜索引擎设计与实现 被引量:1
12
作者 蒋辉 阳小华 +5 位作者 刘志明 闫仕宇 马家宇 李晓昀 李萌 周座 《南华大学学报(自然科学版)》 2013年第4期77-81,共5页
根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体,在信息检索的过程中加入语用信息能有效的提高信息检索的质量.基于查询与内容的文档表示模型较好的利用了语用信息,对站内搜索引擎的查准率的提高有着很好作用;Luc... 根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体,在信息检索的过程中加入语用信息能有效的提高信息检索的质量.基于查询与内容的文档表示模型较好的利用了语用信息,对站内搜索引擎的查准率的提高有着很好作用;Lucene是一个用java语言开发的开源的全文搜索引擎架构.本文利用Lucene设计和实现一个基于查询与内容的文档表示模型的站内搜索引擎,实验结果表明该模型能有效的提高信息检索的查准率. 展开更多
关键词 lucene 站内搜索引擎 搜索引擎 信息检索
下载PDF
使用Heritrix和Lucence的全文检索解决方案 被引量:1
13
作者 周文勤 《甘肃联合大学学报(自然科学版)》 2012年第4期52-56,共5页
对全文检索技术进行了介绍,提出了一种基于网络爬虫Heritrix和开源全文信息检索包Lucence的全文检索解决方案.该方案将Web应用中经常用到的全文检索功能进行封装,使其可以很方便地被集成到Java EE项目中.本方案被用于校园网内容检索功... 对全文检索技术进行了介绍,提出了一种基于网络爬虫Heritrix和开源全文信息检索包Lucence的全文检索解决方案.该方案将Web应用中经常用到的全文检索功能进行封装,使其可以很方便地被集成到Java EE项目中.本方案被用于校园网内容检索功能的实现,实践证明,该解决方案简单易用、应用效果较好. 展开更多
关键词 全文检索 lucene JAVA EE HERITRIX
下载PDF
基于Lucene的影像垂直检索系统设计
14
作者 王振华 宋明 许存禄 《计算机与现代化》 2010年第7期18-22,共5页
为解决数据高效组织和系统管理以及跨域合作数据共享体系不完善的问题,本文设计一个基于Lucene搜索引擎的Web服务影像数据服务器。该服务器核心引入Lucene的全文检索技术进行二次开发,实现一个全文垂直检索引擎,并引入Xml作为数据描述,... 为解决数据高效组织和系统管理以及跨域合作数据共享体系不完善的问题,本文设计一个基于Lucene搜索引擎的Web服务影像数据服务器。该服务器核心引入Lucene的全文检索技术进行二次开发,实现一个全文垂直检索引擎,并引入Xml作为数据描述,最后用Web技术作为与用户的交互手段。该平台有易使用,扩展性能强的优点,能够将数据的多条件查询与选择传输功能有机地结合起来,为用户提供一个具有良好体验的数据共享平台。 展开更多
关键词 lucene 全文检索 二次开发 数据共享 跨域合作
下载PDF
基于语义Web的智能信息检索模型
15
作者 李杏艳 张翠肖 《河北省科学院学报》 CAS 2013年第2期22-25,44,共5页
针对传统基于关键字的信息检索系统查全率和查准率都不高的缺点,提出了一种基于语义Web的智能信息检索模型,此模型在语义Web的环境下,利用本体技术,将最初的检索词通过查询扩展模块得到更完善的检索词集,然后利用扩展的检索词集进行检... 针对传统基于关键字的信息检索系统查全率和查准率都不高的缺点,提出了一种基于语义Web的智能信息检索模型,此模型在语义Web的环境下,利用本体技术,将最初的检索词通过查询扩展模块得到更完善的检索词集,然后利用扩展的检索词集进行检索。将基于关键字匹配的信息检索系统提升为基于本体知识库扩展查询的智能检索系统,从而提高了查全率与查准率,满足了人们对信息检索系统的要求。最后给出了模型的一种实施方案。 展开更多
关键词 信息检索 本体 lucene 查询扩展
下载PDF
基于Nutch与元搜索引擎技术的高校网络舆情监测系统研究
16
作者 聂琰 《计算机时代》 2014年第11期19-21,共3页
针对高校网络舆情监测工作的不足,结合高校舆情信息的传播特点,提出了在校园网范围内基于Nutch搜索引擎技术进行信息检索,在互联网上采用元搜索引擎技术获取相关信息的舆情监测系统构建方案。采用关键词特征库匹配方式自动进行网络舆情... 针对高校网络舆情监测工作的不足,结合高校舆情信息的传播特点,提出了在校园网范围内基于Nutch搜索引擎技术进行信息检索,在互联网上采用元搜索引擎技术获取相关信息的舆情监测系统构建方案。采用关键词特征库匹配方式自动进行网络舆情监测,及时准确地发现网络舆情信息;探讨了高校对于网络舆情的监测、分析、引导和反馈等环节的处理方法,从而形成完善的应对机制。 展开更多
关键词 网络舆情 元搜索引擎 信息检索
下载PDF
基于Lucene的站内搜索设计与实现 被引量:12
17
作者 朱学昊 王儒敬 +1 位作者 余锋林 唐昱 《计算机应用与软件》 CSCD 北大核心 2008年第10期6-8,共3页
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者... 简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者的需要。 展开更多
关键词 全文检索 lucene 中文分词 信息抽取
下载PDF
多级索引驱动的地名信息检索方法 被引量:12
18
作者 李爱勤 《测绘科学》 CSCD 北大核心 2017年第4期103-107,136,共6页
针对地理空间数据交换和共享平台的地名数据日益增多及不同部门的数据差异所造成的地名检索效率低下问题,该文分析了平台中地名的表达特征,设计了面向地名信息的多级索引库组织方式,提出了地名特征词典的构建方法,设计并开发原型系统,... 针对地理空间数据交换和共享平台的地名数据日益增多及不同部门的数据差异所造成的地名检索效率低下问题,该文分析了平台中地名的表达特征,设计了面向地名信息的多级索引库组织方式,提出了地名特征词典的构建方法,设计并开发原型系统,实现了基于Lucene和地名特征词的检索框架。实验表明:多级索引通过基础索引、特征索引、分类索引三者联动的方式降低了地名检索的复杂度,具有较高的检索效率和准确度,应用于浙江省地理空间数据交换和共享平台取得了良好的效果。 展开更多
关键词 地名信息检索 地名特征词 多级索引 lucene框架
原文传递
面向Web电子产品信息分布式检索系统的设计与实现 被引量:9
19
作者 张渊源 张琴燕 蒋关富 《计算机应用》 CSCD 北大核心 2013年第4期1026-1030,共5页
为了从这些海量信息中获取"有用的、满足用户需求的信息",提出一个基于Hadoop和Lucene技术的分布式检索系统架构处理Web电子产品信息检索。利用Hadoop的Map和Reduce实现分布式索引文件的存储,通过Lucene检索技术实现索引文件... 为了从这些海量信息中获取"有用的、满足用户需求的信息",提出一个基于Hadoop和Lucene技术的分布式检索系统架构处理Web电子产品信息检索。利用Hadoop的Map和Reduce实现分布式索引文件的存储,通过Lucene检索技术实现索引文件的访问,从而提高信息检索的效率。并且针对Lucene_Hadoop架构存在粗粒度检索问题,提出了一种细粒度检索方法,减少了系统建立索引的时间。实验表明基于Hadoop和Lucene的分布式检索系统在Web电子产品信息中具有较高的检索性能。 展开更多
关键词 分布式检索系统 Web电子产品信息 HADOOP lucene 细粒度检索
下载PDF
基于XML的中文全文检索关键技术及其发展——简评《XML文档全文检索的理论与方法》 被引量:3
20
作者 苏新宁 《情报科学》 CSSCI 北大核心 2013年第11期155-158,共4页
从全文检索的理论及实践意义出发,讨论了将传统文献信息环境下的全文检索技术应用于网络信息检索的适用性与必要性,阐述了全文检索技术在网络环境下的检索对象—XML数据的结构特征、需求背景、现实意义以及发展方向,随之提出了利用全文... 从全文检索的理论及实践意义出发,讨论了将传统文献信息环境下的全文检索技术应用于网络信息检索的适用性与必要性,阐述了全文检索技术在网络环境下的检索对象—XML数据的结构特征、需求背景、现实意义以及发展方向,随之提出了利用全文检索技术对XML数据资源进行检索的两个难点。对此,《XML文档全文检索的理论与方法》一书从标引理论、索引理论、检索模型理论,到实现XML文档全文检索的技术路线与具体实现都做了深入细致的理论与实践研究。 展开更多
关键词 全文检索 XML lucene 索引理论
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部