期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
分布式网络信息查询系统 被引量:13
1
作者 瞿艳 卢增祥 李衍达 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2000年第1期124-128,共5页
介绍了“中国公众多媒体业务网”的分布式网络导航系统的设计方案。整个系统由多个相互独立又相互配合的子信息查询系统组成。方案采用分布式的结构 ,具有速度快、网络带宽利用合理、安全性高等优势。提出了数据库小型化、本地化等设计... 介绍了“中国公众多媒体业务网”的分布式网络导航系统的设计方案。整个系统由多个相互独立又相互配合的子信息查询系统组成。方案采用分布式的结构 ,具有速度快、网络带宽利用合理、安全性高等优势。提出了数据库小型化、本地化等设计原则。介绍了整体结构和具体模块设计。在此方案中 ,利用用户反馈成功地解决了判断用户对信息的满意程度、选择搜索引擎、更新数据库等关键问题。 展开更多
关键词 信息查询 搜索引擎 分布式网络 集中式 INTERNET
原文传递
基于Hadoop的分布式搜索引擎关键技术 被引量:15
2
作者 王俊生 施运梅 张仰森 《北京信息科技大学学报(自然科学版)》 2011年第4期53-56,61,共5页
实现了基于Hadoop的分布式搜索引擎,着重讨论了实现分布式搜索引擎涉及的3个关键性技术:索引表的建立、分词的处理和索引前的预处理。通过实验对比了集中式搜索引擎和分布式搜索引擎,结果表明了基于hadoop的分布式搜索引擎在处理数据方... 实现了基于Hadoop的分布式搜索引擎,着重讨论了实现分布式搜索引擎涉及的3个关键性技术:索引表的建立、分词的处理和索引前的预处理。通过实验对比了集中式搜索引擎和分布式搜索引擎,结果表明了基于hadoop的分布式搜索引擎在处理数据方面强劲的优势。 展开更多
关键词 HADOOP 分布式搜索引擎 MAP/REDUCE 索引表 分词
下载PDF
Hadoop下的分布式搜索引擎 被引量:15
3
作者 胡彧 封俊 《计算机系统应用》 2010年第7期224-228,共5页
分析了Hadoop系统结构,提出一种改进的PageRank算法,使用Map/Reduce模式设计系统模块。实验证明,使用Hadoop框架能够设计出具有高性能、高可靠性和易扩展性的分布式搜索引擎。
关键词 HADOOP PAGERANK MAP/REDUCE 分布式搜索引擎
下载PDF
基于云计算的分布式企业搜索引擎研究 被引量:9
4
作者 林乐然 陈德龙 《电脑知识与技术》 2009年第11X期9429-9430,9434,共3页
当前企业搜索引擎多采用基于全文检索技术设计,随着索引的膨胀和客户端并发查询的增加,有限的物理存储、CPU周期、内存容量和网络带宽带来了巨大瓶颈。随着云计算概念的提出和发展,为企业搜索引擎提供了更加优化的解决方案。本文将简要... 当前企业搜索引擎多采用基于全文检索技术设计,随着索引的膨胀和客户端并发查询的增加,有限的物理存储、CPU周期、内存容量和网络带宽带来了巨大瓶颈。随着云计算概念的提出和发展,为企业搜索引擎提供了更加优化的解决方案。本文将简要介绍现阶段基于分布式存储和分布式计算的云计算研究成果,以及其在企业搜索引擎中的应用。 展开更多
关键词 云计算 分布式存储 分布式文件系统 分布式计算 企业搜索引擎 全文检索
下载PDF
基于分布式电力资源库的搜索引擎框架 被引量:9
5
作者 张莲梅 陈世鸿 +2 位作者 陈红梅 许继红 杨璃 《高电压技术》 EI CAS CSCD 北大核心 2005年第8期66-68,共3页
在建设电力资源平台的基础上,提出基于分布式电力资源库的由Agent管理系统、共享Agent、搜索引擎界面、搜索词获取机、智能搜索机和跟踪评价机组成的搜索引擎框架。通过基于电力专业词库的分词、专业词规范、机器翻译等面向电力专业的处... 在建设电力资源平台的基础上,提出基于分布式电力资源库的由Agent管理系统、共享Agent、搜索引擎界面、搜索词获取机、智能搜索机和跟踪评价机组成的搜索引擎框架。通过基于电力专业词库的分词、专业词规范、机器翻译等面向电力专业的处理,在跟踪用户搜索行为的基础上结合相似检索优化和数据挖掘该搜索引擎可为用户提供个性化、智能化的电力资源搜索服务,有效提高电力信息搜索的查准率、查全率和查找速度。 展开更多
关键词 分布式 电力资源 搜索引擎 框架 移动代理 AGENT 数据库
下载PDF
分布式搜索引擎系统效能建模与评价 被引量:6
6
作者 张伟哲 张宏莉 +1 位作者 许笑 何慧 《软件学报》 EI CSCD 北大核心 2012年第2期253-265,共13页
针对分布式搜索引擎系统效能建模与评估问题,通过对当前分布式搜索引擎系统的建模与分类,扩展了能耗与网络开销的成本模型;对5种构建搜索引擎系统的设计方案,从系统成本、系统规模和查询响应时间等角度进行了详尽的理论分析与评价.由此... 针对分布式搜索引擎系统效能建模与评估问题,通过对当前分布式搜索引擎系统的建模与分类,扩展了能耗与网络开销的成本模型;对5种构建搜索引擎系统的设计方案,从系统成本、系统规模和查询响应时间等角度进行了详尽的理论分析与评价.由此发现,由广域网分布式采集系统和多机群索引系统组成的半广域网搜索引擎系统相对于其他系统具有相对较高的效能,同时能够较好地兼顾用户的服务质量. 展开更多
关键词 分布式搜索引擎 效能建模 分布式采集 分布式索引 半广域网搜索引擎
下载PDF
基于Redis的分布式搜索引擎研究 被引量:9
7
作者 李彦辰 艾庆忠 王少非 《软件导刊》 2018年第3期201-204,共4页
针对互联网网内信息搜索效率低下问题,设计了以Redis数据库以及Map-reduce思想为核心的分布式搜索引擎框架。为了应对互联网信息时效性强、更新快、难以被准确检索的特点,基于该框架设计了分布式爬虫、分布式索引建立、分布式链接分析... 针对互联网网内信息搜索效率低下问题,设计了以Redis数据库以及Map-reduce思想为核心的分布式搜索引擎框架。为了应对互联网信息时效性强、更新快、难以被准确检索的特点,基于该框架设计了分布式爬虫、分布式索引建立、分布式链接分析算法。该框架明显提高了信息处理的效率,为分布式搜索引擎的搭建提供有效模板。经过测试,与以基于其它主流框架搭建分布式搜索引擎相比,基于Redis的分布式搜索引擎在爬虫爬取、索引生成、链接分析性能方面均有提升。 展开更多
关键词 分布式搜索引擎 Redis数据库 Map-reduce思想
下载PDF
分布式数据库搜索引擎的索引建立和优化 被引量:7
8
作者 蒋维 郝文宁 +1 位作者 杨晓恝 靳大尉 《计算机工程》 CAS CSCD 北大核心 2008年第18期36-38,共3页
对于使用数据的用户来说,能找到准确的数据且没有遗漏是一件非常困难的事。为了较好地满足用户需求,该文提出了利用分布式数据库搜索引擎架构来实现智能化的搜索和定位。通过建立和优化索引,并使用适当的排序算法,搜索引擎能将最贴近用... 对于使用数据的用户来说,能找到准确的数据且没有遗漏是一件非常困难的事。为了较好地满足用户需求,该文提出了利用分布式数据库搜索引擎架构来实现智能化的搜索和定位。通过建立和优化索引,并使用适当的排序算法,搜索引擎能将最贴近用户需要的结果排在其他结果之前,从而提高搜索引擎的检索效率、查全率和查精率。实验表明,该引擎的查全率为90.02%,查精率为89.78%。 展开更多
关键词 分布式 数据库搜索引擎 索引建立 索引优化
下载PDF
分布式Web信息采集系统的设计与实现 被引量:7
9
作者 金岳富 范剑英 冯扬 《哈尔滨理工大学学报》 CAS 北大核心 2010年第1期116-119,123,共5页
Web信息的急剧增长,给信息的有效使用带来了巨大挑战.作为搜索引擎的重要组成部分,Web信息采集扮演着越来越重要的角色.文中从并行性、负载均衡、体系结构以及可扩展性这4个方面详细讨论了分布式Web信息采集系统的设计与实现.经验证,该... Web信息的急剧增长,给信息的有效使用带来了巨大挑战.作为搜索引擎的重要组成部分,Web信息采集扮演着越来越重要的角色.文中从并行性、负载均衡、体系结构以及可扩展性这4个方面详细讨论了分布式Web信息采集系统的设计与实现.经验证,该分布式Web信息采集系统能够实现负载均衡,并具有良好的可扩展性. 展开更多
关键词 分布式系统 WEB信息采集 搜索引擎 信息处理
下载PDF
基于ElasticSearch分布式搜索引擎的信息检索方法研究 被引量:2
10
作者 董元和 贾炎 +2 位作者 朱勇 李恩泽 薛贤红 《湖北师范大学学报(自然科学版)》 2023年第4期56-61,共6页
随着信息量的骤增,传统关系型数据库很难做到实时高效地检索用户需要的信息,并且无法对信息进行分词及关键词组合的短文本搜索,从而很难优化信息检索结果的推荐展示。针对大量信息频繁检索的问题,采取一种基于ElasticSearch分布式搜索引... 随着信息量的骤增,传统关系型数据库很难做到实时高效地检索用户需要的信息,并且无法对信息进行分词及关键词组合的短文本搜索,从而很难优化信息检索结果的推荐展示。针对大量信息频繁检索的问题,采取一种基于ElasticSearch分布式搜索引擎,并采用分词器和倒排索引等技术,能较好地解决这些问题。同时在研究过程中利用代码实现了基础功能搜索、地理位置搜索以及通过算分排序推荐展示等功能。 展开更多
关键词 分布式搜索引擎 短文本搜索 倒排索引 分词器 信息检索
下载PDF
分布式全网职位搜索引擎的研究与实现 被引量:5
11
作者 付剑生 徐林龙 林文斌 《计算机技术与发展》 2015年第5期6-9,共4页
传统招聘网站所查寻的信息仅限于站内搜索,而且每个招聘网站往往都会有重复的招聘信息,导致重复投递,对求职者和招聘者都造成了资源浪费。文中研究和分析了基于Lucene的分布式全文搜索引擎Solrcloud,设计了全网职位搜索引擎系统。该系... 传统招聘网站所查寻的信息仅限于站内搜索,而且每个招聘网站往往都会有重复的招聘信息,导致重复投递,对求职者和招聘者都造成了资源浪费。文中研究和分析了基于Lucene的分布式全文搜索引擎Solrcloud,设计了全网职位搜索引擎系统。该系统采用Bloom Filter进行数据及URL的去重,通过使用Zookeeper提供分布式同步服务,并通过多线程来实现网页并发抓取。通过对系统的测试表明,该系统具有良好的可靠性和应用性,并在大数据量的情况下保证了搜索的效率及准确性。 展开更多
关键词 职位搜索 网络爬虫 分布式搜索引擎
下载PDF
基于语义Web服务的分布式服装搜索引擎系统设计 被引量:3
12
作者 张革伕 徐琪 《计算机应用》 CSCD 北大核心 2009年第6期1601-1604,共4页
从电子商务环境下服装供应链管理的需求出发,分析了目前服装搜索引擎存在的问题,提出了基于语义Web服务的分布式服装商品搜索引擎系统模型,并讨论了它的体系结构。介绍了基于Ontology Web Language(OWL)的服装本体设计模型及其语义描述... 从电子商务环境下服装供应链管理的需求出发,分析了目前服装搜索引擎存在的问题,提出了基于语义Web服务的分布式服装商品搜索引擎系统模型,并讨论了它的体系结构。介绍了基于Ontology Web Language(OWL)的服装本体设计模型及其语义描述方法。分析了服装搜索引擎的基本功能及分布式环境下的Web Services(WS)合成。理论分析和实例原型说明了基于服装语义树的搜索引擎多关键词搜索效率明显高于全文搜索引擎。 展开更多
关键词 语义WEB WEB服务 分布式搜索引擎 服装供应链
下载PDF
基于RSS的分布式新闻博客搜索引擎设计 被引量:3
13
作者 刘峰 施水才 +1 位作者 肖诗斌 王弘蔚 《现代图书情报技术》 CSSCI 北大核心 2007年第1期29-32,共4页
针对传统搜索引擎对频繁更新的新闻和博客网站的搜索实时性较差的现状,提出利用RSS提供的结构化数据,通过Pastry协议,实现索引的分布式存储和传输,同时使用Bloom filter数据结构压缩索引文件,构建一个基于RSS的P2P分布式的新闻博客搜索... 针对传统搜索引擎对频繁更新的新闻和博客网站的搜索实时性较差的现状,提出利用RSS提供的结构化数据,通过Pastry协议,实现索引的分布式存储和传输,同时使用Bloom filter数据结构压缩索引文件,构建一个基于RSS的P2P分布式的新闻博客搜索引擎,从而达到对频繁更新站点的实时性搜索,同时减少存储成本。 展开更多
关键词 RSS PASTRY BLOOM filter分布式搜索引擎
下载PDF
分布式全文检索技术的研究及应用 被引量:3
14
作者 葛云生 孔杰 《计算机工程与设计》 北大核心 2018年第9期2997-3001,共5页
为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并... 为有效解决分布式对海量数据的资源管理、共享资源并发访问控制以及如何对海量数据进行快速且准确的检索,提出一种基于zookeeper的分布式服务协调模型为分布式提供资源的管理和并发访问的控制,在lucene搜索引擎的基础上,采用组件技术并在BM25F算法的基础上添加时间因子分别对文档进行解析,创建索引和检索结果排序算法进行优化的方案。系统应用结果表明,该方案有效解决了分布式的资源管理和控制问题,提高了检索的效率和准确度。 展开更多
关键词 zookeeper框架 分布式 lucene搜索引擎 文档解析 BM25F算法
下载PDF
基于Hadoop的海运业分布式搜索引擎的应用研究 被引量:3
15
作者 陈宁 柴向阳 孙勇 《西安工程大学学报》 CAS 2015年第1期73-77,共5页
针对海运业务系统越来越复杂,区域间数据交换日益频繁,致使海运企业无法高效、稳定地使用传统体系处理业务信息的问题,采用Map/Reduce分布式计算模型以及分布式文件系统,设计了一个基于Hadoop的分布式搜索引擎.该搜索引擎能够使海运企... 针对海运业务系统越来越复杂,区域间数据交换日益频繁,致使海运企业无法高效、稳定地使用传统体系处理业务信息的问题,采用Map/Reduce分布式计算模型以及分布式文件系统,设计了一个基于Hadoop的分布式搜索引擎.该搜索引擎能够使海运企业在合理时间内获取、管理、处理业务信息.通过该分布式搜索引擎,可以高效、稳定地满足海运企业日益繁重的庞大的业务需求. 展开更多
关键词 海运业 HADOOP MAP/REDUCE 分布式文件系统 搜索引擎
下载PDF
分布式搜索引擎的模型综述 被引量:2
16
作者 钱立兵 季振洲 《智能计算机与应用》 2015年第5期113-116,F0003,共5页
本文综述了分布式搜索引擎的模型、结构和查询方法,并讨论了搜索引擎的评价指标。从搜索引擎的离线处理和在线处理讨论了搜索引擎的基本模块,在线查询过程速度决定了搜索引擎性能的关键因素;从分布式搜索引擎的模型上划分,搜索引擎包含... 本文综述了分布式搜索引擎的模型、结构和查询方法,并讨论了搜索引擎的评价指标。从搜索引擎的离线处理和在线处理讨论了搜索引擎的基本模块,在线查询过程速度决定了搜索引擎性能的关键因素;从分布式搜索引擎的模型上划分,搜索引擎包含四个主要子系统:网页爬虫系统、索引构建系统、检索系统和日志分析系统;倒排索引结构是以词典(dictionary)和倒排文件(inverted file)组成,分为文档编号递增排序和词频(或影响力)得分递减排序。然后讨论了当前搜索引擎典型的三类查询处理策略,并比较各自适应的条件。最后,综述评价搜索引擎的两个重要指标:查询效率和查询结果的质量,并列举定量评价公式。 展开更多
关键词 分布式索引 搜索引擎 倒排索引 查询处理
下载PDF
一种瘦服务器—胖客户分布式搜索引擎的设计 被引量:2
17
作者 陶跃华 鲁晓南 张玉琢 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期74-77,共4页
传统的集中服务器搜索引擎模式难以满足未来信息检索的需求。为了提高搜索引擎的查全率和查准率,提出一种瘦服务器—胖客户分布式搜索引擎模型,它通过服务器端与客户端协作来共同完成用户的信息检索请求,充分利用各分布式个体的资源,以... 传统的集中服务器搜索引擎模式难以满足未来信息检索的需求。为了提高搜索引擎的查全率和查准率,提出一种瘦服务器—胖客户分布式搜索引擎模型,它通过服务器端与客户端协作来共同完成用户的信息检索请求,充分利用各分布式个体的资源,以获得整体最佳的效果。经实验验证此模型有较优的性能。 展开更多
关键词 分布式系统 搜索引擎 信息检索
下载PDF
A Simple Implementation of Distributed Vertical Search and Information Integration Technology 被引量:1
18
作者 LIU Jinshuo YANG Nanhai +1 位作者 LIU Yuan DENG Juan 《Wuhan University Journal of Natural Sciences》 CAS 2013年第6期511-516,共6页
The paper proposes the research on the distributed vertical search and information integration technology based on Web mining, which aims at satisfying the requirements of the spe- cific fields' applications. Nowaday... The paper proposes the research on the distributed vertical search and information integration technology based on Web mining, which aims at satisfying the requirements of the spe- cific fields' applications. Nowadays, mining, analyzing, and inte- grating Web's content have become an important trend for daily use. The technique includes the Map/Reduce model, the depth search, and the basic principles of information integration. The focus of the paper is how to implement the distributed vertical search engine based on Map/Reduce technology and the informa- tion integration system. System optimization mechanism and the system test are also proposed. 展开更多
关键词 distributed system search engine HADOOP MAP/REDUCE
原文传递
面向海量植物图像的智能检索系统设计
19
作者 邱金水 庄会富 金涛 《计算机与现代化》 2022年第10期62-67,81,共7页
针对传统软件技术设计的植物图像检索系统中存在无法实现智能检索、植物图像数量增长慢、检索系统难以扩容,以及当植物图像数量达到百万级以上时检索效率低和检索请求高并发时植物图像加载慢等问题,提出利用百度AI技术、Image Sharp图... 针对传统软件技术设计的植物图像检索系统中存在无法实现智能检索、植物图像数量增长慢、检索系统难以扩容,以及当植物图像数量达到百万级以上时检索效率低和检索请求高并发时植物图像加载慢等问题,提出利用百度AI技术、Image Sharp图像分割技术和CV2颜色识别技术实现植物图像的智能检索。利用Fast DFS技术实现检索系统的动态扩容、负载均衡和植物图像的快速加载,利用Solr搜索引擎技术提高海量植物图像的检索效率,利用Python爬虫技术不断丰富检索系统的植物图像从而实现检索系统的可持续化发展。实验结果表明,通过上述技术能够构建一个面向海量植物图像的智能检索系统。 展开更多
关键词 植物图像 检索系统 大数据 人工智能 分布式存储 搜索引擎 网络爬虫
下载PDF
分布协作式搜索引擎系统的初步探索 被引量:1
20
作者 赵新慧 朱伟 《抚顺石油学院学报》 2003年第4期57-60,共4页
针对集中式搜索引擎的瓶颈问题,提出一种既具有集中式搜索引擎优点又解决了其瓶颈门题的分布协作式搜索引擎系统。系统的设计思想是使地理上分散在不同地方的搜索引擎在信息收集与更新上进行协作。讨论了信息收集程序(Crawler)的3种工... 针对集中式搜索引擎的瓶颈问题,提出一种既具有集中式搜索引擎优点又解决了其瓶颈门题的分布协作式搜索引擎系统。系统的设计思想是使地理上分散在不同地方的搜索引擎在信息收集与更新上进行协作。讨论了信息收集程序(Crawler)的3种工作方式:封闭式、交叉式和交换式。提出了成组传送和复制热门URL两种方法来降低在交换式工作方式下传送的URL信息频率和信息量。讨论了Web的3种划分方法:URL散列法、站点散列法和分类法。通过模拟实验验证了在封闭式工作方式下当Crawler数量较少时可以得到较好的收集率。验证了站点散列法比URL散列法能显著减少外部链接的数量。验证了成组传送对降低在交换式工作方式下传送URL信息量所起的作用。 展开更多
关键词 分布协作式 搜索引擎 信息收集
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部