基于Lucene的全文检索架构设计被引量：4

Full-text search architecture design based on Lucene

下载PDF

导出

摘要为在海量数据中快速定位所需信息,解决因数据结构化、半结构化差异造成的检索困难,该文提出了一种基于Lucene的全文检索架构。根据分布式并行计算的设计原理,将检索任务分发给每个子节点服务器并行完成检索工作,最终由根节点服务器汇总结果。子节点服务器也采用了并行化的设计理念。验证性实验显示该文基于Lucene的全文检索架构与传统全文检索架构相比检索耗时降低55%以上。 In order to locate needed information in massive data and solve the search problem caused by the difference between structured and unstructured data,a full-text search architecture based on Lucene is proposed here. According to the design principle of the distributed parallel computing,the search tasks are dispatched to every child-node server,and the root-node server took responsibility for gathering results. Every child-node server adopts the design concept of parallel. Verification experiments show that compared with the traditional full-text search architecture,the search consuming time of the full-text search architecture based on Lucene proposed here decreases by 55% at least.

作者崔诗程李千目戈峰

机构地区南京理工大学计算机科学与工程学院南京信息技术研究院计算技术研究所

出处《南京理工大学学报》 EI CAS CSCD 北大核心 2015年第6期692-697,共6页 Journal of Nanjing University of Science and Technology

基金国家自然科学基金(61272419) 江苏省未来网络前瞻性研究项目(BY2013095-3-02) 江苏省产学研前瞻性项目(BY2014089 BY2013039 BY2013037) 连云港国际合作项目(CH1304)

关键词全文检索分布式并行计算子节点服务器根节点服务器 full-text search distributed parallel computing child-node servers root-node servers

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1谭文堂,贺明科,李阜.基于Lucene.Net的分布式全文检索系统[J].计算机应用与软件,2009,26(9):142-145. 被引量：11
2张丽霞..基于Lucene的全文检索系统设计与实现[D].华中科技大学,2013:
3王莉云,王华,陈刚,姚乃明.基于Lucene的全文检索系统的设计与实现[J].计算机工程与设计,2007,28(24):5959-5961. 被引量：14
4郭永利,卢颖颖.基于Lucene对文件全文检索的研究与应用[J].微型电脑应用,2014(1):51-54. 被引量：8
5李永春,丁华福.Lucene的全文检索的研究与应用[J].计算机技术与发展,2010,20(2):12-15. 被引量：55
6Li Shengdong, Lv Xueqiang, Ling Feng, et al. Study on efficiency of full-text retrieval based on Lucene [ A ]. International Conference on Information Engineering and Computer Science ( ICIECS 2009 ) [ C ]. Wuhan : IEEE ,2009 : 1-4. 被引量：1
7Zhao Wei. The design and research of literary retrieval system based on Lucene [ A ]. 2011 International Conference on Electronic and Mechanical Engineering and Information Technology ( EMEIT ) [ C ]. Harbin: IEEE,2011:4146-4148. 被引量：1
8Huang Hua, Gao Shu, Shao Chaojie. Distributed search engine design and implementation based on Lucene [ A]. 2010 International Conference on Computer Design and Applications (ICCDA) [ C ]. Qinhuangdao: IEEE ,2010 :25-27. 被引量：1
9Zhang Yong, Li Jianlin. Research and improvement of search engine based on Lucene [ A ]. 2009 International Conference on Intelligent Human-Machine Systems and Cybernetics( IHMSC'09 ) [ C ]. Hangzhou : IEEE ,2009 : 270 -273. 被引量：1
10宋佳,诸云强,刘润达.一种基于Lucene改进的全文检索工具包[J].计算机工程与应用,2008,44(4):172-175. 被引量：15

二级参考文献34

1张英武,杜凯,杨树强,韩伟红.分布式海量文本检索系统研究[J].微电子学与计算机,2006,23(z1):32-34. 被引量：3
2董慧,陈琮,雷瑛.基于J2EE规范的数字图书馆示范模型的设计与实现（下）——关键技术分析[J].情报学报,2004,23(3):289-296. 被引量：1
3柯和平.基于全文检索和流媒体技术的素材库设计建设[J].计算机工程与设计,2004,25(9):1466-1469. 被引量：8
4张校乾,金玉玲,侯丽波.一种基于Lucene检索引擎的全文数据库的研究与实现[J].现代图书情报技术,2005(2):40-43. 被引量：30
5王正桓,蔡明.MS.NET Remoting的分布式技术应用研究[J].计算机应用与软件,2005,22(3):140-142. 被引量：11
6陈士杰,张玥杰.基于Lucene的英汉跨语言信息检索[J].计算机工程,2005,31(13):62-64. 被引量：12
7孙西全,马瑞芳,李燕灵.基于Lucene的信息检索的研究与应用[J].情报理论与实践,2006,29(1):125-128. 被引量：20
8郎小伟,王申康.基于Lucene的全文检索系统研究与开发[J].计算机工程,2006,32(4):94-96. 被引量：68
9马保国,王文丰,侯存军,钱方正.基于.NET Remoting的分布式系统实现[J].计算机技术与发展,2006,16(3):50-52. 被引量：20
10向晖,郭一平,王亮.基于Lucene的中文字典分词模块的设计与实现[J].现代图书情报技术,2006(8):46-50. 被引量：27

共引文献92

1刘高原,何伟娜,郑浩,刘觉夫.Nutch0.9中二分法中文分词的实现[J].计算机时代,2009(4):28-30.
2裴志松.基于Lucene的毕业论文相似性检测[J].长春工程学院学报（自然科学版）,2013,14(4):105-107.
3李颖,李志蜀,邓欢.基于Lucene的中文分词方法设计与实现[J].四川大学学报（自然科学版）,2008,45(5):1095-1099. 被引量：13
4周锦程,王丹.基于Lucene的全文搜索引擎研究与应用[J].黔南民族师范学院学报,2009,29(3):7-12. 被引量：4
5黄少林,王华,张玉红,蒋一峰.基于Lucene的索引系统的设计与实现[J].现代情报,2009,29(7):169-171. 被引量：11
6龚磊,武友新.Lucene全文检索系统的研究与实现[J].计算机与数字工程,2010,38(5):64-67. 被引量：5
7孙殿哲,魏海平,陈岩.Nutch中庖丁解牛中文分词的实现与评测[J].计算机与现代化,2010(6):187-190. 被引量：10
8刘洋.Nutch0.9中二分法中文分词的实现[J].科技信息,2009(36):171-172.
9王远定,梁久祯.利用关键词倒排表实时检索中文网页[J].计算机工程与应用,2010,46(28):135-137. 被引量：4
10薛萍.基于Lucene的全文检索系统研究[J].中国科技博览,2010(33):419-419.

同被引文献21

1郑榕增,林世平.基于Lucene的中文倒排索引技术的研究[J].计算机技术与发展,2010,20(3):80-83. 被引量：50
2夏天,黄文,马骏涛,李光伟.Lucene全文检索软件及其在学科信息服务平台中的应用[J].图书情报工作,2011,55(21):106-109. 被引量：8
3姜鑫,余平.基于Lucene的音视频资源检索系统的研究与实现[J].计算机应用与软件,2011,28(11):245-248. 被引量：5
4黄江平,黄理灿,徐玲.基于Lucene的PDF文档的全文检索的实现[J].工业控制计算机,2012,25(5):103-104. 被引量：11
5郭广军,周显光,陈代武.基于本体和Lucene的网络教育资源管理检索系统[J].计算机应用与软件,2012,29(7):115-118. 被引量：5
6义天鹏,陈启安.基于Lucene的中文分析器分词性能比较研究[J].计算机工程,2012,38(22):279-282. 被引量：24
7高平,周磊.版本控制系统——Subversion技术及其在软件开发库的应用[J].航空电子技术,2013,44(1):24-28. 被引量：6
8孔浩,高琴,姜娜.高校URP中基于POI设计实现数据交换中间件[J].陕西理工学院学报（自然科学版）,2013,29(4):39-42. 被引量：2
9王旭仁,郑秋辉,何发镁,李娜,王彦丽.基于Tika和Lucene的桌面搜索引擎研究与实现[J].计算机工程与设计,2014,35(1):310-314. 被引量：3
10秦杰,宋金玉,张广星.基于Lucene的本地搜索引擎研究与实现[J].计算机科学,2014,41(B11):368-370. 被引量：4

引证文献4

1王亮,苏云.基于Lucene的异构数据库全文检索技术[J].指挥控制与仿真,2017,39(2):141-144. 被引量：3
2任洪敏,李敏,赵要强,张敬周.修订限定的SVN全文检索系统研究与实现[J].计算机应用与软件,2017,34(11):86-90.
3张俊飞.海量文档桌面全文检索终端设计与实现[J].现代计算机,2018,24(22):85-90. 被引量：1
4高剑.基于Lucene检索工具的科技查新检索方法设计[J].集成电路应用,2022,39(4):114-115.

二级引证文献4

1任文军,张进,张庆龙,解国爱.鄂尔多斯盆地中的断层相关褶皱及其分布[J].江苏地质,2000,24(1):18-22. 被引量：5
2全志薇,陈晓玲.基于异构数据整合的吉林省区域创新数据库实现[J].软件导刊,2020,19(10):214-217. 被引量：4
3苏荣聪,董玉霞.基于双向参考索引的Java内存数据库快速检索方法[J].蚌埠学院学报,2021,10(2):52-55. 被引量：2
4杨芳,张宁,潘晓梅,王全喜.基于Lucene的专利信息智能检索技术[J].机械设计与制造工程,2022,51(12):104-107.

1杨一珊,张武军,李林.绘图软件标准化定制[J].农业工程,2015,5(1):85-87.
2葛寒松.数据库优点分析研究[J].商丘职业技术学院学报,2007,6(2):46-48. 被引量：2
3陈志鹏.生物数据结构化浅析——以FlyBase为例[J].创新科技,2014,0(14):59-60.
4关中.FOXPRO在数据库系统及关系数据模型方面存在的一些缺陷[J].广州城市职业学院学报,1999,0(2):56-58.
5黄晨.新一代WEB技术层:XML[J].图书馆杂志,2001,20(3):24-26. 被引量：4
6使复制内容“所见即所得”[J].电脑爱好者,2012(13):38-38.
7程洪涛.基于XML的非结构化文本数据转换研究与实现[J].现代计算机,2013,19(6):51-54. 被引量：3
8陈敏,李徽翡.集群系统中的FP-Growth并行算法[J].计算机工程,2009,35(20):71-72. 被引量：8
9王华丽.妙用Excel数据透视表功能建立统计报表[J].计算机与农业,2003(11):40-40.
10唐波,汤晓安,孙茂印.视频检索与数据库机制的适应性分析[J].计算机工程与应用,2005,41(26):162-165. 被引量：1

南京理工大学学报

2015年第6期

浏览历史

内容加载中请稍等...

基于Lucene的全文检索架构设计被引量：4

参考文献13

二级参考文献34

共引文献92

同被引文献21

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Lucene的全文检索架构设计 被引量：4

参考文献13

二级参考文献34

共引文献92

同被引文献21

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于Lucene的全文检索架构设计被引量：4