基于聚焦爬虫的编目数据搜集模型构建

Constructing the Cataloging Data Collection Model Based on Focused Crawler

导出

摘要聚焦爬虫可以搜集特定领域的信息资源,能够满足人们的个性化需求。编目人员在从事原始编目工作的过程中,如果能够从网络中查找到相应的编目数据作为参考,那么将会大大提高编目效率。因此,将此类编目数据视为一类主题信息资源,用聚焦爬虫进行抓取为编目人员所用就成为一种可能的方案。从聚焦爬虫的内涵和基本构成入手,分析利用聚焦爬虫搜集编目数据的技术,并构建融合聚焦爬虫技术的编目数据搜集模型。 Focused crawler can collect specific areas of information resources, so it can meet people＇s personalized needs. In the process of original cataloging, if library catalogers can search the appropriate cataloging data for reference on the Internet, it will greatly improve the efficiency of cataloging. Therefore, we can regard these cataloging data as a subject of information resources, and collect these data by using focused crawler for library catalogers to use. Taking the connotation and the basic composition of focused crawler as research starting points, this paper analyzes the technology of collecting cataloged data by using the focused crawler, and constructs the cataloging data collection model based on the technology of focused crawler.

作者梁士金

机构地区东莞理工学院城市学院图书信息中心

出处《图书馆学研究》 CSSCI 北大核心 2013年第13期78-80,共3页 Research on Library Science

关键词聚焦爬虫编目数据数据搜集模型 focused crawler cataloging data data collection model

分类号 G254.3 [文化科学—图书馆学]

引文网络
相关文献

参考文献8

1范会联,李献礼,曾广朴.基于改进遗传算法的聚焦爬虫设计[J].计算机工程与科学,2010,32(5):126-129. 被引量：3
2陈永彬,张琢,张添.一种基于蚁群算法的主题爬虫搜索策略[J].微型机与应用,2011,30(1):53-56. 被引量：4
3邹永斌,陈兴蜀,王文贤.基于贝叶斯分类器的主题爬虫研究[J].计算机应用研究,2009,26(9):3418-3420. 被引量：17
4关慧芬,师军.基于本体的主题爬虫技术研究[J].计算机仿真,2009,26(10):123-126. 被引量：2
5刘金红,陆余良.主题网络爬虫研究综述[J].计算机应用研究,2007,24(10):26-29. 被引量：132
6陈竹敏..面向垂直搜索引擎的主题爬行技术研究[D].山东大学,2008:
7M. R. Henzinge. Hyperlink Analysis for the Web [J]. IEEE Internet Computing, 2001 (1) : 45 -50. 被引量：1
8周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005,25(9):1965-1969. 被引量：156

二级参考文献82

1钟敏娟,林亚平,陈治平.基于超链接和标记文本的信息检索算法[J].小型微型计算机系统,2004,25(7):1344-1347. 被引量：7
2李学勇,田立军,谭义红,欧阳柳波,李国徽.一种基于非贪婪策略的网络蜘蛛搜索算法[J].计算技术与自动化,2004,23(2):35-39. 被引量：6
3李开荣,陈宏建,陈崚.一种动态自适应蚁群算法[J].计算机工程与应用,2004,40(29):149-152. 被引量：20
4李卫,刘建毅,何华灿,王枞.基于主题的智能Web信息采集系统的研究与实现[J].计算机应用研究,2006,23(2):163-166. 被引量：15
5陶剑文.基于蚁群计算的自适应Web检索算法设计[J].计算机工程与应用,2007,43(15):163-165. 被引量：1
6蒋玲艳,张军,钟树鸿.蚁群算法的参数分析[J].计算机工程与应用,2007,43(20):31-36. 被引量：32
7MURRAY B, MOORE A. Sizing the Intemet [ EB/OL ]. ( 2007- 07 ) [ 2008- 12- 07 ]. http://www, cyveillance com/web/us/downloads/ Sizing_the_lnternet. pdf. 被引量：1
8ZHU Yang-bo, YE Shao-zhi, L1 Xing et al. Distributed PageRank computation based on iterative aggregation-disaggregation methods [C]//Proc of the 14th ACM International Conference on lnformation and Knowledge Management. New York : ACM Press, 2005:578-585. 被引量：1
9MCCALLUM A K, NIGAM K, RENNIE J, et al. Automating the construction of Interuet portals with machine learning [ J ]. Information Retrieval Journal 2000, 3(2) :127-163. 被引量：1
10KUMAR R, RAGHAVAN P, RAJAGOPALAN P, et al. Stochastic models for the Web graph[ C ]//Proc of the 41st Annual Symposium on Foundations of Computer Science. Washington DC : IEEE Computer Society, 2000:57. 被引量：1

共引文献288

1齐虎春.高职化工院校网络化工数据采集课程实践研究[J].内蒙古石油化工,2020,46(10):88-90. 被引量：1
2杨学明,刘柏嵩.主题爬虫在数字图书馆中的应用[J].图书馆杂志,2007,26(8):47-50. 被引量：3
3彭攀峰,刘波.基于农业信息化的垂直搜索引擎的分析与设计[J].农机化研究,2012,34(5):95-99. 被引量：1
4张丽莎,张贵,龙朝夕,张盛.林业专题动态信息的搜索与集成[J].中南林业科技大学学报,2013,33(5):47-51. 被引量：3
5赵志滨,贾岩峰,姚兰,鲍玉斌.含有丰富结构化数据的Web页面分类技术的研究[J].计算机研究与发展,2013,50(S1):53-60. 被引量：5
6胡宏涛,常佳.基于网络的信息获取技术浅析[J].福建电脑,2006,22(4):60-61. 被引量：4
7李刚,周立柱,郭奇,林玲.领域相关的Web网站抓取方法[J].计算机科学,2007,34(2):137-140. 被引量：5
8孙素芬,罗长寿,张峻峰,于峰,张树亮.农业信息资源整合系统研究与应用[J].安徽农业科学,2007,35(22):6993-6994. 被引量：3
9王迁,王丽娜.对收费网站中作品提供链接的法律性质——评“娱乐基地”诉百度案[J].电子知识产权,2007(8):41-43.
10陈军,陈竹敏.基于网页分块的Shark-Search算法[J].山东大学学报（理学版）,2007,42(9):62-66. 被引量：7

1李进.数据新闻:理念与实践[J].新闻与写作,2014(4):4-4.
2徐肖逍.以大数据技术促新闻传播改革[J].中国报业,2014(16):19-20. 被引量：3
3胡丹.大数据时代下国内企业竞争情报研究分析[J].企业技术开发,2014,33(7):101-103. 被引量：1
4郝海涛,马元元.数据挖掘技术在图书馆信息服务中的应用[J].信息通信,2016,29(8):164-166. 被引量：2
5董珊珊.上海市高校图书馆移动终端比较研究[J].图书馆学刊,2016,38(7):120-126. 被引量：3
6陈胜（编译）.终于发现[J].高考金刊,2009(4):31-31.
7高翔.培养搜集与处理数据的能力[J].福建教育,2005,22(09A):51-52. 被引量：1
8刘祥平.图书馆编目工作效率探究[J].科技情报开发与经济,2005,15(11):99-100. 被引量：16
9王继良.高校图书馆如何提高编目效率[J].兰台世界（上旬）,2007(01X):57-58. 被引量：3
10刘镜.高校图书馆提高编目效率的探索[J].辽宁行政学院学报,2010,12(2):162-163. 被引量：3

图书馆学研究

2013年第13期

浏览历史

内容加载中请稍等...

基于聚焦爬虫的编目数据搜集模型构建

参考文献8

二级参考文献82

共引文献288

相关作者

相关机构

相关主题

浏览历史