期刊文献+
共找到415篇文章
< 1 2 21 >
每页显示 20 50 100
大数据:概念、技术及应用研究综述 被引量:233
1
作者 方巍 郑玉 徐江 《南京信息工程大学学报(自然科学版)》 CAS 2014年第5期405-419,共15页
随着物联网、云计算、移动互联网的迅猛发展,大数据(Big Data)吸引了越来越多的关注,正成为信息社会的重要财富,同时也给数据的处理与管理带来了巨大挑战.首先从大数据概念入手,阐述了大数据的来源、主要挑战、关键技术、大数据处理工... 随着物联网、云计算、移动互联网的迅猛发展,大数据(Big Data)吸引了越来越多的关注,正成为信息社会的重要财富,同时也给数据的处理与管理带来了巨大挑战.首先从大数据概念入手,阐述了大数据的来源、主要挑战、关键技术、大数据处理工具和应用实例等,并对比了大数据与云计算、物联网、移动互联网等技术之间关系,然后剖析了大数据核心技术、大数据企业解决方案,讨论了目前大数据应用实例,最后归纳总结了大数据发展趋势.旨在为了解大数据当前发展状况、关键技术以及科学地进行大数据分析与处理提供参考. 展开更多
关键词 大数据 云计算 大数据处理 分布 式系统 nosql
下载PDF
支持大数据管理的NoSQL系统研究综述 被引量:193
2
作者 申德荣 于戈 +2 位作者 王习特 聂铁铮 寇月 《软件学报》 EI CSCD 北大核心 2013年第8期1786-1803,共18页
针对大数据管理的新需求,呈现出了许多面向特定应用的NoSQL数据库系统.针对基于key-value数据模型的NoSQL数据库的相关研究进行综述.首先,介绍了大数据的特点以及支持大数据管理系统面临的关键技术问题;然后,介绍了相关前沿研究和研究挑... 针对大数据管理的新需求,呈现出了许多面向特定应用的NoSQL数据库系统.针对基于key-value数据模型的NoSQL数据库的相关研究进行综述.首先,介绍了大数据的特点以及支持大数据管理系统面临的关键技术问题;然后,介绍了相关前沿研究和研究挑战,其中典型的包括系统体系结构、数据模型、访问方式、索引技术、事务特性、系统弹性、动态负载均衡、副本策略、数据一致性策略、基于flash的多级缓存机制、基于MapReduce的数据处理策略和新一代数据管理系统等;最后给出了研究展望. 展开更多
关键词 nosql key-value存储 大数据管理
下载PDF
数据管理技术的新格局 被引量:110
3
作者 覃雄派 王会举 +5 位作者 李芙蓉 李翠平 陈红 周烜 杜小勇 王珊 《软件学报》 EI CSCD 北大核心 2013年第2期175-197,共23页
数据获取技术的革命性进步、存储器价格的显著下降以及人们希望从数据中获得知识的客观需要等,催生了大数据.数据管理技术迎来了大数据时代.关系数据库技术经历了20世纪70年代以来40年的发展,目前遇到了系统扩展性不足、支持数据类型单... 数据获取技术的革命性进步、存储器价格的显著下降以及人们希望从数据中获得知识的客观需要等,催生了大数据.数据管理技术迎来了大数据时代.关系数据库技术经历了20世纪70年代以来40年的发展,目前遇到了系统扩展性不足、支持数据类型单一等困难.近年来,noSQL技术异军突起,对多种类型的数据进行有效的管理、处理和分析;通过并行处理技术获得良好的系统性能;并以其高度的扩展性,满足不断增长的数据量的处理要求.试图沿着数据库技术进步的历史脉络,从应用维度(操作型与分析型应用)入手,为读者展开当今数据管理技术的新格局,讨论具有挑战性的重要问题,并介绍作者自己的研究工作. 展开更多
关键词 关系数据库 nosql 大数据 操作型 分析型 新格局
下载PDF
基于NoSQL的海量空间数据云存储与服务方法 被引量:61
4
作者 陈崇成 林剑峰 +2 位作者 吴小竹 巫建伟 连惠群 《地球信息科学学报》 CSCD 北大核心 2013年第2期166-174,共9页
近年来,实现海量空间数据高效地存储管理和在线服务,成为地学信息科学领域日益关注的热点问题。本文根据矢量和栅格空间数据的不同特点,提出并实现了矢量栅格数据一体化的海量空间数据分布式云存储管理与访问服务方案,在海量矢量数据存... 近年来,实现海量空间数据高效地存储管理和在线服务,成为地学信息科学领域日益关注的热点问题。本文根据矢量和栅格空间数据的不同特点,提出并实现了矢量栅格数据一体化的海量空间数据分布式云存储管理与访问服务方案,在海量矢量数据存储和处理中创新性引入分布式图数据库Neo4J和并行图计算框架。在三层式空间数据云存储架构基础上,给出NoSQL数据库技术的栅格和矢量数据云存储的实现策略与方法,并开展了通用数据访问接口的设计。采用分布式文件系统HDFS存储栅格数据,并使用列族数据库HBase对其建立分布式空间索引,及采用满足ACID约束的分布式图数据库Neo4J来存储矢量数据,并使用R树建立空间索引。在自主研发的地理知识云平台GeoKSCloud框架下,初步实现了核心组件-空间数据聚合中心(GeoDAC)软件,可为各类用户提供空间数据分布式存储管理和访问服务。通过搭建试验床,开展GeoDAC与开源GIS软件PostGIS在矢量数据读写访问性能方面的对比测试。结果表明,虽然GeoDAC没有获得写入性能的加速作用,但其具有PostGIS无法比拟的强大读取性能。GeoDAC将海量数据经过空间分割后分布在集群上,能够并行处理查询请求,极大地提高空间查询速度,具有广阔的应用前景。 展开更多
关键词 空间数据 云存储 nosql 地理知识云 数据聚合中心
原文传递
大数据在我国图书馆的应用及推进研究 被引量:42
5
作者 江云 李凤兰 《图书馆工作与研究》 CSSCI 北大核心 2014年第6期35-41,共7页
信息科技让图书馆面临被边缘化的危险,传统图书馆将遭受价值质疑、新技术困惑、互动缺失、吸引力危机等挑战,但新技术也会让图书馆服务更精彩。大数据来临,我国图书馆应重塑理念、服务转型。文章阐述了大数据的内涵及应用,分析了我国图... 信息科技让图书馆面临被边缘化的危险,传统图书馆将遭受价值质疑、新技术困惑、互动缺失、吸引力危机等挑战,但新技术也会让图书馆服务更精彩。大数据来临,我国图书馆应重塑理念、服务转型。文章阐述了大数据的内涵及应用,分析了我国图书馆遇上大数据的种种问题,在借鉴国外经验的基础上构建了我国图书馆推进大数据的基本框架,论述了基于NoSQL解决数据异构集成,基于HNC实现文献知识元检索,基于PKI技术保护读者隐私,基于"个人门户"概念开展信息推送服务等措施。 展开更多
关键词 大数据 nosql HNC PKI 个人门户 信息专员
下载PDF
基于NoSQL数据库的农田物联网云存储系统设计与实现 被引量:35
6
作者 许鑫 时雷 +2 位作者 何龙 张浩 马新明 《农业工程学报》 EI CAS CSCD 北大核心 2019年第1期172-179,共8页
为了解决农田物联网大量图像、视频和传感器等结构化和非结构化数据实时处理与写入问题,该文基于分布式存储与NoSQL(NotOnlySQL)技术,结合农田物联网数据特征,利用HDFS(HadoopDistributedFileSystem)和HBase(Hadoop Database)存储非结... 为了解决农田物联网大量图像、视频和传感器等结构化和非结构化数据实时处理与写入问题,该文基于分布式存储与NoSQL(NotOnlySQL)技术,结合农田物联网数据特征,利用HDFS(HadoopDistributedFileSystem)和HBase(Hadoop Database)存储非结构化和结构化数据,基于Redis缓存服务,设计了三层物联网数据云存储框架,实现了海量农田物联网数据存储中的业务处理、事务处理、图片打包与索引、负载均衡等关键技术。面对复杂业务下的事务数据一致性,该文采用基于HLock的乐观锁机制,实现了HBase对强事务性的支持,经过与传统MySQL集群事务对比测试,当数据量级在500万时,数据读取效率提升达35.75%。为了提高农田物联网中大量的小图片和小文件处理效率,基于图片打包合并策略,利用SequenceFile技术实现物联图片的快速索引读写技术,与原生HDFS存储效率相比,读写效率提升30%以上。该研究可以为海量农业物联网数据的存储和管理提供技术参考和理论支撑。 展开更多
关键词 农田 数据存储系统 管理 物联网 nosql Hadoop HBASE 云存储
下载PDF
一种基于NoSQL的地图瓦片数据存储技术 被引量:33
7
作者 陈超 王亮 +3 位作者 闫浩文 仇阿根 李玉祥 朱芳菲 《测绘科学》 CSCD 北大核心 2013年第1期142-143,159,共3页
本文首先介绍了NoSQL(非关系型数据库)的起源与发展,对比其与关系型数据库的优缺点,提出了基于NoSQL的地图瓦片数据存储策略,通过实验对比分析了面向文档型的NoSQL数据库产品Mongo DB与SQL Serv-er 2000在瓦片入库与并发访问性能上的差... 本文首先介绍了NoSQL(非关系型数据库)的起源与发展,对比其与关系型数据库的优缺点,提出了基于NoSQL的地图瓦片数据存储策略,通过实验对比分析了面向文档型的NoSQL数据库产品Mongo DB与SQL Serv-er 2000在瓦片入库与并发访问性能上的差异。研究结果表明,Mongo DB在海量空间数据存储与并发访问方面具有明显的高效性。 展开更多
关键词 nosql 地图瓦片 Mongo DB 四叉树 SQL SERVER 2000
原文传递
NoSQL非关系型数据库的发展及应用初探 被引量:32
8
作者 黄贤立 《福建电脑》 2010年第7期30-30,45,共2页
随着Web 2.0技术的发展,网络环境下的数据库应用出现了一些新的变化。NoSQL是在这种新变化之下产生的一种非关系型数据库产品的总称。文章分析了NoSQL的起源与发展,通过与传统关系型数据库产品的对比,指出了NoSQL的优缺点,讨论了其应用... 随着Web 2.0技术的发展,网络环境下的数据库应用出现了一些新的变化。NoSQL是在这种新变化之下产生的一种非关系型数据库产品的总称。文章分析了NoSQL的起源与发展,通过与传统关系型数据库产品的对比,指出了NoSQL的优缺点,讨论了其应用前景。 展开更多
关键词 nosql 数据库 并发 Key/Value
下载PDF
Redis数据库特性分析 被引量:30
9
作者 马豫星 《物联网技术》 2015年第3期105-106,共2页
Redis是一款开源的、网络化的、基于内存的、可进行数据持久化的Key-Value存储系统。详细介绍了redis数据库底层数据结构、数据库的持久化方式、数据库事务特性以及隐藏在设计之中的一些考量。阐明了Redis高效性的原因在于其精简高效的... Redis是一款开源的、网络化的、基于内存的、可进行数据持久化的Key-Value存储系统。详细介绍了redis数据库底层数据结构、数据库的持久化方式、数据库事务特性以及隐藏在设计之中的一些考量。阐明了Redis高效性的原因在于其精简高效的底层数据结构设计以及对具有高消耗的功能进行分散处理。 展开更多
关键词 数据库 REDIS nosql 分散处理
下载PDF
Key-Value型NoSQL本地存储系统研究 被引量:26
10
作者 马文龙 朱妤晴 +4 位作者 蒋德钧 熊劲 张立新 孟潇 包云岗 《计算机学报》 EI CSCD 北大核心 2018年第8期1722-1751,共30页
NoSQL系统因其高性能、高可扩展性的优势在大数据管理中得到广泛应用,而key-value(KV)模型则是NoSQL系统中使用最广泛的一种存储模型.KV型本地存储系统对于以机械磁盘为持久化存储的情形,存在许多性能优化技术,但这些优化技术面对当前... NoSQL系统因其高性能、高可扩展性的优势在大数据管理中得到广泛应用,而key-value(KV)模型则是NoSQL系统中使用最广泛的一种存储模型.KV型本地存储系统对于以机械磁盘为持久化存储的情形,存在许多性能优化技术,但这些优化技术面对当前的硬件发展新趋势,如多核处理器、大内存和低延迟闪存、非易失性内存NVM(Non-Volatile Memory)等,难以充分发挥新硬件的优势,如数据索引、并发控制、事务日志管理等技术在多核架构下存在多核扩展性问题,又如数据存储策略不适应闪存SSD(Solid State Drive)的新存储特性而产生了IO利用率低效的问题.针对多核处理器、大内存和闪存、NVM等硬件发展新趋势,文中面向当前的大数据应用背景,综述了KV型本地存储系统在索引技术、并发控制、事务日志管理和数据放置等核心模块上的最新优化技术和系统研究成果.从处理器、内存和持久化存储的角度概括了KV型本地存储系统当前存在的最优技术,总结了当前研究尚未解决的技术挑战,并对KV型本地存储系统在CPU缓存高效性、事务日志扩展性和高可用性等方面的研究进行了展望. 展开更多
关键词 nosql 键值存储 多核扩展性 并发数据结构 日志结构合并型存储 SSD/NVM
下载PDF
基于分布式NoSQL数据库的档案大数据存储与检索方案研究 被引量:25
11
作者 施晓峰 《计算机应用与软件》 北大核心 2019年第5期15-20,共6页
随着数字档案资源体系建设的不断加快,档案数据的种类日趋丰富,数量迅猛增长,呈现出大数据的特征。传统关系型数据库与集中式存储在档案大数据处理方面存在着适应性、可靠性和扩展性不足的问题。针对当前遇到的问题,通过分析传统档案数... 随着数字档案资源体系建设的不断加快,档案数据的种类日趋丰富,数量迅猛增长,呈现出大数据的特征。传统关系型数据库与集中式存储在档案大数据处理方面存在着适应性、可靠性和扩展性不足的问题。针对当前遇到的问题,通过分析传统档案数据存储模式的局限性,将分布式NoSQL数据库、分布式文件系统、分布式搜索引擎应用于档案大数据的管理。设计一套基于分布式NoSQL数据库的档案大数据存储与检索方案,并开发原型系统进行验证。 展开更多
关键词 档案 大数据 nosql 分布式数据库
下载PDF
NoSQL的分布式存储与扩展解决方法 被引量:26
12
作者 姚林 张永库 《计算机工程》 CAS CSCD 2012年第6期40-42,共3页
传统的关系型数据库已无法满足海量数据的存储与访问需求。针对该问题,提出一种非关系型数据库(NoSQL)的分布式存储与扩展解决方法。分析并改进NoSQL,讨论基于一致性哈希算法键值对的分布式存储,以及基于双hash环的数据库服务器节点的... 传统的关系型数据库已无法满足海量数据的存储与访问需求。针对该问题,提出一种非关系型数据库(NoSQL)的分布式存储与扩展解决方法。分析并改进NoSQL,讨论基于一致性哈希算法键值对的分布式存储,以及基于双hash环的数据库服务器节点的扩展方法,提出将NoSQL作为镜像引入数据库架构系统。实际应用结果表明,该方法可以避免资源浪费及服务器过载。 展开更多
关键词 非关系型数据库 一致性哈希算法 键值对 镜像
下载PDF
NoSQL数据库与关系数据库的比较分析 被引量:21
13
作者 吕明育 李小勇 《微型电脑应用》 2011年第10期55-58,70,共5页
介绍了两个具有代表性的NoSQL数据库:Bigtable和Dynamo系统。首先,描述了Bigtable和Dynamo的适用范围及其产生原因。Bigtable和Dynamo可以高效的处理web数据提供相应服务;然后,介绍了Bigtable和Dynamo系统的架构、特性等,以及各自独特... 介绍了两个具有代表性的NoSQL数据库:Bigtable和Dynamo系统。首先,描述了Bigtable和Dynamo的适用范围及其产生原因。Bigtable和Dynamo可以高效的处理web数据提供相应服务;然后,介绍了Bigtable和Dynamo系统的架构、特性等,以及各自独特的设计方法。最后,将这两个数据库与传统的关系数据库进行比较分析,描述了它们之间的不同点,对比结果表明NoSQL数据库在处理web应用数据时是高效可用的,比传统关系数据库更占优势。 展开更多
关键词 BIGTABLE DYNAMO nosql 关系数据库
下载PDF
面向地质时空大数据表达与存储管理的数据模型研究 被引量:23
14
作者 刘刚 吴冲龙 +4 位作者 何珍文 翁正平 阙翔 田善君 李旸 《地质科技通报》 CAS CSCD 北大核心 2020年第1期164-174,共11页
随着传感器实时监测等高新技术在地质勘查或生产开发中的应用,形成了动态与静态并存、多源异构的地质时空大数据.然而,目前地质信息系统在地质数据组织管理方面,主要是静态地存储和表达出地质矿产勘查或生产开发在某个特定时期的状态,... 随着传感器实时监测等高新技术在地质勘查或生产开发中的应用,形成了动态与静态并存、多源异构的地质时空大数据.然而,目前地质信息系统在地质数据组织管理方面,主要是静态地存储和表达出地质矿产勘查或生产开发在某个特定时期的状态,尚不能满足对勘查或生产开发过程中实时信息的存储管理,进而支持对地质过程的分析和研判.针对性开展了地质时空大数据表达与存储管理的数据模型研究,目标是能够融合数据多源与时空多维性,又能够支持时间关联与时间多粒性.针对地质大数据、地质过程的静态与动态数据紧密结合的特点,采用面向对象和基于事件的思想,提出了基于事件多因素驱动的地质时空大数据概念模型,并开展了相应的地质大数据存储管理逻辑模型、基于系统工程库的管理结构和地质时空对象管理模型设计.基于地质时空大数据逻辑组织管理模型和时空过程的非关系型分布式数据库架构,设计了地质大数据存储模型.融合三维地质建模技术、动态监测信息实时可视化等技术,构建了所需模型过程模拟的三维环境,通过绑定观测数据源,设计实现了基于OPC接口的模拟数据产生事件、作用对象响应的矿山动态开采流程.在王家岭煤矿首采区地质数据支持下开展了应用研究,实现地质时空事件条件下的矿山动态开采过程表达与数据管理,验证了本文模型的可行性和有效性. 展开更多
关键词 数据模型 地质时空数据表达 地质大数据存储管理 非关系型数据库
下载PDF
传统RDBMS向非关系型MongoDB数据模型转换与数据迁移方法研究 被引量:18
15
作者 曾海峰 王淑营 董钦钰 《计算机应用研究》 CSCD 北大核心 2017年第11期3339-3344,共6页
为解决关系型数据库在大数据处理中遇到的瓶颈问题,满足企业对大数据处理的需求,提出将关系型数据库迁移到No SQL文档型数据库中。针对RDBMS中的关系模型向Mongo DB中的集合模型转换方法进行了研究,提出了表示关系间参照完整性的有向图... 为解决关系型数据库在大数据处理中遇到的瓶颈问题,满足企业对大数据处理的需求,提出将关系型数据库迁移到No SQL文档型数据库中。针对RDBMS中的关系模型向Mongo DB中的集合模型转换方法进行了研究,提出了表示关系间参照完整性的有向图表示模型,以及基于关系型数据模型向Mongo DB文档模型自动转换算法,实现了RDBMS中迁移数据到Mongo DB的插入算法。针对上述方案和算法,结合典型开源RDBMSMy SQL实例,对上述关系有向图模型的生成、基于有向图模型的转换算法以及数据迁移算法应用进行验证,实验结果表明RDBMS可以按照一定的数据结构平滑地迁移到Mongo DB中。 展开更多
关键词 RDBMS nosql MONGODB 关系有向图 模型转换 数据迁移
下载PDF
Big data storage technologies: a survey 被引量:17
16
作者 Aisha SIDDIQA Ahmad KARIM Abdullah GANI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2017年第8期1040-1070,共31页
There is a great thrust in industry toward the development of more feasible and viable tools for storing fast-growing volume, velocity, and diversity of data, termed 'big data'. The structural shift of the storage m... There is a great thrust in industry toward the development of more feasible and viable tools for storing fast-growing volume, velocity, and diversity of data, termed 'big data'. The structural shift of the storage mechanism from traditional data management systems to NoSQL technology is due to the intention of fulfilling big data storage requirements. However, the available big data storage technologies are inefficient to provide consistent, scalable, and available solutions for continuously growing heterogeneous data. Storage is the preliminary process of big data analytics for real-world applications such as scientific experiments, healthcare, social networks, and e-business. So far, Amazon, Google, and Apache are some of the industry standards in providing big data storage solutions, yet the literature does not report an in-depth survey of storage technologies available for big data, investigating the performance and magnitude gains of these technologies. The primary objective of this paper is to conduct a comprehensive investigation of state-of-the-art storage technologies available for big data. A well-defined taxonomy of big data storage technologies is presented to assist data analysts and researchers in understanding and selecting a storage mecha- nism that better fits their needs. To evaluate the performance of different storage architectures, we compare and analyze the ex- isling approaches using Brewer's CAP theorem. The significance and applications of storage technologies and support to other categories are discussed. Several future research challenges are highlighted with the intention to expedite the deployment of a reliable and scalable storage system. 展开更多
关键词 Big data Big data storage nosql databases Distributed databases CAP theorem SCALABILITY Consistency-partition resilience Availability-partition resilience
原文传递
浅析NoSQL数据库 被引量:17
17
作者 卢冬海 何先波 《中国西部科技》 2011年第2期15-16,14,共3页
NoSQL数据库打破了传统的关系模型,以一种模式自由的方式存储数据,提供了新型的访问接口,并克服了传统RDBMS的缺点。NoSQL数据库可部署在廉价的硬件之上,支持分布式存储,能透明地扩展节点。本文介绍了NoSQL数据库的基本特点与设计思想,... NoSQL数据库打破了传统的关系模型,以一种模式自由的方式存储数据,提供了新型的访问接口,并克服了传统RDBMS的缺点。NoSQL数据库可部署在廉价的硬件之上,支持分布式存储,能透明地扩展节点。本文介绍了NoSQL数据库的基本特点与设计思想,列举了几种流行的NoSQL数据库产品,分析了其应用方向、优缺点及发展前景。 展开更多
关键词 nosql SQL 关系型数据库
下载PDF
云平台下的NoSQL分布式大数据存储技术与应用 被引量:19
18
作者 吴燕波 薛琴 +1 位作者 向大为 麦永浩 《现代电子技术》 北大核心 2016年第9期44-47,52,共5页
随着移动互联网云计算、大数据的快速发展,以图片、视频等组成的数据存储急剧增加,目前已有存储方式无法满足系统需要,而No SQL分布式大数据存储技术因其具有可扩展、快速读取、海量处理等特点,其在云计算领域如雨后春笋般被广泛应用。... 随着移动互联网云计算、大数据的快速发展,以图片、视频等组成的数据存储急剧增加,目前已有存储方式无法满足系统需要,而No SQL分布式大数据存储技术因其具有可扩展、快速读取、海量处理等特点,其在云计算领域如雨后春笋般被广泛应用。采用基于Hadoop平台和No SQL的Mongo DB数据库技术设计非结构化数据云存储架构,证明云存储的非结构化数据存储技术可缓解当前非结构化数据存储面临的难题,提升非结构化数据存储服务质量。 展开更多
关键词 Hadoop云存储平台 MongoDB数据库 非关系型数据库 云存储
下载PDF
大数据技术在精准化营销中的应用 被引量:16
19
作者 王东 《中国流通经济》 CSSCI 北大核心 2014年第7期90-93,共4页
分析大数据技术的应用特点,通过Map-Reduce模型、NoSQL和Key-value存储等相关理论的分析,设计大数据副本服务器的Hash-map分布方案,针对精准化营销等特定应用,解决数据一致性检索的追溯性问题。研究认为:(1)大数据的Key-value弱化了数... 分析大数据技术的应用特点,通过Map-Reduce模型、NoSQL和Key-value存储等相关理论的分析,设计大数据副本服务器的Hash-map分布方案,针对精准化营销等特定应用,解决数据一致性检索的追溯性问题。研究认为:(1)大数据的Key-value弱化了数据间的关联关系,建立追溯性索引的弥补机制是必要的;(2)Hashmap索引能够通过(key,value)映射关系对精准化营销产生重要影响;(3)精准化营销可以拉动客户价值的提升,创新因子与限定因子的辨证关系,对保持网络生态系统的平衡起着关键作用。 展开更多
关键词 大数据 网络生态 nosql Hashmap
下载PDF
基于Scrapy的GitHub数据爬虫 被引量:18
20
作者 赵本本 殷旭东 王伟 《电子技术与软件工程》 2016年第6期199-202,共4页
作为最大的社交编程及代码托管网站,GitHub提供了丰富的数据来源。基于Python开源框架Scrapy设计实现了一个Web爬虫,能对GitHub的资源抓取和分析,并进行了结构化处理和存储,可为后续数据分析提供基础。介绍了GitHub爬虫的设计原理、算... 作为最大的社交编程及代码托管网站,GitHub提供了丰富的数据来源。基于Python开源框架Scrapy设计实现了一个Web爬虫,能对GitHub的资源抓取和分析,并进行了结构化处理和存储,可为后续数据分析提供基础。介绍了GitHub爬虫的设计原理、算法的实现方式,对实验结果进行了分析。 展开更多
关键词 网络爬虫 数据爬取 Scrapy GitHub PYTHON nosql
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部