期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
云计算:体系架构与关键技术 被引量:826
1
作者 罗军舟 金嘉晖 +1 位作者 宋爱波 东方 《通信学报》 EI CSCD 北大核心 2011年第7期3-21,共19页
系统地分析和总结云计算的研究现状,划分云计算体系架构为核心服务、服务管理、用户访问接口等3个层次。围绕低成本、高可靠、高可用、规模可伸缩等研究目标,深入全面地介绍了云计算的关键技术及最新研究进展。在云计算基础设施方面,介... 系统地分析和总结云计算的研究现状,划分云计算体系架构为核心服务、服务管理、用户访问接口等3个层次。围绕低成本、高可靠、高可用、规模可伸缩等研究目标,深入全面地介绍了云计算的关键技术及最新研究进展。在云计算基础设施方面,介绍了云计算数据中心设计与管理及资源虚拟化技术;在大规模数据处理方面,分析了海量数据处理平台及其资源管理与调度技术;在云计算服务保障方面,讨论了服务质量保证和安全与隐私保护技术。针对新型的云计算应用和云计算存在的局限性,又探讨并展望了今后的研究方向。最后,介绍了东南大学云计算平台以及云计算研究与应用方面的相关成果。 展开更多
关键词 云计算 虚拟化 数据中心 海量数据处理 服务质量 安全与隐私
下载PDF
针对高速数据流的大规模数据实时处理方法 被引量:95
2
作者 亓开元 赵卓峰 +1 位作者 房俊 马强 《计算机学报》 EI CSCD 北大核心 2012年第3期477-490,共14页
以实时传感数据和历史感知数据为基础的各类计算需求逐渐成为当前物联网应用建设中的关键,如何实现基于高速数据流和大规模历史数据的实时计算成为数据处理领域的新挑战.现有批处理方式的MapReduce大规模数据处理技术难以满足此类计算... 以实时传感数据和历史感知数据为基础的各类计算需求逐渐成为当前物联网应用建设中的关键,如何实现基于高速数据流和大规模历史数据的实时计算成为数据处理领域的新挑战.现有批处理方式的MapReduce大规模数据处理技术难以满足此类计算的实时要求.文中结合城市车辆数据的实时采集与处理应用,在理论和实践分析的基础上,提出了一种针对高速数据流的大规模数据实时处理方法,并对方法中的本地阶段化流水线、中间结果缓存等关键技术瓶颈进行了改进.其中,根据系统参数控制阶段化流水线,使CPU得到了充分、有效利用;通过改造内外存数据结构、读写策略和替换算法,优化了本地中间结果的高并发读写性能.实验表明,上述方法可以显著提升大规模历史数据上数据流处理的实时性和可伸缩性. 展开更多
关键词 数据流处理 大规模数据处理 MAPREDUCE 物联网 大数据 云计算
下载PDF
数据密集型计算编程模型研究进展 被引量:39
3
作者 王鹏 孟丹 +1 位作者 詹剑锋 涂碧波 《计算机研究与发展》 EI CSCD 北大核心 2010年第11期1993-2002,共10页
作为一种新兴的计算模式,云计算受到了学术界和产业界的广泛关注.云计算以互联网服务和应用为中心,服务提供者需要存储和分析海量数据.为了能够低成本高效率地处理Web量级数据,主要的互联网公司都在由商品化服务器组成的大规模集群系统... 作为一种新兴的计算模式,云计算受到了学术界和产业界的广泛关注.云计算以互联网服务和应用为中心,服务提供者需要存储和分析海量数据.为了能够低成本高效率地处理Web量级数据,主要的互联网公司都在由商品化服务器组成的大规模集群系统上研发了分布式编程系统.编程模型可以降低开发人员在大规模集群上编程的难度,并让程序充分利用集群资源,但设计这样的编程模型面临巨大挑战.首先说明了数据密集型计算的特点,并指出了编程模型要解决的基本问题;接着深入介绍了国际上代表性的编程模型,并对这些编程模型的特点进行了比较和分析;最后对当前所面临的问题和今后的发展趋势进行了总结和展望. 展开更多
关键词 云计算 数据密集型计算 编程模型 数据并行 海量数据处理 MAPREDUCE
下载PDF
云计算模型在铁路大规模数据处理中的应用 被引量:22
4
作者 刘真 刘峰 +2 位作者 张宝鹏 马飞 高石玉 《北京交通大学学报》 CAS CSCD 北大核心 2010年第5期14-19,共6页
对铁路行业的计算资源、数据处理进行了特征分析.探讨了云计算模型中的虚拟化技术在铁路计算资源整合及MapReduce编程模型在大规模数据处理中的应用模式.采用Hadoop开源平台和Intel的虚拟化管理平台Tashi,提出和实现了基于云计算技术的... 对铁路行业的计算资源、数据处理进行了特征分析.探讨了云计算模型中的虚拟化技术在铁路计算资源整合及MapReduce编程模型在大规模数据处理中的应用模式.采用Hadoop开源平台和Intel的虚拟化管理平台Tashi,提出和实现了基于云计算技术的铁路数据处理框架模型,并通过大规模的货票数据处理实例验证了框架模型的可扩展性和高效性. 展开更多
关键词 云计算 虚拟化 MAPREDUCE 大规模数据处理
下载PDF
支持高并发数据流处理的MapReduce中间结果缓存 被引量:21
5
作者 亓开元 韩燕波 +1 位作者 赵卓峰 房俊 《计算机研究与发展》 EI CSCD 北大核心 2013年第1期111-121,共11页
针对面向大规模历史数据的高并发数据流处理需求,为改进MapReduce的实时处理能力,提出了一种内存Hash B树、外存SSTable文件的key/value中间结果缓存,该结构具有可划分性、可扩展性和高效性.在此基础上,利用B树的平衡性特征提出了一种... 针对面向大规模历史数据的高并发数据流处理需求,为改进MapReduce的实时处理能力,提出了一种内存Hash B树、外存SSTable文件的key/value中间结果缓存,该结构具有可划分性、可扩展性和高效性.在此基础上,利用B树的平衡性特征提出了一种基于概率的B树构造算法和多路查询算法,利用读写开销估算和缓冲区信息改造了外存文件读写策略和内外存替换算法,进一步优化了中间结果的高并发读写性能.算法分析和实验证明了该缓存的有效性. 展开更多
关键词 高并发 大规模数据处理 数据流处理 MAPREDUCE 中间结果缓存
下载PDF
面向大规模感知数据的实时数据流处理方法及关键技术 被引量:9
6
作者 亓开元 韩燕波 +1 位作者 赵卓峰 马强 《计算机集成制造系统》 EI CSCD 北大核心 2013年第3期641-653,共13页
为了在大规模历史感知数据基础上实现针对高速传感数据流的实时计算,提出一种面向大规模历史数据的数据流处理方法RTMR,通过中间结果缓存、流水化和本地化改进了MapReduce的数据流处理能力。在此基础上,为了适应性地构造RTMR集群,利用... 为了在大规模历史感知数据基础上实现针对高速传感数据流的实时计算,提出一种面向大规模历史数据的数据流处理方法RTMR,通过中间结果缓存、流水化和本地化改进了MapReduce的数据流处理能力。在此基础上,为了适应性地构造RTMR集群,利用模型分析方法根据应用特征和集群环境配置节点类型和拓扑结构。为实现集群的负载均衡,通过计算负载状态转换关系分组空闲节点和过载节点,将NP难的动态负载均衡问题快速分解为规模较小的子问题,并且综合执行时间和数据移动代价作为子问题的优化目标,提高应对负载倾斜的反应速度。实验表明,上述方法和技术能够保障大规模历史数据上数据流处理的可伸缩性。 展开更多
关键词 数据流处理 大规模数据处理 MapReduce方法 适应性架构 负载均衡
下载PDF
基于云计算的大规模数据处理算法优化分析
7
作者 沈毅 《集成电路应用》 2024年第6期116-117,共2页
阐述提升数据算法运行速度的策略,介绍基于云计算技术的大规模数据处理算法,包括数据处理算法分类、大规模数据处理算法特点。针对云计算环境下数据处理挑战,提出算法优化方案。
关键词 云计算 大规模数据处理 算法优化 数据处理效率
下载PDF
基于IPFIX的网络流量日志系统 被引量:5
8
作者 马云龙 张千里 王继龙 《通信学报》 EI CSCD 北大核心 2013年第S2期5-8,共4页
针对高速网络海量数据采集、存储和管理问题,分析了传统IPFIX流量日志系统在高速网络中的性能问题,提出了基于IPFIX协议的用户网络流量日志系统体系结构的优化设计,改进了数据聚类和存储算法,包括二元归并方式采集数据以及多层结构的散... 针对高速网络海量数据采集、存储和管理问题,分析了传统IPFIX流量日志系统在高速网络中的性能问题,提出了基于IPFIX协议的用户网络流量日志系统体系结构的优化设计,改进了数据聚类和存储算法,包括二元归并方式采集数据以及多层结构的散列算法存储数据。经校园网部署应用证明,可提供万兆链路下用户网络日志详单及准确上网流量计量值。 展开更多
关键词 IPFIX 散列 流量日志 海量数据处理
下载PDF
云计算环境下大规模数据处理技术研究 被引量:4
9
作者 刘小铭 李宗辉 《湖南城市学院学报(自然科学版)》 CAS 2016年第2期135-136,共2页
随着科技的不断发展,云技术在各个领域当中正在得到越来越广泛的应用。尤其是在云计算系统的数据收集和数据整理当中,大规模数据处理技术更是发挥着不可替代的作用。因此,在大规模的数据处理当中,可以应用云计算技术,建立一个高性能的... 随着科技的不断发展,云技术在各个领域当中正在得到越来越广泛的应用。尤其是在云计算系统的数据收集和数据整理当中,大规模数据处理技术更是发挥着不可替代的作用。因此,在大规模的数据处理当中,可以应用云计算技术,建立一个高性能的计算平台,并且基于云计算,建立一个大规模数据处理框架模型,从而更好的完成大规模数据处理工作。 展开更多
关键词 云计算环境 大规模数据 处理技术
下载PDF
大规模核素扩散数据可视化方法研究与应用 被引量:2
10
作者 贾亚宁 郑晓磊 +2 位作者 陈春花 何桃 龙鹏程 《辐射研究与辐射工艺学报》 CAS CSCD 2018年第5期52-58,共7页
在核应急响应期间,利用可视化手段直观展示大规模核素扩散数据的空间分布,有助于应急指挥人员快速有效地进行科学决策与指挥。本文基于科学计算可视化技术,选用改进的八叉树模型对扩散数据建立空间索引,并根据操作干预水平提取数据水平... 在核应急响应期间,利用可视化手段直观展示大规模核素扩散数据的空间分布,有助于应急指挥人员快速有效地进行科学决策与指挥。本文基于科学计算可视化技术,选用改进的八叉树模型对扩散数据建立空间索引,并根据操作干预水平提取数据水平时空切片,完成了大规模核素扩散数据的可视化。以日本福岛核事故为例,对其大规模核素扩散数据进行分层可视化,直观显示了放射性核素在不同高度的空间分布状态,表明本文方法可为核应急快速响应与决策提供技术支持。 展开更多
关键词 大规模数据处理 核素扩散 可视化 核事故应急
下载PDF
基于Spark的供电所数据架构研究
11
作者 宋才华 关兆雄 布力 《自动化与仪器仪表》 2022年第6期172-175,共4页
现有的电力数据架构无法准确提取电力数据传输负荷特征,导致数据架构加速比过低,为增大数据传输效率,基于Spark设计供电所数据架构。度量各数据节点连接距离,设计数据连接访问结构;提取并行数据传输负荷特征,计算负荷节点间最大距离,追... 现有的电力数据架构无法准确提取电力数据传输负荷特征,导致数据架构加速比过低,为增大数据传输效率,基于Spark设计供电所数据架构。度量各数据节点连接距离,设计数据连接访问结构;提取并行数据传输负荷特征,计算负荷节点间最大距离,追加读写校验容量标准值;设计电力数据整体逻辑架构,分别分析六个层级的逻辑架构的基础特征。在对比实验中计算各架构的加速比,当数据规模为10000时,任意数量网络节点中该架构的加速比均高于其他电力数据架构。由此可见,基于Spark的数据架构在相同的数据规模下可以更快的速度传输数据。 展开更多
关键词 SPARK 供电所 电力数据 架构设计 大规模数据处理
原文传递
基于云计算环境下的大规模数据处理技术研究 被引量:1
12
作者 李慧玲 《电子测试》 2016年第1期28-29,共2页
随着计算机技术与互联网技术的发展,网络信息和数据量日益增长。诸多领域当中,都具有极大规模的数据信息。而在这些领域当中,需要对这些大规模数据进行处理和计算,需要完成极其庞大的运算量。基于此,采用基于云计算环境下的大规模数据... 随着计算机技术与互联网技术的发展,网络信息和数据量日益增长。诸多领域当中,都具有极大规模的数据信息。而在这些领域当中,需要对这些大规模数据进行处理和计算,需要完成极其庞大的运算量。基于此,采用基于云计算环境下的大规模数据处理技术,能够有效的打破这些限制,从而实现更加高效、快速的数据计算。 展开更多
关键词 云计算环境 大规模数据 处理技术
下载PDF
大规模网络数据存储系统的设计与实现
13
作者 李荣利 《现代电子技术》 北大核心 2017年第2期118-121,124,共5页
当前的网络数据存储系统在处理大规模数据时需要较长时间,增加了网络数据存储周期,存储性能较差。因此设计并实现一种大规模网络数据存储系统,该系统主要包括A/D高速采集模块、FLASH存储模块和FPGA数据接收模块。A/D高速采集模块采集大... 当前的网络数据存储系统在处理大规模数据时需要较长时间,增加了网络数据存储周期,存储性能较差。因此设计并实现一种大规模网络数据存储系统,该系统主要包括A/D高速采集模块、FLASH存储模块和FPGA数据接收模块。A/D高速采集模块采集大规模网络数据,采用FPGA数据接收模块对采集到的网络数据进行接收和处理,过滤其中的噪声因素,再将处理好的网络数据保存在FLASH存储模块中。依据三层架构模式设计大规模网络数据存储系统软件架构,并给出了业务逻辑层完成数据传递的关键代码。实验结果表明,所设计的大规模网络数据存储系统具有较高的数据存储和读取速度,能够实现网络数据的负载均衡存储。 展开更多
关键词 A/D高速采集 FPGA 网络数据存储 大规模数据处理
下载PDF
一种优化的内核态文件发送方法
14
作者 屠雪真 《计算机与现代化》 2019年第5期13-18,共6页
传统的Linux内核协议栈已不能满足大规模数据处理系统对网络传输越来越高的性能要求。现有很多研究是将原来在内核态实现的协议和接口移到用户态去实现,但针对内核态优化的研究比较少。在研究分析Linux内核态文件发送接口sendfile()处... 传统的Linux内核协议栈已不能满足大规模数据处理系统对网络传输越来越高的性能要求。现有很多研究是将原来在内核态实现的协议和接口移到用户态去实现,但针对内核态优化的研究比较少。在研究分析Linux内核态文件发送接口sendfile()处理流程和管理机制的基础上,本文提出一种内核态文件发送优化方法,采用自动负载均衡的定长内存池管理、CPU亲和性等技术,对内核态文件发送接口进行优化改造。解决了系统在高负载情况下内存碎片、内存耗尽及CPU抖动的问题,有效提升了数据传输性能。实验结果表明,在高并发、高吞吐场景下,采用本文优化方法后,系统运行更稳定,内核态CPU占有率下降50%。 展开更多
关键词 大规模数据处理 用户态协议栈 负载均衡 内存池管理 CPU亲和性
下载PDF
超大规模数据处理中并行计算技术的应用研究
15
作者 杨多海 《科技创新与应用》 2024年第17期181-184,共4页
随着人工智能和大数据时代的到来,超大规模数据处理成了一个重要的研究领域。该文主要探讨并行计算技术在超大规模数据处理中的应用,首先详细阐述并行计算和超大规模数据处理的基本理论与概念,特别是并行计算的编程模型与工具,最后通过... 随着人工智能和大数据时代的到来,超大规模数据处理成了一个重要的研究领域。该文主要探讨并行计算技术在超大规模数据处理中的应用,首先详细阐述并行计算和超大规模数据处理的基本理论与概念,特别是并行计算的编程模型与工具,最后通过分析并行计算在搜索引擎、气象预报和金融分析等中的实际案例,阐述并行计算技术在超大规模数据处理中的实际应用。 展开更多
关键词 并行计算技术 超大规模数据处理 编程模型与工具 实际案例 具体应用
下载PDF
云计算环境下大规模数据处理技术的研究
16
作者 马玲玲 《移动信息》 2023年第6期253-255,258,共4页
随着技术的发展,云计算技术越来越多地被运用到了各个领域。在大规模数据处理技术中引入云计算技术,能够有效推进大规模计算平台的构建,并建立起具有动态变化、可扩展性和高性价比的系统,从而形成一个以云计算环境为基础的大规模数据处... 随着技术的发展,云计算技术越来越多地被运用到了各个领域。在大规模数据处理技术中引入云计算技术,能够有效推进大规模计算平台的构建,并建立起具有动态变化、可扩展性和高性价比的系统,从而形成一个以云计算环境为基础的大规模数据处理与分析系统的结构实体建模。文中论述了在这种情况下,如何进行大规模的数据处理,并建立了相应的计算机平台,最终验证了计算机体系结构的可行性。 展开更多
关键词 云计算环境 大规模数据处理技术 研究
下载PDF
基于HDFS开源架构与多级索引表的海量数据检索mDHT算法 被引量:4
17
作者 汤羽 王英杰 +1 位作者 范爱华 姚远哲 《计算机科学》 CSCD 北大核心 2013年第2期195-199,234,共6页
针对大规模能源数据系统的存储与快速检索需求,提出了一种基于HDFS/Hadoop开源平台的云存储架构及多级索引目录体系,以及此架构下的基于多级索引表的mDHT算法,并完成了算法的MapReduce编程实现。基于上述算法完成的4800万条数据的仿真... 针对大规模能源数据系统的存储与快速检索需求,提出了一种基于HDFS/Hadoop开源平台的云存储架构及多级索引目录体系,以及此架构下的基于多级索引表的mDHT算法,并完成了算法的MapReduce编程实现。基于上述算法完成的4800万条数据的仿真实验表明:在数据量达到1200万~4800万条时,采用多级索引表的mDHT算法较常规的MS SQL Server实现和HDFS/Hive方法在检索性能方面有质的飞跃;与单级索引表检索方法比较,在数据查找时间上也有24.5%~57.8%的显著降低。文中提出的基于多级索引表的DHT算法为构建基于云存储架构的海量数据快速搜索引擎提供了一个关键技术。 展开更多
关键词 大规模数据处理 云存储 多级索引表 查找算法 MAPREDUCE
下载PDF
面向大数据复杂应用的GPU协同计算模型 被引量:3
18
作者 张龙翔 曹云鹏 王海峰 《计算机应用研究》 CSCD 北大核心 2020年第7期2049-2053,共5页
大数据计算中存在流计算、内存计算、批计算和图计算等不同模式,各种计算模式有不同的访存、通信和资源利用等特征。GPU异构集群在大数据分析处理中得到广泛应用,然而缺少研究GPU异构集群在大数据分析中的计算模型。多核CPU与GPU协同计... 大数据计算中存在流计算、内存计算、批计算和图计算等不同模式,各种计算模式有不同的访存、通信和资源利用等特征。GPU异构集群在大数据分析处理中得到广泛应用,然而缺少研究GPU异构集群在大数据分析中的计算模型。多核CPU与GPU协同计算时不仅增加了计算资源的密度,而且提高节点间和节点内的通信复杂度。为了从理论上研究GPU与多核CPU协同计算问题,面向多种计算模式建立一个多阶段的协同计算模型(p-DCOT)。p-DCOT以BSP大同步并行模型为核心,将协同计算过程分成数据层、计算层和通信层三个层次,并且延用DOT模型的矩阵来形式化描述计算和通信行为。通过扩展p-DOT模型描述节点内和节点间的协同计算行为,细化了负载均衡的参数并证明时间成本函数,最后用典型计算作业验证模型及参数分析的有效性。该协同计算模型可成为揭示大数据分析处理中协同计算行为的工具。 展开更多
关键词 协同计算模型 计算模式 大数据处理 GPU异构集群
下载PDF
税收风险管理大数据分析平台的设计与实现 被引量:1
19
作者 刘铭 单玉莹 +2 位作者 苏钧驿 秦喜文 蒋扬 《吉林大学学报(信息科学版)》 CAS 2022年第1期96-102,共7页
为实现更好的税收风险管理,提高税收风险的科学性和可应用性,完善税收风险管理基础,提出了税收数据库和税收风险管理相结合的支撑着风险排序、风险查询和风险指标管理的税收风险管理平台。该平台能解决税务部门在现有税收风险分析平台... 为实现更好的税收风险管理,提高税收风险的科学性和可应用性,完善税收风险管理基础,提出了税收数据库和税收风险管理相结合的支撑着风险排序、风险查询和风险指标管理的税收风险管理平台。该平台能解决税务部门在现有税收风险分析平台无法处理大量数据的问题,有利于税务部门从大量数据中找出税收过程中可能出现的各类风险,从而可以根据风险提示避免、减少和预防此类风险的发生。 展开更多
关键词 税收风险 风险管理 大数据 HADOOP分布式文件系统 大规模数据处理引擎
下载PDF
面向大规模地震数据并行处理高速可扩展通信技术应用研究 被引量:1
20
作者 包红林 李敏 +1 位作者 邵志东 张代兰 《石油物探》 CSCD 北大核心 2022年第5期793-800,共8页
随着地震数据规模的不断增大,在进行数据并行处理时,并行计算通信框架因使用TCP(Transmission Control Protocol)协议存在网络吞吐量低、高时延等性能问题,以及主从并行模式下存在主节点网卡性能瓶颈问题,制约了数据并行处理效率的线性... 随着地震数据规模的不断增大,在进行数据并行处理时,并行计算通信框架因使用TCP(Transmission Control Protocol)协议存在网络吞吐量低、高时延等性能问题,以及主从并行模式下存在主节点网卡性能瓶颈问题,制约了数据并行处理效率的线性提升,集群节点规模扩展性下降明显。为此,提出采用RoCE(RDMA over Converged Ethernet)协议替换TCP协议、主节点配置高性能100 GE网卡的高效并行计算通信优化方案,解决了并行计算框架存在的数据网络传输性能问题及主节点同时收集多个计算节点计算结果数据的网络性能瓶颈问题,实现了高速可扩展技术的大规模地震数据处理通信应用方案,计算节点可快速完成数据通信,提升了大规模地震数据处理计算效率;另外采用UCX(Unified Communication X)技术还提升了应用系统的可移植性与使用的便捷性。逆时偏移处理数据的测试结果表明,对于本次大规模数据的处理,逆时偏移并行计算效率提升了32.8%,效果显著,可缩短大规模地震数据逆时偏移计算的时间,并减少计算能源消耗,因此具有很高的实用价值和经济效益。 展开更多
关键词 大规模地震数据处理 逆时偏移处理 并行计算 MPI 通信框架 计算效率 RoCE 100 GE网卡
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部