期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于WebSocket协议的即时通讯系统的开发 被引量:9
1
作者 惠苗 赖道健 《榆林学院学报》 2019年第6期76-79,共4页
即时通讯系统不需要下载安装聊天工具,用户通过浏览器就可以进行交友通讯。系统采用SSM轻量级开发框架,通过WebSocket协议实现浏览器和服务器的双向通讯,将用户信息、聊天记录等映射成MySQL数据库中的记录,好友推荐的计算任务用Hadoop M... 即时通讯系统不需要下载安装聊天工具,用户通过浏览器就可以进行交友通讯。系统采用SSM轻量级开发框架,通过WebSocket协议实现浏览器和服务器的双向通讯,将用户信息、聊天记录等映射成MySQL数据库中的记录,好友推荐的计算任务用Hadoop Mapreduce来完成。系统界面美观友好,用户可以方便地进行单聊和群聊,包括用户信息管理、收发消息、群管理、好友管理、好友分组、系统消息六大模块。有效减少了传统软件下载软件所花费的时间,降低应用成本。 展开更多
关键词 WebSocket 即时通讯系统 hadoop mapreduce SSM
下载PDF
云计算架构在银行批处理流程优化中的应用研究 被引量:5
2
作者 赵曦 《软件导刊》 2013年第10期1-4,共4页
银行业在实现业务和数据集中处理的信息化架构后,随着业务的发展,面对数量越来越多、规模越来越大的批处理需求,如何提高计算资源的使用效率和灵活配置资源是银行信息中心不断面对的挑战。以资源和应用虚拟化为核心的云计算架构和技术... 银行业在实现业务和数据集中处理的信息化架构后,随着业务的发展,面对数量越来越多、规模越来越大的批处理需求,如何提高计算资源的使用效率和灵活配置资源是银行信息中心不断面对的挑战。以资源和应用虚拟化为核心的云计算架构和技术正在不断发展和成熟,它可以有效地提高信息中心的资源使用,为批处理业务动态配置有效资源。针对以批处理中按照业务类型和处理流程进行资源配置的传统方法,提出了一种将业务流程进行优化分解成为可以进行独立并行处理任务的方法,可以在云计算环境下分组处理具有共同特征的计算和操作任务,实现优化资源调配。通过Hadoop MapReduce并行计算架构进行模拟验证,初步实验结果表明了该方法在批处理执行效率、资源使用和灵活性方面的优势,在大量批处理业务领域(金融、证券、电子商务)具有一定的应用和研究价值。 展开更多
关键词 银行业务 批处理流程 hadoop mapreduce 云计算
下载PDF
Accelerating Iterative Big Data Computing Through MPI 被引量:5
3
作者 梁帆 鲁小亿 《Journal of Computer Science & Technology》 SCIE EI CSCD 2015年第2期283-294,共12页
Current popular systems, Hadoop and Spark, cannot achieve satisfied performance because of the inefficient overlapping of computation and communication when running iterative big data applications. The pipeline of com... Current popular systems, Hadoop and Spark, cannot achieve satisfied performance because of the inefficient overlapping of computation and communication when running iterative big data applications. The pipeline of computing, data movement, and data management plays a key role for current distributed data computing systems. In this paper, we first analyze the overhead of shuffle operation in Hadoop and Spark when running PageRank workload, and then propose an event-driven pipeline and in-memory shuffle design with better overlapping of computation and communication as DataMPI- Iteration, an MPI-based library, for iterative big data computing. Our performance evaluation shows DataMPI-Iteration can achieve 9X-21X speedup over Apache Hadoop, and 2X-3X speedup over Apache Spark for PageRank and K-means. 展开更多
关键词 iterative computation DataMPI SPARK hadoop mapreduce
原文传递
基于MongoDB与Hadoop MapReduce的数据分析系统性能改进研究 被引量:4
4
作者 杨浩 《微型电脑应用》 2019年第11期61-64,共4页
随着云计算、物联网等现代信息技术的高速发展,各行各业的数据急剧增长,特别是价值密度较低的非结构化数据的迅速增长,急需要一种高性能分布式系统来挖掘海量数据里所蕴藏的价值。论述了通过MongoDB-Connector for Hadoop连接器构建的基... 随着云计算、物联网等现代信息技术的高速发展,各行各业的数据急剧增长,特别是价值密度较低的非结构化数据的迅速增长,急需要一种高性能分布式系统来挖掘海量数据里所蕴藏的价值。论述了通过MongoDB-Connector for Hadoop连接器构建的基于MongoDB与Hadoop MapReduce的数据分析平台的数据传输机制,并从Chunk size设置、分片方式、MongoDB分片集群部署、CAP、混合分区、有向无环图、计算本地化及设置预测机制等方面提出了改进数据分析系统的措施,最后,对这些措施在舆情分析和超市顾客购买行为分析等项目实践中的应用效果进行了分析,论证了这些措施在改进性能中的可行性。研究结果可供大数据相关领域的人员参考。 展开更多
关键词 MONGODB hadoop mapreduce 分布式存储 分布式计算 大数据
下载PDF
基于Hadoop MapReduce的分布式数据流聚类算法研究 被引量:5
5
作者 蔡斌雷 任家东 +1 位作者 朱世伟 郭芹 《信息工程大学学报》 2014年第4期472-478,共7页
随着数据流规模的持续增大,现有基于网格的聚类算法对数据流的聚类效果不好,不能实时发现任意形状的簇,也不能及时删除数据流中的噪声点。文章提出了一种Hadoop平台环境下基于网格密度的分布式数据流聚类算法(PGDC-Stream),利于基于Had... 随着数据流规模的持续增大,现有基于网格的聚类算法对数据流的聚类效果不好,不能实时发现任意形状的簇,也不能及时删除数据流中的噪声点。文章提出了一种Hadoop平台环境下基于网格密度的分布式数据流聚类算法(PGDC-Stream),利于基于Hadoop的MapReduce框架对数据流进行阶段化的并行聚类分析,实时发现数据流中任意形状的簇,定义检测周期和密度阈值函数并及时删除数据流中的噪声点。算法基于网格密度对数据流初始聚类后,随着新数据的到来,使用基于密度阈值函数的噪声点处理策略,周期性检测和删除噪声点,使用基于Hadoop MapReduce框架的并行分析模型周期性地调整已经生成的簇。实验结果表明,PGDC-Stream对大规模数据流的聚类质量、可伸缩性和实时性都好于CluStream。 展开更多
关键词 数据挖掘 聚类 数据流聚类 分布式聚类
下载PDF
同构Hadoop环境作业执行时间计算方法 被引量:1
6
作者 张霄宏 海林鹏 +2 位作者 贾宗璞 沈记全 赵文涛 《计算机工程与应用》 CSCD 2014年第10期249-252,共4页
执行时间是作业调度的重要参考因素之一。通过分析Hadoop MapReduce环境作业的执行特征,提出了以map任务和reduce任务执行时间为输入,估算作业执行时间的方法。该方法在一定假设条件下,借助作业预执行来获取map任务和reduce任务的执行... 执行时间是作业调度的重要参考因素之一。通过分析Hadoop MapReduce环境作业的执行特征,提出了以map任务和reduce任务执行时间为输入,估算作业执行时间的方法。该方法在一定假设条件下,借助作业预执行来获取map任务和reduce任务的执行时间。实验结果表明,该方法估算作业执行时间的误差率小于7%。 展开更多
关键词 hadoop mapreduce 作业执行时间 调度
下载PDF
基于Hadoop MapReduce的大规模雷电电磁传播数值仿真 被引量:1
7
作者 林海铭 《计算机应用与软件》 CSCD 2016年第11期66-70,89,共6页
面对大规模雷电电磁问题,单机计算不能达到完全解决问题的程度,可以考虑利用新兴云计算技术来解决。提出基于Hadoop MapReduce框架的域分解时域有限差分并行算法,在6节点的Hadoop实验室集群上,对上海浦东某地区发生的大规模雷电电磁传... 面对大规模雷电电磁问题,单机计算不能达到完全解决问题的程度,可以考虑利用新兴云计算技术来解决。提出基于Hadoop MapReduce框架的域分解时域有限差分并行算法,在6节点的Hadoop实验室集群上,对上海浦东某地区发生的大规模雷电电磁传播过程进行数值仿真,并测试不同计算子域所获得的加速比。计算结果显示,所提出的并行算法能有效地求解大规模雷电电磁传播问题,且计算模型越大、计算节点越多,加速比也大,在设定的计算环境下,最大加速比为2.4,受硬盘空间限制,最大计算规模为1 368万节点。 展开更多
关键词 云计算 hadoop mapreduce 雷电 有限差分法 并行计算
下载PDF
Seismic Data Collection with Shakebox and Analysis Using MapReduce
8
作者 Bin Tang Jianchao Han +3 位作者 Mohsen Beheshti Garrett Poppe Liv Nguekap Rashid Siddiqui 《Journal of Computer and Communications》 2015年第5期94-101,共8页
In this paper we study a seismic sensing platform using Shakebox, a low-noise and low-power 24- bit wireless accelerometer sensor. The advances of wireless sensor offer the potential to monitor earthquake in Californi... In this paper we study a seismic sensing platform using Shakebox, a low-noise and low-power 24- bit wireless accelerometer sensor. The advances of wireless sensor offer the potential to monitor earthquake in California at unprecedented spatial and temporal scales. We are exploring the possibility of incorporating Shakebox into California Seismic Network (CSN), a new earthquake monitoring system based on a dense array of low-cost acceleration seismic sensors. Compared to the Phidget/Sheevaplug sensors currently used in CSN, the Shakebox sensors have several advantages. However, Shakebox sensor collects 4K Bytes of seismic data per second, giving around 0.4G Bytes of data in a single day. Therefore how to process such large amount of seismic data becomes a new challenge. We adopt Hadoop/MapReduce, a popular software framework for processing vast amounts of data in-parallel on large clusters of commodity hardware. In this research, the test bed-generated seismic data generation will be reported, the map and reduce function design will be presented, the application of MapReduce on the testbed-generated data will be illustrated, and the result will be analyzed. 展开更多
关键词 SEISMIC DATA Shakebox BIG DATA hadoop mapreduce
下载PDF
一种基于云计算架构的业务流程优化研究
9
作者 赵曦 《微电子学与计算机》 CSCD 北大核心 2013年第3期160-164,共5页
本文提出了一种将业务流程进行优化分解成为可以进行独立并行处理任务的方法,可以在云计算环境下分组处理具有共同特征的计算和操作任务,实现优化资源调配.通过Hadoop MapReduce并行计算架构进行模拟验证,实验结果表明了该方法在业务处... 本文提出了一种将业务流程进行优化分解成为可以进行独立并行处理任务的方法,可以在云计算环境下分组处理具有共同特征的计算和操作任务,实现优化资源调配.通过Hadoop MapReduce并行计算架构进行模拟验证,实验结果表明了该方法在业务处理效率、资源使用和灵活性方面的优势,在大量在线和批量业务流程处理领域具有一定的应用和深入研究价值. 展开更多
关键词 业务流程优化 mapreduce计算框架 云计算
下载PDF
云计算环境下大规模数据处理的研究与初步实现 被引量:37
10
作者 张兴旺 李晨晖 秦晓珠 《现代图书情报技术》 CSSCI 北大核心 2011年第4期17-23,共7页
将云计算技术引入到大规模数据处理过程中,提出在集中或分布管理的大量廉价计算机集群上构建动态的、可扩展的、高性价比的、易使用的高性能计算平台,创建一种基于云计算的大规模数据处理的框架模型。论述在这一环境下的大规模数据处理... 将云计算技术引入到大规模数据处理过程中,提出在集中或分布管理的大量廉价计算机集群上构建动态的、可扩展的、高性价比的、易使用的高性能计算平台,创建一种基于云计算的大规模数据处理的框架模型。论述在这一环境下的大规模数据处理的方法和应用,通过搭建相应的计算平台,验证计算机集群及框架模型的可行性。 展开更多
关键词 云计算 大规模数据 廉价计算平台hadoop mapreduce
原文传递
主要分布式搜索引擎技术的研究 被引量:10
11
作者 蒋建洪 《科学技术与工程》 2007年第10期2418-2424,共7页
讨论了当前搜索引擎的主要技术以及这些技术的原理。介绍了基于P2P的搜索技术,以及JAXT搜索框架的基本原理,重点给出了基于Map/Reduce技术分布式搜索引擎的实现。对今后搜索引擎的发展也作出了相应的探讨。
关键词 分布式 搜索引擎 P2P DHT JXTA hadoop mapreduce
下载PDF
基于Hive的海量搜索日志分析系统研究 被引量:15
12
作者 赵龙 江荣安 《计算机应用研究》 CSCD 北大核心 2013年第11期3343-3345,共3页
针对传统分布式模型在海量日志并行处理时的可扩展性和并行程序编写困难的问题,提出了基于Hive的Web海量搜索日志分析机制。利用HQL语言以及Hadoop分布式文件系统(HDFS)和MapReduce编程模式对海量搜索日志进行分析处理,对用户搜索行为... 针对传统分布式模型在海量日志并行处理时的可扩展性和并行程序编写困难的问题,提出了基于Hive的Web海量搜索日志分析机制。利用HQL语言以及Hadoop分布式文件系统(HDFS)和MapReduce编程模式对海量搜索日志进行分析处理,对用户搜索行为进行了分析研究。对用户搜索行为中的查询热点主题、用户点击数和URL排名、查询会话的分析结果对于搜索引擎的排序算法和系统优化都有一定的指导意义。 展开更多
关键词 hadoop mapreduce HQL语言 WEB日志 搜索引擎 用户行为分析
下载PDF
基于Hadoop的海量共现矩阵生成方法 被引量:13
13
作者 杨代庆 张智雄 《现代图书情报技术》 CSSCI 北大核心 2009年第4期23-26,共4页
海量数据的处理分析是当前信息处理技术的热点之一,介绍开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架,并在Hadoop基础上提出一种通过多重MapReduce操作,实现海量共现矩阵的生成方法。
关键词 hadoop mapreduce 共现矩阵 开源软件
下载PDF
Hadoop平台中MapReduce调度算法研究 被引量:11
14
作者 徐焕良 翟璐 +1 位作者 薛卫 任守纲 《计算机应用与软件》 CSCD 2015年第5期1-6,16,共7页
MapReduce是一种新型的并行计算框架,在计算速度,容错性,可靠性等方面具有优势,因此得到了广泛的商业应用与科学研究。而调度算法作为MapReduce的核心组成部分,它的优劣成为了直接影响MapReduce性能的关键因素,因而得到了很大的关注。... MapReduce是一种新型的并行计算框架,在计算速度,容错性,可靠性等方面具有优势,因此得到了广泛的商业应用与科学研究。而调度算法作为MapReduce的核心组成部分,它的优劣成为了直接影响MapReduce性能的关键因素,因而得到了很大的关注。在介绍和分析MapReduce并行计算模型的基础上,介绍了几种相关的模型改进,并基于Hadoop平台,重点研究了MapReduce的常用调度算法及改进算法。通过对比分析,就MapReduce未来的发展进行了进一步的探讨,为其调度算法的改进提供有效的方法。 展开更多
关键词 云计算 并行计算模型 hadoop mapreduce 调度算法
下载PDF
基于改进的MapReduce模型的Web挖掘 被引量:10
15
作者 应毅 任凯 曹阳 《科学技术与工程》 北大核心 2013年第5期1205-1209,共5页
基于单一服务器的Web挖掘系统在处理海量数据集时计算能力不足,针对该问题,提出了一种基于云计算的挖掘方法。将大数据集和挖掘任务分解到多台计算机上并行处理。实现了一个基于Hadoop开源框架的并行Web挖掘平台,同时提出了一种改进的Ma... 基于单一服务器的Web挖掘系统在处理海量数据集时计算能力不足,针对该问题,提出了一种基于云计算的挖掘方法。将大数据集和挖掘任务分解到多台计算机上并行处理。实现了一个基于Hadoop开源框架的并行Web挖掘平台,同时提出了一种改进的MapReduce模型——MapReduce-LP。并通过对电子商务系统中Web日志的挖掘工作验证了系统的有效性和新模型的高效性。实验表明,在集群中使用云计算技术处理大数据集,可以明显提高挖掘效率。 展开更多
关键词 WEB挖掘 云计算技术 hadoop mapreduce-LP模型 WEB日志挖掘
下载PDF
基于Hadoop MapReduce的大规模线性有限元法并行实现 被引量:3
16
作者 林海铭 《计算机应用与软件》 2017年第3期21-26,共6页
面对越来越复杂的工程问题,单机上的有限元计算不能达到完全解决问题的程度,可以考虑利用新兴云计算技术来解决。设计合适的杆单元数据结构,提出基于MapReduce框架的线性有限单元法并行算法,包括总体刚度阵组装和CG法求解线性方程组。在... 面对越来越复杂的工程问题,单机上的有限元计算不能达到完全解决问题的程度,可以考虑利用新兴云计算技术来解决。设计合适的杆单元数据结构,提出基于MapReduce框架的线性有限单元法并行算法,包括总体刚度阵组装和CG法求解线性方程组。在6节点Hadoop实验集群上,通过大规模空间桁架结构进行数值验证。结果表明采用该算法求解大规模空间桁架结构简洁、易用;在总刚组装阶段,网格模型越大,计算节点越多,计算性能越好;但求解方程组阶段,计算性能不理想,有待改善。 展开更多
关键词 云计算hadoop mapreduce 线性有限元 空间桁架 并行计算
下载PDF
可扩展存储网络空间数据信息动态分配方法研究
17
作者 李英 《周口师范学院学报》 CAS 2018年第5期125-128,共4页
现有信息分配技术不能根据数据包的具体走向建立文件索引列表,导致分配效率过低现象频繁发生.为解决此问题,提出基于可扩展存储网络空间环境的数据信息动态分配方法.通过确定Hadoop/MapReduce存储框架、增设文件存储合并模块、完善网络... 现有信息分配技术不能根据数据包的具体走向建立文件索引列表,导致分配效率过低现象频繁发生.为解决此问题,提出基于可扩展存储网络空间环境的数据信息动态分配方法.通过确定Hadoop/MapReduce存储框架、增设文件存储合并模块、完善网络空间索引文件列表三个步骤,完成可扩展存储网络空间环境的搭建.在此基础上,通过数据信息动态优先级计算、分配情况判断、参数修正三个步骤,完成新型数据信息动态分配方法的搭建.设计对比实验结果显示,应用基于可扩展存储网络空间环境数据信息动态分配方法后,可以更好地控制数据包的走向,并及时、有效地建立信息索引列表,分配效率过低现象的发生几率得到一定程度地控制. 展开更多
关键词 扩展存储 网络空间 信息动态分配 hadoop/mapreduce 合并模块
下载PDF
基于Hadoop/MapReduce的K_NN算法
18
作者 艾树宇 《科技传播》 2013年第1期203-204,200,共3页
分布式框架Hadoop/MapReduce的逐渐流行,本文针对机器算法K最邻近算法,阐述其在Hadoop/MapReduce上的实现过程,其中对于文本的相似度会利用余弦定理还处理,这样在Hadoop/MapReduce环境下实现K-NN算法对位置类别的文本分类。机器算法在Ha... 分布式框架Hadoop/MapReduce的逐渐流行,本文针对机器算法K最邻近算法,阐述其在Hadoop/MapReduce上的实现过程,其中对于文本的相似度会利用余弦定理还处理,这样在Hadoop/MapReduce环境下实现K-NN算法对位置类别的文本分类。机器算法在Hadoop/MapReduce上的实现,同时增加了算法的可扩展性和分析文本的能力,适应于当今大规模数据处理的要求。 展开更多
关键词 K-NN hadoop/mapreduce 文本分类 余弦定理 机器学习
下载PDF
分布式网络环境中基于Hadoop的矩阵乘法算法研究
19
作者 杨博 《信息通信》 2016年第4期18-19,共2页
互联网时代已经来临,面对大规模数据的处理,传统计算机技术已跟不上步伐,文章引入了开源云计算系统Hadoop(一种分布式计算平台),利用Mapreduce编程模式对互联网中经常涉及的大规模矩阵乘法的算法理论进行了相关研究,并对Hadoop相关技术... 互联网时代已经来临,面对大规模数据的处理,传统计算机技术已跟不上步伐,文章引入了开源云计算系统Hadoop(一种分布式计算平台),利用Mapreduce编程模式对互联网中经常涉及的大规模矩阵乘法的算法理论进行了相关研究,并对Hadoop相关技术领域的应用做了展望。 展开更多
关键词 矩阵乘法 hadoopmapreduce 并行化计算
下载PDF
基于内容的Hadoop/MapReduce架构图像检索方法
20
作者 蔡丽娟 《福建广播电视大学学报》 2014年第5期41-45,共5页
运用Hadoop/Map Reduce并行海量图像处理框架进行基于内容的海量图像检索,将海量图像数据分布式存储在众多节点上,运用优化的ACCC算法在各节点上进行基于内容的图像搜索分析算法一体化处理,通过与传统并行计算方法和单节点方法试验对比... 运用Hadoop/Map Reduce并行海量图像处理框架进行基于内容的海量图像检索,将海量图像数据分布式存储在众多节点上,运用优化的ACCC算法在各节点上进行基于内容的图像搜索分析算法一体化处理,通过与传统并行计算方法和单节点方法试验对比,演示本方法在存储能力和计算检索效能的优势。 展开更多
关键词 hadoop/mapreduce 并行处理 图像处理
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部