期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
基于Hadoop架构的多重分布式BP神经网络的短期负荷预测方法 被引量:95
1
作者 苏学能 刘天琪 +4 位作者 曹鸿谦 焦慧明 于亚光 何川 沈骥 《中国电机工程学报》 EI CSCD 北大核心 2017年第17期4966-4973,共8页
随着智能电网、通信网络技术和传感器技术的发展,电力负荷数据规模呈现指数形式增长、且复杂程度增大,逐步构成了电力负荷大数据,传统负荷预测方法已无法满足海量负荷大数据分析的要求。提出一种基于Hadoop架构的多重分布式BP神经网络... 随着智能电网、通信网络技术和传感器技术的发展,电力负荷数据规模呈现指数形式增长、且复杂程度增大,逐步构成了电力负荷大数据,传统负荷预测方法已无法满足海量负荷大数据分析的要求。提出一种基于Hadoop架构的多重分布式BP神经网络的短期负荷预测方法。该方法首先在从BP神经网络原理层对其输入信号的正向传递、误差信号的反向传播过程予以剖析的基础上,研究并建立基于Hadoop架构中Map Reduce框架的BP神经网络负荷分布式预测模型;其次,为弱化其"过拟合"问题,在引入"多重"概念的基础上,提出基于灰色关联度和最短距离法聚类的方式择取多重分布式BP神经网络预测模型初始重数和成员集的方法,并定义衡量聚类优劣的有效指标,以确定合理重数。实验结果表明,多重分布式BP神经网络预测方法相比传统BP神经网络,预测精度更高。 展开更多
关键词 负荷预测 hadoop架构 分布式计算 BP神经网络 灰色关联度
下载PDF
Hadoop架构下基于模式匹配的短期电力负荷预测方法 被引量:35
2
作者 吴润泽 包正睿 +3 位作者 王文韬 邓伟 唐良瑞 赫蕾 《电工技术学报》 EI CSCD 北大核心 2018年第7期1542-1551,共10页
大数据处理技术充分利用海量动态数据,能有效提升电力负荷预测精度及计算效率。采用Hadoop架构提出了一种基于模式匹配的短期电力负荷预测方法,通过度量日负荷序列相似性挖掘得出典型日负荷模式,辨识出关键影响因素构建基于并行随机森... 大数据处理技术充分利用海量动态数据,能有效提升电力负荷预测精度及计算效率。采用Hadoop架构提出了一种基于模式匹配的短期电力负荷预测方法,通过度量日负荷序列相似性挖掘得出典型日负荷模式,辨识出关键影响因素构建基于并行随机森林的决策树群从而建立模式匹配规则,实现待测日负荷模式的快速准确匹配;在典型负荷模式下建立多时刻点预测模型,采用Map Reduce计算框架进行负荷计算与预测分析,从而建立大量样本下的负荷预测模型。以某地市电网全年负荷数据为例进行负荷预测分析,并通过平均误差和方均根误差等指标对比局部加权线性回归(LWLR)算法的预测效果。仿真结果表明该方法用于短期负荷预测时具有更高的预测准确性和计算效率。 展开更多
关键词 hadoop 架构 负荷预测 影响因素 决策树群 模式匹配
下载PDF
基于Hadoop的数值预报产品服务平台设计与实现 被引量:32
3
作者 李永生 曾沁 +1 位作者 徐美红 石小英 《应用气象学报》 CSCD 北大核心 2015年第1期122-128,共7页
数值预报产品数据与日俱增,采用传统的关系型数据库对其进行存储和管理存在效率低和存储能力不足的问题。另外,基于文件的存储方式在数据存储处理、数据读取和算法计算等方面存在性能瓶颈。针对这一问题,基于Hadoop技术体系设计了分布... 数值预报产品数据与日俱增,采用传统的关系型数据库对其进行存储和管理存在效率低和存储能力不足的问题。另外,基于文件的存储方式在数据存储处理、数据读取和算法计算等方面存在性能瓶颈。针对这一问题,基于Hadoop技术体系设计了分布式的数据存储模型,实现了数值预报产品数据的分布式存储和处理,开发了数值预报产品数据接入处理模块;并实现了基于Rest Web Service的获取数值预报产品要素场数据访问接口、时间序列数据访问接口、数据下载接口等业务应用接口。多业务用户的实际业务测试表明,该平台在诸如数值预报产品气象数据处理和业务应用方面较传统技术架构具有一定优势。 展开更多
关键词 hadoop技术体系 气象数据 WEB Service接口
下载PDF
面向大数据挖掘的Hadoop框架K均值聚类算法 被引量:22
4
作者 李爽 陈瑞瑞 林楠 《计算机工程与设计》 北大核心 2018年第12期3734-3738,共5页
为提高大数据聚类效率,提出一种基于Hadoop框架的K均值聚类算法。采用Hadoop框架所用的MapReduce模型,将大数据划分成许多数据块。在Map阶段提出权重K均值聚类算法,对每一个数据块独立聚类,得到聚类中心和权重;在Reduce阶段提出加权融合... 为提高大数据聚类效率,提出一种基于Hadoop框架的K均值聚类算法。采用Hadoop框架所用的MapReduce模型,将大数据划分成许多数据块。在Map阶段提出权重K均值聚类算法,对每一个数据块独立聚类,得到聚类中心和权重;在Reduce阶段提出加权融合K均值聚类算法,对Map阶段得到的聚类中心和权重进行融合,得到最终的聚类结果。在HIGGS数据集上进行聚类实验,实验结果表明,该算法在保持聚类准确率的前提下大幅提升了大数据聚类时K均值聚类算法的运算效率。 展开更多
关键词 数据挖掘 K均值聚类 hadoop框架 大数据 MAPREDUCE模型
下载PDF
基于大数据挖掘的电力通信信号异常数据提取方法 被引量:18
5
作者 张磊 吴颖 杨建常 《科技通报》 2022年第6期35-38,44,共5页
为准确分辨电力通信信号中的异常数据信息,并对其实施具有指向性的提取与处理,提出基于大数据挖掘的电力通信信号异常数据提取方法。利用Hadoop挖掘框架,提供异常通信信号原数据集合建立所需的信息参量,联合关联性规则,完成基于大数据... 为准确分辨电力通信信号中的异常数据信息,并对其实施具有指向性的提取与处理,提出基于大数据挖掘的电力通信信号异常数据提取方法。利用Hadoop挖掘框架,提供异常通信信号原数据集合建立所需的信息参量,联合关联性规则,完成基于大数据挖掘的电力通信异常信号处理。在此基础上,重新编码异常数据特征,再将已编码特征参量与原通信信号对应,实施指向性译码处理,计算解调系数,约束现有编码原则,实现基于大数据挖掘的电力通信信号异常数据提取方法的设计与应用。实验结果显示,与深度置信型辨识制度相比,大数据挖掘型提取方法能够更加准确地分辨电力通信信号中的异常数据信息,符合指向性处理电力信息参量的实际应用需求。 展开更多
关键词 大数据挖掘 电力通信 异常信号 数据提取 hadoop框架 关联性规则
下载PDF
基于Hadoop的网络日志分析系统研究 被引量:17
6
作者 胡光民 周亮 柯立新 《电脑知识与技术》 2010年第8期6163-6164,6185,共3页
查看网络日志是调查系统故障,监控系统运行状况的重要手段。管理员可以查看在某段时间内所发生的事件,也可以通过对各个日志文件进行分析获取知识。由于日志具有数据量大,不易读懂的特点,如果仅凭借管理员查看日志记录的手段,其中所蕴... 查看网络日志是调查系统故障,监控系统运行状况的重要手段。管理员可以查看在某段时间内所发生的事件,也可以通过对各个日志文件进行分析获取知识。由于日志具有数据量大,不易读懂的特点,如果仅凭借管理员查看日志记录的手段,其中所蕴含的有用信息也难以发现。分布式计算技术正好可以用来解决这一难题。阐述了syslog日志收集流程,详细介绍了Hadoop分布式计算框架,设计并实现了一套基于Hadoop的网络日志分析系统。实验证明该系统是有效而实用的。 展开更多
关键词 hadoop框架 分布式 日志分析 SYSLOG
下载PDF
一种基于Hadoop的语义大数据分布式推理框架 被引量:15
7
作者 陈曦 陈华钧 +3 位作者 顾珮嵚 张宁豫 陈娇彦 于彤 《计算机研究与发展》 EI CSCD 北大核心 2013年第S2期103-113,共11页
随着语义万维网(sematic Web)和关联数据集项目(linked data project)的不断发展,各领域的语义数据正在大规模扩增.同时,这些大规模语义数据之间存在着复杂的语义关联性,这些关联信息的挖掘对于研究者来说有着重要的意义.为解决传统推... 随着语义万维网(sematic Web)和关联数据集项目(linked data project)的不断发展,各领域的语义数据正在大规模扩增.同时,这些大规模语义数据之间存在着复杂的语义关联性,这些关联信息的挖掘对于研究者来说有着重要的意义.为解决传统推理引擎在进行大规模语义数据推理时存在的计算性能和可扩展性不足等问题,提出了一种基于Hadoop的语义大数据分布式推理框架,并且设计了相应的基于属性链(property chain)的原型推理系统来高效地发现海量语义数据中潜在的有价值的信息.实验主要关注于医疗和生命科学领域各本体之间的语义关联发现,实验结果表明,该推理系统取得了良好的性能———扩展性以及准确性. 展开更多
关键词 hadoop 语义推理 大数据 属性链 分布式框架
下载PDF
基于Hadoop的网络行为大数据安全实体识别系统设计 被引量:15
8
作者 李芳菊 《现代电子技术》 北大核心 2019年第17期75-79,共5页
为解决大数据网络的负载拥塞问题,设计基于Hadoop的网络行为大数据安全实体识别系统。在Hadoop分布式框架中,规划网络行为大数据接收模块与识别发送模块的从属位置,实现网络行为大数据安全实体识别系统的硬件运行环境搭建。在此基础上,... 为解决大数据网络的负载拥塞问题,设计基于Hadoop的网络行为大数据安全实体识别系统。在Hadoop分布式框架中,规划网络行为大数据接收模块与识别发送模块的从属位置,实现网络行为大数据安全实体识别系统的硬件运行环境搭建。在此基础上,分析实体识别地址,在保持良好均衡处理结果的条件下,对识别信息进行导入导出与存储处理,实现系统软件运行环境搭建,结合基础硬件执行条件,完成基于Hadoop的网络行为大数据安全实体识别系统设计。对比实验结果表明,与理想状态下的识别系统相比,应用基于Hadoop的安全实体识别系统后,大流网络通道的占用率明显下降,单位时间内分流转发的安全信息总量提升,大数据网络的负载拥塞现状得到有效缓解。 展开更多
关键词 网络行为 大数据 安全实体识别 hadoop框架 接收发送 信息存储 系统设计
下载PDF
依托Hadoop架构的海量变压器实时监测与存储方案构建 被引量:15
9
作者 韦彪 刘天琪 苏学能 《电测与仪表》 北大核心 2020年第10期6-12,75,共8页
随着智能电网的建设以及电力变压器在线监测技术的成熟,电力变压器在线监测数据呈现出体量大、类型多等特点。使用传统存储技术存储变压器在线监测数据,已不能满足实时、快速的需求。为此,设计基于Hadoop集群的变压器在线监测数据存储... 随着智能电网的建设以及电力变压器在线监测技术的成熟,电力变压器在线监测数据呈现出体量大、类型多等特点。使用传统存储技术存储变压器在线监测数据,已不能满足实时、快速的需求。为此,设计基于Hadoop集群的变压器在线监测数据存储方案。该方案利用HBase(分布式列式数据库)具有快速实时读写数据的优势,将变压器在线监测系统采集的海量数据实时快速地存储。为能自动快速实时收集数据和避免因数据流过大造成系统崩溃,分别采用Flume(日志收集工具)和Kafka(分布式流处理平台)收集和缓存数据。以电力变压器在线监测的油色谱数据为例,验证了所提存储方案的可行性和有效性。 展开更多
关键词 智能电网 在线监测 变压器 hadoop框架 HBASE
下载PDF
基于Hadoop平台的大数据分析关键技术标准化探讨 被引量:13
10
作者 高洪 杨庆平 黄震江 《信息技术与标准化》 2013年第5期27-30,共4页
分析基于Hadoop平台的大数据分析关键技术面临的标准化问题,从数据采集、并行计算框架、分析结果输出、并行数据分析算法四个方面进行标准化的分析和调研,提出包含架构模型等四个方面的标准化方向以及相关API等方面的标准化建议。
关键词 大数据分析 计算框架 并行分析算法 hadoop
下载PDF
基于MapReduce的并行PageRank算法实现 被引量:12
11
作者 平宇 向阳 +1 位作者 张波 黄寅飞 《计算机工程》 CAS CSCD 2014年第2期31-34,38,共5页
分布式网络爬虫的广泛应用使得搜索引擎的数据规模呈几何式增长,面对数以TB甚至PB量级的数据,单机模式下的PageRank算法由于CPU、I/O和内存的开销过大导致效率低下。为此,提出一种基于MapReduce框架的并行PageRank算法。在算法的一次迭... 分布式网络爬虫的广泛应用使得搜索引擎的数据规模呈几何式增长,面对数以TB甚至PB量级的数据,单机模式下的PageRank算法由于CPU、I/O和内存的开销过大导致效率低下。为此,提出一种基于MapReduce框架的并行PageRank算法。在算法的一次迭代过程中,利用Map函数对网页拓扑信息文件进行解析,使用Reduce函数计算网页得分,从而并行化PageRank算法的中间迭代过程。通过计算全局网页得分控制迭代次数,得到较精确的网页排序结果。实验结果表明,该算法在保持原有单机PageRank算法整体网页排序精度的基础上,具有较好的集群性能和较快的执行速度。 展开更多
关键词 搜索引擎 PAGERANK算法 MAPREDUCE框架 并行计算 hadoop平台
下载PDF
基于大数据的井喷式状态监测数据实时处理研究 被引量:12
12
作者 吴秋莉 郭丽娟 +1 位作者 吕泽承 张炜 《电力信息与通信技术》 2017年第3期49-54,共6页
针对快速增长的井喷式状态监测数据,文章提出一种大数据分析方法。介绍了目前大数据流式数据实时分析技术和实时批处理技术,在Hadoop框架下结合状态监测系统的数据特点建立基于Kafka+Storm+Spark+Hadoop的实时分析架构,该分析架构能保... 针对快速增长的井喷式状态监测数据,文章提出一种大数据分析方法。介绍了目前大数据流式数据实时分析技术和实时批处理技术,在Hadoop框架下结合状态监测系统的数据特点建立基于Kafka+Storm+Spark+Hadoop的实时分析架构,该分析架构能保证所有的监测数据及流数据都能被及时有效处理,防止数据接入速率不匹配造成的数据丢失,将处理后的状态监测数据保存到分布式文件系统或实时数据库中并深度分析,实现了海量井喷状态监测数据快速、有效的分析处理。 展开更多
关键词 井喷式数据 hadoop框架 大数据 实时处理框架
下载PDF
Hadoop远程过程调用机制的分析和应用 被引量:10
13
作者 王博 陈莉君 《西安邮电学院学报》 2012年第6期74-77,共4页
为了高效快速的开发和使用Hadoop远程通信功能,对Hadoop远程过程调用(Remote Procedure Call,RPC)机制进行分析,提出独立调用Hadoop RPC实现多客户端并发通信和大数据传输的机制,既继承Hadoop PRC框架,又在通信中增加数据文件传输,并采... 为了高效快速的开发和使用Hadoop远程通信功能,对Hadoop远程过程调用(Remote Procedure Call,RPC)机制进行分析,提出独立调用Hadoop RPC实现多客户端并发通信和大数据传输的机制,既继承Hadoop PRC框架,又在通信中增加数据文件传输,并采用线程池模拟多客户线程的测试方案。通过测试发现Hadoop远程过程调用在通信数据负载量和数据传输量的大致范围,测试方案和结论可用于Hadoop RPC应用的配置和开发。 展开更多
关键词 hadoop框架 远程过程调用(RPC) 分布式存储 分布式计算 并发
下载PDF
后勤保障大数据技术体系 被引量:10
14
作者 林积微 朱卫国 陈杨 《指挥信息系统与技术》 2015年第2期32-37,共6页
鉴于后勤保障指挥信息化建设对数据分析需求的迅速增长,阐述了大数据背景下的数据分析技术,结合后勤保障指挥服务框架结构,提出了大数据背景下后勤保障指挥数据技术体系架构。该体系架构分析有助于提高后勤保障指挥数据技术体系建设,为... 鉴于后勤保障指挥信息化建设对数据分析需求的迅速增长,阐述了大数据背景下的数据分析技术,结合后勤保障指挥服务框架结构,提出了大数据背景下后勤保障指挥数据技术体系架构。该体系架构分析有助于提高后勤保障指挥数据技术体系建设,为后勤保障指挥数据管理与部门建设应用大数据提供基础。 展开更多
关键词 大数据 后勤保障指挥 数据技术体系 hadoop框架 MAPREDUCE框架
下载PDF
面向港口停留区域识别的船舶停留轨迹提取方法 被引量:9
15
作者 郑振涛 赵卓峰 +1 位作者 王桂玲 徐垚 《计算机应用》 CSCD 北大核心 2019年第1期113-117,共5页
针对港口停留区域识别时船舶轨迹大数据的精度低、稀疏、漂移等问题,提出了一种多约束条件下的船舶停留轨迹提取(MPTSSE)方法。首先,结合船舶轨迹数据特点,给出了用于停留区域识别与提取的停留段概念的定义;其次,建立了基于速度、时间... 针对港口停留区域识别时船舶轨迹大数据的精度低、稀疏、漂移等问题,提出了一种多约束条件下的船舶停留轨迹提取(MPTSSE)方法。首先,结合船舶轨迹数据特点,给出了用于停留区域识别与提取的停留段概念的定义;其次,建立了基于速度、时间差、停留时长、距离等多约束的轨迹停留段提取模型和并行化轨迹停留段提取算法;最后,基于Hadoop框架给出了船舶轨迹大数据集上的轨迹停留段提取算法实现。基于真实船舶轨迹数据的实验结果表明,与基于Stop/Move模型的轨迹停留提取方法相比,MPTSSE方法在三个港口泊位的提取中准确率提高了22%。MPTSSE方法能有效避免轨迹停留段误分割情况,同时在大规模船舶轨迹数据下具有较高的执行效率。 展开更多
关键词 港口停留区域 船舶轨迹数据 停留轨迹 多约束提取 hadoop框架
下载PDF
基于大数据的高职学生行为分析 被引量:9
16
作者 程光胜 《职业教育研究》 2020年第8期76-80,共5页
为改变依靠说教和事后分析找对策的传统学生管理方式,基于大数据的视角,构建了校园学生行为数据的分析模型,并通过大数据处理框架Hadoop和数据分析语言R设计了学生行为分析平台架构,基于此架构,实现了学生行为特征的分析,为学生管理的... 为改变依靠说教和事后分析找对策的传统学生管理方式,基于大数据的视角,构建了校园学生行为数据的分析模型,并通过大数据处理框架Hadoop和数据分析语言R设计了学生行为分析平台架构,基于此架构,实现了学生行为特征的分析,为学生管理的科学化、全面化和个性化提供了技术服务,为学校的高层决策提供智力支持。 展开更多
关键词 互联网+教育 教育大数据 学生行为分析 hadoop框架 R语言
下载PDF
Hadoop平台下的并行Web日志挖掘算法 被引量:6
17
作者 周诗慧 殷建 《计算机工程》 CAS CSCD 2013年第6期43-46,共4页
当面对海量数据时,基于单一节点的Web数据挖掘存在时间和空间效率上的瓶颈。针对该问题,提出一种在Hadoop平台下实现Web日志挖掘的并行FP-growth算法,利用Hadoop分布式文件系统和MapReduce并行计算模型处理日志文件。实验结果表明,该算... 当面对海量数据时,基于单一节点的Web数据挖掘存在时间和空间效率上的瓶颈。针对该问题,提出一种在Hadoop平台下实现Web日志挖掘的并行FP-growth算法,利用Hadoop分布式文件系统和MapReduce并行计算模型处理日志文件。实验结果表明,该算法的加速比能随着数据集的增大而提高,其执行效率优于串行FP-growth算法。 展开更多
关键词 hadoop框架 WEB挖掘 WEB日志 MapReduce编程模式 hadoop分布式文件系统 并行FP-growth算法
下载PDF
基于MapReduce的视频爬虫系统研究 被引量:7
18
作者 孔涛 曹丙章 邱荷花 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第5期129-132,共4页
针对当前网络中视频媒体数量大、更新快、内容多、下载难,以及基于单机的视频网络爬虫系统中的处理速度慢、并发度低和下载速度慢等问题,提出了基于Hadoop框架的视频爬虫系统,为视频爬取提供了高并发度的处理和爬取速度.通过MapReduce... 针对当前网络中视频媒体数量大、更新快、内容多、下载难,以及基于单机的视频网络爬虫系统中的处理速度慢、并发度低和下载速度慢等问题,提出了基于Hadoop框架的视频爬虫系统,为视频爬取提供了高并发度的处理和爬取速度.通过MapReduce计算模型实现网页抓取、分析、去重及下载等计算任务,Hadoop分布式文件系统(HDFS)存储各阶段计算任务的计算结果,运用多处备份机制,使得在某个结点退出时转移任务集,不影响整个系统的稳定性和有效性.实验结果表明完全分布式基于Hadoop的视频爬虫系统无论在单位时间内的视频下载速率还是爬取网页个数都明显高于未基于Hadoop的和伪分布式的视频爬虫系统. 展开更多
关键词 视频 爬虫 分布式 hadoop框架 MapReduce计算模型 hadoop分布式文件系统
原文传递
基于VoIP技术的一体化电力调度自动控制系统设计 被引量:4
19
作者 吴蓉 朱婷婷 +1 位作者 赵璐 秦璐 《电子设计工程》 2023年第1期69-72,77,共5页
为了解决电力生产过程中的电力控制与管理问题,增强控制主机对电量数据的调度与疏散能力,设计基于VoIP技术的一体化电力调度自动控制系统。借助Hadoop调度框架,连接一体化数据操作平台与管理控制模块,完成自动控制系统硬件执行环境的搭... 为了解决电力生产过程中的电力控制与管理问题,增强控制主机对电量数据的调度与疏散能力,设计基于VoIP技术的一体化电力调度自动控制系统。借助Hadoop调度框架,连接一体化数据操作平台与管理控制模块,完成自动控制系统硬件执行环境的搭建。基于VoIP技术,对编码地址进行转换处理,通过建立数字签名机制的方式,获取电力数据编译与打包结果,完成控制系统软件执行环境的搭建,结合相关硬件设备结构体系,实现基于VoIP技术的一体化电力调度自动控制系统设计。实验结果表明,与基于数据挖掘技术的控制系统相比,一体化控制系统能够较好适应电量数据的持续累积需求,在增强电网运行、调度与疏散能力的同时,实现对传输电子量的有效处理。 展开更多
关键词 VOIP技术 一体化电力调度 自动控制系统 hadoop框架 编码地址 数字签名
下载PDF
Hadoop云构架的智能调度无损集群压缩技术 被引量:7
20
作者 屈志坚 郭亮 +1 位作者 陈秋琳 蒋俊俊 《电力系统自动化》 EI CSCD 北大核心 2013年第18期93-98,共6页
针对智能调度系统中的大数据集信息压缩处理问题,利用Hadoop框架和Map/Reduce分布式编程模型,提出了一种基于云架构的无损集群压缩新方法。对字典编码和统计编码的无损压缩进行了分类比较,利用云计算节点的集群网络配置方式进行调度主... 针对智能调度系统中的大数据集信息压缩处理问题,利用Hadoop框架和Map/Reduce分布式编程模型,提出了一种基于云架构的无损集群压缩新方法。对字典编码和统计编码的无损压缩进行了分类比较,利用云计算节点的集群网络配置方式进行调度主机和监控服务器的部署,在集群数据节点中融入无损压缩,建立调度监控信息的无损集群压缩实验环境。利用调度端的断面量测记录进行测试研究,得出:对于相同断面记录集的无损压缩,BZip2格式的集群压缩比优于Deflate和Gzip格式。对不同断面记录集的BZip2集群压缩结果表明:在断面记录超过3×106以上时,压缩比达到81.1%,相对传统无损压缩方法提高30%以上。 展开更多
关键词 智能调度 hadoop构架 云计算节点 无损压缩 压缩比
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部