期刊文献+
共找到218篇文章
< 1 2 11 >
每页显示 20 50 100
基于Hive的电力设备状态信息数据仓库 被引量:40
1
作者 王德文 肖凯 肖磊 《电力系统保护与控制》 EI CSCD 北大核心 2013年第9期125-130,共6页
随着智能变电站的建设及其状态监测系统的发展,电力设备状态信息数据规模逐渐增大。针对现有电力数据仓库在海量状态数据存储查询和分析处理方面的不足,提出基于Hive的电力设备状态信息数据仓库及其多维数据快速查询与分析方法。通过对... 随着智能变电站的建设及其状态监测系统的发展,电力设备状态信息数据规模逐渐增大。针对现有电力数据仓库在海量状态数据存储查询和分析处理方面的不足,提出基于Hive的电力设备状态信息数据仓库及其多维数据快速查询与分析方法。通过对状态监测系统与生产管理系统(PMS)的分析,将电力设备静态信息与状态监测信息存储到Hive数据仓库中。设计了基于Hive的电力设备状态信息数据仓库的系统架构和海量状态数据存储结构,采用Hadoop分布式文件系统(HDFS)对数据进行分布式存储管理,Map Reduce作为海量数据查询分析的计算模式,HiveQL查询语言作为数据仓库的控制工具,并给出了数据仓库的工作过程。建立一个基于Hive的电力设备状态信息数据仓库实验平台,分别利用5个节点和10个节点的Hadoop集群进行测试,结果表明上述方法具有较好的扩展性,能满足大规模多维电力设备状态数据存储查询的需要。 展开更多
关键词 智能变电站 电力设备状态信息 数据仓库 hive HDFS
下载PDF
一种基于HIVE和分布式集群的大量数据高效处理方法研究 被引量:33
2
作者 侯晓芳 王欢 李瑛 《中国电子科学研究院学报》 北大核心 2018年第3期315-320,共6页
为了对海量电子日志数据进行有效处理,提出一种基于HIVE和分布式集群的综合解决方案。首先,从需求分析出发,阐述了分布式集群搭建、虚拟机的Flume配置和HIVE数据处理;然后,进行数据采集和清洗、业务逻辑处理及优化、数据合并与查询。实... 为了对海量电子日志数据进行有效处理,提出一种基于HIVE和分布式集群的综合解决方案。首先,从需求分析出发,阐述了分布式集群搭建、虚拟机的Flume配置和HIVE数据处理;然后,进行数据采集和清洗、业务逻辑处理及优化、数据合并与查询。实验以统计分析网站访问排名为例,对具体的表结构和实施过程进行描述,并验证其可行性。结果表明:与其他框架相比,所提大数据综合处理方法在数据采集和日志处理方面更效率,且省去了处理业务逻辑的大量Java代码,可用性更佳。 展开更多
关键词 分布式集群 虚拟机 日志数据 hive HADOOP 大数据
下载PDF
基于Hadoop的高校大数据平台的设计与实现 被引量:30
3
作者 唐燕 刘仁权 王苹 《信息技术》 2017年第12期105-109,共5页
随着信息化的推进,高校已经建设了很多信息系统,积累了大量数据。如何从海量数据中,挖掘有价值的信息,支撑智慧校园的建设,成为需要迫切解决的问题。文中就高校大数据平台的关键技术和架构进行阐述,结合高校实际情况,设计高校大数据平... 随着信息化的推进,高校已经建设了很多信息系统,积累了大量数据。如何从海量数据中,挖掘有价值的信息,支撑智慧校园的建设,成为需要迫切解决的问题。文中就高校大数据平台的关键技术和架构进行阐述,结合高校实际情况,设计高校大数据平台架构,通过搭建Hadoop集群环境,以业务系统和平台之间的数据交互验证平台设计的可行性和优势。通过研究,文中为高校建设大数据平台提出一种设计方案,为高校信息化建设提供一种新思路。 展开更多
关键词 大数据 HADOOP 分布式计算 hive 高校信息化
下载PDF
基于Hadoop/Hive的web日志分析系统的设计 被引量:24
4
作者 刘永增 张晓景 李先毅 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第A01期314-317,共4页
互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的... 互联网技术的迅速发展,使得web承载的信息量呈现出爆炸式增长的趋势,因此web日志的数据量也越来愈大。如何存储、处理大规模数据就成了新的挑战。云计算技术的出现,为这类问题的解决提供了一种思路。云计算将数据通过网络分布到集群的各个计算节点上,从而完成大规模数据的存储和运算。Hadoop是一个用于构建云计算平台的流行的开源框架,广泛应用于海量数据的处理。但利用Hadoop处理数据,用户必须自己开发Map/Reduce程序。这种程序处于比较低的层次,用户不容易掌握,而且难于维护。Hive是一个基于Hadoop的开源数据仓库工具,它能够将文件映射成数据表,并提供类SQL语句,简化了用户的开发。利用Hadoop、Hive设计了一个用于处理web日志分析的系统,既充分利用了Hadoop的海量数据处理的能力,又降低了开发的难度。通过与单机实验的对比,证明系统是有效的和有价值的。 展开更多
关键词 WEB日志 云计算 HADOOP hive
下载PDF
一种基于Hive日志分析的大数据存储优化方法 被引量:21
5
作者 王正也 李书芳 《软件》 2014年第11期94-100,共7页
从2002年起,某金融机构积累了大量的银行卡支付日志数据。随着业务的不断增长,数据集高速增长,原生的Hive的查询性能已经不能令人满意。文章研究了大数据及存储的现状,提出了一种基于存储日志的分析的Hive存储格式优化方法,通过该优化... 从2002年起,某金融机构积累了大量的银行卡支付日志数据。随着业务的不断增长,数据集高速增长,原生的Hive的查询性能已经不能令人满意。文章研究了大数据及存储的现状,提出了一种基于存储日志的分析的Hive存储格式优化方法,通过该优化方法从查询时间和存储空间利用率两方面使系统性能得到提升,提升了查询效率。论文对该金融机构原有Hive存储系统通过基于存储日志分析的Hive存储格式优化方法进行改进,通过实际数据,充分证明了该方法的可行性。 展开更多
关键词 大数据 hive 存储优化 列式存储
下载PDF
基于ICP-MS法对4种动物源性药材中16种无机元素的测定及量变规律研究 被引量:19
6
作者 李耀磊 左甜甜 +4 位作者 徐健 金红宇 韩笑 安丽萍 马双成 《药物评价研究》 CAS 2020年第2期248-254,共7页
目的测定地龙、土鳖虫、九香虫、蜂房4种动物源性药材中无机元素,并探索其元素量变规律。方法采用微波消解法对样品进行前处理,电感耦合等离子体质谱(ICP-MS)法对地龙、土鳖虫、九香虫、蜂房中铍(Be)、钒(V)、钴(Co)、镍(Ni)、镓(Ga)、... 目的测定地龙、土鳖虫、九香虫、蜂房4种动物源性药材中无机元素,并探索其元素量变规律。方法采用微波消解法对样品进行前处理,电感耦合等离子体质谱(ICP-MS)法对地龙、土鳖虫、九香虫、蜂房中铍(Be)、钒(V)、钴(Co)、镍(Ni)、镓(Ga)、硒(Se)、铷(Rb)、锶(Sr)、银(Ag)、铯(Cs)、铀(U)、铜(Cu)、砷(As)、镉(Cd)、汞(Hg)和铅(Pb)16种无机元素进行测定,并采用元素指纹图谱直观分析、元素主成分分析、偏最小二乘判别分析、聚类分析对元素含量差异性进行统计分析。结果16种无机元素的线性关系良好(R>0.996),回收率为87.4~113.0%。4种动物药中检测了16种无机元素含量,并绘制无机元素指纹图谱,发现其谱图具有一定的特征性,4种动物药中As、Cd和Pb残留量较高,有害无机元素的量超标应引起关注。通过主成分分析、偏最小二乘法判别分析、聚类分析,发现不同样品元素之间含量变异均能呈现出明显特征,并以此可区分不同种类的动物药。结论通过无机元素在4种动物药中的组成分布及其量的变化规律研究,为动物药的质量控制及安全性评价提供依据,同时为动物药重金属形态价态研究提供基础参考。 展开更多
关键词 动物药 重金属 微量元素 主成分分析 电感耦合等离子体质谱 地龙 土鳖虫 九香虫 蜂房
原文传递
基于Hadoop的高校公共数据平台的构建 被引量:15
7
作者 胡锐 胡伏原 陈丽春 《苏州科技学院学报(自然科学版)》 CAS 2015年第3期52-55,共4页
随着高校信息化建设的发展,数据资源出现了快速的增长。现有的存储平台已难以满足信息化数据增长的要求。文中提出一种基于云存储的公共数据平台,该平台以Hadoop为基础,通过Hive、HBase和HDFS等技术实现数据资源的统一存储和共享。实验... 随着高校信息化建设的发展,数据资源出现了快速的增长。现有的存储平台已难以满足信息化数据增长的要求。文中提出一种基于云存储的公共数据平台,该平台以Hadoop为基础,通过Hive、HBase和HDFS等技术实现数据资源的统一存储和共享。实验证明,该平台性能基本可以代替传统的数据库系统和文件存储系统。 展开更多
关键词 hive HADOOP 公共数据平台
下载PDF
Hadoop云计算基础架构的搭建和hbase和hive的整合应用 被引量:14
8
作者 谭洁清 毛锡军 《贵州科学》 2013年第5期32-35,共4页
本论文介绍一种常见的云计算分布式hadoop架构及其子项目分布式的hbase数据库和hive数据仓库,真实搭建一个hadoop云计算实验平台,并整合hbase和hive,通过创建数据表并验证实现了两数据库之间的访问,为以后的大规模的数据的存储,计算和... 本论文介绍一种常见的云计算分布式hadoop架构及其子项目分布式的hbase数据库和hive数据仓库,真实搭建一个hadoop云计算实验平台,并整合hbase和hive,通过创建数据表并验证实现了两数据库之间的访问,为以后的大规模的数据的存储,计算和应用创造基础。 展开更多
关键词 HADOOP 云计算 HBASE hive
下载PDF
蜜蜂蜂群温湿度调节研究进展 被引量:16
9
作者 汪天澍 刘芳 +3 位作者 余林生 潘炜 江朝晖 付月生 《生态学报》 CAS CSCD 北大核心 2015年第10期3172-3179,共8页
环境温度的变化直接影响蜜蜂的个体发育、群体活动、蜂群繁殖、群势强弱等方面,蜂群温湿度是对蜜蜂生命活动影响最大的环境因素,蜜蜂会积极地响应环境温度变化。在巢群内温度高于或低于子脾要求温度,蜜蜂就会采取各种解决办法。研究蜂... 环境温度的变化直接影响蜜蜂的个体发育、群体活动、蜂群繁殖、群势强弱等方面,蜂群温湿度是对蜜蜂生命活动影响最大的环境因素,蜜蜂会积极地响应环境温度变化。在巢群内温度高于或低于子脾要求温度,蜜蜂就会采取各种解决办法。研究蜂群温度的分布、变化规律以及调控机制是当前蜂学领域的热点问题,而掌握了蜂群温度变化规律,也能更好的进行科学养蜂,提高蜂产品的产量和质量,同时对人类认知、环境保护也具有非常重要的借鉴价值。近年来随着基因组学、生物学、高新科学技术等的应用,蜜蜂温湿度调节的研究不断深入。整合当前国内外蜜蜂蜂群温湿度调节的研究报道,对蜜蜂蜂群温湿度调节现象和行为进行综合阐述,并对蜂群温湿度内在调控机理方面的进一步研究提出新思路。 展开更多
关键词 蜜蜂 蜂群 温度 湿度 调节
下载PDF
基于Spark的大数据分析工具Hive的研究 被引量:12
10
作者 杨宁 黄婷婷 《计算机时代》 2018年第11期31-35,共5页
随着数据规模的不断增大,传统的关系型数据库方法已经无法满足大数据量的数据查询需求,而基于Hadoop平台的Hive数据仓库为海量数据分析提供了方便的操作。随着实时查询需求的增加,基于Spark的Hive操作得到了很好的应用。文章主要介绍了H... 随着数据规模的不断增大,传统的关系型数据库方法已经无法满足大数据量的数据查询需求,而基于Hadoop平台的Hive数据仓库为海量数据分析提供了方便的操作。随着实时查询需求的增加,基于Spark的Hive操作得到了很好的应用。文章主要介绍了Hive on Spark的整合步骤以及与Hadoop运行模式的比较。对MovieLens数据集的实验测试显示,新模式的执行速度提高了17.42-46.35倍,这对进一步了解Hive的运行机制及海量数据的实时分析具有重要的意义。 展开更多
关键词 HADOOP hive SPARK 海量数据 实时分析
下载PDF
基于分布式数据仓库的分类分析研究 被引量:10
11
作者 李伟卫 李梅 +1 位作者 张阳 申爱丽 《计算机应用研究》 CSCD 北大核心 2013年第10期2936-2939,2943,共5页
针对GAC-RDB分类算法只能应用于单机版数据仓库的局限性,为了能够更方便、快捷地在云计算平台上开展数据挖掘工作,基于分布式数据仓库HBase,结合GAC-RDB分类算法的实现机理,制定适合分布式平台的运行策略,使用原生HiveQL语言提出了一种... 针对GAC-RDB分类算法只能应用于单机版数据仓库的局限性,为了能够更方便、快捷地在云计算平台上开展数据挖掘工作,基于分布式数据仓库HBase,结合GAC-RDB分类算法的实现机理,制定适合分布式平台的运行策略,使用原生HiveQL语言提出了一种分布式GAC-RDB分类算法。实验显示,随着集群中节点的不断增加,算法的运行时间稳步下降。结果表明,在保证算法准确率的前提下,分布式数据仓库能够有效提高GACRDB分类算法的扩展性和运行效率,相对于MapReduce框架,HiveQL语言降低了对数据挖掘从业人员的技术要求,更大程度地减少了算法的开发时间,为挖掘海量数据提供了新的解决方案。 展开更多
关键词 数据挖掘 分布式数据仓库 分类分析 GAC—RDB HADOOP HBASE hive
下载PDF
基于Hive的高可用双引擎数据仓库 被引量:10
12
作者 李翀 张彤彤 +1 位作者 杜伟静 刘学敏 《计算机系统应用》 2019年第9期65-71,共7页
打破信息孤岛,整合异构数据,汇聚共享交换,深度分析挖掘,提供行业领域辅助决策和态势分析具有深远的理论和应用价值.本文以中国科学院教育科研态势感知服务的实际需求为牵引,设计并实现了一套基于Hive的Hadoop/Spark双计算引擎大数据仓... 打破信息孤岛,整合异构数据,汇聚共享交换,深度分析挖掘,提供行业领域辅助决策和态势分析具有深远的理论和应用价值.本文以中国科学院教育科研态势感知服务的实际需求为牵引,设计并实现了一套基于Hive的Hadoop/Spark双计算引擎大数据仓库,支持多种方式OLAP分析,进行了可用性、负载均衡、资源管理的优化设计,为后续进行全院数据汇聚挖掘、知识图谱构建、学科态势分析提供了平台支撑.实验表明,系统灵活高效,高可用可扩展,资源调度科学,负载均衡效果明显. 展开更多
关键词 数据仓库 hive 高可用 OLAP HADOOP
下载PDF
基于Hive的海量web日志分析系统设计研究 被引量:9
13
作者 江三锋 王元亮 《软件》 2015年第4期93-96,共4页
针对于传统对海量数据处理和计算的瓶颈,提出了一种基于Hive的海量web日志分析机制。通过Hadoop分布式系统架构以及Hive数据仓库对海量web日志做了分析处理,并对用户的浏览行为进行了分析研究。对用户浏览行为中的浏览量和跳出率、IP数... 针对于传统对海量数据处理和计算的瓶颈,提出了一种基于Hive的海量web日志分析机制。通过Hadoop分布式系统架构以及Hive数据仓库对海量web日志做了分析处理,并对用户的浏览行为进行了分析研究。对用户浏览行为中的浏览量和跳出率、IP数、版块热度排行的分析结果对于网站建设和大数据分析系统优化都具有一定的指导意义。 展开更多
关键词 hive WEB日志 HADOOP 网站建设
下载PDF
基于大数据技术的大学生就业分析系统的研究 被引量:8
14
作者 朱永忠 《现代信息科技》 2020年第18期128-130,136,共4页
从网络招聘网站采集招聘数据,存储于Hadoop分布式集群上,使用MapReduce程序进行清洗、转换为满足分析要求的结构化数据,最后利用数据仓库Hive从职位的区域分布、薪资分布、福利频次、技能频次等四个维度进行分析,为大学生的职业规划、... 从网络招聘网站采集招聘数据,存储于Hadoop分布式集群上,使用MapReduce程序进行清洗、转换为满足分析要求的结构化数据,最后利用数据仓库Hive从职位的区域分布、薪资分布、福利频次、技能频次等四个维度进行分析,为大学生的职业规划、技能学习和就业提供参考建议,为高校的专业建设、课程设置和人才培养提供决策支持。 展开更多
关键词 大数据分析 hive 数据采集 就业分析
下载PDF
基于Hadoop的SQL查询引擎性能研究 被引量:8
15
作者 吴黎兵 邱鑫 +2 位作者 叶璐瑶 王晓栋 聂雷 《华中师范大学学报(自然科学版)》 CAS 北大核心 2016年第2期174-182,共9页
Apache Hadoop处理超大规模数据集有非常出色的表现,相比较于传统的数据仓库和关系型数据库有不少优势.为了让原有业务能够充分利用Hadoop的优势,SQL-on-Hadoop系统越来越受到工业界和学术界的关注.基于Hadoop的SQL查询引擎种类繁多,各... Apache Hadoop处理超大规模数据集有非常出色的表现,相比较于传统的数据仓库和关系型数据库有不少优势.为了让原有业务能够充分利用Hadoop的优势,SQL-on-Hadoop系统越来越受到工业界和学术界的关注.基于Hadoop的SQL查询引擎种类繁多,各有优势,其运算引擎主要包括三种:1传统的Map/Reduce引擎;2新兴的Spark引擎;3基于shared-nothing架构的MPP引擎.本文选取了其中最有代表性的三种SQL查询引擎—Hive、Spark SQL、Impala,并使用了一种类TPC-H的测试基准对它们的决策支持能力进行测试及评估.从实验结果来看,Impala和Spark SQL相对于传统的Hive都有较大的提高,其中Impala的部分查询比Hive快了10倍以上,并且Impala在完成查询所占用的集群资源也是最少的.然而若从稳定性、易用性、兼容性和性能等多个方面进行对比,并不存在各方面均最优的查询引擎,因此在构建基于Hadoop的数据仓库系统时,推荐采用Hive+Impala或者Hive+Spark SQL的混合架构. 展开更多
关键词 大数据 SQL-on-Hadoop 数据仓库 SPARK SQL IMPALA hive
下载PDF
基于Hive的智慧城市数据处理技术研究与实现 被引量:8
16
作者 艾丽蓉 刘云峰 《计算机技术与发展》 2018年第2期9-13,共5页
对智慧城市系统中产生的大量数据进行有效的采集、合理的存储、高效精准的分析,进而对决策的做出提供合理的支持是在智慧城市建设过程中必须要解决的问题。对此,在充分理解智慧园区数据分析系统功能需求、性能需求的基础上,结合当前比... 对智慧城市系统中产生的大量数据进行有效的采集、合理的存储、高效精准的分析,进而对决策的做出提供合理的支持是在智慧城市建设过程中必须要解决的问题。对此,在充分理解智慧园区数据分析系统功能需求、性能需求的基础上,结合当前比较主流的数据分析方面的技术,提出了Kettle+Hive+Tableau的智慧园区数据分析解决方案。该系统具有较高的可用性、稳定性、效率以及非常高的扩展性、可移植性,不仅适合于对智慧园区的数据分析,还普遍适用于对智能化信息系统数据进行分析,具有较高的普适性、通用性。该系统通过ETL工具、数据可视化工具的应用,尽量减少在数据分析系统开发过程中代码的编写,能够适用于绝大部分有数据分析需求并且数据量较大的信息化系统。 展开更多
关键词 智慧城市 hive 数据采集 数据可视化分析
下载PDF
基于Hadoop的电商用户行为分析系统设计与实现 被引量:7
17
作者 陈伟 《宿州教育学院学报》 2021年第3期120-125,共6页
电商行业的飞速发展使得用户行为数据规模爆炸式增长,传统的IT架构模式已无法满足持续增长的数据处理需求。针对海量数据处理问题,提出一种基于Hadoop平台的电商用户行为分析模型,通过对Hadoop平台相关技术的研究,设计了包含数据采集、... 电商行业的飞速发展使得用户行为数据规模爆炸式增长,传统的IT架构模式已无法满足持续增长的数据处理需求。针对海量数据处理问题,提出一种基于Hadoop平台的电商用户行为分析模型,通过对Hadoop平台相关技术的研究,设计了包含数据采集、处理、分析及可视化一整套流程的电商用户行为分析系统,并对系统进行功能实现。最后,对该系统进行实际场景测试,结果表明,该系统能够根据不同分析需求快速得到目标数据,实现对用户行为的深度分析与挖掘,为企业调整营销策略,实现精准营销提供数据支撑。 展开更多
关键词 HADOOP 用户行为 hive 数据分析 可视化
下载PDF
基于Hadoop的离线电商数据分析系统的设计与实现 被引量:1
18
作者 潘杰恒 蔡群英 《现代计算机》 2024年第3期112-116,共5页
随着互联网的普及和人们不断增长的消费需求,电子商务平台已成为人们生活不可或缺的一部分,由此产生大量数据。基于Hadoop,设计并实现一个离线电商数据分析系统,从系统架构、数据采集、传输、存储、分析处理和可视化等方面作了介绍,系... 随着互联网的普及和人们不断增长的消费需求,电子商务平台已成为人们生活不可或缺的一部分,由此产生大量数据。基于Hadoop,设计并实现一个离线电商数据分析系统,从系统架构、数据采集、传输、存储、分析处理和可视化等方面作了介绍,系统具有一定的数据分析能力,能将原本无用的数据进行整理利用,发挥数据本身的价值。 展开更多
关键词 电商 离线 分析系统 大数据 HADOOP hive FLUME Kafka
下载PDF
基于分布式存储系统的Hive与Hbase的研究 被引量:7
19
作者 高金标 何利力 邹云阳 《工业控制计算机》 2015年第12期44-45,47,共3页
近年来,随着数据量的爆炸式增长和科技的迅速发展,快速分析大规模数据的需求加快了分布式云计算的迅速兴起。Hadoop除了有HDFS和能够支持Map Reduce的计算架构,还在这一基础上提供了数据仓库工具Hive和列式存储的非关系型数据库Hbase等... 近年来,随着数据量的爆炸式增长和科技的迅速发展,快速分析大规模数据的需求加快了分布式云计算的迅速兴起。Hadoop除了有HDFS和能够支持Map Reduce的计算架构,还在这一基础上提供了数据仓库工具Hive和列式存储的非关系型数据库Hbase等。在详细介绍HDFS分布式文件系统的基础上,解析了数据仓库工具Hive和关系数据库的区别,还详细阐述了列式存储数据库Hbase的存储架构。 展开更多
关键词 大数据 HADOOP MAP REDUCE HDFS hive 列式存储 HBASE
下载PDF
基于Hive的大数据在线分析处理 被引量:7
20
作者 陈耀旺 朱宁 施扬朋 《计算机时代》 2018年第1期1-3,共3页
随着传统行业与互联网的快速匹配,企业面对大量堆积的业务数据和用户数据而无从下手,用户的查询需求也越来越复杂且涉及跨库、跨表的大数据量综合分析查询,传统关系型数据库的方式已无法满足企业大数据在线分析处理的要求。文章提出基于... 随着传统行业与互联网的快速匹配,企业面对大量堆积的业务数据和用户数据而无从下手,用户的查询需求也越来越复杂且涉及跨库、跨表的大数据量综合分析查询,传统关系型数据库的方式已无法满足企业大数据在线分析处理的要求。文章提出基于Hive的大数据在线分析的系统架构,研究数据仓库的主题构建、多维分析以及数据可视化的综合分析处理方案,满足在线查询分析结果的用户需求,相比于传统数据库的OLAP方案,查询的时间效率得到显著提升。 展开更多
关键词 HADOOP hive 数据仓库 在线分析
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部