摘要
从统计学视角研究了大数据分析问题,以当前较为流行的Hadoop云计算平台为基础,分析设计了海量数据描述统计分析的整体架构,分析了相关统计分析算法的特点并给出了实现的具体思路。最后通过实际数据进行了实验性验证,取得了较为理想的效果,为海量数据的统计分析提供了一个可供借鉴的新思路。
In this paper ,from a statistical perspective of the big data analysis problems to the current more popular Hadoop cloud computing platform ,we analyzed and designed the overall architecture about describing statistical analysis of massive data , analyzed the characteristics of the relevant statistical analysis algorithms , and gave specific ideas to achieve . Finally , the actual data were verified experimentally achieved more satisfactory results for the statistical analysis of massive data provides a new way for reference .
出处
《统计与信息论坛》
CSSCI
北大核心
2015年第11期32-38,共7页
Journal of Statistics and Information
基金
全国统计科学研究计划重点项目<基于HADOOP云计算平台的分布式海量数据的统计分析研究>(2012LZ05)
山东省社科规划项目<基于"蓝黄"战略背景下民办高校专业设置与预警机制研究>(13CGLJ21)