-
题名大数据背景下多重抽样框方法探讨
被引量:1
- 1
-
-
作者
高詹清
刘艺璇
贺建风
-
机构
中国人民大学经济学院
上海财经大学经济学院
华南理工大学经济与贸易学院
-
出处
《统计与决策》
CSSCI
北大核心
2020年第1期5-9,共5页
-
基金
国家社会科学基金资助项目(19BTJ022)
广东省科技计划项目(2019A101002003
+2 种基金
2018A070712009)
广州市“羊城青年学人”项目(17QNXR02)
华南理工大学中央高校基本科研业务费重点项目(XYZD201906)
-
文摘
当前所获取的大数据并非都是总体数据,通常未能完全覆盖总体,因其多源异构的特性,致使传统的数据分析方法受阻。文章将抽样调查方法引入到大数据中,对大数据背景下应用多重抽样框的必要性进行剖析,并主要针对大数据中数据多源异构的难点,将每个来源数据作为一个抽样框进行处理,提出了大数据中多重抽样框的构建。进而根据大数据的数据特征进行分类,针对不同情况确定是否需要进行分阶段抽样设计,并提出运用SF估计量对基于多重抽样框的总体进行估计,此估计量较为符合大数据中多重抽样估计的需求,并能对总体有较好的估计。
-
关键词
大数据
多重抽样框
多源数据
sf估计量
-
Keywords
big data
multi-sampling frame
multi-source data
sf estimator
-
分类号
O212
[理学—概率论与数理统计]
-