期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
线上、线下调查数据的融合问题——以基于伪设计的校准为例 被引量:5
1
作者 金勇进 刘晓宇 《统计研究》 CSSCI 北大核心 2022年第1期122-131,共10页
在当前调查环境和互联网发展的背景下,线上、线下混合调查的方式得到广泛应用。如何将两方面数据相融合,减少信息浪费,合理利用数据资源,得到有效且精度高的估计结果,是大数据背景下调查数据推断面临的严峻挑战。本文针对线上样本是非... 在当前调查环境和互联网发展的背景下,线上、线下混合调查的方式得到广泛应用。如何将两方面数据相融合,减少信息浪费,合理利用数据资源,得到有效且精度高的估计结果,是大数据背景下调查数据推断面临的严峻挑战。本文针对线上样本是非概率样本、线下样本是概率样本的情况,提出了进行数据融合的基本思路:一是对非概率样本进行"概率性检验",进而将两类数据结合在一起进行统计推断;二是利用概率样本中提供的信息,对非概率样本进行"伪随机化"。本文针对第二种思路,以基于倾向得分伪权数的校准估计为例,探讨了具体的解决方法及变量选择问题,并通过模拟进行验证。 展开更多
关键词 数据融合 混合样本 权数 倾向得分 校准法
下载PDF
基于倾向得分的伪权数构造与混合样本推断 被引量:4
2
作者 刘展 潘莹丽 +1 位作者 涂朝凤 张梦 《统计与决策》 CSSCI 北大核心 2021年第2期20-24,共5页
随着网络调查与大数据的发展,非概率样本受到越来越多的关注和重视,然而非概率样本存在入样概率和权数未知的问题,为了充分利用信息,如何将非概率样本和概率样本结合,利用混合样本推断总体成为一个热点问题。基于此,文章提出将概率样本... 随着网络调查与大数据的发展,非概率样本受到越来越多的关注和重视,然而非概率样本存在入样概率和权数未知的问题,为了充分利用信息,如何将非概率样本和概率样本结合,利用混合样本推断总体成为一个热点问题。基于此,文章提出将概率样本与非概率样本混合,从同时计算权数和分别计算权数两条思路出发,结合倾向得分来构造非概率样本的伪权数,并利用混合样本来推断总体。模拟与实证研究表明:提出的两种混合样本推断方法所得的总体均值估计的绝对偏差、方差与均方误差都比仅基于概率样本的总体均值估计小,并且相对于分别计算权数估计总体均值的方法,同时计算权数估计总体均值的方法效果更好。 展开更多
关键词 倾向得分匹配法 权数 混合样本 概率样本 非概率样本
下载PDF
基于校准的伪权数构造与混合样本推断 被引量:1
3
作者 侯兰宝 邓严林 《统计与决策》 CSSCI 北大核心 2021年第12期5-9,共5页
无论是大数据时代下的抽样,还是目前流行的网络调查,产生的样本大多为非概率样本,而非概率样本入样概率未知,无法根据传统的抽样推断理论来估计总体,成为大数据背景下网络调查中需要解决的一个问题。针对该问题,文章提出将非概率样本与... 无论是大数据时代下的抽样,还是目前流行的网络调查,产生的样本大多为非概率样本,而非概率样本入样概率未知,无法根据传统的抽样推断理论来估计总体,成为大数据背景下网络调查中需要解决的一个问题。针对该问题,文章提出将非概率样本与概率样本结合为一个混合样本,从同时构造权数与分别构造权数两条思路出发,利用校准对非概率样本构造伪权数,并利用混合样本数据推断总体。模拟与实证研究结果表明:基于校准的伪权数构造与混合样本推断方法效果较好,且基于校准同时构造权数的总体估计方法优于基于校准分别构造权数的总体估计方法。 展开更多
关键词 校准 权数 非概率样本 混合样本
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部