-
题名权数对基于模型推断的影响分析
被引量:8
- 1
-
-
作者
金勇进
刘晓宇
-
机构
中国人民大学应用统计科学研究中心
中国人民大学统计学院
中国人民大学调查技术研究所
-
出处
《统计与信息论坛》
CSSCI
北大核心
2022年第3期3-13,共11页
-
基金
全国统计科学研究重点项目“大型抽样调查样本整合及其有效性研究”(2020LZ27)。
-
文摘
利用抽样调查数据对总体参数进行推断通常分为两种途径:一种是基于设计的推断体系;另一种是基于模型的推断体系。基于设计的推断以随机化理论为基础,推断依赖于抽样设计,在大样本下估计量具有无偏性和一致性,但在样本量较小或存在非抽样误差等情况下效率较低。基于模型的推断认为有限总体是一个来自无限超总体的随机样本,推断依赖于模型假设,构建超总体模型具有很大的灵活性,有利于充分利用总体辅助信息并提高估计精度,但在模型假定有误或样本的入样过程不具有无信息性时存在估计误差。如何将两种推断途径相结合,在体现样本对总体代表性的同时,保证估计效率和估计量的优良性质,尚待研究。权数在基于设计的推断中起着核心作用,能够反映抽样设计对样本的影响,实现样本对总体的还原。将权数引入基于模型的推断,可以使基于模型推断的结果具有总体代表性,能更好地发挥两种推断体系的组合优势,并削弱模型假定对推断效果的影响。据此,从权数对于模型推断的影响入手,针对因果推断问题,提出将权数同时引入倾向得分模型和预测模型的建模过程,来构造双稳健估计的方法,并通过模拟研究加以验证。最终结果表明,根据文章所提出的方法进行处理效应的估计,能够充分发挥权数的作用,得到更准确、更稳健的估计结果。实证部分采用2017年CGSS调查数据进行分析,进一步说明在基于调查数据进行模型推断时应充分考虑抽样设计的影响,为科研人员进行因果推断以及其他基于调查数据开展的研究提供参考。
-
关键词
权数
基于模型的推断
因果推断
双稳健估计
-
Keywords
weights
model-based inference
causal inference
double-robust estimation
-
分类号
C81
[社会学—统计学]
-
-
题名非概率样本的模型推断
被引量:5
- 2
-
-
作者
金勇进
郝一炜
-
机构
中国人民大学应用统计科学研究中心
中国人民大学统计学院
中国人民大学调查技术研究所
首都医科大学附属北京地坛医院
-
出处
《数学的实践与认识》
北大核心
2019年第5期246-255,共10页
-
基金
国家社科基金项目<大数据背景下非概率抽样的统计推断问题研究>(15BTJ014)
中央高校建设世界一流大学(学科)和特色发展引导专项基金
-
文摘
非概率抽样在大数据时代有广阔的应用空间,但其统计推断问题仍有待研究和发展.针对这一问题,提出利用基于模型的推断方法结合配额抽样实现非概率样本的统计推断,其思路是先设定线性回归形式的超总体模型,再利用配额样本观测数据拟合模型估计未知参数,进而利用模型对非观测单元进行预测,案例分析结果显示基于超总体模型的推断方法是解决非概率样本统计推断的有力途径,具有较大的深入研究价值.
-
关键词
非概率抽样
配额抽样
基于模型的抽样推断
无信息抽样
-
Keywords
non-probability sampling
quota sampling
model-based survey sampling
non-informative sampling
-
分类号
O212.2
[理学—概率论与数理统计]
-
-
题名模型假设对基于模型的森林蓄积量估算的影响
- 3
-
-
作者
齐元浩
侯正阳
刘太训
徐晴
-
机构
北京林业大学森林培育与保护教育部重点实验室
国家林业和草原局黑龙江三江平原沼泽草甸生态系统定位观测研究站
中交天津航道局有限公司
国际竹藤中心、国家林业和草原局/北京竹藤科学与技术重点开放实验室
-
出处
《林业科学》
EI
CAS
CSCD
北大核心
2024年第9期111-123,共13页
-
基金
雄安新区科技创新专项“白洋淀生态固碳能力评估与调控”(2022XACX1000)
国家社会科学基金项目“森林生态系统碳汇监测核算体系构建与评价研究”(22BTJ005)。
-
文摘
【目的】1)评估模型的线性和非线性形式、模型残差假设对推断不确定性的效应;2)比较2种总体均值的方差估计方法(自助法和解析法);3)评估多种因素对推断不确定性的效应,构建基于遥感模型的统计推断经验法则用于指导实践。【方法】应用基于模型的统计推断方法,以森林蓄积量估算为例,基于非洲稀树草原的薪材材积实测样地数据和Landsat 8遥感辅助数据,使用二阶抽样从总体中选择160块样地形成样本,在不同模型假设下进行总体参数推断,量化分析参数模型假设对估计量不确定性的效应,并辅以置信椭圆等诊断方法确保分析的有效性。【结果】1)不同模型假设下的总体均值估计值μ_(mb)为7.159~7.331 m^(3)·hm^(-2),解析方差估计值Var(μ_(mb))为0.147~0.221,抽样精度为93.59%~96.64%,总体均值的经验方差估计值Var(μ_(mb))为0.143~0.237。模型假设会影响模型参数估计,进而影响推断精度Var(μ_(mb))。自助法是检验总体参数解析估计量无偏性的有效方法。2)基于设计的统计推断方法得出的总体均值估计值μ_(db)为6.774 m^(3)·hm^(-2),其方差估计值Var(μ_(db))为0.965,抽样精度为85.50%。既定条件下,相比基于设计的统计推断,基于模型的统计推断能够有效将推断精度提升77.10%~84.77%,对抽样精度的提升为9.46%~13.03%。【结论】基于模型的统计推断在小样本推断中具有更高的推断精度和抽样精度,有助于实现高精度、低样本量、短周期的森林资源调查目标,但建模过程中的不确定性会影响推断精度,其中残差变异性对推断不确定性的影响最大。忽略方差异性和空间自相关效应在同方差假设下进行总体参数推断,会低估Var(μ_(mb)),在考虑方差异性的同时应进一步检验空间自相关性并使用相应的权函数和自相关函数模拟残差变异性。
-
关键词
森林资源遥感调查
基于模型的统计推断
回归模型
方差估计
-
Keywords
remote sensing-assisted forest inventory
model-based inference
regression model
variance estimation
-
分类号
S757.2
[农业科学—森林经理学]
-