反事实预测和选择偏差是因果效应估计中的重大挑战。为对潜在协变量的复杂混杂分布进行有效表征,同时增强反事实预测泛化能力,提出一种面向工业因果效应估计应用的重加权对抗变分自编码器网络(RVAENet)模型。针对混杂分布去偏问题,借鉴...反事实预测和选择偏差是因果效应估计中的重大挑战。为对潜在协变量的复杂混杂分布进行有效表征,同时增强反事实预测泛化能力,提出一种面向工业因果效应估计应用的重加权对抗变分自编码器网络(RVAENet)模型。针对混杂分布去偏问题,借鉴域适应思想,采用对抗学习机制对由变分自编码器(VAE)获得的隐含变量进行表示学习的分布平衡;在此基础上,通过学习样本倾向性权重对样本进行重加权,进一步缩小实验组(Treatment)与对照组(Control)样本间的分布差异。实验结果表明,在工业真实场景数据集的两个场景下,所提模型的提升曲线下的面积(AUUC)比TEDVAE(Treatment Effect with Disentangled VAE)分别提升了15.02%、16.02%;在公开数据集上,所提模型的平均干预效果(ATE)和异构估计精度(PEHE)普遍取得最优结果。展开更多
目的利用SAS开发的CAUSALTRT过程,实现三类估计方法的因果效应估计。方法采用SmokingWeight数据集,以戒烟为处理变量,体重变化为结局变量,其他因素为混杂变量,通过增强逆概率加权法(augmented inverse probability weighting,AIPW)对平...目的利用SAS开发的CAUSALTRT过程,实现三类估计方法的因果效应估计。方法采用SmokingWeight数据集,以戒烟为处理变量,体重变化为结局变量,其他因素为混杂变量,通过增强逆概率加权法(augmented inverse probability weighting,AIPW)对平均处理效应(the average treatment effect,ATE)进行估计,通过回归调整法(regression adjustment,REGADJ)对处理组平均处理效应(the average treatment effect for the treated,ATT)进行估计。结果戒烟对体重变化的ATE和ATT分别为3.209(95%CI:2.232~4.187)和3.276(95%CI:2.332~4.219)。结论CAUSALTRT可以实现不同的因果效应估计,但应用时需要考虑其是否满足前提假设以及注意事项。展开更多
文摘反事实预测和选择偏差是因果效应估计中的重大挑战。为对潜在协变量的复杂混杂分布进行有效表征,同时增强反事实预测泛化能力,提出一种面向工业因果效应估计应用的重加权对抗变分自编码器网络(RVAENet)模型。针对混杂分布去偏问题,借鉴域适应思想,采用对抗学习机制对由变分自编码器(VAE)获得的隐含变量进行表示学习的分布平衡;在此基础上,通过学习样本倾向性权重对样本进行重加权,进一步缩小实验组(Treatment)与对照组(Control)样本间的分布差异。实验结果表明,在工业真实场景数据集的两个场景下,所提模型的提升曲线下的面积(AUUC)比TEDVAE(Treatment Effect with Disentangled VAE)分别提升了15.02%、16.02%;在公开数据集上,所提模型的平均干预效果(ATE)和异构估计精度(PEHE)普遍取得最优结果。
文摘目的利用SAS开发的CAUSALTRT过程,实现三类估计方法的因果效应估计。方法采用SmokingWeight数据集,以戒烟为处理变量,体重变化为结局变量,其他因素为混杂变量,通过增强逆概率加权法(augmented inverse probability weighting,AIPW)对平均处理效应(the average treatment effect,ATE)进行估计,通过回归调整法(regression adjustment,REGADJ)对处理组平均处理效应(the average treatment effect for the treated,ATT)进行估计。结果戒烟对体重变化的ATE和ATT分别为3.209(95%CI:2.232~4.187)和3.276(95%CI:2.332~4.219)。结论CAUSALTRT可以实现不同的因果效应估计,但应用时需要考虑其是否满足前提假设以及注意事项。