期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
不同缺失值处理方法对随机缺失数据处理效果的比较 被引量:22
1
作者 花琳琳 施念 +2 位作者 杨永利 赵天仪 施学忠 《郑州大学学报(医学版)》 CAS 北大核心 2012年第3期315-318,共4页
目的:比较不同的缺失值处理方法处理随机缺失数据的效果。方法:以HIV/AIDS血液样本血红蛋白、白细胞和血尿素氮检测数据为基础,利用SAS9.1,分别模拟完整数据集和不同缺失率的数据集,从精确度、准确度和分布三方面比较不同方法对缺失数... 目的:比较不同的缺失值处理方法处理随机缺失数据的效果。方法:以HIV/AIDS血液样本血红蛋白、白细胞和血尿素氮检测数据为基础,利用SAS9.1,分别模拟完整数据集和不同缺失率的数据集,从精确度、准确度和分布三方面比较不同方法对缺失数据集的处理效果。结果:任意缺失比例下血红蛋白和白细胞数据经不同的方法处理后与完整数据集比较差异无统计学意义。不同缺失比例下,多重填补(MI)法的精确度最高。缺失率10%~20%时,MI法填充后的准确度最高。缺失率30%时,成组删除法处理后的准确度最高。缺失40%以上时,准确度填充效果不稳定。不同缺失比例下,回归法、成组删除法和MI填充2次后的数据的分布特征与完整数据集一致。结论:数据缺失10%~20%时,MI法填充效果最好;缺失30%时,成组删除法处理效果最好;缺失40%以上时,所有方法填充效果均不佳。 展开更多
关键词 连续变量 缺失值 随机缺失
下载PDF
协变量随机缺失下线性模型的经验似然推断及其应用 被引量:10
2
作者 杨宜平 《数理统计与管理》 CSSCI 北大核心 2011年第4期655-663,共9页
考虑协变量带有缺失的线性模型,提出了加权的经验似然方法和借补的经验似然方法,证明了所提出的经验对数似然比渐近于x^2分布,由此构造回归系数的置信域。模拟研究了所提出方法的有限样本性质,并进行了实例分析。
关键词 线性模型 随机缺失 经验似然 X^2分布
原文传递
协变量随机缺失的广义半参数模型 被引量:6
3
作者 李志强 薛留根 《北京工业大学学报》 CAS CSCD 北大核心 2007年第7期761-765,共5页
在协变量随机缺失条件下,研究了广义半参数模型的加权拟似然估计方法,给出了未知参数与非参数回归函数的估计.进一步求出了估计的渐近偏差和渐近方差,并证明了所给出的加权拟似然估计具有渐近正态性.
关键词 广义半参数模型 局部线性估计 随机缺失 渐近正态性 加权拟似然
下载PDF
缺失数据下的逆概率多重加权分位回归估计及其应用 被引量:7
4
作者 邰凌楠 王春雨 田茂再 《统计研究》 CSSCI 北大核心 2018年第9期115-128,共14页
数据缺失问题普遍存在于应用研究中。在随机缺失机制假定下,本文从模型推断角度出发,针对线性缺失分位回归模型,提出一种新的有效估计方法——逆概率多重加权(IPMW)估计。该方法是在逆概率加权(IPW)估计的基础上,结合倾向得分匹配及模... 数据缺失问题普遍存在于应用研究中。在随机缺失机制假定下,本文从模型推断角度出发,针对线性缺失分位回归模型,提出一种新的有效估计方法——逆概率多重加权(IPMW)估计。该方法是在逆概率加权(IPW)估计的基础上,结合倾向得分匹配及模型平均思想,经过多次估计,加权确定最终参数估计结果。该方法适用于响应变量是独立同分布或独立非同分布的情形,并适用于绝大多数数据缺失场景。经过理论推导及模拟研究发现,IPMW估计量在继承IPW估计量的优势上具有更稳健的性质。最后,将该方法应用于含有缺失数据的微观调查数据中,研究了经济较发达的准一线城市中等收入群体消费水平的影响因素,对比两种估计方法的估计结果,发现逆概率多重加权估计量的标准偏差更小,估计结果更稳健。 展开更多
关键词 线性分位回归 倾向得分 逆概率多重加权 随机缺失机制 模型平均
下载PDF
临床研究缺失数据多重填补敏感性分析方法 被引量:5
5
作者 闫世艳 郭中宁 +1 位作者 何丽云 刘保延 《世界科学技术-中医药现代化》 CSCD 北大核心 2020年第3期823-828,共6页
缺失数据是临床研究中不可避免的重要问题,若处理不当,容易引起研究结果的偏倚。通常根据数据缺失机制不同,选择不同的缺失数据处理方法。多重填补是目前较为常用和推荐的缺失值处理方法,与单一填补相比,考虑了缺失值的变异性,更为合理... 缺失数据是临床研究中不可避免的重要问题,若处理不当,容易引起研究结果的偏倚。通常根据数据缺失机制不同,选择不同的缺失数据处理方法。多重填补是目前较为常用和推荐的缺失值处理方法,与单一填补相比,考虑了缺失值的变异性,更为合理。但由于其基于随机缺失假定,而实际应用过程中,往往无法验证随机缺失的假定是否正确。因此,需要采用敏感性分析的方法,来验证随机缺失假定下多重填补分析结果的可靠性。目前,国内外对多重填补的敏感性分析并不重视,也缺乏相应的方法介绍。本研究介绍了一种较为简便的多重填补敏感性分析方法,并给出应用实例,以期为研究者提供参考和借鉴。 展开更多
关键词 缺失数据 多重填补 敏感性分析 随机缺失 非随机缺失
下载PDF
临床试验中缺失数据的预防与处理 被引量:6
6
作者 蒋志伟 李婵娟 +1 位作者 王陵 夏结来 《药学学报》 CAS CSCD 北大核心 2015年第11期1402-1407,共6页
缺失数据是临床试验中常见但又不可避免的一个问题。缺失数据不仅会降低试验的把握度,还会给试验结果带来偏倚。因此,一方面可以在统计分析中采用合适的缺失数据处理方法,另一方面要特别注意尽可能预防缺失数据的产生。其中,缺失数据的... 缺失数据是临床试验中常见但又不可避免的一个问题。缺失数据不仅会降低试验的把握度,还会给试验结果带来偏倚。因此,一方面可以在统计分析中采用合适的缺失数据处理方法,另一方面要特别注意尽可能预防缺失数据的产生。其中,缺失数据的预防应当是第一位的。从数据的角度来讲,首先,应在方案设计、数据采集和数据核查的各个阶段,采取合理措施提高受试者的依从性,减少不必要的数据缺失;其次,对于确认发生的数据缺失,应详细记录缺失数据产生的原因,这对于判定数据缺失的机制和选择合适的缺失数据处理方法 (例如,前一次观察数据向后结转、多重填补和重复测量数据混合效应模型等)具有非常重要的作用。 展开更多
关键词 缺失数据 前一次观察数据向后结转 多重填补 重复测量数据混合效应模型 随机缺失
原文传递
超高维缺失响应数据的特征筛选 被引量:2
7
作者 邹丽英 刘祎 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第1期147-156,共10页
本文提出了一种解决超高维缺失响应数据的特征筛选的新方法。首先,通过插补技术,补全缺失响应变量值,构造插补响应变量与协变量分布函数之间的距离相关系数,以此作为筛选指标进行特征筛选。所提出的筛选方法具有以下优势:第一,它是一个... 本文提出了一种解决超高维缺失响应数据的特征筛选的新方法。首先,通过插补技术,补全缺失响应变量值,构造插补响应变量与协变量分布函数之间的距离相关系数,以此作为筛选指标进行特征筛选。所提出的筛选方法具有以下优势:第一,它是一个非参数无模型假设的方法,可以处理变量间的非线性关系;第二,对协变量异常值稳健;第三,可以直接处理多维响应变量情形。然后,通过数值模拟展示了所提方法的性能与表现,并与现有的筛选方法进行了比较。最后,将所提方法应用于弥漫性大B细胞淋巴瘤的数据分析,分析结果表明基于该方法拟合后的模型具有更好的风险分离效果。 展开更多
关键词 超高维数据 随机缺失 特征筛选 稳健距离相关 无模型假设
下载PDF
基于函数型数据模型的PM2.5浓度与温度关系的实证分析
8
作者 陈宇庆 凌能祥 《大学数学》 2024年第4期1-6,共6页
考虑在函数型解释变量部分观测的情况下,用函数线性模型刻画与标量响应变量的关系.基于函数型主成分分析(Functional Principal Component Analysis,简称FPCA)实现了对缺失部分样本的重构,并通过实证分析,对一组北京市2010-2014年间统... 考虑在函数型解释变量部分观测的情况下,用函数线性模型刻画与标量响应变量的关系.基于函数型主成分分析(Functional Principal Component Analysis,简称FPCA)实现了对缺失部分样本的重构,并通过实证分析,对一组北京市2010-2014年间统计的包括部分观测PM2.5数值的气象数据,分析了PM2.5作为部分观测函数型解释变量对标量响应变量平均气温的影响,结果表明了该方法具有处理缺失函数数据的现实意义. 展开更多
关键词 函数线性模型 随机缺失 复合分位数回归 PM2.5
下载PDF
Smoothed Empirical Likelihood Inference for Nonlinear Quantile Regression Models with Missing Response
9
作者 Honghua Dong Xiuli Wang 《Open Journal of Applied Sciences》 2023年第6期921-933,共13页
In this paper, three smoothed empirical log-likelihood ratio functions for the parameters of nonlinear models with missing response are suggested. Under some regular conditions, the corresponding Wilks phenomena are o... In this paper, three smoothed empirical log-likelihood ratio functions for the parameters of nonlinear models with missing response are suggested. Under some regular conditions, the corresponding Wilks phenomena are obtained and the confidence regions for the parameter can be constructed easily. 展开更多
关键词 Nonlinear Model Quantile Regression Smoothed Empirical Likelihood missing at random
下载PDF
缺失数据下EV模型的渐近性质 被引量:1
10
作者 罗双华 玄海燕 王亚芹 《河南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第1期12-15,共4页
在缺失响应变量的不完全数据下,考虑半参数EV模型,利用二阶段估计的方法求出了EV模型中参数β和非参数g的估计量^βn,^gn.研究了它们的强相合性及渐近正态性.
关键词 半参数EV模型 强相合性 渐近正态性 缺失数据
下载PDF
删失指标随机缺失下部分线性模型的稳健估计及变量选择
11
作者 饶珍敏 王江峰 +1 位作者 陈定凯 王磊 《高校应用数学学报(A辑)》 北大核心 2023年第1期1-17,共17页
在删失指标随机缺失数据下,研究部分线性模型的复合分位数回归估计.基于校准和插值两种方法,根据三步法构建线性参数和非参数函数的CQR估计量.与此同时,利用自适应LASSO惩罚方法,对线性参数进行变量选择.在适当的假设下,证明了估计量的... 在删失指标随机缺失数据下,研究部分线性模型的复合分位数回归估计.基于校准和插值两种方法,根据三步法构建线性参数和非参数函数的CQR估计量.与此同时,利用自适应LASSO惩罚方法,对线性参数进行变量选择.在适当的假设下,证明了估计量的渐近正态性,受惩罚的估计量被证明具有oracle性质.最后通过模拟研究评估参数估计量和非参数函数估计量的性能. 展开更多
关键词 删失指标 随机缺失 复合分位数回归 部分线性回归模型 变量选择 渐近正态性
下载PDF
缺失数据下的半参数变系数模型的借补估计 被引量:3
12
作者 李志强 薛留根 《应用数学学报》 CSCD 北大核心 2009年第3期422-430,共9页
本文在响应变量随机缺失情形下讨论了半参数部分线性变系数模型的估计问题.首先采用局部线性方法估计系数函数。然后进一步估计常数系数.最后利用回归方法借补缺失的响应值,再用全部数据估计常数系数.本文进一步讨论了利用完整个体方法... 本文在响应变量随机缺失情形下讨论了半参数部分线性变系数模型的估计问题.首先采用局部线性方法估计系数函数。然后进一步估计常数系数.最后利用回归方法借补缺失的响应值,再用全部数据估计常数系数.本文进一步讨论了利用完整个体方法及借补方法求得的参数估计的渐近性质。并进行了模拟比较. 展开更多
关键词 随机缺失 半参变系数模型 局部线性估计 借补估计 渐近正态性
原文传递
协变量缺失情形下的逆概率加权众数回归估计
13
作者 林金官 景钰涵 韩忠成 《应用数学》 北大核心 2023年第2期562-570,共9页
数据缺失在实际应用中普遍存在,数据缺失会降低研究效率,导致参数估计有偏.在协变量随机缺失(MAR)的假定下,本文基于众数回归和逆概率加权估计方法对线性模型进行参数估计.该方法结合参数Logistic回归和非参数Nadaraya-Watson估计两种... 数据缺失在实际应用中普遍存在,数据缺失会降低研究效率,导致参数估计有偏.在协变量随机缺失(MAR)的假定下,本文基于众数回归和逆概率加权估计方法对线性模型进行参数估计.该方法结合参数Logistic回归和非参数Nadaraya-Watson估计两种倾向得分估计方法,分别构建IPWM-L估计量和IPWM-NW估计量.模拟研究和实例分析表明,众数回归模型比均值回归模型更具稳健性,逆概率加权众数(IPWM)估计方法在缺失数据下表现出了更好的拟合效果,与IPWM-L估计量相比,IPWM-NW估计量更稳健. 展开更多
关键词 随机缺失 众数回归 逆概率加权估计 倾向得分
下载PDF
响应变量随机缺失的相依函数型单指标模型的k近邻估计
14
作者 何文然 黄振生 《重庆工商大学学报(自然科学版)》 2023年第6期105-110,共6页
针对具有α混合结构的函数型时间序列数据,当响应变量随机缺失时,利用函数型单指标模型进行统计建模,并采用k近邻方法对模型中未知参数和未知函数进行估计,与经典核方法相比,其数据适用性更强,可以提高估计效率;通过数值模拟和厄尔尼诺... 针对具有α混合结构的函数型时间序列数据,当响应变量随机缺失时,利用函数型单指标模型进行统计建模,并采用k近邻方法对模型中未知参数和未知函数进行估计,与经典核方法相比,其数据适用性更强,可以提高估计效率;通过数值模拟和厄尔尼诺海平面温度数据,将k近邻方法和经典核方法进行比较,讨论k近邻方法与经典核方法对未知参数和未知函数的估计效果;从模拟结果可以看到:k近邻方法对未知参数和未知函数的估计精度以及随样本增加的改善效果要优于经典核方法,在真实数据分析中,k近邻对真实数据的精度拟合以及趋势拟合都表现优异;这些结果表明:在响应变量随机缺失的时间序列单指标模型中,采用k近邻方法对未知参数和未知函数进行估计,在精度上要优于经典核方法,同时在真实数据分析中,相比经典核方法,k近邻方法能更好地拟合数据。 展开更多
关键词 函数型单指标模型 α混合 k近邻估计 随机缺失
下载PDF
缺失数据下广义变系数模型的均值借补估计 被引量:2
15
作者 李志强 薛留根 《数理统计与管理》 CSSCI 北大核心 2007年第3期444-448,共5页
本文在响应变量随机缺失时,给出广义变系数模型中响应变量的2个均值拟似然借补估计。证明了它们具有渐近正态性,并进行了模拟研究。
关键词 广义变系数模型 随机缺失 局部线性拟似然估计 均值借补估计 渐f近正态性
下载PDF
基于缺失数据的Logistic模型的分布式优化方法 被引量:4
16
作者 潘莹丽 刘展 蔡雯 《统计与决策》 CSSCI 北大核心 2020年第22期23-26,共4页
随着互联网、物联网和云计算的高速发展,数据呈现"爆炸式"增长趋势,然而,各类信息的大量流通使我们无法获得完整的数据。如何快速、高效地处理缺失数据是我们面临的一大挑战。在大数据背景下,文章将数据分别存储在不同的子机... 随着互联网、物联网和云计算的高速发展,数据呈现"爆炸式"增长趋势,然而,各类信息的大量流通使我们无法获得完整的数据。如何快速、高效地处理缺失数据是我们面临的一大挑战。在大数据背景下,文章将数据分别存储在不同的子机器中,结合分布式优化方法,对协变量随机缺失的指示变量建立Logistic模型,并基于该模型提出一个替代似然函数来进行参数估计。模拟和实证研究结果表明,所提出的基于替代似然函数的分布式优化方法优于基于平均思想的OneShot方法。 展开更多
关键词 大数据 随机缺失 LOGISTIC模型 替代似然函数 分布式优化
下载PDF
随机缺失下阈值和灵敏性的联合估计
17
作者 程伟丽 吴莹 左卫兵 《河南师范大学学报(自然科学版)》 CAS 北大核心 2023年第3期97-104,共8页
在观察性试验研究中,某些受试者的诊断检验值可能缺失,若只用完全观测的数据可能会得到有偏的估计.考虑在诊断检验值随机缺失的情形下,基于灵敏性和特异性相等的对称点准则将逆概率加权和多重插补相结合建立起包含待估参数的非光滑估计... 在观察性试验研究中,某些受试者的诊断检验值可能缺失,若只用完全观测的数据可能会得到有偏的估计.考虑在诊断检验值随机缺失的情形下,基于灵敏性和特异性相等的对称点准则将逆概率加权和多重插补相结合建立起包含待估参数的非光滑估计方程,采用非参数两样本经验似然方法给出阈值和灵敏性的联合估计和置信域.在一定的正则条件下,建立了阈值和灵敏性联合估计的渐近性质.模拟研究证实所提方法的估计要优于其他方法的估计. 展开更多
关键词 随机缺失 阈值 灵敏性 对称点准则 经验似然
下载PDF
删失数据中删失指标随机缺失下回归函数的非参数估计(英文) 被引量:3
18
作者 王景乐 郑明 《应用概率统计》 CSCD 北大核心 2014年第5期476-490,共15页
本文在删失数据中删失指标随机缺失的情况下,运用非参数方法给出了回归函数的两种估计量,给出了估计量的一致收敛速度以及渐近分布,并进一步通过数值模拟验证了所提方法在有限样本下的性质.
关键词 核估计 随机删失 随机缺失 回归函数
下载PDF
Empilrical Likelihood for Non-parametric Regression Models with Missing Responses:Multiple Design Case 被引量:2
19
作者 Qing-zhu Lei Yong-song Qin 《Acta Mathematicae Applicatae Sinica》 SCIE CSCD 2011年第1期1-12,共12页
Empirical likelihood (EL) ratio statistic on θ=g(x) is constructed based on the inverse probability weighted imputation approach in a nonparametric regression model Y = g(x) +ε (x ∈ [0, 1]p) with fixed des... Empirical likelihood (EL) ratio statistic on θ=g(x) is constructed based on the inverse probability weighted imputation approach in a nonparametric regression model Y = g(x) +ε (x ∈ [0, 1]p) with fixed designs and missing responses, which asymptotically has X1^2 distribution. This result is used to obtain a EL based confidence interval on θ. 展开更多
关键词 Nonparametric regression empirical likelihood missing at random confidence interval
原文传递
协变量随机缺失下大规模Huber回归模型的分布式计算方法研究 被引量:2
20
作者 龚承刚 孙莉 +1 位作者 刘松林 潘莹丽 《数理统计与管理》 CSSCI 北大核心 2022年第6期1015-1028,共14页
大数据是一种海量、高增长率、多元化的信息资产,需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力。在大数据的背景下,为了消除异常值和缺失数据的影响,本文提出一种协变量随机缺失下大规模Huber回归模型的分布式计算... 大数据是一种海量、高增长率、多元化的信息资产,需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力。在大数据的背景下,为了消除异常值和缺失数据的影响,本文提出一种协变量随机缺失下大规模Huber回归模型的分布式计算方法。首先对随机缺失的协变量采用逆概率加权的方法进行处理,然后将大数据进行分布式存储,构造一个交互有效的替代损失函数,将替代损失函数的优化问题与ADMM算法相结合对未知参数进行估计。模拟和实证研究表明:在有限次主从机器之间交互次数下,提出的分布式计算方法得到的估计误差递减并趋于全局最优方法得到的估计误差,且比基于平均的OneShot方法的估计误差小。 展开更多
关键词 大数据 Huber回归 随机缺失 分布式计算方法 ADMM算法
原文传递
上一页 1 2 4 下一页 到第
使用帮助 返回顶部