期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
超高维数据特征筛选方法综述 被引量:7
1
作者 牛勇 李华鹏 +3 位作者 刘阳惠 熊世峰 於州 张日权 《应用概率统计》 CSCD 北大核心 2021年第1期69-110,共42页
随着数据收集和存储能力的大幅提高,超高维数据[9],即数据维数伴随着样本呈指数增长,频繁出现在许多科学邻域.此时,惩罚类变量选择方法普遍遭遇三个方面的挑战:计算的复杂性,统计的准确性以及算法的稳定性.Fan和Lv[9]首先提出超高维特... 随着数据收集和存储能力的大幅提高,超高维数据[9],即数据维数伴随着样本呈指数增长,频繁出现在许多科学邻域.此时,惩罚类变量选择方法普遍遭遇三个方面的挑战:计算的复杂性,统计的准确性以及算法的稳定性.Fan和Lv[9]首先提出超高维特征筛选的方法,并在近十多年取得大量研究成果,成为当今统计最热点的研究邻域.本文主要从带模型假设,包含参数、非参数半参数模型假定的筛选方法、无模型假设的筛选以及特殊数据的筛选方法四个角度来介绍超高维筛选相关工作,并简要探讨目前超高维筛选方法存在的问题以及未来可能的研究方向. 展开更多
关键词 超高维 特征筛选 可加模型 非参数独立筛选 确保筛选性质 线性模型 变量选择 组变量选择 充分降维 纵向数据 稀疏性
下载PDF
一种基于鞅差散度的纵向数据降维方法 被引量:2
2
作者 汪红霞 房丽云 +1 位作者 卜士杰 许佩蓉 《应用概率统计》 CSCD 北大核心 2023年第1期132-158,共27页
变量间的相关性和同一个体多次观测之间的相关性是纵向数据集两大固有特点,这两种相关性包含纵向数据的许多重要信息.本文借鉴矩阵值数据的降维思想,利用这两种相关性对纵向数据进行降维,提出一种基于鞅差散度的充分维数折叠降维方法.... 变量间的相关性和同一个体多次观测之间的相关性是纵向数据集两大固有特点,这两种相关性包含纵向数据的许多重要信息.本文借鉴矩阵值数据的降维思想,利用这两种相关性对纵向数据进行降维,提出一种基于鞅差散度的充分维数折叠降维方法.理论上,该降维准则在总体形式下能找到中心均值维数折叠子空间,实现时间和变量两个维度的同时降维,基于其样本形式得到的中心均值维数折叠子空间的估计具有√n相合性.算法上,通过引入Kronecker乘积假定,将降维过程转化为带约束的低维优化问题,从而可以用成熟的非线性优化算法快速求解.进一步地,本文提出一种相合的BIC准则自适应地确定结构维数.相较于文献中的降维方法,数值模拟表明所提方法不仅能快速实现,而且在中心均值维数折叠子空间的估计和结构维数的确定上有更高的准确度.最后,本文通过原发性胆汁性肝硬化临床数据的实证分析验证了所提方法的有效性. 展开更多
关键词 纵向数据 鞅差散度 充分性降维 维数折叠 中心均值子空间
下载PDF
Sliced Average Variance Estimation for Tensor Data
3
作者 Chuan-quan LI Pei-wen XIAO +1 位作者 Chao YING Xiao-hui LIU 《Acta Mathematicae Applicatae Sinica》 SCIE CSCD 2024年第3期630-655,共26页
Tensor data have been widely used in many fields,e.g.,modern biomedical imaging,chemometrics,and economics,but often suffer from some common issues as in high dimensional statistics.How to find their low-dimensional l... Tensor data have been widely used in many fields,e.g.,modern biomedical imaging,chemometrics,and economics,but often suffer from some common issues as in high dimensional statistics.How to find their low-dimensional latent structure has been of great interest for statisticians.To this end,we develop two efficient tensor sufficient dimension reduction methods based on the sliced average variance estimation(SAVE)to estimate the corresponding dimension reduction subspaces.The first one,entitled tensor sliced average variance estimation(TSAVE),works well when the response is discrete or takes finite values,but is not■consistent for continuous response;the second one,named bias-correction tensor sliced average variance estimation(CTSAVE),is a de-biased version of the TSAVE method.The asymptotic properties of both methods are derived under mild conditions.Simulations and real data examples are also provided to show the superiority of the efficiency of the developed methods. 展开更多
关键词 tensor data sliced average variance estimation sufficient dimension reduction central subspace
原文传递
基于充分降维的半参数不可忽略无响应光滑分位回归
4
作者 郭婧璇 田茂再 《系统科学与数学》 CSCD 北大核心 2024年第2期471-507,共37页
文章在响应变量不可忽略缺失假定下,考察了分位回归的估计问题.文章首先建立半参数指数倾斜响应模型,为克服不可忽略缺失数据的识别性困难,避免多元非参数核估计造成的维数灾难,文章基于充分降维假设,利用数据驱动方法构造缺失工具变量... 文章在响应变量不可忽略缺失假定下,考察了分位回归的估计问题.文章首先建立半参数指数倾斜响应模型,为克服不可忽略缺失数据的识别性困难,避免多元非参数核估计造成的维数灾难,文章基于充分降维假设,利用数据驱动方法构造缺失工具变量,得到倾斜参数的轮廓两步广义矩估计量和非参数部分的降维核估计量;基于上述估计量建立逆概率加权(IPW)、核辅助估计方程插补(EEI)和增强逆概率加权(AIPW)三种分位回归估计方程,并利用卷积平滑分位损失函数代替经典的分位损失函数克服检查函数不平滑造成的理论和计算困难,回归系数的估计量由经验似然方法得到.理论研究证明了三种估计量等价的渐近正态性和相应对数经验似然比函数的渐近χ2加权和性质.数值模拟比较了上述估计量的有限样本性能.最后对HIV-CD4实际数据进行分析. 展开更多
关键词 不可忽略缺失 半参数 充分降维 分位回归 光滑经验似然
原文传递
大规模数据下基于充分降维的Leverage重要性抽样方法 被引量:5
5
作者 秦磊 王奕丹 苏治 《统计研究》 CSSCI 北大核心 2020年第3期114-128,共15页
随着信息技术的飞速发展,大规模数据在短时间内搜集并储存下来,为分析决策提供了巨大的信息量,也给统计建模带来了一定难度。对于样本容量大、变量个数少的数据,Leverage重要性抽样是一个简便可行的方法。本文发现,该方法中度量样本重... 随着信息技术的飞速发展,大规模数据在短时间内搜集并储存下来,为分析决策提供了巨大的信息量,也给统计建模带来了一定难度。对于样本容量大、变量个数少的数据,Leverage重要性抽样是一个简便可行的方法。本文发现,该方法中度量样本重要性的Leverage分数与因变量无关,而且在维度较大的情形下对样本没有区分程度,使得估计结果较差。为了同时考虑因变量和维度的影响,本文提出了基于充分降维的Leverage重要性抽样方法。该方法以不损失信息为前提,在充分降维的空间内重新计算Leverage分数,使得抽样更具有代表性。模拟数据分析显示,在样本容量较大的复杂数据中,相比于原始的Leverage重要性抽样方法,本文提出的方法可以降低估计的均方误差。三个实际数据也证实了该方法的可行性和有效性。 展开更多
关键词 大规模数据 Leverage分数 重要性抽样 充分降维
下载PDF
充分降维的稳健性改进与比较研究 被引量:1
6
作者 王丙参 魏艳华 张宝学 《系统科学与数学》 CSCD 北大核心 2023年第9期2388-2403,共16页
探讨充分降维算法SIR、SAVE、CP-SAVE的适用范围,从两种角度对充分降维算法进行稳健改进:构建SIR与SAVE混合算法,从而融合二者优点,以适应更广数据类型与连接函数;当观测数据受污染时,利用软修剪方法估计的稳健均值、协方差代替传统估计... 探讨充分降维算法SIR、SAVE、CP-SAVE的适用范围,从两种角度对充分降维算法进行稳健改进:构建SIR与SAVE混合算法,从而融合二者优点,以适应更广数据类型与连接函数;当观测数据受污染时,利用软修剪方法估计的稳健均值、协方差代替传统估计,构建稳健充分降维算法.数值实验显示:在连接函数关于自变量均值对称时,一阶算法SIR的降维效果较差,但它对自变量分布、切片数较稳健;相比SIR,二阶算法SAVE、CP-SAVE的要求更苛刻,对切片数、自变量分布都敏感,但可找到SIR探索不到的方向;当自变量为厚尾分布时,CP-SAVE通常优于SAVE;SIR与SAVE混合算法对自变量分布、连接函数的适应性更好,在多种场合下可改进降维效果;软修剪稳健估计对截断参数稳健,建议截断参数略大于异常点比例;相对稳健SAVE,稳健SIR只需要在切片内估计稳健均值,适应条件宽松,更符合实际,推荐优先使用. 展开更多
关键词 充分降维 切片逆回归 切片平均方差估计 混合算法 稳健估计
原文传递
大数据下张量充分降维方法及其应用研究 被引量:4
7
作者 马少沛 孙庆慧 +1 位作者 武雅萱 田茂再 《统计研究》 CSSCI 北大核心 2021年第2期114-134,共21页
在大数据时代,金融学、基因组学和图像处理等领域产生了大量的张量数据。Zhong等(2015)提出了张量充分降维方法,并给出了处理二阶张量的序列迭代算法。鉴于高阶张量在实际生活中的广泛应用,本文将Zhong等(2015)的算法推广到高阶,以三阶... 在大数据时代,金融学、基因组学和图像处理等领域产生了大量的张量数据。Zhong等(2015)提出了张量充分降维方法,并给出了处理二阶张量的序列迭代算法。鉴于高阶张量在实际生活中的广泛应用,本文将Zhong等(2015)的算法推广到高阶,以三阶张量为例,提出了两种不同的算法:结构转换算法和结构保持算法。两种算法都能够在不同程度上保持张量原有结构信息,同时有效降低变量维度和计算复杂度,避免协方差矩阵奇异的问题。将两种算法应用于人像彩图的分类识别,以二维和三维点图等形式直观展现了算法分类结果。将本文的结构保持算法与K-means聚类方法、t-SNE非线性降维方法、多维主成分分析、多维判别分析和张量切片逆回归共五种方法进行对比,结果表明本文所提方法在分类精度方面有明显优势,因此在图像识别及相关应用领域具有广阔的发展前景。 展开更多
关键词 张量 充分降维 迭代算法 图像识别
下载PDF
高维支持向量机的一些新发展
8
作者 史宏炜 饶昊宸 郭旭 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期319-327,共9页
对高维支持向量机(SVM)的一些新发展如非凸惩罚SVM,L_(1)范数SVM的误差界以及SVM在充分性降维中的应用进行了介绍;通过数值模拟和实例分析,展示了这些新方法在有限样本时的表现;讨论了一些可能的方向和问题.
关键词 二元响应变量 支持向量机 惩罚估计 误差界 变量选择 充分性降维
下载PDF
高维附加信息下的商业医疗保险费用评估模型和方法 被引量:3
9
作者 赵晓兵 王伟伟 《财经论丛》 CSSCI 北大核心 2013年第4期58-65,共8页
医疗保险费用的评估是商业医疗费用管理中的重要环节,附加信息在医疗费用的远期预测中具有重要作用。但是,如果费用数据中含有高维的附加信息,传统的方法就不再适用。因此,本文提出一个新模型来拟合含有大范围附件信息的医疗费用,并用... 医疗保险费用的评估是商业医疗费用管理中的重要环节,附加信息在医疗费用的远期预测中具有重要作用。但是,如果费用数据中含有高维的附加信息,传统的方法就不再适用。因此,本文提出一个新模型来拟合含有大范围附件信息的医疗费用,并用两步法估计医疗费用数据。首先,用充分降维方法将高维协变量降为低维,得到中心降维子空间的基方向和结构维数后,再利用局部回归方法去估计医疗费用曲线,最后通过模拟和实例分析来评价该模型和方法的可行性。 展开更多
关键词 医疗保险 广义线性模型 充分降维 局部回归
下载PDF
基于矩生成函数的多元响应降维子空间估计 被引量:3
10
作者 甘胜进 游文杰 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2017年第1期43-47,共5页
提出一类新的估计多元响应降维子空间方法,即基于矩生成函数(GF)、绝对值矩生成函数(G-A)与矩生成函数海塞主方向方法(G-PHD).给出了该方法估计量的相合性以及渐近性性质,并进行了实例模拟.
关键词 充分降维 切片逆回归 矩生成函数 绝对值矩生成函数 海塞主方向
下载PDF
基于切片逆回归的稳健降维方法 被引量:2
11
作者 李向杰 吴燕燕 张景肖 《统计研究》 CSSCI 北大核心 2018年第7期115-124,共10页
经典的充分降维方法对解释变量存在异常值或者当其是厚尾分布时效果较差,为此,经过对充分降维理论中加权与累积切片的分析研究,本文提出了一种将两者有机结合的稳健降维方法——累积加权切片逆回归法(CWSIR)。该方法对自变量存在异常值... 经典的充分降维方法对解释变量存在异常值或者当其是厚尾分布时效果较差,为此,经过对充分降维理论中加权与累积切片的分析研究,本文提出了一种将两者有机结合的稳健降维方法——累积加权切片逆回归法(CWSIR)。该方法对自变量存在异常值以及小样本情况下表现比较稳健,并且有效避免了对切片数目的选择。数值模拟结果显示CWSIR要优于传统的切片逆回归(SIR)、累积切片估计(CUME)、基于等高线的切片逆回归估计(CPSIR)、加权典则相关估计(WCANCOR)、切片逆中位数估计(SIME)、加权逆回归估计(WIRE)等方法。最后,通过对某视频网站真实数据的分析也验证了CWSIR的有效性。 展开更多
关键词 充分降维 切面逆回归 加权 累积切片估计
下载PDF
一类多元响应降维子空间的估计及其应用 被引量:2
12
作者 甘胜进 涂开仁 游文杰 《统计与信息论坛》 CSSCI 北大核心 2017年第10期18-23,共6页
在高维空间中进行统计建模通常会碰到"维数祸根"问题,解决办法之一是降维,充分降维是一种有效的降维方法。针对多维响应降维子空间提出一类矩生成函数估计方法及其改进估计量,并给出该类方法估计量的大样本性质:相合性、渐近... 在高维空间中进行统计建模通常会碰到"维数祸根"问题,解决办法之一是降维,充分降维是一种有效的降维方法。针对多维响应降维子空间提出一类矩生成函数估计方法及其改进估计量,并给出该类方法估计量的大样本性质:相合性、渐近正态性。通过随机模拟与实例分析,表明改进估计量估计效果有较大幅度提高。 展开更多
关键词 充分降维 切片逆回归 傅里叶变换估计 矩生成函数
下载PDF
Dimension reduction based on weighted variance estimate
13
作者 ZHAO JunLong1 & XU XingZhong2 1 Department of Mathematics, Beihang University Laboratory of Mathematics, Information and Behavior of the Ministry of Education, Beijing 100083, China 2 Department of Mathematics, Beijing Institute of Technology, Beijing 100081, China 《Science China Mathematics》 SCIE 2009年第3期539-560,共22页
In this paper, we propose a new estimate for dimension reduction, called the weighted variance estimate (WVE), which includes Sliced Average Variance Estimate (SAVE) as a special case. Bootstrap method is used to sele... In this paper, we propose a new estimate for dimension reduction, called the weighted variance estimate (WVE), which includes Sliced Average Variance Estimate (SAVE) as a special case. Bootstrap method is used to select the best estimate from the WVE and to estimate the structure dimension. And this selected best estimate usually performs better than the existing methods such as Sliced Inverse Regression (SIR), SAVE, etc. Many methods such as SIR, SAVE, etc. usually put the same weight on each observation to estimate central subspace (CS). By introducing a weight function, WVE puts different weights on different observations according to distance of observations from CS. The weight function makes WVE have very good performance in general and complicated situations, for example, the distribution of regressor deviating severely from elliptical distribution which is the base of many methods, such as SIR, etc. And compared with many existing methods, WVE is insensitive to the distribution of the regressor. The consistency of the WVE is established. Simulations to compare the performances of WVE with other existing methods confirm the advantage of WVE. 展开更多
关键词 central subspace contour regression sliced average variance estimate sliced inverse regression sufficient dimension reduction weight function 62G08 62H05
原文传递
Stable direction recovery in single-index models with a diverging number of predictors
14
作者 Zhu LiPing Zhu LiXing 《Science China Mathematics》 SCIE 2010年第7期1814-1823,共10页
Large dimensional predictors are often introduced in regressions to attenuate the possible modeling bias. We consider the stable direction recovery in single-index models in which we solely assume the response Y is in... Large dimensional predictors are often introduced in regressions to attenuate the possible modeling bias. We consider the stable direction recovery in single-index models in which we solely assume the response Y is independent of the diverging dimensional predictors X when βτ 0 X is given, where β 0 is a p n × 1 vector, and p n →∞ as the sample size n →∞. We first explore sufficient conditions under which the least squares estimation β n0 recovers the direction β 0 consistently even when p n = o(√ n). To enhance the model interpretability by excluding irrelevant predictors in regressions, we suggest an e1-regularization algorithm with a quadratic constraint on magnitude of least squares residuals to search for a sparse estimation of β 0 . Not only can the solution β n of e1-regularization recover β 0 consistently, it also produces sufficiently sparse estimators which enable us to select "important" predictors to facilitate the model interpretation while maintaining the prediction accuracy. Further analysis by simulations and an application to the car price data suggest that our proposed estimation procedures have good finite-sample performance and are computationally efficient. 展开更多
关键词 E1 -minimization diverging parameters inverse regression RESTRICTED orthonormality SPARSITY sufficient dimension reduction
原文传递
A selective overview of sparse sufficient dimension reduction 被引量:1
15
作者 Lu Li Xuerong Meggie Wen Zhou Yu 《Statistical Theory and Related Fields》 2020年第2期121-133,共13页
High-dimensional data analysis has been a challenging issue in statistics.Sufficient dimension reduction aims to reduce the dimension of the predictors by replacing the original predictors with a minimal set of their ... High-dimensional data analysis has been a challenging issue in statistics.Sufficient dimension reduction aims to reduce the dimension of the predictors by replacing the original predictors with a minimal set of their linear combinations without loss of information.However,the estimated linear combinations generally consist of all of the variables,making it difficult to interpret.To circumvent this difficulty,sparse sufficient dimension reduction methods were proposed to conduct model-free variable selection or screening within the framework of sufficient dimension reduction.Wereview the current literature of sparse sufficient dimension reduction and do some further investigation in this paper. 展开更多
关键词 Minimax rate sparse sufficient dimension reduction variable selection variable screening
原文传递
Sufficient dimension reduction in the presence of controlling variables
16
作者 Guoliang Fan Liping Zhu 《Science China Mathematics》 SCIE CSCD 2022年第9期1975-1996,共22页
We are concerned with partial dimension reduction for the conditional mean function in the presence of controlling variables.We suggest a profile least squares approach to perform partial dimension reduction for a gen... We are concerned with partial dimension reduction for the conditional mean function in the presence of controlling variables.We suggest a profile least squares approach to perform partial dimension reduction for a general class of semi-parametric models.The asymptotic properties of the resulting estimates for the central partial mean subspace and the mean function are provided.In addition,a Wald-type test is proposed to evaluate a linear hypothesis of the central partial mean subspace,and a generalized likelihood ratio test is constructed to check whether the nonparametric mean function has a specific parametric form.These tests can be used to evaluate whether there exist interactions between the covariates and the controlling variables,and if any,in what form.A Bayesian information criterion(BIC)-type criterion is applied to determine the structural dimension of the central partial mean subspace.Its consistency is also established.Numerical studies through simulations and real data examples are conducted to demonstrate the power and utility of the proposed semi-parametric approaches. 展开更多
关键词 central partial mean subspace controlling variable hypothesis test semi-parametric regression sufficient dimension reduction
原文传递
对称阵稀疏主成分分析及其在充分降维问题中的应用 被引量:1
17
作者 邵伟 祝丽萍 +1 位作者 刘福国 王秋平 《山东大学学报(理学版)》 CAS CSCD 北大核心 2012年第4期116-120,126,共6页
讨论了对称阵的稀疏主成分分析,并给出估计的渐近结果。基于蒙特卡洛分析的模拟实验展示了在充分降维中稀疏主成分的优势。
关键词 对称阵 主成分分析 稀疏主成分分析 充分降维 蒙特卡洛 LASSO
原文传递
基于区间Ⅰ型删失数据的切片逆回归
18
作者 董小刚 赵立妍 +1 位作者 刘新蕊 王纯杰 《吉林师范大学学报(自然科学版)》 2022年第2期41-47,共7页
通过构造权重矩阵,将切片逆回归方法推广至区间Ⅰ型删失数据的变量选择中.在不假定具体模型的情况下,运用切片逆回归方法筛选出重要协变量,避免了维数灾难问题.且该方法具有容易实施、计算方便的特点.研究表明该方法可以有效选取重要变... 通过构造权重矩阵,将切片逆回归方法推广至区间Ⅰ型删失数据的变量选择中.在不假定具体模型的情况下,运用切片逆回归方法筛选出重要协变量,避免了维数灾难问题.且该方法具有容易实施、计算方便的特点.研究表明该方法可以有效选取重要变量.进而可以将该方法应用于大鼠胆管增生数据的分析中. 展开更多
关键词 区间Ⅰ型删失数据 切片逆回归 充分降维
下载PDF
Quantile treatment effect estimation with dimension reduction 被引量:1
19
作者 Ying Zhang Lei Wang +1 位作者 Menggang Yu Jun Shao 《Statistical Theory and Related Fields》 2020年第2期202-213,共12页
Quantile treatment effects can be important causal estimands in evaluation of biomedical treatments or interventions for health outcomes such as medical cost and utilisation.We consider their estimation in observation... Quantile treatment effects can be important causal estimands in evaluation of biomedical treatments or interventions for health outcomes such as medical cost and utilisation.We consider their estimation in observational studies with many possible covariates under the assumption that treatment and potential outcomes are independent conditional on all covariates.To obtain valid and efficient treatment effect estimators,we replace the set of all covariates by lower dimensional sets for estimation of the quantiles of potential outcomes.These lower dimensional sets are obtained using sufficient dimension reduction tools and are outcome specific.We justify our choice from efficiency point of view.We prove the asymptotic normality of our estimators and our theory is complemented by some simulation results and an application to data from the University of Wisconsin Health Accountable Care Organization. 展开更多
关键词 CAUSALITY efficiency bound propensity score quantile treatment effect sufficient dimension reduction
原文传递
On a New Hybrid Estimator for the Central Mean Space 被引量:1
20
作者 XIA Qi DONG Yuexiao 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2017年第1期111-121,共11页
Existing estimators of the central mean space are known to have uneven performances across different types of link functions. By combining the strength of the ordinary least squares and the principal Hessian direction... Existing estimators of the central mean space are known to have uneven performances across different types of link functions. By combining the strength of the ordinary least squares and the principal Hessian directions, the authors propose a new hybrid estimator that successfully recovers the central mean space for a wide range of link functions. Based on the new hybrid estimator, the authors further study the order determination procedure and the marginal coordinate test. The superior performance of the hybrid estimator over existing methods is demonstrated in extensive simulation studies. 展开更多
关键词 Marginal coordinate test order determination ordinary least squares principal Hessiandirections sufficient dimension reduction.
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部