期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于logistic回归模型的大数据分布式两步子抽样算法
被引量:
6
1
作者
李莉莉
杜梅慧
张璇
《数理统计与管理》
CSSCI
北大核心
2022年第5期858-866,共9页
随着大数据时代的到来,分布式存储系统被广泛应用,这使得数据的分析面临较大的挑战。本文主要基于文[1]提出的两步子抽样算法思想,提出分布式两步子抽样算法,利用该算法得到的参数估计量具有一致性和渐近正态性。采用数值模拟及真实数...
随着大数据时代的到来,分布式存储系统被广泛应用,这使得数据的分析面临较大的挑战。本文主要基于文[1]提出的两步子抽样算法思想,提出分布式两步子抽样算法,利用该算法得到的参数估计量具有一致性和渐近正态性。采用数值模拟及真实数据预测,进一步对算法进行评估,结果表明,分布式两步子抽样算法与简单随机抽样算法相比精度更高,与全样本相比,在保证精度损失很小的基础上,节约了CPU运行时间,提高了算法效率。
展开更多
关键词
大数据
分布式存储
两
步子
抽样
算法
LOGISTIC回归模型
原文传递
基于两步子抽样算法的多目标抽样统计推断研究
2
作者
李莉莉
周楷贺
杜梅慧
《数理统计与管理》
CSSCI
北大核心
2023年第6期1037-1060,共24页
针对海量数据,子抽样算法是当前一种流行的简化计算和降低计算成本的方法。现阶段的研究主要集中于单目标变量的估计上。多目标抽样也是现实生活中经常遇到的问题。本文提出基于广义线性模型,多目标抽样的均值两步子抽样算法。两步子抽...
针对海量数据,子抽样算法是当前一种流行的简化计算和降低计算成本的方法。现阶段的研究主要集中于单目标变量的估计上。多目标抽样也是现实生活中经常遇到的问题。本文提出基于广义线性模型,多目标抽样的均值两步子抽样算法。两步子抽样算法是Wang等(2018)[1]提出的基于L-最优和A-最优的思想,确定每个抽样单元的入样概率。本文在此基础上,定义多目标抽样的各单元的入样概率,并推导模型参数估计量的渐近性质,最后用模拟数据和实际例子对均值两步子抽样算法和多目标两步子抽样方法进行比较。结果表明,在样本量相同时,A-最优准则下均值两步子抽样算法在估计精度上优于基于两步子抽样算法的MPPS抽样和L-最优准则下均值多目标两步子抽样算法。在计算效率上也较全样本估计有显著的提高,节约了计算时间。
展开更多
关键词
大数据
两
步子
抽样
算法
广义线性模型
原文传递
基于主成分分析法的两步子抽样算法及应用研究
3
作者
王玉
李莉莉
周楷贺
《青岛大学学报(自然科学版)》
CAS
2023年第4期13-17,共5页
针对大数据中高维变量多重共线性问题,结合Logistic模型提出两种基于主成分分析法的两步子抽样算法,分别为基于A-最优准则的最小均方误差(minimum Mean Square Error,mMSE)抽样和基于L-最优准则的最小方差协方差(minimum Variance covar...
针对大数据中高维变量多重共线性问题,结合Logistic模型提出两种基于主成分分析法的两步子抽样算法,分别为基于A-最优准则的最小均方误差(minimum Mean Square Error,mMSE)抽样和基于L-最优准则的最小方差协方差(minimum Variance covariance,mVc)抽样。实证结果表明,相较于随机抽样,mMSE抽样和mVc抽样能大幅降低模型参数估计的均方误差,提升模型的查准率、召回率、F1分数、特异度等分类评价指标。
展开更多
关键词
大数据
主成分分析法
两
步子
抽样
算法
信用风险预测
下载PDF
职称材料
题名
基于logistic回归模型的大数据分布式两步子抽样算法
被引量:
6
1
作者
李莉莉
杜梅慧
张璇
机构
青岛大学经济学院
南开大学经济学院
中国标准化研究院
出处
《数理统计与管理》
CSSCI
北大核心
2022年第5期858-866,共9页
基金
国家社科基金项目(2019BTJ028)。
文摘
随着大数据时代的到来,分布式存储系统被广泛应用,这使得数据的分析面临较大的挑战。本文主要基于文[1]提出的两步子抽样算法思想,提出分布式两步子抽样算法,利用该算法得到的参数估计量具有一致性和渐近正态性。采用数值模拟及真实数据预测,进一步对算法进行评估,结果表明,分布式两步子抽样算法与简单随机抽样算法相比精度更高,与全样本相比,在保证精度损失很小的基础上,节约了CPU运行时间,提高了算法效率。
关键词
大数据
分布式存储
两
步子
抽样
算法
LOGISTIC回归模型
Keywords
big data
distributed storage
two-step subsampling algorithm
logistic regression model
分类号
O212 [理学—概率论与数理统计]
原文传递
题名
基于两步子抽样算法的多目标抽样统计推断研究
2
作者
李莉莉
周楷贺
杜梅慧
机构
青岛大学经济学院
南开大学数量经济研究所
出处
《数理统计与管理》
CSSCI
北大核心
2023年第6期1037-1060,共24页
基金
国家社科基金项目(2019BTJ028)。
文摘
针对海量数据,子抽样算法是当前一种流行的简化计算和降低计算成本的方法。现阶段的研究主要集中于单目标变量的估计上。多目标抽样也是现实生活中经常遇到的问题。本文提出基于广义线性模型,多目标抽样的均值两步子抽样算法。两步子抽样算法是Wang等(2018)[1]提出的基于L-最优和A-最优的思想,确定每个抽样单元的入样概率。本文在此基础上,定义多目标抽样的各单元的入样概率,并推导模型参数估计量的渐近性质,最后用模拟数据和实际例子对均值两步子抽样算法和多目标两步子抽样方法进行比较。结果表明,在样本量相同时,A-最优准则下均值两步子抽样算法在估计精度上优于基于两步子抽样算法的MPPS抽样和L-最优准则下均值多目标两步子抽样算法。在计算效率上也较全样本估计有显著的提高,节约了计算时间。
关键词
大数据
两
步子
抽样
算法
广义线性模型
Keywords
big data
two-step subsampling algorithm
generalized linear model
分类号
O212.2 [理学—概率论与数理统计]
原文传递
题名
基于主成分分析法的两步子抽样算法及应用研究
3
作者
王玉
李莉莉
周楷贺
机构
青岛大学经济学院
出处
《青岛大学学报(自然科学版)》
CAS
2023年第4期13-17,共5页
基金
国家社科基金(批准号:2019BTJ028)资助
山东省金融应用重点研究项目(批准号:2020-JRZZ-03)资助。
文摘
针对大数据中高维变量多重共线性问题,结合Logistic模型提出两种基于主成分分析法的两步子抽样算法,分别为基于A-最优准则的最小均方误差(minimum Mean Square Error,mMSE)抽样和基于L-最优准则的最小方差协方差(minimum Variance covariance,mVc)抽样。实证结果表明,相较于随机抽样,mMSE抽样和mVc抽样能大幅降低模型参数估计的均方误差,提升模型的查准率、召回率、F1分数、特异度等分类评价指标。
关键词
大数据
主成分分析法
两
步子
抽样
算法
信用风险预测
Keywords
big data
principal component analysis
two-step subsampling algorithm
credit risk prediction
分类号
O212.2 [理学—概率论与数理统计]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于logistic回归模型的大数据分布式两步子抽样算法
李莉莉
杜梅慧
张璇
《数理统计与管理》
CSSCI
北大核心
2022
6
原文传递
2
基于两步子抽样算法的多目标抽样统计推断研究
李莉莉
周楷贺
杜梅慧
《数理统计与管理》
CSSCI
北大核心
2023
0
原文传递
3
基于主成分分析法的两步子抽样算法及应用研究
王玉
李莉莉
周楷贺
《青岛大学学报(自然科学版)》
CAS
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部