期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
多重填补法在任意缺失随访资料中的应用 被引量:10
1
作者 邹莉玲 吴娟丽 李觉 《中国卫生统计》 CSCD 北大核心 2015年第2期221-223,共3页
目的比较任意缺失模式下不同填补方法在随访资料缺失数据中的多重填补效果。方法结合我国外周动脉疾病患者踝臂指数(ankle brachial index,ABI)等基线及六年随访数据,通过SAS9.3/MI过程,分别采用马尔可夫链蒙特卡罗(markov chain monte ... 目的比较任意缺失模式下不同填补方法在随访资料缺失数据中的多重填补效果。方法结合我国外周动脉疾病患者踝臂指数(ankle brachial index,ABI)等基线及六年随访数据,通过SAS9.3/MI过程,分别采用马尔可夫链蒙特卡罗(markov chain monte carlo,MCMC)、回归分析、判别分析(discriminant analysis)和logistic回归等方法,实现生存时间、生存结局变量缺失值的填补,并作综合分析及比较。结果得到不同填补方法、不同填补次数多重填补后的生存时间和结局变量完全数据集,并对总体参数作出估计和统计,计算各次填补效率等综合评价指标。结论对于多次随访资料中的连续性变量生存时间,采用回归分析方法填补效率较高,填补效率随着填补次数增加而增大,对于缺失率小的变量填补效率更高。 展开更多
关键词 多重填补mi 任意缺失模式 缺失数据 随访研究
下载PDF
MI和SVM算法在煤与瓦斯突出预测中的应用 被引量:21
2
作者 郑晓亮 来文豪 薛生 《中国安全科学学报》 CAS CSCD 北大核心 2021年第1期75-80,共6页
为解决能用于煤与瓦斯突出预测模型的真实事故训练数据量小、数据集缺失严重的问题,提出采用数据挖掘多重填补(MI)算法填补事故数据中缺失参数,增大可用数据集,并将填补后的数据用于支持向量机(SVM)预测模型的训练与测试,选取K最近邻(K... 为解决能用于煤与瓦斯突出预测模型的真实事故训练数据量小、数据集缺失严重的问题,提出采用数据挖掘多重填补(MI)算法填补事故数据中缺失参数,增大可用数据集,并将填补后的数据用于支持向量机(SVM)预测模型的训练与测试,选取K最近邻(KNN)算法与SVM进行对比。结果表明:SVM数据填补前后的平均识别率分别为88.37%和88.87%,事故数据的识别率分别79.71%和91.27%;KNN算法在数据填补前后,平均识别率分别为87.59%和88.37%,事故识别率分别为70.4%和84.23%;可见:MI对平均识别率的提升作用不大,对事故识别率的提升作用显著,可提高煤与瓦斯突出事故预测率,数据填补后SVM算法比KNN算法的事故识别率高。 展开更多
关键词 多重填补(mi) 支持向量机(SVM) 煤与瓦斯突出 预测 事故识别率
下载PDF
基于数据填补-机器学习的煤与瓦斯突出预测效果研究 被引量:5
3
作者 陈利成 陈建宏 《中国安全生产科学技术》 CAS CSCD 北大核心 2022年第9期69-74,共6页
为解决煤与瓦斯突出事故数据集少,数据缺失严重的问题,提出将多重插补(MI)和随机森林填补(MF)应用于填补缺失参数,并将填补前和填补后的数据输入SVM,ELM,RF 3种机器学习算法进行训练,构建9种耦合模型。采用总体准确率、局部准确率、运... 为解决煤与瓦斯突出事故数据集少,数据缺失严重的问题,提出将多重插补(MI)和随机森林填补(MF)应用于填补缺失参数,并将填补前和填补后的数据输入SVM,ELM,RF 3种机器学习算法进行训练,构建9种耦合模型。采用总体准确率、局部准确率、运行时间这3种指标评价模型性能。研究结果表明:采用数据填补算法后,由于训练样本增大,煤与瓦斯突出事故预测的总体准确率提高,运行时间增长;MF-RF模型的总体准确率与事故预测准确率最高,分别为97.90%和98.93%;RD-ELM模型的运行时间最短,为0.24 s;多重插补使得煤与瓦斯突出预测的总体准确率提高0.98%~1.11%,随机森林填补总体准确率提高5.13%~7.50%,随机森林填补的效果好于多重插补。 展开更多
关键词 煤与瓦斯突出 预测 多重插补(mi) 随机森林填补(MF) 机器学习
下载PDF
基于Markov Chain Monte Carlo模型对医院出院病人调查表数据缺失的填补与分析 被引量:2
4
作者 魏海建 时峰 魏健 《数理统计与管理》 CSSCI 北大核心 2010年第5期931-936,共6页
目的对医院出院病人调查表普遍存在的数据缺失进行填补与分析,以保证统计调查表的质量,为医院以及上级卫生部门了解现状,进行预策和决策提供技术支持和质量保证。方法运用SAS9.1,采用多重填补方法Markov Chain Monte Carlo(MCMC)模型对... 目的对医院出院病人调查表普遍存在的数据缺失进行填补与分析,以保证统计调查表的质量,为医院以及上级卫生部门了解现状,进行预策和决策提供技术支持和质量保证。方法运用SAS9.1,采用多重填补方法Markov Chain Monte Carlo(MCMC)模型对缺失数据进行多次填补并综合分析。结果MCMC填补10次的结果最优。结论(Multiple Imputation)MI方法在解决医院出院病人调查表数据缺失时有优势,发挥空间较大,且填补效率较高。 展开更多
关键词 医院出院病人调查表 缺失值 多重填补 MARKOV CHAIN MONTE Carlo
原文传递
数据挖掘中基于核的多重填补的一种新算法 被引量:1
5
作者 苏毅娟 《计算机工程与应用》 CSCD 北大核心 2008年第31期156-158,172,共4页
在数据挖掘预处理中,数据缺失是最为常见的数据预处理问题之一。通常对所要挖掘的数据分布形式没有任何先验知识。在这种情况下,非参回归分析方法可以为数据缺失的处理提供一种效果很好的解决途径。据此,在缺失机制是随机缺失(Missing a... 在数据挖掘预处理中,数据缺失是最为常见的数据预处理问题之一。通常对所要挖掘的数据分布形式没有任何先验知识。在这种情况下,非参回归分析方法可以为数据缺失的处理提供一种效果很好的解决途径。据此,在缺失机制是随机缺失(Missing at Random,MAR)和完全随机缺失(Missing Completely at Random,MCAR)的条件下,提出了一种处理数据缺失的新方法,即基于核函数的非参多重填补算法。模拟实验结果表明,算法的置信区间的覆盖率,区间长度,以及相对效率都比常用的NORM算法要好。 展开更多
关键词 多重填补 缺失数据 核函数 非参
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部