期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
客观归责理论的引入与因果关系的功能回归 被引量:24
1
作者 孙运梁 《现代法学》 CSSCI 北大核心 2013年第1期139-152,共14页
我国刑法中的因果关系无论在理论研究还是司法实务领域都存在一定程度的混乱与迷惑,这在很大程度上与因果关系理论功能定位不清有关。我国现行的因果关系理论除了进行事实判断之外,还承担了规范归责的功能。因果关系应当解决的是构成要... 我国刑法中的因果关系无论在理论研究还是司法实务领域都存在一定程度的混乱与迷惑,这在很大程度上与因果关系理论功能定位不清有关。我国现行的因果关系理论除了进行事实判断之外,还承担了规范归责的功能。因果关系应当解决的是构成要件行为与构成要件结果之间是否存在客观关联的问题,而结果能否归责于行为则是刑法归责理论的任务。客观归责理论的贡献在于,在承认条件因果关系的前提下,跨越自然科学性的事实审查而进入价值性、规范性审查的阶段。客观归责理论除了提供判断规则之外,也许更重要的是提供了一种逻辑思维方法,促使我国刑法中的因果关系回归事实判断的功能定位,克服我国因果关系理论哲学色彩浓厚、判断标准不一的弊端。 展开更多
关键词 客观归责 条件理论 相当性 规范评价 逻辑方法
下载PDF
黄河流域水文数据插补方法比较及应用 被引量:7
2
作者 王志良 黄珊 陈海涛 《人民黄河》 CAS 北大核心 2020年第7期14-18,共5页
水文数据的完整性是水文水资源与水环境计算的重要基础,水文观测缺失数据的插补是水文数据整编的一个重要环节。为更好地解决水文观测数据中断、缺失问题,以黄河流域黑石关水文站流量观测数据为例,对4种不同的时间序列插补方法(样条插... 水文数据的完整性是水文水资源与水环境计算的重要基础,水文观测缺失数据的插补是水文数据整编的一个重要环节。为更好地解决水文观测数据中断、缺失问题,以黄河流域黑石关水文站流量观测数据为例,对4种不同的时间序列插补方法(样条插值法、Stineman内插法、加权滑动平均值法、卡尔曼滤波和状态空间模型法)进行比较分析,并通过3项评估指标(平均绝对误差、均方根误差和平均百分比误差)比较插值效果的优劣。结果表明:加权滑动平均值法可较好地实现黑石关水文站流量缺失数据的插补,为后续黄河流域生态保护提供可靠的基础数据。 展开更多
关键词 水文观测数据 缺失数据 插补方法 时间序列 黄河
下载PDF
协变量数据缺失情形下的参数估计方法 被引量:6
3
作者 于力超 《统计与决策》 CSSCI 北大核心 2018年第17期9-13,共5页
在抽样调查活动中,如何对含缺失的数据集进行总体参数估计是一个热点话题。目前已有方法主要针对因变量数据缺失的情形,对协变量缺失的情况研究较少。文章在协变量数据缺失机制为MAR或NMAR的情形下,介绍了几种协变量缺失情形下参数估计... 在抽样调查活动中,如何对含缺失的数据集进行总体参数估计是一个热点话题。目前已有方法主要针对因变量数据缺失的情形,对协变量缺失的情况研究较少。文章在协变量数据缺失机制为MAR或NMAR的情形下,介绍了几种协变量缺失情形下参数估计的方法,包括多重插补法、Bayes法、EM极大似然估计法,尝试将EM算法、Gibbs抽样法、数据扩充算法等统计计算方法引入协变量缺失情形下的参数估计问题。并通过数值模拟,对几种方法进行比较。 展开更多
关键词 协变量缺失 多重插补法 Bayes法 极大似然估计 EM算法 GIBBS抽样 数据扩充算法
下载PDF
基因型填充策略研究 被引量:4
4
作者 邓天宇 杜立新 +1 位作者 王立贤 赵福平 《畜牧兽医学报》 CAS CSCD 北大核心 2020年第9期2068-2078,共11页
基因组数据在畜禽遗传育种中的应用越来越广泛,基因型填充作为基因组数据处理的重要工具,填充结果的好坏直接影响后续分析,为了得到好的填充结果,需要制定完善的填充策略。本研究通过模拟数据探讨参考群体大小、目标群体与参考群体间遗... 基因组数据在畜禽遗传育种中的应用越来越广泛,基因型填充作为基因组数据处理的重要工具,填充结果的好坏直接影响后续分析,为了得到好的填充结果,需要制定完善的填充策略。本研究通过模拟数据探讨参考群体大小、目标群体与参考群体间遗传关系(距离)远近、目标位点数目(比例)、最小等位基因频率以及填充算法等因素对基因型填充效果的影响。结果表明,目标位点数目与填充效果呈显著的正相关(P<0.05),是影响基因型填充准确性的主要因素;参考群体大小是影响Beagle5.1填充错误率的主要因素,目标位点数目是影响Minimac4填充错误率的主要因素;目标群体和参考群体的遗传距离对Beagle5.1填充效果的影响较Minimac4更为显著;一般情况下,最小等位基因频率越高的位点填充错误率越高;在参考群体个体数量少且目标位点数目多的情况下,Minimac4的填充速度优于Beagle5.1,但随参考群体个体数目增加有逆趋势。在保证填充质量的前提下,Beagle5.1对本研究中几种因素的标准要求相对较低。相对地,当目标群体位点数目较低,参考群体个体数目较多时,Beagle5.1的填充效果更好,而Minimac4更适合参考群体个体数目较少,目标群体位点数目较高的填充中。本研究针对不同的填充目的制定了不同策略,为基因型填充标准提供了参考。 展开更多
关键词 基因型填充 模拟数据 参考群体大小 填充算法 错误率
下载PDF
针对机器学习中残缺数据的近似补全方法 被引量:5
5
作者 曹卫权 褚衍杰 李显 《西安交通大学学报》 EI CAS CSCD 北大核心 2017年第10期142-148,共7页
针对机器学习中含残缺项的数据不能被有效利用,导致分类和回归准确率不高的问题,提出了一种近似补全方法——k-ANNO方法。给定残缺的数据样本,该方法首先通过离线构建的图结构来近似搜索与该样本最接近的k个近邻顶点,然后采用快速二次... 针对机器学习中含残缺项的数据不能被有效利用,导致分类和回归准确率不高的问题,提出了一种近似补全方法——k-ANNO方法。给定残缺的数据样本,该方法首先通过离线构建的图结构来近似搜索与该样本最接近的k个近邻顶点,然后采用快速二次规划估计各近邻的最优权重,最后基于权重值来补全样本中的残缺项,用户可以根据实际需求在补全效率与准确性之间折中。k-ANNO方法较好地解决了机器学习中普遍存在的数据残缺问题,有效抑制了数据残缺对分类和回归精度的干扰。利用多份公开数据集评估了k-ANNO方法的补全效果,结果表明:当加速比在2~10之间时,k-ANNO方法的分类错误率比已有的均值补全、C均值补全、自组织映射补全方法低1%~4%,回归均方根误差比已有方法低约0.5~2.0;当样本规模为4 000时,在不同加速比参数下,k-ANNO方法的计算效率比朴素k近邻方法高约35%~320%。 展开更多
关键词 机器学习 残缺项 二次规划 补全方法
下载PDF
因变量缺失下线性回归模型的估计与检验 被引量:4
6
作者 杨徐佳 于倩倩 王森 《淮北师范大学学报(自然科学版)》 CAS 2011年第1期24-28,共5页
文章研究因变量缺失下的线性回归模型,借助单点插补方法,首先给出模型的估计,研究参数估计量的渐近正态性,其次,对于模型系数的线性约束检验问题,基于Wald方法构造检验统计量并给出其渐近分布.最后,通过数值模拟验证所提方法的有效性.
关键词 线性回归模型 缺失数据 插补方法 最小二乘估计 WALD检验
下载PDF
“环境侵权”法律术语及其归责原则分析——杜增申与中铁二十局等环境噪声污染侵权案评释 被引量:3
7
作者 刘先辉 《江苏大学学报(社会科学版)》 2016年第3期57-63,共7页
在中铁二十局公司、河南禹亳铁路公司环境噪声污染案中,法院以"噪音标准是缴纳超标准排污费和进行环境管理的依据,而非确定排污单位是否承担赔偿责任的界限"为由,认为行为的违法性并不是构成环境侵权行为的必要前提,而行为的... 在中铁二十局公司、河南禹亳铁路公司环境噪声污染案中,法院以"噪音标准是缴纳超标准排污费和进行环境管理的依据,而非确定排污单位是否承担赔偿责任的界限"为由,认为行为的违法性并不是构成环境侵权行为的必要前提,而行为的致害性才是环境侵权行为的构成要件。这种观点值得商榷。现有法律体系在对环境侵权的规定中,应当明确"环境侵权"的法律术语;在归责原则上,《民法通则》《物权法》体现的是过错责任原则,而《侵权责任法》《环境保护法》体现的是无过错责任原则。应当以类型化的方法,对环境侵权归责原则进行协调。 展开更多
关键词 环境侵权 归责原则 类型化
下载PDF
一种基于对抗神经网络的方法在钻井数据恢复中的应用
8
作者 张宁 《海洋石油》 CAS 2022年第2期83-88,115,共7页
机器学习中数据缺失很普遍,导致数据缺失的因素通常有人为失误、数据处理软件的缺陷、获取数据的传感器错误等。数据缺失会导致机器学习的性能下降,因此缺失值的填补对机器学习任务变得格外重要。针对数据缺失问题,该文提出一种新颖的... 机器学习中数据缺失很普遍,导致数据缺失的因素通常有人为失误、数据处理软件的缺陷、获取数据的传感器错误等。数据缺失会导致机器学习的性能下降,因此缺失值的填补对机器学习任务变得格外重要。针对数据缺失问题,该文提出一种新颖的缺失数据填补方法,构建了一个生成对抗填补网络(简称GAIN)。GAIN主要包括生成器和判别器两个部分,其中生成器(G)用来观察真实数据的每一部分,然后根据观察的结果填补缺失数据的部分,输出一个填补后完整的向量;判别器(D)接受一个完整的向量,来判别哪一部分数据是真实的,哪一部分是被填补的。在4个UCI机器学习标准数据集和石油行业钻井液数据集间进行了实验,验证了GAIN方法的有效性,能提升机器学习任务的性能。 展开更多
关键词 机器学习 数据缺失 填补方法 生成对抗填补网络 生成器 判别器 石油行业 钻井液
下载PDF
离散型缺失数据填补法综合比较 被引量:2
9
作者 袁建裕 闫春艳 +1 位作者 叶志伟 杨志勇 《湖北工业大学学报》 2021年第5期59-63,共5页
针对离散型数据填补方法的研究尚不完备的情况,通过改造现有模型,系统地比较和分析了基于众数填补、随机填补、K最近邻填补、基于自编码器的填补和基于生成对抗网络的填补在离散型数据的填补性能,对在数据预处理阶段选择适合数据集的填... 针对离散型数据填补方法的研究尚不完备的情况,通过改造现有模型,系统地比较和分析了基于众数填补、随机填补、K最近邻填补、基于自编码器的填补和基于生成对抗网络的填补在离散型数据的填补性能,对在数据预处理阶段选择适合数据集的填补方案具有重要的意义。实验结果显示,不同填补方法的填补结果有较大的差异,进而影响后续分析的准确性。 展开更多
关键词 离散缺失数据 填补方法 方法比较
下载PDF
Comparison of Missing Data Imputation Methods in Time Series Forecasting 被引量:1
10
作者 Hyun Ahn Kyunghee Sun Kwanghoon Pio Kim 《Computers, Materials & Continua》 SCIE EI 2022年第1期767-779,共13页
Time series forecasting has become an important aspect of data analysis and has many real-world applications.However,undesirable missing values are often encountered,which may adversely affect many forecasting tasks.I... Time series forecasting has become an important aspect of data analysis and has many real-world applications.However,undesirable missing values are often encountered,which may adversely affect many forecasting tasks.In this study,we evaluate and compare the effects of imputationmethods for estimating missing values in a time series.Our approach does not include a simulation to generate pseudo-missing data,but instead perform imputation on actual missing data and measure the performance of the forecasting model created therefrom.In an experiment,therefore,several time series forecasting models are trained using different training datasets prepared using each imputation method.Subsequently,the performance of the imputation methods is evaluated by comparing the accuracy of the forecasting models.The results obtained from a total of four experimental cases show that the k-nearest neighbor technique is the most effective in reconstructing missing data and contributes positively to time series forecasting compared with other imputation methods. 展开更多
关键词 Missing data imputation method time series forecasting LSTM
下载PDF
核实数据下反映缺失非线性EV模型的经验似然推断 被引量:1
11
作者 方连娣 《数学的实践与认识》 北大核心 2019年第18期199-208,共10页
考虑一类带有不完全数据的非线性模型,其协变量带有测量误差且反映变量随机缺失.通过核实数据和借补数据构造了回归参数θ的估计的经验对数似然比统计量,证明了所构造的似然比函数渐近独立标准X12变量的加权和分布.在权未知的情况下,分... 考虑一类带有不完全数据的非线性模型,其协变量带有测量误差且反映变量随机缺失.通过核实数据和借补数据构造了回归参数θ的估计的经验对数似然比统计量,证明了所构造的似然比函数渐近独立标准X12变量的加权和分布.在权未知的情况下,分别采用定义权的相合估计法和构造调整被估计的经验对数似然法构造出θ的渐近置信域.进一步,基于借补方法构造了反映变量均值的调整经验对数似然比统计量,并证明了统计量渐近标准X12分布,所得结果可以用来构造反映均值的置信域. 展开更多
关键词 经验似然 反映缺失 非线性模型 相合估计 借补方法
原文传递
Comparative Variance and Multiple Imputation Used for Missing Values in Land Price DataSet 被引量:1
12
作者 Longqing Zhang Xinwei Zhang +2 位作者 Liping Bai Yanghong Zhang Feng Sun Changcheng Chen 《Computers, Materials & Continua》 SCIE EI 2019年第9期1175-1187,共13页
Based on the two-dimensional relation table,this paper studies the missing values in the sample data of land price of Shunde District of Foshan City.GeoDa software was used to eliminate the insignificant factors by st... Based on the two-dimensional relation table,this paper studies the missing values in the sample data of land price of Shunde District of Foshan City.GeoDa software was used to eliminate the insignificant factors by stepwise regression analysis;NORM software was adopted to construct the multiple imputation models;EM algorithm and the augmentation algorithm were applied to fit multiple linear regression equations to construct five different filling datasets.Statistical analysis is performed on the imputation data set in order to calculate the mean and variance of each data set,and the weight is determined according to the differences.Finally,comprehensive integration is implemented to achieve the imputation expression of missing values.The results showed that in the three missing cases where the PRICE variable was missing and the deletion rate was 5%,the PRICE variable was missing and the deletion rate was 10%,and the PRICE variable and the CBD variable were both missing.The new method compared to the traditional multiple filling methods of true value closer ratio is 75%to 25%,62.5%to 37.5%,100%to 0%.Therefore,the new method is obviously better than the traditional multiple imputation methods,and the missing value data estimated by the new method bears certain reference value. 展开更多
关键词 imputation method multiple imputations probabilistic model
下载PDF
一种无参数的微阵列缺失值填补方法(英文)
13
作者 张小白 王惠南 +1 位作者 宋晓峰 张焕萍 《计算机与应用化学》 CAS CSCD 北大核心 2007年第12期1611-1616,共6页
微阵列数据中的缺失值会对随后的数据分析造成影响。因此,正确地估计这些缺失值是很必要的。将一个k值选取算法结合到有序的局部最小二乘填补算法中,提出了一种无参数的缺失值填补方法(SLLSkimpute)。该方法的三个特点是:第一,无需事先... 微阵列数据中的缺失值会对随后的数据分析造成影响。因此,正确地估计这些缺失值是很必要的。将一个k值选取算法结合到有序的局部最小二乘填补算法中,提出了一种无参数的缺失值填补方法(SLLSkimpute)。该方法的三个特点是:第一,无需事先确定参数;第二,针对不同的目标基因使用不同数目的邻居基因;第三,有序地估计缺失值,并有选择地将已得到的估计值应用到后续的估计过程中。实验结果证实了该算法的有效性,其估计性能优于其它一些常用的填补方法。 展开更多
关键词 缺失值 填补方法 最小二乘法 标准均方根误差(NRMSE) 微阵列数据
原文传递
The Ability of Different Imputation Methods to Preserve the Significant Genes and Pathways in Cancer
14
作者 Rosa Aghdam Taban Baghfalaki +1 位作者 Pegah Khosravi Elnaz Saberi Ansari 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2017年第6期396-404,共9页
Deciphering important genes and pathways from incomplete gene expression data could facilitate a better understanding of cancer. Different imputation methods can be applied to estimate the missing values. In our study... Deciphering important genes and pathways from incomplete gene expression data could facilitate a better understanding of cancer. Different imputation methods can be applied to estimate the missing values. In our study, we evaluated various imputation methods for their performance in preserving significant genes and pathways. In the first step, 5% genes are considered in random for two types of ignorable and non-ignorable missingness mechanisms with various missing rates. Next, 10 well-known imputation methods were applied to the complete datasets. The significance analysis of microarrays (SAM) method was applied to detect the significant genes in rectal and lung cancers to showcase the utility of imputation approaches in preserving significant genes. To determine the impact of different imputation methods on the identification of important genes, the chi-squared test was used to compare the proportions of overlaps between significant genes detected from original data and those detected from the imputed datasets. Additionally, the significant genes are tested for their enrichment in important pathways, using the ConsensusPathDB. Our results showed that almost all the significant genes and pathways of the original dataset can be detected in all imputed datasets, indicating that there is no significant difference in the performance of various imputation methods tested. The source code and selected datasets are available on http://profiles.bs.ipm.ir/soft- wares/imputationmethods/. 展开更多
关键词 Gene expression Missing data imputation method Signi?cant genes Pathway enrichment
原文传递
环境污染侵权的归责原则:争歧、反思与调整
15
作者 王雨彤 《绵阳师范学院学报》 2020年第1期51-56,共6页
我国《侵权责任法》第65条在理论界和实务界均引发了激烈的争议,表明当前对环境污染侵权行为不加区分地笼统适用无过错责任归责原则已经无法适应现实需求。然而当前学说上提出的分类标准和归责原则还存在着一些缺陷,未来环境污染侵权归... 我国《侵权责任法》第65条在理论界和实务界均引发了激烈的争议,表明当前对环境污染侵权行为不加区分地笼统适用无过错责任归责原则已经无法适应现实需求。然而当前学说上提出的分类标准和归责原则还存在着一些缺陷,未来环境污染侵权归责原则的调整方向可以是:符合环境行政管理要求的“拟制型”污染侵权无需承担侵权责任;不符合环境行政管理要求的“拟制型”污染侵权适用过错责任;符合环境行政管理要求的“实质型”污染侵权适用无过错责任;不符合环境行政管理要求的“实质型”污染侵权适用过错责任。 展开更多
关键词 环境侵权 归责原则 类型化
下载PDF
中国工业企业数据库(1999~2013)的使用研究:基于插值处理方法的比较分析 被引量:9
16
作者 张少华 李苏苏 《贵州财经大学学报》 CSSCI 北大核心 2021年第5期20-29,共10页
中国工业企业数据库已经成为研究中国微观企业活动的首选数据库,但是数据库中关键指标的缺失严重影响了数据库的更新和使用。本文在借鉴主要文献处理方法的基础上,先后采用单值移动时序平滑法、MICE1、MICE2、MMICE1和MMICE2五种插补方... 中国工业企业数据库已经成为研究中国微观企业活动的首选数据库,但是数据库中关键指标的缺失严重影响了数据库的更新和使用。本文在借鉴主要文献处理方法的基础上,先后采用单值移动时序平滑法、MICE1、MICE2、MMICE1和MMICE2五种插补方法对数据库进行完善,从而将中国工业企业数据库延伸至2013年,并通过计算企业全要素生产率来评估各种插补方法的相对有效性。研究表明:在这五种插值方法中,单值移动时序平滑法和MMICE1是两种最为有效的插值方法,不仅可以实现插值前后的数据库特征一致,而且能够实现所计算的全要素生产率的数据结构特征一致。值得强调的是,在完善数据库和计算全要素生产率方面,前者因为处理过程简单因而是一种相对经济的方法,而后者因为能够保留更多样本信息因而是一种相对有效的方法。本文研究价值体现在对使用中国工业企业数据库提供了基础性研究工作。 展开更多
关键词 中国工业企业数据库 单值移动时序平滑法 多重链式方程插补法 混合插补法 全要素生产率
下载PDF
A Study of EM Algorithm as an Imputation Method: A Model-Based Simulation Study with Application to a Synthetic Compositional Data
17
作者 Yisa Adeniyi Abolade Yichuan Zhao 《Open Journal of Modelling and Simulation》 2024年第2期33-42,共10页
Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear mode... Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear model is the most used technique for identifying hidden relationships between underlying random variables of interest. However, data quality is a significant challenge in machine learning, especially when missing data is present. The linear regression model is a commonly used statistical modeling technique used in various applications to find relationships between variables of interest. When estimating linear regression parameters which are useful for things like future prediction and partial effects analysis of independent variables, maximum likelihood estimation (MLE) is the method of choice. However, many datasets contain missing observations, which can lead to costly and time-consuming data recovery. To address this issue, the expectation-maximization (EM) algorithm has been suggested as a solution for situations including missing data. The EM algorithm repeatedly finds the best estimates of parameters in statistical models that depend on variables or data that have not been observed. This is called maximum likelihood or maximum a posteriori (MAP). Using the present estimate as input, the expectation (E) step constructs a log-likelihood function. Finding the parameters that maximize the anticipated log-likelihood, as determined in the E step, is the job of the maximization (M) phase. This study looked at how well the EM algorithm worked on a made-up compositional dataset with missing observations. It used both the robust least square version and ordinary least square regression techniques. The efficacy of the EM algorithm was compared with two alternative imputation techniques, k-Nearest Neighbor (k-NN) and mean imputation (), in terms of Aitchison distances and covariance. 展开更多
关键词 Compositional Data Linear Regression Model Least Square method Robust Least Square method Synthetic Data Aitchison Distance Maximum Likelihood Estimation Expectation-Maximization Algorithm k-Nearest Neighbor and Mean imputation
下载PDF
基于标准欧氏距离的燃油流量缺失数据填补算法 被引量:8
18
作者 陈静杰 车洁 《计算机科学》 CSCD 北大核心 2017年第S1期109-111,125,共4页
为减小数据缺失对飞机油耗统计推断精度带来的负面影响,针对基于传统欧氏距离、马氏距离以及精简关联度的最近邻填补算法的不足,提出了一种基于标准欧氏距离的填补算法来估计QAR(Quick Access Recorder)数据中部分燃油流量数值的缺失。... 为减小数据缺失对飞机油耗统计推断精度带来的负面影响,针对基于传统欧氏距离、马氏距离以及精简关联度的最近邻填补算法的不足,提出了一种基于标准欧氏距离的填补算法来估计QAR(Quick Access Recorder)数据中部分燃油流量数值的缺失。该算法通过QAR数据样本之间的标准欧氏距离选择最近邻样本,并利用熵值赋权法计算最近邻的加权系数,基于最近邻样本中燃油流量的加权平均即可得到缺失燃油流量的估计值。实验结果表明,标准欧氏距离能够有效度量样本相似性,所提出的算法优于常规填补算法,是处理飞机油耗数据缺失的一种有效方法。 展开更多
关键词 标准欧氏距离 燃油流量缺失数据估计 K近邻填补算法 熵值赋权法 RKNN算法
下载PDF
基于缺失森林模型的稀疏函数型数据修复方法
19
作者 高海燕 李唯欣 马文娟 《西华师范大学学报(自然科学版)》 2024年第5期481-487,共7页
为解决函数型数据缺失插补问题,在函数型数据分析框架下,以缺失森林模型(MF)为基础,采用基于条件期望主成分分析的函数型插补方法PACE进行初始插补,并通过K-means聚类借助样本之间的相关性插补,给出了一种融合类信息的函数型多重插补方... 为解决函数型数据缺失插补问题,在函数型数据分析框架下,以缺失森林模型(MF)为基础,采用基于条件期望主成分分析的函数型插补方法PACE进行初始插补,并通过K-means聚类借助样本之间的相关性插补,给出了一种融合类信息的函数型多重插补方法。模拟数据插补实验结果表明,在不同缺失比例(5%~55%)下,本文方法相较于Hot.deck、MF、均值插补、PACE、MFP、SFI、HFI等7种插补方法,更能保证插补的准确性和有效性。同时,针对股票数据的实例应用验证了本文方法插补得到的数据符合实际情况和规律。 展开更多
关键词 函数型数据 缺失森林 多重插补 缺失插补方法
下载PDF
基于面板数据模型的拱坝缺失数据填补方法 被引量:1
20
作者 崔欣然 石立 +3 位作者 陆希 顾昊 吴艳 朱明远 《水力发电学报》 CSCD 北大核心 2024年第3期94-107,共14页
混凝土拱坝作为重要的水工建筑物,由于监测设备故障、人为因素等影响,导致其监测数据频繁出现缺失的现象,降低了大坝安全评估与预测的有效性与准确性。传统方法多仅依赖单测点测值进行插补,忽略了测点之间的相关性与异质性。本文提出了... 混凝土拱坝作为重要的水工建筑物,由于监测设备故障、人为因素等影响,导致其监测数据频繁出现缺失的现象,降低了大坝安全评估与预测的有效性与准确性。传统方法多仅依赖单测点测值进行插补,忽略了测点之间的相关性与异质性。本文提出了一种基于面板数据模型的变形缺失数据插补方法。首先,改进传统变形相似性增量速度指标,解决了其分母可能等于零的问题。其次,提出了一种组合加权方法以计算变形相似性综合指标,并采用改进的基于密度聚类方法对变形监测点进行分类。随后,建立了面板模型,以填补不同区域内的缺失数据。本文提出的方法可以更准确地填补混凝土拱坝变形数据的缺失,从而能够有效地解决变形监测数据缺失的问题。 展开更多
关键词 缺失数据填补 变形相似性指标 聚类方法 面板数据模型 混凝土拱坝
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部