期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于马氏距离的缺失值填充算法 被引量:24
1
作者 杨涛 骆嘉伟 +1 位作者 王艳 吴君浩 《计算机应用》 CSCD 北大核心 2005年第12期2868-2871,共4页
提出了一种基于马氏距离的填充算法来估计基因表达数据集中的缺失数据。该算法通过基因之间的马氏距离来选择最近邻居基因,并将已得到的估计值应用到后续的估计过程中,然后采用信息论中熵值的概念计算最近邻居的加权系数,得到缺失数据... 提出了一种基于马氏距离的填充算法来估计基因表达数据集中的缺失数据。该算法通过基因之间的马氏距离来选择最近邻居基因,并将已得到的估计值应用到后续的估计过程中,然后采用信息论中熵值的概念计算最近邻居的加权系数,得到缺失数据的填充值。实验结果证明了该算法具有有效性,其性能优于其他基于最近邻居法的缺失值处理算法。 展开更多
关键词 微阵列 缺失值估计 马氏距离 信息熵
下载PDF
基于SVM-BP神经网络的气象能见度数据缺失值预估 被引量:6
2
作者 殷利平 刘宵瑜 +2 位作者 盛绍学 温华洋 邱康俊 《南京信息工程大学学报(自然科学版)》 CAS 北大核心 2021年第4期494-501,共8页
自动气象站能见度检测仪多采用光学装置采样,雨雪、粉尘等天气因素会对部分仪器镜头造成污染,导致能见度要素数据缺测.针对能见度数据缺失问题,本文选用安徽部分气象站的历年数据,首先运用灰色关联分析方法筛选出与能见度密切相关的其... 自动气象站能见度检测仪多采用光学装置采样,雨雪、粉尘等天气因素会对部分仪器镜头造成污染,导致能见度要素数据缺测.针对能见度数据缺失问题,本文选用安徽部分气象站的历年数据,首先运用灰色关联分析方法筛选出与能见度密切相关的其他气象要素,通过支持向量机和BP神经网络单一预估方法预估不同地形的能见度缺失值,然后采用最优权重组合将两种方法预估的能见度值进行组合,并与单一预估方法进行对比.结果表明组合方法的预估结果误差均值小、整体准确度高,可以保证台站观测资料的完备性,为短时天气预报、实况分析和气象公共服务工作提供有效依据. 展开更多
关键词 组合模型 缺失值预估 关联分析 BP神经网络 能见度 支持向量机
下载PDF
时序基因表达缺失值的加权双向回归估计算法 被引量:4
3
作者 李建更 郭庆雷 贺益恒 《数据采集与处理》 CSCD 北大核心 2013年第2期136-140,共5页
由于受实验条件等客观因素制约,实验所得到的基因表达谱数据存在数据缺失的现象,不利于数据的后续使用。如何在不丢失数据信息、不影响数据整体使用的情况下,对实验数据进行估计、填充已成为目前生物信息学研究的热点。本文通过利用核... 由于受实验条件等客观因素制约,实验所得到的基因表达谱数据存在数据缺失的现象,不利于数据的后续使用。如何在不丢失数据信息、不影响数据整体使用的情况下,对实验数据进行估计、填充已成为目前生物信息学研究的热点。本文通过利用核加权函数提取与缺失值所在的行列具有最大相似性的行列信息,提出了基于双向核加权回归估计的算法。在回归过程中同时考虑基因表达的空间相关性和时间相关性信息,使回归算法使用的信息更加充分。通过与其他缺失值估计算法相比较,加权双向回归算法的估计结果较好。 展开更多
关键词 时序基因表达 空间相关性 时间相关性 加权双向回归 缺失值估计
下载PDF
基于自适应样本权重的矩阵分解推荐算法 被引量:4
4
作者 石晓玲 陈芷 +1 位作者 杨立功 沈伟 《计算机科学》 CSCD 北大核心 2019年第B06期488-492,共5页
稀疏数据矩阵缺失值估计是一项必要的基础性研究,在推荐系统中尤为重要,针对该问题的一种有效方法便是矩阵分解算法(Matrix Factorization,MF),但传统MF算法仅直接使用回归思想拟合矩阵样本点,并没有考虑样本自身拟合难易程度的差异性... 稀疏数据矩阵缺失值估计是一项必要的基础性研究,在推荐系统中尤为重要,针对该问题的一种有效方法便是矩阵分解算法(Matrix Factorization,MF),但传统MF算法仅直接使用回归思想拟合矩阵样本点,并没有考虑样本自身拟合难易程度的差异性。针对该情况,文中分析提出了一种基于自适应样本权重的矩阵分解算法(AWS-MF),在原有MF算法的基础上,针对样本差异性进行有偏向模型拟合,为增加模型回归的准确性与稳定性,加权整合中间算法结果,从而得到最终的拟合数据值。实验结果表明,相比于MF算法和NMF算法,改进后的AWS-MF算法能根据样本差异性自动调整样本权重占比,在充分利用已有数据的前提下,最终得到更好的缺失值估计结果。 展开更多
关键词 矩阵分解 缺失值估计 推荐系统 样本差异性 偏向性
下载PDF
基于矩阵填充的肿瘤基因表达谱数据缺失点估计 被引量:3
5
作者 黄经纬 杨国亮 +1 位作者 胡政伟 王艳芳 《科学技术与工程》 北大核心 2017年第7期63-68,89,共7页
为解决肿瘤基因表达谱数据后续研究需要完整数据矩阵的问题,针对包含缺失点的数据集。提出基于矩阵填充(matrix completion)与模糊C均值(fuzzy c-means algorithm,FCM)相结合的缺失点估计方法(FCM_MC)。该方法充分利用肿瘤基因表达谱数... 为解决肿瘤基因表达谱数据后续研究需要完整数据矩阵的问题,针对包含缺失点的数据集。提出基于矩阵填充(matrix completion)与模糊C均值(fuzzy c-means algorithm,FCM)相结合的缺失点估计方法(FCM_MC)。该方法充分利用肿瘤基因表达谱数据的冗余信息,通过模糊C均值聚类得到具有良好的低秩特性的基因语义片段,再利用矩阵填充方法分别对每个语义片段进行缺失点的重建。在不同数据集上进行实验,与传统缺失点估计算法比较。实验表明FCM_MC算法在缺失数据估计准确度和类结构保持度上效果得到有效提升,同时运行效率较高。 展开更多
关键词 矩阵填充 模糊C均值 低秩 基因语义 缺失值估计
下载PDF
无线传感器网络中缺失数据的估计 被引量:3
6
作者 付惠娟 任美睿 +1 位作者 李金宝 郭龙江 《计算机工程》 CAS CSCD 北大核心 2011年第1期90-92,共3页
针对无线传感器网络中经常存在的感知数据缺失的问题,提出一个分布式算法SC,其中包括2种缺失数据估计的方法,即SRS和CNI。算法SC根据当前节点的子节点数对SRS和CNI进行动态选择。理论分析表明,SC不增加额外的通信能量消耗。模拟实验结... 针对无线传感器网络中经常存在的感知数据缺失的问题,提出一个分布式算法SC,其中包括2种缺失数据估计的方法,即SRS和CNI。算法SC根据当前节点的子节点数对SRS和CNI进行动态选择。理论分析表明,SC不增加额外的通信能量消耗。模拟实验结果表明,SC对缺失数据的估计具有较好的准确性,对于不同的拓扑结构有较好的适应性。 展开更多
关键词 传感器网络 缺失数据 估计方法
下载PDF
我国农户入户调查数据预处理及在农户收入模型中的应用 被引量:1
7
作者 曹昆 王成璋 《世界科技研究与发展》 CSCD 2011年第3期511-513,共3页
使用Grubbs检验法对直接入户采集获得的农村住户资料进行异常值检验,并对异常值进行删除,而后使用EM法对数据集由于无回答和异常值删除产生的缺失数据进行插补;并利用处理后的数据进行衣户收入关于其劳动力投入和资本投入的微观计量分析... 使用Grubbs检验法对直接入户采集获得的农村住户资料进行异常值检验,并对异常值进行删除,而后使用EM法对数据集由于无回答和异常值删除产生的缺失数据进行插补;并利用处理后的数据进行衣户收入关于其劳动力投入和资本投入的微观计量分析,得到结论:农户可用劳动力数量对农户收入影响最大,而农户家庭经营支出对农户收入的影响大于农户家庭生产性固定资产拥有量对农户收入的影响。 展开更多
关键词 数据预处理 异常值检验 缺失值插补 农户收入
原文传递
开放骨架磷酸铝定向合成反应预测研究 被引量:1
8
作者 姚明海 李劲松 《渤海大学学报(自然科学版)》 CAS 2020年第1期66-75,共10页
针对国内外材料领域和分子工程学领域中如何定向合成无机微孔材料的热点问题.基于开放骨架磷酸铝具有独特结构特征的特点,于吉林大学“无机合成与制备国家重点实验室”构建的磷酸铝合成反应数据库的研究基础上,采用基于机器学习的算法... 针对国内外材料领域和分子工程学领域中如何定向合成无机微孔材料的热点问题.基于开放骨架磷酸铝具有独特结构特征的特点,于吉林大学“无机合成与制备国家重点实验室”构建的磷酸铝合成反应数据库的研究基础上,采用基于机器学习的算法对磷酸铝合成反应进行预测.首先提取富信息样本建立预测模型和补值模型.然后利用BP补值模型对数据库中的缺失数据进行校正.最后根据已建模型建立了一个简单、易用的定向合成(12,6)元环分子筛系统. 展开更多
关键词 无机微孔材料 数据挖掘 磷酸铝合成 缺失值估计 合成分析与预测
下载PDF
Multivariate time series imputation for energy data using neural networks
9
作者 Christopher Bulte Max Kleinebrahm +1 位作者 Hasan Umitcan Yilmaz Juan Gomez-Romero 《Energy and AI》 2023年第3期25-35,共11页
Multivariate time series with missing values are common in a wide range of applications,including energy data.Existing imputation methods often fail to focus on the temporal dynamics and the cross-dimensional correlat... Multivariate time series with missing values are common in a wide range of applications,including energy data.Existing imputation methods often fail to focus on the temporal dynamics and the cross-dimensional correlation simultaneously.In this paper we propose a two-step method based on an attention model to impute missing values in multivariate energy time series.First,the underlying distribution of the missing values in the data is learned.This information is then further used to train an attention based imputation model.By learning the distribution prior to the imputation process,the model can respond flexibly to the specific characteristics of the underlying data.The developed model is applied to European energy data,obtained from the European Network of Transmission System Operators for Electricity.Using different evaluation metrics and benchmarks,the conducted experiments show that the proposed model is preferable to the benchmarks and is able to accurately impute missing values. 展开更多
关键词 missing value estimation Multivariate time series Neural networks Attention model Energy data
原文传递
一种基于KNN-SVR的基因表达缺失值的估计方法 被引量:1
10
作者 王广云 倪青山 +1 位作者 邱浪波 王正志 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第1期124-128,共5页
为了消除不相似基因对基因表达谱中缺失值估计的影响,提出了一种基于KNN-SVR的缺失值估计方法。该方法先通过最近邻法选出与目标基因表达最相似的一组完全基因,再用这些基因通过支持向量回归对缺失值进行估计。还提出了用标准化偏差的... 为了消除不相似基因对基因表达谱中缺失值估计的影响,提出了一种基于KNN-SVR的缺失值估计方法。该方法先通过最近邻法选出与目标基因表达最相似的一组完全基因,再用这些基因通过支持向量回归对缺失值进行估计。还提出了用标准化偏差的方差来度量算法的稳定性和估计值的可信度。该方法通过对基因的过滤提高了缺失值估计的有效性。实验结果表明,KNN-SVR法具有较高的估计精度和稳定性。 展开更多
关键词 基因芯片 缺失值估计 最近邻法 支持向量回归 相似性
下载PDF
基于空间结构的无线传感器网络缺失值估计方法
11
作者 李微微 马卫 《电子测试》 2022年第12期44-46,12,共4页
为了保证无线传感器网络中数据的完整性,针对感知数据在传输中存在数据丢失或者数据异常的问题,提出一种基于空间结构的无线传感器网络缺失值估计方法。矩阵补全方法是估计缺失值的有效方法,但目前尚未考虑到数据间的连续性而导致估计... 为了保证无线传感器网络中数据的完整性,针对感知数据在传输中存在数据丢失或者数据异常的问题,提出一种基于空间结构的无线传感器网络缺失值估计方法。矩阵补全方法是估计缺失值的有效方法,但目前尚未考虑到数据间的连续性而导致估计误差较大。本文结合传感器节点数据具有时空相关性的特点,通过增加正则化项的方式来约束矩阵补全的解空间对数据进行缺失值估计。仿真时采用伯克利英特尔实验室的传感器数据,通过Matlab软件对模型进行测试并分析仿真结果。实验结果表明:该算法对连续多个数据的缺失值估计效果理想,估计误差始终保持在较低水平。 展开更多
关键词 无线传感器网络 缺失值估计 空间结构
下载PDF
利用蛋白质相互作用关系改善基因芯片缺失数据估计的精度
12
作者 倪青山 王广云 +2 位作者 邱浪波 强波 王正志 《生命科学研究》 CAS CSCD 2008年第2期104-109,共6页
针对基因芯片数据缺失问题,利用蛋白质相互作用关系与基因表达的内在联系,提出了一种利用蛋白质相互作用信息提高基因芯片缺失数据估计精度的方法.将蛋白质间的相互作用关系与基因表达数据间的距离相结合来计算基因间的表达相似度,根据... 针对基因芯片数据缺失问题,利用蛋白质相互作用关系与基因表达的内在联系,提出了一种利用蛋白质相互作用信息提高基因芯片缺失数据估计精度的方法.将蛋白质间的相互作用关系与基因表达数据间的距离相结合来计算基因间的表达相似度,根据这个新的相似性度量标准为含有缺失数据的基因选择更为合适的用于估计缺失值的基因集合.将新的相似性度量标准与传统的KNNimpute、LLSimpute方法相结合,描述了对应的改进算法PPI-KNNimpute、PPI-LLSimpute.对真实的数据集测试表明,蛋白质相互作用信息能有效改善基因缺失数据估计的精度. 展开更多
关键词 基因芯片 缺失值估计 蛋白质相互作用
下载PDF
基于时序矩阵分解的缺失销售数据估计
13
作者 陈斯敏 杨磊 +1 位作者 陈文娜 黄晓宇 《运筹与管理》 CSSCI CSCD 北大核心 2021年第11期99-105,共7页
企业的历史销售记录是供应链优化研究的基础数据来源,然而,在日常的研究中,几乎所有可以通过公开途径获得的销售记录都是高度不完整的,这为研究者开展工作带来了极大的不便。为解决此问题,本文提出,以销售数据集中已有的数据为基础,使... 企业的历史销售记录是供应链优化研究的基础数据来源,然而,在日常的研究中,几乎所有可以通过公开途径获得的销售记录都是高度不完整的,这为研究者开展工作带来了极大的不便。为解决此问题,本文提出,以销售数据集中已有的数据为基础,使用面向时序数据的矩阵分解模型MAFTIS对其缺失的部分进行估算,从而把残缺的数据集补全完整。进一步地,为提高MAFTIS的计算效率,本文还为该模型设计了一种基于交替最小二乘法的求解策略MAFTIS^(ALS)。在评估实验中,MAFTIS^(ALS)被用于三个真实销售数据集的缺失记录估计,结果显示,与其它估计模型相比,MAFTIS^(ALS)能获得更准确的估计结果,并且具有更高的收敛速度。 展开更多
关键词 销售数据 缺失值估计 矩阵分解
下载PDF
一种无线传感器网络缺失数值估计算法
14
作者 阚杰 张瑞瑞 陈立平 《传感器与微系统》 CSCD 北大核心 2014年第7期112-115,共4页
无线传感器网络(WSNs)工作环境复杂,不可避免会出现感知数值缺失问题。提出一种基于BP神经网络模型的缺失数值估计算法,利用同节点多参数间相关性特点,以强相关参数集为输入进行缺失数值输出估计。为了提高数值估计准确性和稳定性,提出... 无线传感器网络(WSNs)工作环境复杂,不可避免会出现感知数值缺失问题。提出一种基于BP神经网络模型的缺失数值估计算法,利用同节点多参数间相关性特点,以强相关参数集为输入进行缺失数值输出估计。为了提高数值估计准确性和稳定性,提出将上述算法与线性回归算法结合,对二种缺失数值估计量进行加权平均,针对变化规律复杂的缺失数值进行有效的估计。基于实际采样数值进行仿真分析,结果表明:算法能够有效地完成缺失数值估计,同时对WSNs拓扑结构和节点覆盖率依赖性较弱,实用性较好。 展开更多
关键词 无线传感器网络 神经网络 缺失数值估计 相关分析
下载PDF
WSN中基于线性回归和最大似然的缺失值估计模型
15
作者 陈园园 袁焕丽 《周口师范学院学报》 CAS 2016年第5期71-74,共4页
为了解决无线传感器网络中感知数据缺失问题,笔者结合基于时间相关性的多元线性回归模型和最大似然估计模型的两种参数估计算法,提出了一种新的缺失值估计算法.该算法不仅可以准确地估算出某时刻缺失对象的信息,而且在时间序列不满足线... 为了解决无线传感器网络中感知数据缺失问题,笔者结合基于时间相关性的多元线性回归模型和最大似然估计模型的两种参数估计算法,提出了一种新的缺失值估计算法.该算法不仅可以准确地估算出某时刻缺失对象的信息,而且在时间序列不满足线性模型的情况下仍可以对缺失值进行估计,实验表明该算法有很好的可靠性和稳定性. 展开更多
关键词 无线传感器网络 缺失值估计 线性回归模型 EM算法
下载PDF
基于标准欧氏距离的燃油流量缺失数据填补算法 被引量:8
16
作者 陈静杰 车洁 《计算机科学》 CSCD 北大核心 2017年第S1期109-111,125,共4页
为减小数据缺失对飞机油耗统计推断精度带来的负面影响,针对基于传统欧氏距离、马氏距离以及精简关联度的最近邻填补算法的不足,提出了一种基于标准欧氏距离的填补算法来估计QAR(Quick Access Recorder)数据中部分燃油流量数值的缺失。... 为减小数据缺失对飞机油耗统计推断精度带来的负面影响,针对基于传统欧氏距离、马氏距离以及精简关联度的最近邻填补算法的不足,提出了一种基于标准欧氏距离的填补算法来估计QAR(Quick Access Recorder)数据中部分燃油流量数值的缺失。该算法通过QAR数据样本之间的标准欧氏距离选择最近邻样本,并利用熵值赋权法计算最近邻的加权系数,基于最近邻样本中燃油流量的加权平均即可得到缺失燃油流量的估计值。实验结果表明,标准欧氏距离能够有效度量样本相似性,所提出的算法优于常规填补算法,是处理飞机油耗数据缺失的一种有效方法。 展开更多
关键词 标准欧氏距离 燃油流量缺失数据估计 K近邻填补算法 熵值赋权法 RKNN算法
下载PDF
基于核范数凸优化的微阵列缺失点重建 被引量:1
17
作者 孟繁驰 李书琴 蔡骋 《计算机工程与设计》 CSCD 北大核心 2013年第2期660-664,共5页
为解决大多数基因微阵列矩阵中含有缺失点的问题,提出了基于矩阵核范数凸优化(Nuclear Norm Optimization)的微阵列缺失点的重建方法。该方法利用了微阵列矩阵中的冗余信息,使用矩阵填充(Matrix Completion,MC)来重建缺失点,实现了矩阵... 为解决大多数基因微阵列矩阵中含有缺失点的问题,提出了基于矩阵核范数凸优化(Nuclear Norm Optimization)的微阵列缺失点的重建方法。该方法利用了微阵列矩阵中的冗余信息,使用矩阵填充(Matrix Completion,MC)来重建缺失点,实现了矩阵的核范数凸优化。实验结果表明,矩阵填充在某些时间序列的微阵列数据集上与K最近邻(KNN)、贝叶斯主成分分析(BPCA)和局部最小二乘法(LLSimpute)相比表现出了较强的竞争力。由矩阵填充得到的矩阵,还可以替代广泛应用的局部最小二乘法中的行均值填充矩阵。矩阵填充和局部最小二乘法结合的方法在所有测试数据集的几乎所有缺失率下都取得了最低的重建错误率。 展开更多
关键词 微阵列缺失点重建 核范数凸优化 矩阵填充 非精确增广拉格朗日乘子 局部最小二乘法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部