期刊文献+

基于改进的K近缺失数据补全 被引量:8

Missing data completion based on an improved K-neighbor algorithm
原文传递
导出
摘要 针对化工过程中的数据样本缺失的问题,本文基于改进的K近邻算法对样本数据缺失值补全的方法进行了研究,阐述了K近邻补全算法的基本思路,并针对K近邻补全算法在缺失数据的K个最近邻的选择上可能存在的偏好,提出了一种改进的数据补全算法,有效的解决了K近邻补全算法在近邻选取上的偏向性。根据K近邻补全算法选取的K个近邻数据与缺失数据之间的距离,对K个近邻作加权,使得补全的数据更趋合理。仿真实验证明:改进的K近邻补全算法可以对样本的缺失部分进行更加有效的补全,从而扩展了软测量建模可用的样本数量。 In view of the problem of the missing data in chemical process, this article studies a method for missing data completion based on theK-neighbor algorithm, and expounds the basic idea ofK-neighbor completion, proposes an improved method of completion data to solve the problem about nearest neighbor algorithm selection bias effectively. According to the distance between the neighboring data and missing data, the weights ofK-neighbors are distributed to make the completion of data more reasonable. The simulation results show that the improved nearest neighbor completion algorithm can effectively estimate the missing part of samples so that the sample set can be expanded.
出处 《计算机与应用化学》 CAS 2015年第12期1499-1502,共4页 Computers and Applied Chemistry
基金 国家自然科学基金资助项目(61273070) 江苏高校优势学科建设工程资助项目
关键词 K近邻 缺失补全 偏向性 加权 nearest neighbor missing data completion bias weight
  • 相关文献

参考文献8

二级参考文献40

  • 1乔珠峰,田凤占,黄厚宽,陈景年.缺失数据处理方法的比较研究[J].计算机研究与发展,2006,43(z1):171-175. 被引量:13
  • 2程泽凯,林士敏,陆玉昌,蒋望东,陆小艺.基于Matlab的贝叶斯分类器实验平台MBNC[J].复旦学报(自然科学版),2004,43(5):729-732. 被引量:27
  • 3李晓毅,徐兆棣.增量式贝叶斯分类的原理和算法[J].沈阳工业大学学报,2006,28(4):422-425. 被引量:7
  • 4张文修 吴伟志 梁吉业 李德玉.粗造集理论与方法[M].北京:科学出版社,2001.115-131. 被引量:3
  • 5[1]Riedman N F,Geiger Dan.Bayesian network classifier.Machine Learning,1997; 29:131-163 被引量:1
  • 6[2]Dominigo S P,Pazzani M.On the op timality of the simp leBayesian classifier under zeroyone loss.Machine Learning,1997; 29:103-130 被引量:1
  • 7[3]D'Ambrosio B.Incremental evaluation and construction of defeasible probabilistic models.International Journal of Approximate Reasoning,1990;4:233-260 被引量:1
  • 8[4]Geiger D,Heckerman D.A characterization of the Dirichlet distribution with applicable to learning Bayesian network.Proceedings of Eleventh Conference on Uncertainty in Artificial Intelligence.Montreal,QU,1995;196-207 被引量:1
  • 9朱晓锋.缺失值填充若干问题研究[D].桂林:广西师范大学计算机科学与信息工程学院,2007. 被引量:2
  • 10Hua-wen LIU, Shi-ehao ZHANG. Noisy Data Elimination Using Mutual K-Nearest Neighbor for Classification Mining. Journal of Systems and Software 85(5): 1067-1074(2012). 被引量:1

共引文献19

同被引文献89

引证文献8

二级引证文献38

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部