期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于MapReduce的混合数据孤立点检测算法 被引量:3
1
作者 郭一鹏 梁吉业 赵兴旺 《小型微型计算机系统》 CSCD 北大核心 2014年第9期1961-1966,共6页
在处理混合型大数据时,已有孤立点检测算法往往存在时间代价大、适用性差等问题.为了解决这一问题,本文基于最近邻思想提出了一个混合数据孤立点检测算法.该算法依据邻域计数的思想给出混合数据对象之间的相异性度量,并基于最近邻定义... 在处理混合型大数据时,已有孤立点检测算法往往存在时间代价大、适用性差等问题.为了解决这一问题,本文基于最近邻思想提出了一个混合数据孤立点检测算法.该算法依据邻域计数的思想给出混合数据对象之间的相异性度量,并基于最近邻定义了对象的孤立度,进而设计出一个混合数据孤立点检测算法,并且基于MapReduce编程模型对该算法进行了并行化设计以进一步提高算法执行效率.最后,在UCI数据集上通过与已有算法比较实验结果表明,本文提出的混合数据孤立点检测算法能有效地检测出孤立点,具有参数少、检测精度高的优点;算法的并行化实现提高了算法对混合型大数据的孤立点检测效率. 展开更多
关键词 孤立点检测 混合型数据 邻域计数 MAPREDUCE
下载PDF
基于邻近集计算的光谱相似性测度方法研究 被引量:1
2
作者 宋春静 丁香乾 +1 位作者 徐鹏民 吕光杰 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2017年第7期2032-2035,共4页
在近红外光谱数据相似性测度时,由于光谱数据高维、非线性、重叠等特点,会出现测度距离失效、数据信息处理困难等难题。针对传统相似性测度方法在高维空间出现的不适应性,提出了基于邻近集计算的光谱相似性测度方法。首先,采用邻域保持... 在近红外光谱数据相似性测度时,由于光谱数据高维、非线性、重叠等特点,会出现测度距离失效、数据信息处理困难等难题。针对传统相似性测度方法在高维空间出现的不适应性,提出了基于邻近集计算的光谱相似性测度方法。首先,采用邻域保持投影neighborhood preserving projections(NPP)算法对原始光谱数据进行降维处理,该降维方法可以很好的保留原始光谱数据非线性结构信息和数据点的邻域信息。然后,在光谱数据降维后的低维空间中,采用改进的邻近集计算方法,实现对近红外光谱数据的相似性测度。实验结果表明,基于邻近集计算的光谱相似性测度方法,有效的实现了光谱数据的相似性测度,在烟叶风格判定和品质分析方面有较好的应用前景,同时也为高维光谱数据相似性测度提供了一个良好的解决方法。 展开更多
关键词 近红外光谱 邻域保持投影 邻近集计算 相似性测度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部