检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到5篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种XML相似重复数据的清理方法研究被引量：7: 1; 作者陈伟丁秋林《北京航空航天大学学报》 EI CAS CSCD 北大核心 2004年第9期835-838,共4页; 针对半结构化数据XML在数据清理中的重要性 ,研究了如何清理XML相似重复数据 ,主要工作有 :提出一种有效的XML相似重复数据清理方法 ,该方法具有较强的适应性 ,任何XML相似检测算法都适用于此 ;给出一种基于树编辑距离的相似检测算法 ,... 展开更多; 关键词规则库算法库数据清理可扩展标记语言相似重复数据; 下载PDF 职称材料

数据清洗研究综述被引量：9: 2; 作者廖书妍《电脑知识与技术》 2020年第20期44-47,共4页; 数据清洗是数据分析、数据挖掘等研究的起点。本文对数据清洗的研究进行了综述。首先阐述了数据清洗与数据质量的关系,然后说明了数据清洗的概况,并分析了数据清洗的步骤及方法,最后简要介绍了国内外关于数据清洗的研究近况,同时对中文... 展开更多; 关键词脏数据数据清洗数据质量相似重复数据清洗步骤; 下载PDF 职称材料

基于Hadoop平台的数据清洗研究被引量：3: 3; 作者范会丽彭宁任薇《电脑知识与技术》 2020年第5期27-28,共2页; 各行各业数据的指数级增长,导致数据仓库建设管理,数据库中知识发现和总体数据质量管理中涉及的重复数据、数据值缺失、错误记录、没有意义的异常值等数据问题越来越棘手。这三个领域也是数据清洗的主要领域。基于当前现状,结合当前各... 展开更多; 关键词 HADOOP平台数据清洗完全重复数据相似重复数据; 下载PDF 职称材料

面向时序的相似重复数据清洗算法优化被引量：1: 4; 作者沈沛毛海涛 +1 位作者胡文林芮波《计算机时代》 2022年第9期68-72,77,共6页; 针对海量时序数据集提出了一种相似重复数据检测算法。该算法以传统近邻排序算法SNM为基础,增加了对窗口大小的动态调整策略,新增了窗口跳跃滑动策略。新策略大大减少了相似重复数据清洗过程中的比对次数。该算法的提出,对时序数据集中... 展开更多; 关键词时序数据 SNM改进算法相似重复数据动态滑动窗口数据清洗; 下载PDF 职称材料

基于语义相似的中文数据清洗方法: 5; 作者李碧秋王佳斌刘雪丽《现代计算机》 2021年第19期58-61,共4页; 目前关于数据清洗的研究大多针对英文数据,相关算法较为成熟,而对中文文本数据的清洗研究较少,且中英文差距较大,面向英文的清洗方法不完全适应于中文。基于此提出一种面向中文的相似重复数据清洗方法,充分考虑中文存在的一词多义与多... 展开更多; 关键词中文文本数据清洗相似重复数据文本向量化聚类; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部