-
题名数据质量及数据清洗方法
被引量:31
- 1
-
-
作者
宋金玉
陈爽
郭大鹏
王内蒙
-
机构
解放军理工大学指挥信息系统学院
吉林陆军预备役步兵第
-
出处
《指挥信息系统与技术》
2013年第5期63-70,共8页
-
文摘
数据质量问题关系到信息系统建设。首先,概述了数据质量的定义和数据质量问题的分类并总结其来源,介绍了数据质量维度这一数据质量评估指标;然后,说明了不同领域中数据清洗的概念,分析了不同数据质量问题的清洗方法,并归纳了数据清洗有关的框架和工具。最后,对数据清洗相关研究进行了展望。
-
关键词
数据质量
数据清洗
清洗方法
数据清洗工具
-
Keywords
data quality
data cleaning
cleaning methods
data cleaning tools
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向流程企业数据仓库的设计与应用
被引量:2
- 2
-
-
作者
闫伟
童祯恭
廖西亮
-
机构
山东大学机械工程学院
华东交通大学土木建筑学院
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2006年第6期899-904,共6页
-
基金
国家863/CIMS主题资助项目(2002AA412410)~~
-
文摘
建立了应用于某流程企业的数据仓库。首先分析了数据的不同来源,设计了基于此数据源的数据清洗工具,提出数据清洗时遇到的技术问题和解决方案,并着重分析了罩盖技术检查重复数据的过程。采用数据仓库-实体联系概念模型设计了生产费用、油气生产、干气和副产品库存为主题的数据仓库,并用商业智能插件实现了联机分析处理对数据仓库的查询。采用了基于主成分分析和拉格朗日公式的支持向量机方法建立了此公司各产品产量的分析预测模型,实现了用干气预测原料气和副产品的功能,获得了良好的经济效益。
-
关键词
数据仓库
数据清洗工具
罩盖技术
数据仓库-实体联系概念模型
支持向量机方法
-
Keywords
data warehouse
extraction transformation loading tool
canopy methods
data warehouse- entity relationship model
support vector machine method
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-