-
题名基于清洗规则和主数据的数据修复算法实现
被引量:5
- 1
-
-
作者
林印华
张春海
刘洁
-
机构
中国海洋大学信息科学与工程学院
-
出处
《计算机科学》
CSCD
北大核心
2012年第S3期174-176,共3页
-
文摘
为了有效地清洗数据,此前已经提出了很多的完整性约束规则,例如条件函数依赖、条件包含依赖。这些约束规则虽然可以侦测出错误的存在,但是不能有效地指导用户纠正错误。实际上,基于约束规则的数据修复可能最终得不到确定性的修复结果,相反会引入新的错误,因此很大程度上降低了数据修复的效率。针对以上不足,提出了一种有效的数据清洗框架:首先基于Editing Rules和Master Data对数据进行清洗操作,最终得到确定性的修复;然后依据条件函数依赖来修复遗漏的错误,此种修复结果是不确定的,但是相比之下该框架不仅可以有效地保证数据修复的精确性与唯一性,而且提高了数据修复的效率。
-
关键词
条件函数依赖
清洗规则
数据清洗
数据质量
-
Keywords
Conditional functional dependency
Cleaning rules
Data cleaning
Data quality
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-