期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
基于条件函数依赖的数据库一致性检测研究 被引量:9
1
作者 耿寅融 刘波 《计算机工程与应用》 CSCD 2012年第3期122-125,共4页
条件函数依赖是函数依赖在语义上的扩充,可以应用于数据清洗工作,在数据库一致性的修复上应用广泛。讨论了条件函数依赖的相关语义规则,重点研究了基于条件函数依赖对违反数据库一致性元组的检测工作,并引入置信度评价机制,对相关的检... 条件函数依赖是函数依赖在语义上的扩充,可以应用于数据清洗工作,在数据库一致性的修复上应用广泛。讨论了条件函数依赖的相关语义规则,重点研究了基于条件函数依赖对违反数据库一致性元组的检测工作,并引入置信度评价机制,对相关的检测规则进行了改进。改进后的检测方法在基于多个函数依赖的检测中显示出了优越性,使得检测工作更为精简,检测标准更加明确。 展开更多
关键词 条件函数依赖 函数依赖 结构化查询语言(SQL)
下载PDF
条件依赖理论及其应用展望 被引量:8
2
作者 胡艳丽 张维明 《计算机科学》 CSCD 北大核心 2009年第12期115-118,145,共5页
介绍了条件函数依赖理论及如何用于检测不一致数据。首先介绍了条件函数依赖的概念及其推理系统,以及如何通过依赖传播实现视图的规范化;阐述了条件函数依赖的一致性和蕴含判定问题,并在此基础上介绍了基于条件函数依赖检测关系数据库... 介绍了条件函数依赖理论及如何用于检测不一致数据。首先介绍了条件函数依赖的概念及其推理系统,以及如何通过依赖传播实现视图的规范化;阐述了条件函数依赖的一致性和蕴含判定问题,并在此基础上介绍了基于条件函数依赖检测关系数据库数据一致性的技术;最后讨论了条件函数依赖的扩展及应用。 展开更多
关键词 数据质量 数据清洗 条件函数依赖 推理规则 依赖传播 一致性判定 蕴含判定
下载PDF
一种基于数据一致性的记录比较方法 被引量:4
3
作者 冉德彤 游宏梁 《电子设计工程》 2018年第1期66-69,73,共5页
记录比较的准确性对能否正确识别相似重复记录起重要作用。为得到更为准确的记录比较结果,提出了一种基于数据一致性的记录比较方法。该方法利用条件函数依赖检测数据一致性信息,基于该信息计算属性相似度,并与传统方法的结果相结合,完... 记录比较的准确性对能否正确识别相似重复记录起重要作用。为得到更为准确的记录比较结果,提出了一种基于数据一致性的记录比较方法。该方法利用条件函数依赖检测数据一致性信息,基于该信息计算属性相似度,并与传统方法的结果相结合,完成记录比较。实验表明,新的记录比较结果有助于获得更高的准确率、召回率和F值。 展开更多
关键词 数据质量 实体分辨 记录比较 数据一致性 条件函数依赖
下载PDF
Discovering context-aware conditional functional dependencies 被引量:1
4
作者 Yuefeng DU Derong SHEN +2 位作者 Tiezheng NIE Yue KOU Ge YU 《Frontiers of Computer Science》 SCIE EI CSCD 2017年第4期688-701,共14页
Conditional functional dependencies(CFDs) are important techniques for data consistency. However, CFDs are limited to 1) provide the reasonable values for consistency repairing and 2) detect potential errors. This... Conditional functional dependencies(CFDs) are important techniques for data consistency. However, CFDs are limited to 1) provide the reasonable values for consistency repairing and 2) detect potential errors. This paper presents context-aware conditional functional dependencies(CCFDs) which contribute to provide reasonable values and detect po- tential errors. Especially, we focus on automatically discov- ering minimal CCFDs. In this paper, we present context rela- tivity to measure the relationship of CFDs. The overlap of the related CFDs can provide reasonable values which result in more accuracy consistency repairing, and some related CFDs are combined into CCFDs. Moreover, we prove that discover- ing minimal CCFDs is NP-complete and we design the pre- cise method and the heuristic method. We also present the dominating value to facilitate the process in both the precise method and the heuristic method. Additionally, the context relativity of the CFDs affects the cleaning results. We will give an approximate threshold of context relativity accord- ing to data distribution for suggestion. The repairing results are approved more accuracy, even evidenced by our empirical evaluation. 展开更多
关键词 conditional functional dependencies contextaware rules discovery
原文传递
一种增量发现条件函数依赖的算法 被引量:1
5
作者 李丁月 刘建勋 翟海军 《计算机工程与科学》 CSCD 北大核心 2013年第8期149-155,共7页
数据库频繁更新会导致满足条件的条件函数依赖(CFDs)发生变化,为获取准确的条件函数依赖,可以在更新后的数据库上重新执行发现过程,但这种方法会导致大量时间都浪费在对原始数据集的重复处理上。针对这种情况,在CFINDER算法基础上,提出... 数据库频繁更新会导致满足条件的条件函数依赖(CFDs)发生变化,为获取准确的条件函数依赖,可以在更新后的数据库上重新执行发现过程,但这种方法会导致大量时间都浪费在对原始数据集的重复处理上。针对这种情况,在CFINDER算法基础上,提出了一个增量发现条件函数依赖的算法CFUP。当数据库中增加新数据集时,CFUP在已有的CFDs的基础上,去掉不满足条件的CFDs,发现满足条件的新CFDs。实验表明,该算法能有效地进行条件函数依赖的增量式更新,与重新运行CFINDER算法相比,减少了原始数据集的扫描次数,提高了更新CFDs的效率。 展开更多
关键词 条件函数依赖 增量式算法 数据库
下载PDF
基于水利普查数据的函数依赖关系算法 被引量:1
6
作者 钱振兴 万定生 +1 位作者 李士进 程习锋 《计算机与现代化》 2014年第8期96-100,共5页
条件函数依赖(Conditional Functional Dependencies,CFDs)在数据库一致性的检测上应用广泛。为检测水利普查数据的一致性,本文针对水利普查数据特点,将普查数据分为度量、维度2部分,并对度量数据进行聚类,引入条件函数依赖的概念,同时... 条件函数依赖(Conditional Functional Dependencies,CFDs)在数据库一致性的检测上应用广泛。为检测水利普查数据的一致性,本文针对水利普查数据特点,将普查数据分为度量、维度2部分,并对度量数据进行聚类,引入条件函数依赖的概念,同时重新定义条件函数依赖,改进发现条件函数依赖的算法(即CTANE算法);以水库工程数据为例,验证本文改进的算法能准确高效地发现水利普查数据中的条件函数依赖,为检测数据一致性做好准备。 展开更多
关键词 水利普查数据 条件函数依赖 度量 维度 CTANE算法
下载PDF
基于内容感知发现XML条件函数依赖 被引量:1
7
作者 郑婷 段富 《计算机应用研究》 CSCD 北大核心 2014年第12期3655-3658,3662,共5页
针对XML函数依赖(XFD)不能充分检测XML局部数据源语义上的数据不一致,借鉴关系数据库中条件函数依赖(CFD)的概念,并根据XML自身结构和约束特性,提出了基于内容感知发现(CAD)XML条件函数依赖(XCFD),CAD使用隐藏在数据值中的内容发现局部... 针对XML函数依赖(XFD)不能充分检测XML局部数据源语义上的数据不一致,借鉴关系数据库中条件函数依赖(CFD)的概念,并根据XML自身结构和约束特性,提出了基于内容感知发现(CAD)XML条件函数依赖(XCFD),CAD使用隐藏在数据值中的内容发现局部XML文档的XCFDs,检测异构数据源中数据一致性,提高数据的质量,并给出了详细的算法,同时引入修剪规则集减少搜索点阵和候选的XCFD的数量,提高算法的效率,使得XCFD无冗余、最小化。通过案例研究表明,基于CAD方法发现的XCFD比现有XFD发现更多的函数依赖和语义约束。 展开更多
关键词 可扩展标记语言 条件函数依赖 语义约束 内容感知 数据一致性
下载PDF
面向企业应用集成的主数据管理系统 被引量:13
8
作者 林泳琴 《电脑知识与技术》 2011年第7期4521-4523,4533,共4页
针对企业数据集成中存在的数据质量问题,为解决集成数据的不一致性问题,提出基于CFD、CIND进行数据一致性检测和基于订阅规则进行数据发布的主数据管理系统。系统搭建于SOA架构之上,通过主数据抽取、主数据质量控制、主数据发布等组... 针对企业数据集成中存在的数据质量问题,为解决集成数据的不一致性问题,提出基于CFD、CIND进行数据一致性检测和基于订阅规则进行数据发布的主数据管理系统。系统搭建于SOA架构之上,通过主数据抽取、主数据质量控制、主数据发布等组件功能为各应用系统提供透明的“单一”主数据视图,并实现了主数据变更流程的自动管理。应用结果表明,使用主数据管理有效地解决了在各应用系统中流转数据的一致性问题,从而提高了集成数据的质量。 展开更多
关键词 主数据管理 数据质量 条件函数依赖 条件包含依赖
下载PDF
异构模式中关联数据的一致性规则发现方法 被引量:9
9
作者 杜岳峰 李晓光 宋宝燕 《计算机研究与发展》 EI CSCD 北大核心 2020年第9期1939-1948,共10页
数据一致性是数据质量管理的一项核心事务.规则约束作为一种抽象化、形式化的数据关系表达技术,可以有效地进行数据一致性管理.但是,在进行多源数据一致性管理的过程中,由于异源数据所属的关系模式不同,给一致性规则融合带来了挑战.另外... 数据一致性是数据质量管理的一项核心事务.规则约束作为一种抽象化、形式化的数据关系表达技术,可以有效地进行数据一致性管理.但是,在进行多源数据一致性管理的过程中,由于异源数据所属的关系模式不同,给一致性规则融合带来了挑战.另外,不论同源数据还是异源数据,数据之间是相互关联的,可以利用这种关系强化规则约束中语义含义的表达作用,发现数据中的潜在错误.具体地,条件包含依赖(conditional inclusion dependencies,CINDs)和内容相关的条件函数依赖(content-related conditional functional dependencies,CCFDs)可以分别用于异构模式的属性匹配和内容关联数据的一致性维护.基于此,对面向异构关系模式中关于关联数据的一致性规则发现问题进行研究.首先,针对使用CINDs进行异构模式中CCFDs规则发现的基本问题进行分析,对规则发现的可满足性、蕴含性和可验证性问题进行解释,它们分别满足NP-complete,coNP-complete,PTIME的复杂性判定问题.其次,为了对规则空间内的全部CCFDs进行发现,以CCFDs中的条件属性和变量属性为划分依据,提出了一种2级lattice的搜索结构.再次,设计了一种基于CINDs和CCFDs的异构关联数据一致性规则发现方法,使用CINDs对规则形式进行融合,而后通过增量发现方式查找一致性规则.最后,通过在2组真实数据进行实验,验证了方法的有效性和高效性. 展开更多
关键词 异构关系模式 关联数据 条件包含依赖 内容相关的条件函数依赖 规则发现
下载PDF
语义知识库构建中的异常数据发现
10
作者 贺彬彬 邹磊 赵东岩 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期195-202,共8页
为了提高RDF知识库的数据质量,提出RDF图数据的异常检测及其自动修复的方法。首先,原创性地定义了基于图的条件函数依赖(GCFD),能够将属性值和语义结构的依赖关系统一表示;然后,提出有效的算法框架以及优化策略,挖掘RDF数据中的GCFD,并... 为了提高RDF知识库的数据质量,提出RDF图数据的异常检测及其自动修复的方法。首先,原创性地定义了基于图的条件函数依赖(GCFD),能够将属性值和语义结构的依赖关系统一表示;然后,提出有效的算法框架以及优化策略,挖掘RDF数据中的GCFD,并给出异常数据的自动修复流程;最后,在真实的数据集上,通过大量实验确认解决方案的可行性和优越性。 展开更多
关键词 RDF数据质量 基于图的条件函数依赖 条件函数依赖 函数依赖
下载PDF
条件函数依赖的增量计算
11
作者 刘波 周健昌 《系统工程与电子技术》 EI CSCD 北大核心 2015年第11期2640-2647,共8页
条件函数依赖是对传统函数依赖的扩展,它通过引入条件模式,使其语义比函数依赖更精确、表达能力更强。然而,条件函数依赖的计算需要消耗较多的时间,为了提高条件函数依赖挖掘的效率,研究了条件函数依赖增量维护方法。针对数据集增加、... 条件函数依赖是对传统函数依赖的扩展,它通过引入条件模式,使其语义比函数依赖更精确、表达能力更强。然而,条件函数依赖的计算需要消耗较多的时间,为了提高条件函数依赖挖掘的效率,研究了条件函数依赖增量维护方法。针对数据集增加、删除、修改3种情况分别分析了条件函数依赖集变化规律,提出了条件函数依赖的增量计算算法,从而能够在数据库变化情况下,高效、动态地维护条件函数依赖。同时,在理论上对算法中关键步骤的正确性进行了论证,并通过实验验证了算法的有效性。 展开更多
关键词 增量计算 条件函数依赖 数据挖掘
下载PDF
一种基于CFDs规则的修复序列快速判定方法
12
作者 王欢 张云峰 张艳 《计算机科学》 CSCD 北大核心 2018年第3期311-316,共6页
数据一致性是大数据质量管理研究的一个重要内容。条件函数依赖(CFDs)是维护数据一致性的有效技术手段。然而,在修复过程中选择不同的CFDs修复顺序,会影响修复的准确性和效率。因此,如何选取一个正确且合理的修复顺序对数据修复至关重... 数据一致性是大数据质量管理研究的一个重要内容。条件函数依赖(CFDs)是维护数据一致性的有效技术手段。然而,在修复过程中选择不同的CFDs修复顺序,会影响修复的准确性和效率。因此,如何选取一个正确且合理的修复顺序对数据修复至关重要。针对该问题,提出一种基于CFDs规则的快速判定修复序列的计算方法。首先,设计了一种数据修复框架。然后,利用CFDs之间的关联关系,提出了修复序列图的概念,以用于CFDs修复顺序的计算。一方面,可以避免某些错误的或者不必要的数据修复,提高修复的准确性。另一方面,使用规则来判定修复顺序比使用实际数据进行判定更为快速。此外,在判定修复序列的过程中,对修复死锁进行了检测,保证了修复过程的可终止性。最后,通过在真实数据集上与现有方法进行对比实验,证明了所提方法具有更高的准确性和运行效率。 展开更多
关键词 数据一致性 条件函数依赖 修复序列
下载PDF
大数据上基于Hadoop的不一致数据检测与修复算法 被引量:13
13
作者 张安珍 门雪莹 +2 位作者 王宏志 李建中 高宏 《计算机科学与探索》 CSCD 北大核心 2015年第9期1044-1055,共12页
随着现代社会互联网的普及应用,产生的海量数据普遍存在质量问题。针对数据质量中不一致性问题进行研究,设计并实现了基于Hadoop并行平台的不一致数据检测与修复算法。采用数据依赖理论中的条件函数依赖,根据给定规则检测不一致数据集,... 随着现代社会互联网的普及应用,产生的海量数据普遍存在质量问题。针对数据质量中不一致性问题进行研究,设计并实现了基于Hadoop并行平台的不一致数据检测与修复算法。采用数据依赖理论中的条件函数依赖,根据给定规则检测不一致数据集,对这些不一致数据求解修复方案,使得修复结果满足数据一致性要求,并给出修复结果的确定性概率。最后通过实验证明了该算法较已有的单机算法有更好的修复效果,当约束规则较少的情况下,算法执行时间呈线性增长。 展开更多
关键词 数据一致性 MAP REDUCE 条件函数依赖 数据质量
下载PDF
Mining Conditional Functional Dependency Rules on Big Data 被引量:5
14
作者 Mingda Li Hongzhi Wang Jianzhong Li 《Big Data Mining and Analytics》 2020年第1期68-84,共17页
Current Conditional Functional Dependency(CFD)discovery algorithms always need a well-prepared training dataset.This condition makes them difficult to apply on large and low-quality datasets.To handle the volume issue... Current Conditional Functional Dependency(CFD)discovery algorithms always need a well-prepared training dataset.This condition makes them difficult to apply on large and low-quality datasets.To handle the volume issue of big data,we develop the sampling algorithms to obtain a small representative training set.We design the fault-tolerant rule discovery and conflict-resolution algorithms to address the low-quality issue of big data.We also propose parameter selection strategy to ensure the effectiveness of CFD discovery algorithms.Experimental results demonstrate that our method can discover effective CFD rules on billion-tuple data within a reasonable period. 展开更多
关键词 DATA MINING conditional functional dependENCY BIG DATA DATA quality
原文传递
基于条件函数依赖的挖掘算法研究 被引量:6
15
作者 张方舟 高晓松 《计算机技术与发展》 2015年第5期56-59,共4页
由于采用函数依赖(Functional Dependency,FD)对数据库的检测和修复还不够充分,现提出了条件函数依赖(Conditional Functional Dependency,CFD),其是在FD的基础上加入了语义约束。条件函数依赖的挖掘是一种重要的数据库分析技术,CFD挖... 由于采用函数依赖(Functional Dependency,FD)对数据库的检测和修复还不够充分,现提出了条件函数依赖(Conditional Functional Dependency,CFD),其是在FD的基础上加入了语义约束。条件函数依赖的挖掘是一种重要的数据库分析技术,CFD挖掘是在FD挖掘的基础上通过条件分析进行更细粒度的信息挖掘,其时间复杂度较高。文中主要介绍了CFD的相关概念及CFD经典挖掘算法之一—CTANE,并对该算法效率进行改进。改进后的算法不仅可以提高数据挖掘过程中操作的效率,同时也将节省数据的存储空间。 展开更多
关键词 条件函数依赖 数据质量 数据清洗 CTANE算法
下载PDF
基于关联规则的条件函数依赖发现及数据修复 被引量:5
16
作者 张春生 图雅 +2 位作者 翁慧 李艳 魏国利 《计算机应用研究》 CSCD 北大核心 2016年第2期384-387,共4页
大数据时代,数据的来源复杂,数据质量存在严重问题,有些数据不准确、缺失或存在错误。不正确的数据严重影响了数据挖掘的质量,给决策造成重大的影响。关于缺失数据的修复方法很多,其中条件函数依赖就是一个有效的方法,在如何发现条件函... 大数据时代,数据的来源复杂,数据质量存在严重问题,有些数据不准确、缺失或存在错误。不正确的数据严重影响了数据挖掘的质量,给决策造成重大的影响。关于缺失数据的修复方法很多,其中条件函数依赖就是一个有效的方法,在如何发现条件函数依赖方面已经有了很多研究成果。提出一种应用关联规则构建条件函数依赖的方法,由于关联规则通过数据挖掘得到,具有一定的隐蔽性,不是一般的方法能够发现,所以,由关联规则构建的条件函数依赖具有一定的应用价值,给出了构建方法,并通过实验证明其有效性。 展开更多
关键词 关联规则 条件函数依赖 一致性 数据修复 大数据 缺失数据
下载PDF
基于清洗规则和主数据的数据修复算法实现 被引量:5
17
作者 林印华 张春海 刘洁 《计算机科学》 CSCD 北大核心 2012年第S3期174-176,共3页
为了有效地清洗数据,此前已经提出了很多的完整性约束规则,例如条件函数依赖、条件包含依赖。这些约束规则虽然可以侦测出错误的存在,但是不能有效地指导用户纠正错误。实际上,基于约束规则的数据修复可能最终得不到确定性的修复结果,... 为了有效地清洗数据,此前已经提出了很多的完整性约束规则,例如条件函数依赖、条件包含依赖。这些约束规则虽然可以侦测出错误的存在,但是不能有效地指导用户纠正错误。实际上,基于约束规则的数据修复可能最终得不到确定性的修复结果,相反会引入新的错误,因此很大程度上降低了数据修复的效率。针对以上不足,提出了一种有效的数据清洗框架:首先基于Editing Rules和Master Data对数据进行清洗操作,最终得到确定性的修复;然后依据条件函数依赖来修复遗漏的错误,此种修复结果是不确定的,但是相比之下该框架不仅可以有效地保证数据修复的精确性与唯一性,而且提高了数据修复的效率。 展开更多
关键词 条件函数依赖 清洗规则 数据清洗 数据质量
下载PDF
一种条件函数依赖挖掘算法的分析与实现 被引量:6
18
作者 周健昌 刘波 《计算机与数字工程》 2012年第9期8-11,共4页
条件函数依赖(Conditional Functional Dependence,CFD)的挖掘是一种重要的数据库分析技术,它是在函数依赖(FunctionalDependence,FD)挖掘的基础上加入条件分析功能扩展而来,当前被应用于数据质量检测。CFD挖掘是在FD挖掘的基础上通过... 条件函数依赖(Conditional Functional Dependence,CFD)的挖掘是一种重要的数据库分析技术,它是在函数依赖(FunctionalDependence,FD)挖掘的基础上加入条件分析功能扩展而来,当前被应用于数据质量检测。CFD挖掘是在FD挖掘的基础上通过条件分析进行更细粒度的信息挖掘,其时间复杂度较高。文章详细介绍一种经典的CFD挖掘方法(即CTANE算法),对其实现方法提出了优化措施,并通过实验比较了不同实现方法的效率,得出了优化措施改进效率的结论。 展开更多
关键词 数据挖掘 数据质量 一致性检测 数据清洗 条件函数依赖 CTANE算法
下载PDF
异构物联网中关联数据一致性规则挖掘模型 被引量:1
19
作者 许明宇 王宜怀 《计算机仿真》 北大核心 2023年第2期425-428,442,共5页
数据一致性规则属于数据质量管理的核心规则。因此,以高效、准确挖掘为目的,研究了面向异构物联网,构建了一种关联数据一致性规则挖掘模型。先通过多维数据聚类去除异构物联网中的重复数据,以此来减少后续关联数据一致性规则挖掘过程的... 数据一致性规则属于数据质量管理的核心规则。因此,以高效、准确挖掘为目的,研究了面向异构物联网,构建了一种关联数据一致性规则挖掘模型。先通过多维数据聚类去除异构物联网中的重复数据,以此来减少后续关联数据一致性规则挖掘过程的耗时;基于内容相关的条件函数依赖关系建立挖掘模型,并将清理后数据导入中,对其中的一致性规则展开挖掘。经仿真测试可知,针对3种不同数据量的异构物联网数据,上述模型对在挖掘其一致性规则时的效率与准确性均较高,挖掘耗时最大值仅为1.27s,规则挖掘结果与实际规则数量一致,充分证明了上述模型的高效性。 展开更多
关键词 异构物联网 关联数据 一致性规则 规则挖掘 条件函数依赖
下载PDF
基于依赖的数据一致性研究进展 被引量:3
20
作者 余敏 赵晓南 许志 《计算机应用》 CSCD 北大核心 2018年第A02期72-76,102,共6页
大数据时代数据源的多样性使得数据质量良莠不齐,数据中包含的语义不一致性给应用其进行决策的领域造成损失。对数据间语义联系的了解程度决定了错误检出和修复的效果,通常掌握的知识粒度越细错误检出和修复越有效。在关系数据库理论中... 大数据时代数据源的多样性使得数据质量良莠不齐,数据中包含的语义不一致性给应用其进行决策的领域造成损失。对数据间语义联系的了解程度决定了错误检出和修复的效果,通常掌握的知识粒度越细错误检出和修复越有效。在关系数据库理论中提出的函数依赖是描述数据间语义联系的规则,最初用于定义模式,最近被用于改善数据质量。为了弥补函数依赖在解决数据质量、描述语义知识时的局限性,研究人员又定义了条件函数依赖和微函数依赖。应用依赖改善数据一致性通常需要确定依赖集合、发现违反依赖的错误数据和修复错误三步,当前研究人员围绕着其中一两个步骤展开研究取得了一些成果。按依赖所描述语义逐渐细化的顺序,综述最新研究进展,指出在大数据时代尚缺乏兼顾错误检出率、修复效果和可扩展性的一致性问题解决方案,展望未来的研究方向。 展开更多
关键词 数据一致性 函数依赖 条件函数依赖 微函数依赖
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部