-
题名最大依赖集在不一致数据检测中的应用
- 1
-
-
作者
戴超凡
李沛
王文倩
-
机构
国防科技大学信息系统工程重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2019年第15期89-95,共7页
-
基金
军队高层次创新人才工程
教育部新世纪优秀人才支持计划(No.B43451914)
-
文摘
针对条件函数依赖(CFDs)对不一致数据检测不完备问题,提出基于最大依赖集(MDS)的依赖提升算法(DLA),通过获取依赖中包含的隐性依赖(RCFDs)对数据集中的不一致数据进行检测。利用动态值域调整,设置数值变化的前移和后移指针,改进原算法的枚举过程,提高了算法对连续属性的适用性,给出动态值域调整和依赖提升算法的算法流程和伪代码,并对算法的收敛性和时间复杂度进行分析。最后通过对照实验,对比了依赖提升算法和基于CFDs的检测方法的检测精度和时间代价,验证了算法的有效性。
-
关键词
条件函数依赖(cfds)
不一致数据
最大依赖集(MDS)
动态值域调整
-
Keywords
conditional functional dependency(cfds)
inconsistent data
Maximum dependency Set(MDS)
dynamic domain adjustment
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于条件函数依赖的隐私保护模型
被引量:1
- 2
-
-
作者
陈伟鹤
陈霖
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2012年第10期3838-3841,共4页
-
基金
江苏省教育厅自然科学基金资助项目(09KJB520003)
江苏大学高级人才启动基金资助项目(07JDG031)
-
文摘
数据拥有者发布的数据中如果包含条件函数依赖会导致数据的隐私受到攻击,由条件函数依赖产生的属性间的关联会带来潜在的隐私泄露问题。针对现有的隐私保护方法均无法保护包含条件函数依赖的数据的隐私,形式化地定义了基于条件函数依赖的隐私攻击,提出了隐私保护模型l-deduction来对包含条件函数依赖的数据进行隐私保护;并设计了相应的匿名算法来实现l-deduction模型。理论分析和实验结果表明,该方法既能保护包含条件函数依赖的数据的隐私,又具有较小的信息损失度。
-
关键词
隐私保护
数据发布
条件函数依赖
l-deduction
信息损失
-
Keywords
privacy-preserving
data publishing
conditional functional dependency(cfds)
l-deduction
information loss
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于CFDs规则的修复序列快速判定方法
- 3
-
-
作者
王欢
张云峰
张艳
-
机构
北华航天工业学院科学技术处
北华航天工业学院计算机与遥感信息技术学院
-
出处
《计算机科学》
CSCD
北大核心
2018年第3期311-316,共6页
-
基金
河北省自然科学基金(F2014409008)
河北省科技计划项目(17210336)
廊坊市科技计划项目(2017011042)资助
-
文摘
数据一致性是大数据质量管理研究的一个重要内容。条件函数依赖(CFDs)是维护数据一致性的有效技术手段。然而,在修复过程中选择不同的CFDs修复顺序,会影响修复的准确性和效率。因此,如何选取一个正确且合理的修复顺序对数据修复至关重要。针对该问题,提出一种基于CFDs规则的快速判定修复序列的计算方法。首先,设计了一种数据修复框架。然后,利用CFDs之间的关联关系,提出了修复序列图的概念,以用于CFDs修复顺序的计算。一方面,可以避免某些错误的或者不必要的数据修复,提高修复的准确性。另一方面,使用规则来判定修复顺序比使用实际数据进行判定更为快速。此外,在判定修复序列的过程中,对修复死锁进行了检测,保证了修复过程的可终止性。最后,通过在真实数据集上与现有方法进行对比实验,证明了所提方法具有更高的准确性和运行效率。
-
关键词
数据一致性
条件函数依赖
修复序列
-
Keywords
Data consistency
conditional functional dependencies(cfds)
Repairing sequence
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-