-
题名k-匿名数据中的数据依赖问题研究
被引量:2
- 1
-
-
作者
万涛
刘国华
-
机构
东华大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
2012年第20期38-40,共3页
-
基金
国家自然科学基金资助项目(61070032)
-
文摘
k-匿名隐私保护模型在隐私保护过程中会产生大量k-匿名数据。为研究k-匿名数据中的数据依赖问题,提出一种扩展函数依赖,将经典函数依赖中的被决定属性取值相等这个条件进行扩展,使其取值来自于同一个指定集合。应用结果表明,该扩展函数依赖不仅包括经典函数依赖、垂直函数依赖、水平函数依赖、度量函数依赖的特性,而且可以从数据完整性的角度描述k-匿名数据的约束条件及指导k-匿名隐私保护模型中准标识符的选取。
-
关键词
K-匿名
扩展函数依赖
准标识符
不确定数据
完整性约束
敏感属性
-
Keywords
k-anonymity
Extended Functional Dependencies(EFDs)
Quasi-identifier(QI)
uncertain data
integrity constraint
sensitive attribute
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-
-
题名一种扩展条件函数依赖的发现算法
被引量:5
- 2
-
-
作者
刘显敏
李建中
-
机构
哈尔滨工业大学
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第1期130-140,共11页
-
基金
国家"九七三"重点基础研究发展计划基金项目(2012CB316200)
国家自然科学基金青年基金项目(61003046)
-
文摘
扩展条件函数依赖(extended conditional functional dependency,eCFD)是一种描述数据一致性的语义规则,是条件函数依赖(conditional functional dependency,CFD)的扩展.相比于CFD,eCFD能够描述更多的模式从而表达更丰富的语义信息.然而,关注eCFD的研究工作并不多.从给定数据中发现eCFD规则是一个重要问题,据笔者所知,目前还没有这方面的工作.该问题的难点在于,给定数据中所有合法的eCFD规则之间存在不一致的情况,且包含大量冗余,而CFD和传统的函数依赖规则并没有这样的问题.为避免不一致,同时尽可能地消除冗余,定义了"强合法eCFD"和"近似无冗余eCFD".基于这些概念给出了eCFD发现问题的形式化定义,并给出了MeCFD算法.利用划分属性的方法,MeCFD首先生成所有的基本eCFD,然后,通过合并基本eCFD来构造"组合eCFD".使用先深序来搜索候选空间,使得MeCFD仅用常数的存储空间来维护数据划分,节省了大量的空间开销,有效的剪枝策略被用来改进MeCFD的性能.真实数据集上的实验结果显示出MeCFD良好的可扩展性以及剪枝策略和优化方法的有效性.
-
关键词
扩展条件函数依赖
发现算法
搜索算法
剪枝策略
冗余
-
Keywords
extended conditional functional dependency (eCFD)
discovering algorithm
search algorithm
pruningstrategy
redundancy
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-