摘要
在许多数据共享的应用中,要求发布的共享信息可以保护个体的敏感信息,例如,患者的疾病、客户的信誉等级、雇员的工资等涉及个人隐私的信息.同时,另一些信息也需要被共享.文中考虑了数据发布应用中同时存在的信息保护与信息共享问题.攻击者能够使用发布的信息以很高的置信度推断出敏感数据的真实值.目的是防止在发布数据上利用关联规则进行数据推演.对攻击框架进行了形式化定义,并研究了复杂性问题.证明了计算安全的可发布数据表的计算复杂性为NP难.根据信息发布的要求对问题进行了分类,提出了相应的计算安全可发布数据表的算法.基于实际数据集的实验分析表明所提出的算法可以产生近似最多的发布数据,并且改善了现有算法的运算效率.
基金
国家自然科学基金(批准号:60828004
60503036)
教育部新世纪优秀人才支持计划(批准号:NCET-06-0290)
霍英东教育基金会青年教师基金优选资助课题(批准号:104027)资助项目