面向关系-事务数据的数据匿名方法被引量：4

Data Anonymization Approach for Microdata with Relational and Transaction Attributes

下载PDF

导出

摘要在发布同时包含关系和事务属性的数据(简称为关系-事务数据)时,由于关系数据和事务数据均有可能受到链接攻击,需要同时匿名这两部分的数据.现有的数据匿名技术在匿名化关系-事务数据时会造成严重的数据缺损,无法保障数据可用性.针对此问题,提出了(k,l)-多样化模型,通过等价类上的l-多样化约束和事务数据上的k-匿名约束来保证用户隐私不被泄露.在此基础上,设计并实现了APA和PAA两种满足该模型的匿名算法,以不同的顺序对关系-事务数据进行匿名,并提出了相应的数据缺损评估方法.实际公开数据集上的实验结果表明,与现有的数据匿名技术相比,APA和PAA能够在保护用户隐私的前提下,以更低的数据缺损和更高的效率完成对关系-事务数据的匿名. When publishing datasets that contain relational and transaction attributes, referred to as RT-data for briefness, either type of data may suffer from linking attacks. Anonymizing both of them is essential However, previous approaches suffer from huge information loss during anonymizing RT-data, and they fail to preserve the utility of datasets. To address this problem, an anonymization model, （k,l）- diversity is proposed to ensure privacy by guaranteeing l-diversity on each equivalence class and k-anonymity on transaction data. In addition, two heuristic algorithms named APA and PAA, which anonymize RT-data in different orders, are also provided to achieve （k,l）- diversity. Extensive experiments based on real-world dataset show that APA and PAA outperform existing approaches in terms of execution time and information loss.

作者龚奇源杨明罗军舟 GONG Qi-Yuan YANG Ming LUO Jun-Zhou(School of Computer Science and Engineering, Southeast University, Nanjing 211189, China)

机构地区东南大学计算机科学与工程学院

出处《软件学报》 EI CSCD 北大核心 2016年第11期2828-2842,共15页 Journal of Software

基金国家自然科学基金(61272054 61572130 61632008 61320106007 61502100 61402104) 江苏省自然科学基金(BK 20150628 BK20140648 BK20150637) 中央高校基本科研业务费专项资金(2242014R30010) 江苏省科技支撑项目(BE2014603) 江苏省青蓝工程江苏省网络与信息安全重点实验室资助项目(BM2003201) 教育部网络与信息集成重点实验室资助项目(93K-9)~~

关键词数据匿名隐私泄露 K-匿名 l-多样化关系-事务数据 data anonymization privacy breach k-anonymity l-diversity RT-data

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1周水庚,李丰,陶宇飞,肖小奎.面向数据库应用的隐私保护研究综述[J].计算机学报,2009,32(5):847-861. 被引量：221
2张啸剑,孟小峰.面向数据发布和分析的差分隐私保护[J].计算机学报,2014,37(4):927-949. 被引量：138
3杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
4熊平,朱天清,王晓峰.差分隐私保护及其应用[J].计算机学报,2014,37(1):101-122. 被引量：174

二级参考文献84

1罗永龙,黄刘生,荆巍巍,姚亦飞,陈国良.一个保护私有信息的布尔关联规则挖掘算法[J].电子学报,2005,33(5):900-903. 被引量：33
2葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
3杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
4张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
5张锋,常会友.基于分布式数据的隐私保持协同过滤推荐研究[J].计算机学报,2006,29(8):1487-1495. 被引量：17
6羌卫中,邹德清,金海.网格环境中证书和策略的隐私保护机制研究[J].计算机研究与发展,2007,44(1):11-19. 被引量：11
7Han J, Kamber M. Data Mining: Concepts and Techniques. 2nd Edition, San Francisco: Morgan Kaufmann Publishers, 2006 被引量：1
8Agrawal D, Aggarwal C C. On the design and auantification of privacy preserving data mining atgorithms//Proceedings of the Symposium on Principles of Database Systems (PODS). Santa Barbara, California, USA, 2001:247-255 被引量：1
9Verykios V S, Bertino E, Fovino I N, Provenza I N, Saygin Y, Theodoridis Y. State-of-the-art in privacy preserving data mining. ACM SIGMOD Record, 2004, 3(1): 50-57 被引量：1
10Agrawal R, Srikant R. Privacy preserving data mining//Proceedings of the ACM SIGMOD Conference on Management of Data (SIGMOD). Dallas, Texas, 2000:439-450 被引量：1

共引文献486

1李坪.大数据赋权正当性证成[J].中山大学法律评论,2020(1):3-21. 被引量：1
2张小玉,沈国华,杨阳.基于属性分割的差分隐私异构多属性数据发布[J].计算机系统应用,2022,31(10):225-235.
3李昱.“去识别化的个人信息”不受刑法保护吗?[J].刑事法评论,2019(1):656-692. 被引量：1
4孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：16
5王一蕾,吴英杰,唐庆明.基于混合划分技术的隐私保护关系型数据发布算法[J].南京理工大学学报,2013,37(4):493-499. 被引量：2
6张勇,倪巍伟,崇志宏,胡新平.基于邻域相关性的面向聚类数据扰动方法[J].计算机研究与发展,2011,48(S3):79-85. 被引量：1
7武毅,王丹,蒋宗礼.基于事务型K-Anonymity的动态集值属性数据重发布隐私保护方法[J].计算机研究与发展,2013,50(S1):248-256. 被引量：7
8岑婷婷,韩建民,王基一,李细雨.隐私保护中K-匿名模型的综述[J].计算机工程与应用,2008,44(4):130-134. 被引量：18
9杨晓春,王雅哲,王斌,于戈.数据发布中面向多敏感属性的隐私保护方法[J].计算机学报,2008,31(4):574-587. 被引量：59
10黄立明,宋金玲,刘国华,张奇.视图的k-匿名化方法[J].计算机工程与应用,2008,44(17):115-118.

同被引文献62

1张霁雯.社交媒体用户隐私关注、自我表露和隐私管理行为的实证研究[J].新媒体研究,2021(4):39-45. 被引量：3
2焦海涛.个人信息的反垄断法保护:从附属保护到独立保护[J].法学,2021(4):108-124. 被引量：96
3赵克勤.集对分析对不确定性的描述和处理[J].信息与控制,1995,24(3):162-166. 被引量：150
4戢渼钧.关于个性化信息服务的隐私保护[J].图书情报工作,2006,50(2):49-51. 被引量：20
5侯海燕,刘则渊,陈悦,姜春林,尹丽春,庞杰.当代国际科学学研究热点演进趋势知识图谱[J].科研管理,2006,27(3):90-96. 被引量：158
6周水庚,李丰,陶宇飞,肖小奎.面向数据库应用的隐私保护研究综述[J].计算机学报,2009,32(5):847-861. 被引量：221
7毛宇星,陈彤兵,施伯乐.一种高效的多层和概化关联规则挖掘方法[J].软件学报,2011,22(12):2965-2980. 被引量：37
8王彩梅,郭亚军,郭艳华.位置服务中用户轨迹的隐私度量[J].软件学报,2012,23(2):352-360. 被引量：31
9辛文娟,彭李余.社交网络环境下大学生隐私保护现状及对策研究——基于对重庆市六所高校的问卷调查[J].中国出版,2013(10):61-64. 被引量：6
10龚奇源,杨明,罗军舟.面向缺失数据的数据匿名方法[J].软件学报,2013,24(12):2883-2896. 被引量：5

引证文献4

1熊金波,王敏燊,田有亮,马蓉,姚志强,林铭炜.面向云数据的隐私度量研究进展[J].软件学报,2018,29(7):1963-1980. 被引量：21
2周治平,李智聪.无可信第三方的数据匿名化收集协议[J].电子与信息学报,2019,41(6):1442-1449. 被引量：1
3桂琼,吕永军,程小辉.基于敏感信息邻近抵抗的匿名方法[J].计算机工程,2020,46(12):142-149. 被引量：5
4杨瑞仙,李航毅,孙倬.社交网络数据隐私保护:溯源、技术、政策、展望[J].农业图书情报学报,2024,36(4):4-20.

二级引证文献27

1王进茂,郑均宝,高秀丽,徐振华,张法勇.花烛组织培养的研究[J].河北林果研究,2000,15(1):69-74. 被引量：24
2王洪均,谢国君.高压水除鳞系统改进[J].四川冶金,2000,22(2):48-50. 被引量：4
3李奕麟.试论我国隐私权保护的不足及其完善[J].祖国,2018,0(7):89-89.
4付钰,俞艺涵,吴晓平.大数据环境下差分隐私保护技术及应用[J].通信学报,2019,40(10):157-168. 被引量：22
5王林信,杨鹏,江元,侯应龙,廖晓群.智能电网大数据隐私保护技术研究与实现[J].电力信息与通信技术,2019,17(12):24-30. 被引量：20
6谢明明,彭长根,吴睿雪,丁红发,刘波涛.结构化数据的隐私与数据效用度量模型[J].计算机应用研究,2020,37(5):1465-1469. 被引量：6
7高帅,徐雅斌,武装.一种抗相似性攻击的匿名保护方法[J].北京信息科技大学学报（自然科学版）,2020,35(4):63-68.
8梁艳,安健,胡先智,杨倩,司海峰.群智感知中支持隐私保护的激励机制研究[J].计算机学报,2020,43(12):2414-2432. 被引量：6
9赵蕙,王良民,申屠浩,黄磊,倪晓铃.网络匿名度量研究综述[J].软件学报,2021,32(1):218-245. 被引量：4
10赵明烽,Lei Chen,钟洋,熊金波.移动边缘群智感知动态隐私度量模型与评价机制[J].网络与信息安全学报,2021,7(1):157-166. 被引量：1

1朱兴统,许波.一种面向XML文档的模糊关联规则算法[J].科学技术与工程,2011,11(26):6467-6470. 被引量：1
2史周军,叶晓俊.基于元数据的对象关系映射研究[J].计算机科学,2005,32(5):95-97. 被引量：10
3桂琼,程小辉.基于聚类的分级匿名方法[J].计算机应用,2013,33(2):412-416. 被引量：4
4熊平,朱天清.基于杂度增益与层次聚类的数据匿名方法[J].计算机研究与发展,2012,49(7):1545-1552. 被引量：6
5何贤芒,陈银冬,李东,郝艳妮.基于环概化的半同构泛化算法研究[J].计算机研究与发展,2015,52(10):2382-2394.
6王智慧,许俭,汪卫,施伯乐.一种基于聚类的数据匿名方法[J].软件学报,2010,21(4):680-693. 被引量：49
7郭昆,张岐山.基于聚类的快速数据流匿名方法[J].软件学报,2013,24(8):1852-1867. 被引量：5
8龚奇源,杨明,罗军舟.面向缺失数据的数据匿名方法[J].软件学报,2013,24(12):2883-2896. 被引量：5
9秦晓薇,门爱华,邹妍.基于K-匿名的隐私保护算法研究[J].赤峰学院学报（自然科学版）,2010,26(5):14-16. 被引量：2
10毛金玲.面向关系数据库关键字查询系统的设计[J].中小企业管理与科技,2015,0(11):238-239. 被引量：1

软件学报

2016年第11期

浏览历史

内容加载中请稍等...

面向关系-事务数据的数据匿名方法被引量：4

参考文献4

二级参考文献84

共引文献486

同被引文献62

引证文献4

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

面向关系-事务数据的数据匿名方法 被引量：4

参考文献4

二级参考文献84

共引文献486

同被引文献62

引证文献4

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

面向关系-事务数据的数据匿名方法被引量：4