基于属性分类的用电大数据隐私保护方法被引量：8

Power Consumption Big Data Privacy Protection Method Based on Attribute Classification

下载PDF

导出

摘要针对用电大数据环境下,非交互式差分隐私模型无法提供准确查询结果及计算开销较大的问题,提出一种基于最大信息系数与数据匿名化的差分隐私数据发布方法。从原始数据集中选出部分隐私属性作为特征集,利用最大信息系数选出与此特征集相关性高的数据作为隐私数据集,使用协同隐私保护算法对隐私数据集进行保护,发布满足差分隐私保护的用电大数据集。理论分析与实验结果表明,所提出的方法在提高大数据隐私保护处理效率同时,有效分化查询函数敏感性,提高发布数据可用性。 In the environment of power consumption big data,non-interactive differential privacy can not provide accurate query results and high computational overhead,a differential privacy data publishing model based on maximum information coefficient and data anonymization is proposed.Firstly,a small number of privacy attributes with high correlation are selected from original data set as feature set by using the maximum information coefficient.Then,the proposed cooperative privacy protection algorithm is applied to the privacy data set to achieve anonymity.Finally,the collaborative privacy protection algorithm is used to protect the privacy data set,and the power consumption big data set meeting the differential privacy protection is released.The theoretical analysis and experimental results show that the proposed method not only improves the efficiency of large data privacy protection processing,but also effectively differentiates the sensitivity of query functions and improves the utility of published data.

作者梁晓兵许斌翟峰沈博 LIANG Xiaobing;XU Bin;ZHAI Feng;SHEN Bo(China Electric Power Research Institute,Beijing 100192,China;State Key Laboratory of Information Security,Institute of Information Engineering,CAS,Beijing 100093,China;School of Cyber Security,University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区中国电力科学研究院有限公司中国科学院信息工程研究所信息安全国家重点实验室中国科学院大学网络空间安全学院

出处《计算机工程与应用》 CSCD 北大核心 2020年第5期93-100,共8页 Computer Engineering and Applications

基金国家电网公司科技项目（No.JL71-18-022）

关键词差分隐私最大信息系数数据匿名化数据发布 differential privacy maximum information coefficient data anonymization data publishing

分类号 TP309.2 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献3

1柴瑞敏,冯慧慧.基于聚类的高效(K,L)-匿名隐私保护[J].计算机工程,2015,41(1):139-142. 被引量：8
2崇志宏,倪巍伟,刘腾腾,张勇.一种面向聚类的隐私保护数据发布方法[J].计算机研究与发展,2010,47(12):2083-2089. 被引量：13
3刘晓迁,李千目.基于聚类匿名化的差分隐私保护数据发布方法[J].通信学报,2016,37(5):125-129. 被引量：21

二级参考文献39

1吴溥峰,张玉清.数据库安全综述[J].计算机工程,2006,32(12):85-88. 被引量：96
2Kantarcioglu M,Jin Jiasun,Clifton C.When do data mining results violate privacy?[C]//Proc of the 10th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining.New York:ACM,2004:599-604. 被引量：1
3Agrawal R,Srikant R.Privacy-preserving data mining[C]//Proc of the 2000 ACM SIGMOD Conf on Management of Data.New York:ACM,2000:439-450. 被引量：1
4Oliveira S R M,Zaane O R.Privacy preservation when sharing data for clustering[C]//Proc of the Int Workshop on Secure Data Management in a Connected World.Berlin:Springer,2004:67-82. 被引量：1
5Parameswaran R,Blough D M.Privacy preserving data obfuscation for inherently clustered data[J].International Journal of Information and Computer Security,2008,2(1):1744-1765. 被引量：1
6Mukherjee S,Chen Zhiyuan,Gangopadhyay A.A privacy-preserving technique for Euclidean distance-based mining algorithms using Fourier-related transforms[J].The International Journal on Very Large Data Bases,2006,15(4):293-315. 被引量：1
7Aggarwal G,Feder T,Kenthapadi K,et al.Approximation algorithms for k-anonymity[C]//Proc of ACM SIGMOD Int Conf on Management of Data.New York:ACM,2007. 被引量：1
8Du Yang,Xia Tian,Tao Yufei,et al.On multidimensional k-anonymity with local recoding generalization[C]//Proc of IEEE the 23rd Int Conf on Data Engineering.Los Alamitos,CA:IEEE Computer Society,2007. 被引量：1
9Rijsbergen C J van.Information Retrieval (2nd edition)[M].London:Butterworths,1979. 被引量：1
10Ester M,Kriegel H P,Sander J,et al.A density based algorithm of discovering clusters in large spatial databases with noise[C]//Proc of the 2nd Int Conf on Knowledge Discovery and Data Mining.Menlo Park,CA:AAAI,1996:226-231. 被引量：1

共引文献38

1桂琼,程小辉.基于聚类的分级匿名方法[J].计算机应用,2013,33(2):412-416. 被引量：4
2李杨,郝志峰,温雯,谢光强.差分隐私保护k-means聚类方法研究[J].计算机科学,2013,40(3):287-290. 被引量：48
3刘英华.分布式隐私保护FHE-DBIRCH模型研究[J].计算机工程与科学,2014,36(7):1384-1388.
4徐东镇.试析面向大数据的个性化检索中的用户匿名化策略[J].电子世界,2014(24):10-10. 被引量：1
5朱卫红,潘巨龙,时磊.一种泛化约束的(K,L)-匿名算法[J].中国计量学院学报,2016,27(1):80-85. 被引量：1
6刘晓迁,李千目.基于聚类匿名化的差分隐私保护数据发布方法[J].通信学报,2016,37(5):125-129. 被引量：21
7张卫国,孙嫚,陈振华,陈娓.空间位置关系的安全多方计算及其应用[J].电子与信息学报,2016,38(9):2294-2300. 被引量：6
8丁慧洁.不可信任环境下敏感数据自动匿名方法仿真[J].计算机仿真,2017,34(5):257-260.
9崔一辉,宋伟,王占兵,史成良,程芳权.一种基于格的隐私保护聚类数据挖掘方法[J].软件学报,2017,28(9):2293-2308. 被引量：26
10丁蓉,杨俊杰.基于DDS技术的信号发生器的设计与实现[J].上海电力学院学报,2017,33(6):577-580. 被引量：4

同被引文献92

1赖启超,许力,王峰.智能电网支持隐私保护的数据聚合方案[J].密码学报,2019,6(5):605-614. 被引量：4
2董哲君,肖飞,郭健.生物样本库建立现况及进展[J].中华检验医学杂志,2013,36(2):130-135. 被引量：27
3谷丽华,徐玲,孟群.欧美国家健康信息隐私保护立法情况探析及对我国立法的启示[J].中国卫生信息管理杂志,2013,10(6):520-524. 被引量：19
4张建光,朱建明,尚进.电子政务安全与隐私保护研究综述——基于CNKI数据的计量分析[J].电子政务,2014(11):111-117. 被引量：7
5董尔丹,胡海,俞文华.生物样本库是生物医学研究的重要基础[J].中国科学：生命科学,2015,45(4):359-370. 被引量：43
6曾令烽,刘军,潘建科,王璐,曹烨,陈曲波,曾星,梁伟雄.生物样本研究数据环境与受试者隐私保护伦理问题[J].世界科学技术-中医药现代化,2015,17(7):1567-1576. 被引量：10
7宋健,许国艳,夭荣朋.基于差分隐私的数据匿名化隐私保护方法[J].计算机应用,2016,36(10):2753-2757. 被引量：17
8陈晓云,王思洁,高洁,姜维洁.样本库受试者隐私保护管理的现状分析[J].中国医学伦理学,2017,30(1):74-77. 被引量：4
9贺晶,白杨,池慧,欧阳昭连.我国生物样本库建设管理中存在的问题及规范化管理策略[J].医学信息学杂志,2017,38(1):53-58. 被引量：9
10王亚强,汤铭,曾沁,唐聃,舒红平.级联式低消耗大规模网页分类在线获取方法[J].计算机应用,2017,37(4):924-927. 被引量：3

引证文献8

1蒋兆强,靳明英,谢小萍,张玲希,陈俊斐,何晓波.国外生物样本库大数据伦理管理的现状及启示[J].医学与哲学,2021,42(11):23-28. 被引量：7
2楼佳.基于大数据的政务App个人隐私协同保护技术[J].信息与电脑,2021,33(21):16-18.
3张晓琴,汪云飞.基于属性基加密的恶意域名训练异常数据检测[J].信息技术,2022,46(3):90-95.
4徐敏.基于K-means聚类的电力大数据脱敏技术研究[J].电子设计工程,2022,30(19):175-178. 被引量：1
5虞娟.基于混洗差分的Web查询大数据隐私保护方法[J].黑龙江工业学院学报（综合版）,2022,22(12):64-69. 被引量：2
6陈华锋.基于物联网的电力核心用户数据匿名化系统[J].信息技术,2023,47(3):150-154.
7盛丹丹.基于大数据分析的隐私信息保护系统设计与实现[J].信息安全研究,2023,9(9):914-920. 被引量：1
8张宸,王春蕾,刘钰,金荣兵,张垣垣.基于隐私等级的能源大数据隐私保护方法[J].电脑与电信,2023(12):66-71.

二级引证文献11

1秦文静,郑颖,杨仙荷,刘云云,江锦良.综合性医院生物样本库建设的实践与探索[J].现代医药卫生,2023,39(9):1599-1602. 被引量：5
2杨家克,周大智,苏日古格,王昊楠,杨凯淇,李嘉,蔡雨阳,李国东.基于CiteSpace的近十五年我国生物样本库文献计量学分析[J].中国医药生物技术,2023,18(3):262-267. 被引量：1
3洪耕,姜孟楠,魏强.国际主要微生物保藏机构保藏能力分析[J].中华实验和临床病毒学杂志,2023,37(3):339-345.
4林子俊,裴世敏.犬猫肿瘤样本库的发展现状及基本建立流程[J].黑龙江畜牧兽医,2023(19):128-131.
5骆海霞.基于递推估计的Web前端偶发任务能耗感知方法[J].黑龙江工业学院学报（综合版）,2023,23(10):115-120.
6余意.面向用户兴趣特征提取的大数据线性回归推荐算法[J].黑龙江工业学院学报（综合版）,2023,23(12):94-99.
7栗召辉,温颖,祁军.生物样本库建设的发展状况与分析[J].口岸卫生控制,2024,29(1):23-27. 被引量：1
8周梅珊,邬凤娟.慢性病大数据管理的隐私保护困境及应对策略[J].医学与哲学,2024,45(5):21-26.
9何博宇,潘洪志.大数据环境下位置轨迹安全存储系统研究与实现[J].电脑知识与技术,2024,20(10):77-80.
10邢汇笛,龚钢军,翟明岳,刘雪松,王浩淼,扬爽.电力数据共享安全防护与隐私保护综述[J].综合智慧能源,2024,46(5):30-40. 被引量：1

1张婷,解庭峰,张城.大数据时代个人数据匿名化的法律规制研究[J].电子工程学院学报,2019,8(9):131-133.
2颜恬.企业衍生数据的商业秘密保护与个人数据权的冲突与协调[J].湖北第二师范学院学报,2019,36(10):36-40.
3张涛.欧盟个人数据匿名化治理：法律、技术与风险[J].图书馆论坛,2019,39(12):90-101. 被引量：30
4首个获美国FDA突破性疗法认证的中国创新药Zanubrutinib重要进展[J].中国肿瘤临床与康复,2019,26(12):1533-1533.
5于莉莉,张磊,苏晓光,张春玲.面向虹膜数据发布的差分隐私保护[J].中国科技论文,2019,14(11):1223-1228. 被引量：2
6半月大事[J].半月谈,2019,0(24):87-88.
7江志晃.一种面对大数据集的改进基于支持向量机的算法性能分析[J].自动化技术与应用,2020,39(2):27-29. 被引量：3
8李杨,陈子彬,谢光强.一种基于ExtraTrees的差分隐私保护算法[J].计算机工程,2020,46(2):134-140. 被引量：6
9冯登国,张敏,叶宇桐.基于差分隐私模型的位置轨迹发布技术研究[J].电子与信息学报,2020,42(1):74-88. 被引量：16
10顾贞,马春光,宋蕾,李菊雁.轨迹数据隐私保护综述[J].网络空间安全,2019,10(11):32-40. 被引量：4

计算机工程与应用

2020年第5期

浏览历史

内容加载中请稍等...

基于属性分类的用电大数据隐私保护方法被引量：8

参考文献3

二级参考文献39

共引文献38

同被引文献92

引证文献8

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于属性分类的用电大数据隐私保护方法 被引量：8

参考文献3

二级参考文献39

共引文献38

同被引文献92

引证文献8

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于属性分类的用电大数据隐私保护方法被引量：8