基于粗糙集的数据发布多约束匿名保护方法被引量：1

Anonymous preservation method for data publication based on rough set and multiple constraints

下载PDF

导出

摘要针对传统匿名算法采用相同的匿名强度实现k-划分,常导致所要发布数据的隐私保护程度与数据可用性之间失衡的问题,提出一种基于粗糙集属性重要度的多约束匿名化方法。根据准标识符属性重要度的差别,对准标识符属性维度进行自动划分,实现多约束匿名参数的设计,对具有不同维度的划分进行相应的匿名化操作。基于粗糙集理论和信息熵理论,设计了一种分类型数据可用性评估模型。从数据泛化后的信息损失、等价类对集合划分导致的信息熵改变两方面综合评估匿名化数据表的信息损失量。实验结果表明,采用该方法能够较好地实现数据的隐私保护和数据可用性之间的平衡。 To erase the imbalance phenomenon between the privacy protection and the utility of anonymized data caused by identifying all attributes having the same importance degree in the traditional algorithm, a multi-constraint anonymous method based on the attribute significance of the rough set was proposed, which took into account the influence caused by various quasi-identi- fier attributes. The dimension division was carried out automatically according to the quasi-identifier attributes significance and thereby the design of multi-constraint anonymous parameters was realized. After that, an anonymous operation was executed on the separate partition. Additionally, a model for evaluating the utility of anonymized data based on both the rough set theory and the information entropy theory was designed, which comprehensibly evaluated the information loss of anonymized data by considering the information loss of generated attribute values and the change of the information entropy caused by using equivalence classes to partition the data set. Experimental results show that the method better balances the privacy protection degree and the data availability.

作者刘萍邱桃荣段文影

机构地区南昌大学信息工程学院

出处《计算机工程与设计》 CSCD 北大核心 2014年第8期2769-2772,2784,共5页 Computer Engineering and Design

基金国家自然科学基金项目(61070139) 江西省自然科学基金项目(20114BAB201039)

关键词数据发布隐私保护多约束粗糙集属性重要度 data publication privacy preservation multiple constrains rough set attribute significance

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献11

1任毅,彭智勇,唐祖锴,叶凌青.隐私数据库--概念、发展和挑战[J].小型微型计算机系统,2008,29(8):1467-1474. 被引量：4
2Machanavajjhala A, Gehrke J, Kifer D, et al. 1-diversity: Privacy beyond k-anonymity [C] //Proceedings of the 22nd In- ternational Conference on Data Enginee-ring. IEEE Computer Society, 2006: 24-35. 被引量：1
3Li N, Li T, Venkatasubramanian S. T-closeness: Privacy be- yond k-anonymity and 1-diversity [C] //Proceedings of the 23rd International Conference on Data Engineering. IEEE, 2007: 106-115. 被引量：1
4Zhang Q, Koudas N, Srivastava D, et al. Aggregate query an- swering on anonymized tabIes [C] //Proceedings of the 23rd Inter- national Conference on Data Engineering. IEEE, 2007: 116-125. 被引量：1
5Chen B C, Ramkrishnan R, LeFevre K. Privacy skyIine: Pri- vacy with multidimensional adversarial knowledge [C] //Pro- ceedings of the 33rd International Conference on Very Large DataBases. ACM, 2007: 770-781. 被引量：1
6刘玉葆,黄志兰,傅慰慈,印鉴.基于有损分解的数据隐私保护方法[J].计算机研究与发展,2009,46(7):1217-1225. 被引量：21
7Martin D, Kifer D, Machanavajjhala A, et al. Worst-case background knowledge in privacy [C] //Proceedings of the 23rd International Conference on Data Engineering. IEEE, 2007: 116-125,. 被引量：1
8刘明,叶晓俊.个性化K-匿名模型[J].计算机工程与设计,2008,29(2):282-286. 被引量：11
9王璐,邱桃荣,何妞,刘萍.基于粗糙集和蚁群优化算法的特征选择方法[J].南京大学学报（自然科学版）,2010,46(5):487-493. 被引量：19
10苗夺谦,李道国著..粗糙集理论、算法与应用[M].北京:清华大学出版社,2008:326.

二级参考文献49

1任毅,彭智勇,程玉容.基于对象代理的隐私数据模型研究[J].计算机研究与发展,2006,43(z3):295-302. 被引量：2
2王颖,谢剑英.一种自适应蚁群算法及其仿真研究[J].系统仿真学报,2002,14(1):31-33. 被引量：232
3葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
4刘胥影,吴建鑫,周志华.一种基于级联模型的类别不平衡数据分类方法[J].南京大学学报（自然科学版）,2006,42(2):148-155. 被引量：23
5杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
6张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
7Sweeney L.Achieving k-anonymity privacy protection using generalization and suppression[J].International Journal on Uncertainty,Fuzziness and Knowldege-Based Systems,2002,10(5):571-588. 被引量：1
8Agrawal R,Srikant R.Privacy-preserving data mining[C]// Proc of SIGMOD 2000.New York:ACM.2000:439-450. 被引量：1
9Wong R,Li J,Fu A,et al.(alpha,k)-anonymity,An enhanced k-anonymity model for privacy-preserving data publishing[C] aProc of KDD2006.New York:ACM,2006:754-759. 被引量：1
10Aggrawal G,Feder T,Kenthapadi K,et al.Anomyrnizing tables[C] //Proc of ICDT 2005.Berlin:Springer,2005:236-258. 被引量：1

共引文献56

1骆永成,陈惠兰.基于需求的图书流通信息匿名发布研究[J].福建电脑,2009,25(8):100-101. 被引量：3
2李孝利,卢建朱.基于XML的时态数据库的隐私数据访问控制方案[J].计算机工程与设计,2010,31(6):1205-1208. 被引量：1
3申艳光,刘永红.个性粒化k-匿名隐私保护方法研究[J].数学的实践与认识,2010,40(11):97-104. 被引量：4
4吴俊军,罗康,王同洋,张新访.一种混合模式的智能卡DBMS存储模型研究[J].计算机工程与科学,2010,32(10):112-116. 被引量：1
5张坤,李庆忠,史玉良.面向SaaS应用的数据组合隐私保护机制研究[J].计算机学报,2010,33(11):2044-2054. 被引量：35
6韩建民,于娟,虞慧群,贾泂.面向数值型敏感属性的分级l-多样性模型[J].计算机研究与发展,2011,48(1):147-158. 被引量：23
7徐勇,王浩,李东勤.数据发布领域匿名隐私保护相关技术研究[J].情报杂志,2011,30(8):128-133. 被引量：2
8徐勇,丁忠明,司凤山.基于频繁项集发现的匿名隐私保护算法[J].计算机应用研究,2011,28(10):3828-3830.
9王波,杨静.数据发布中的个性化隐私匿名技术研究[J].计算机科学,2012,39(4):168-171. 被引量：12
10陈玉明,吴克寿,孙金华.基于幂树的决策表最小属性约简[J].南京大学学报（自然科学版）,2012,48(2):164-171. 被引量：5

同被引文献15

1邓松,王映龙,何火娇,罗东平,袁威.粗糙集在销售决策系统中的应用[J].计算机技术与发展,2011,21(9):160-162. 被引量：6
2杨传健,葛浩,汪志圣.基于粗糙集的属性约简方法研究综述[J].计算机应用研究,2012,29(1):16-20. 被引量：57
3张清华,王国胤,肖雨.粗糙集的近似集[J].软件学报,2012,23(7):1745-1759. 被引量：43
4钱文彬,杨炳儒,徐章艳.一种基于决策表的快速属性约简矩阵算法[J].小型微型计算机系统,2012,33(9):1954-1958. 被引量：3
5孙继佳,邵建华,苏式兵.邻域粗糙贝叶斯网络及其在医学数据挖掘中的应用[J].数理医药学杂志,2013,26(5):539-543. 被引量：4
6常雪琴,陈秀兰.模糊粗糙集理论在医院肝病诊断中的应用[J].甘肃科技,2014,30(5):103-105. 被引量：1
7叶回春,张世文,黄元仿,周志明,沈重阳.粗糙集理论在土壤肥力评价指标权重确定中的应用[J].中国农业科学,2014,47(4):710-717. 被引量：59
8徐菲菲,雷景生,毕忠勤,苗夺谦,杜海舟.大数据环境下多决策表的区间值全局近似约简[J].软件学报,2014,25(9):2119-2135. 被引量：22
9张洋,刘勇军,刘伦.基于粗糙集的航空灾害协同预警研究[J].武汉理工大学学报（信息与管理工程版）,2014,36(4):550-556. 被引量：1
10张贤勇,苗夺谦.基于逻辑或的双量化粗糙集模型的计算分析与属性约简[J].模式识别与人工智能,2014,27(9):778-786. 被引量：3

引证文献1

1武友新,李文晶,钟子岳.基于属性值集合链的粗糙集快速属性约简算法[J].计算机工程与设计,2016,37(11):2967-2970.

1黎东英,王应明.基于粗集理论的一种数据泛化方法[J].微机发展,2005,15(7):1-3.
2钟智,胡荣耀,何威,罗?.基于图稀疏的自表达属性选择算法[J].计算机工程与设计,2016,37(6):1643-1648. 被引量：2
3周旋,孙力娟,黄海平,杨耀.一种基于隐私保护的无线传感网聚类方法研究[J].系统仿真学报,2013,25(10):2294-2299. 被引量：1
4樊龙,万定生,顾昕辰.基于Hadoop云平台的水利普查数据挖掘系统的设计和实现[J].计算机与数字工程,2014,42(5):831-834. 被引量：9
5龚卫华,兰雪锋,裴小兵,杨良怀.基于k-度匿名的社会网络隐私保护方法[J].电子学报,2016,44(6):1437-1444. 被引量：11
6吴蓉.运用SQL实现面向属性归纳的算法[J].电脑知识与技术,2008(10):4-6.
7徐晓霞,王刊良,席酉民,汪应洛.群体支持系统过程支持中匿名强度的研究[J].管理科学学报,1998,1(2):57-61. 被引量：2
8刘泽良,杨保海.用VisualC++实现数字图像处理研究[J].洛阳工业高等专科学校学报,2006,16(1):33-34.
9靳铁良.利用Visual C++实现数字图像处理研究[J].河南教育学院学报（自然科学版）,2007,16(1):42-44.
10李钊,孙占全,李晓,李诚.基于信息损失量的特征选择方法研究及应用[J].山东大学学报（理学版）,2016,51(11):7-12. 被引量：2

计算机工程与设计

2014年第8期

浏览历史

内容加载中请稍等...

基于粗糙集的数据发布多约束匿名保护方法被引量：1

参考文献11

二级参考文献49

共引文献56

同被引文献15

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的数据发布多约束匿名保护方法 被引量：1

参考文献11

二级参考文献49

共引文献56

同被引文献15

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的数据发布多约束匿名保护方法被引量：1