基于粒度计算的减量式隐私保护数据挖掘被引量：2

Decreasing privacy preserving data mining based on granular computing

下载PDF

导出

摘要为了能够更好地开展隐私保护数据挖掘工作,描述该领域的研究进展。针对基于随机的干扰方法中典型代表EMASK算法,用粒度计算的思想提出改进意见,将关系数据表转换成面向机器的粒度关系模型。这种计算方法使用了数据的垂直Bitmap表示,利用位操作的方法来保证准确性不降低的情况下,减少I/O操作的次数,降低空间开销,同时在生成频繁项集时,也记录了其在扭曲后数据中的支持度,减少了文件的访问次数,由此提高计算效率。针对现实世界事务数据库变化情况,利用减量式更新算法技术来解决减量式事务数据库频繁项集计算问题。实验结果证明,无论是在固定减量集数据库还是可变减量集数据库处理中,BDEMASK相对于EMASK而言,时间效率都有很大幅度的提高。 In order to work better on privacy preserving data mining, described the research progress in this area. Aiming at EMASK algorithm-the typical method based on random perturbation, this paper proposed improvements with granular computing, transforming the relational data forms into granularity relation model for machine. With bit operation method to ensure no reduction of accuracy, this calculation method used vertical Bitmap representation of the data, reducing the number of 1/0 operations and the space overhead. At the same time, it also recorded the distorted data support and reduced file access times in the generation of frequent item sets, thus improved the calculation efficiency. In view of the real world database changes, it solved the calculation problem of decreasing business database frequent item sets by using the decreasing updating algorithm technology. The experimental results show that, whether in fixed or variable decreasing database processing, the time efficiency improves greatly by BDEMASK compared with EMASK.

作者程舒通徐从富但红卫

机构地区浙江大学计算机科学与技术学院杭州科技职业技术学院信息工程学院

出处《计算机应用研究》 CSCD 北大核心 2015年第11期3264-3268,共5页 Application Research of Computers

基金国家自然科学基金资助项目(61272303)

关键词隐私保护频繁模式知识粒度减量式 privacy preserving frequent pattern knowledge granularity decreasing

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献16

1李锋..面向数据挖掘的隐私保护方法研究[D].上海交通大学,2008:
2徐勇,秦小麟,杨一涛,杨种学,黄灿.一种考虑属性权重的隐私保护数据发布方法[J].计算机研究与发展,2012,49(5):913-924. 被引量：17
3倪巍伟,张勇,黄茂峰,崇志宏,贺玉芝.一种向量等价置换隐私保护数据干扰方法[J].软件学报,2012,23(12):3198-3208. 被引量：6
4张海涛,黄慧慧,徐亮,高莎莎.隐私保护数据挖掘研究进展[J].计算机应用研究,2013,30(12):3529-3535. 被引量：15
5方炜炜,杨炳儒,夏红科.基于SMC的隐私保护聚类模型[J].系统工程与电子技术,2012,34(7):1505-1510. 被引量：11
6俞迪.支持隐私保护的数据挖掘研究[D].长沙:湖南大学,2009. 被引量：2
7Ge Xinjing, Zhu Jianming. Collusion-resistant protocol for privacy- preserving distributed association rules mining [ C ]//Proc of Informa- tion and Communications Security. [ S. 1. ] : Springer,2009 : 359- 369. 被引量：1
8钱萍,吴蒙.同态加密隐私保护数据挖掘方法综述[J].计算机应用研究,2011,28(5):1614-1617. 被引量：30
9Rizvi S J, Haritsa J R. Maintaining data privacy in association rnle mining[ C ]//Proc of International Conference on Very Large Databas- es. [ S. 1. ] : Morgan Kaufmann Publishers,2002:682-693. 被引量：1
10Agrawal S, Krishuan V, Haritsa J R. On addressing efficiency con- cerns in privacy-preserving mining[ C ]//Proc of Database Systems for Advances Applications. [ S. 1. ] : Springer, 2004 : 113-124. 被引量：1

二级参考文献163

1杨煜尧,赵方,罗海勇,陶冶,蓝星灿.一种基于地理位置信息的移动互联网社交模型[J].计算机研究与发展,2011,48(S2):307-313. 被引量：11
2李德毅,刘常昱,杜鹢,韩旭.不确定性人工智能[J].软件学报,2004,15(11):1583-1594. 被引量：400
3杨勇,方勇,周安民.秘密同态技术研究及其算法实现[J].计算机工程,2005,31(2):157-159. 被引量：18
4黄兵,周献中.不一致决策表中规则提取的矩阵算法[J].系统工程与电子技术,2005,27(3):441-445. 被引量：12
5冯登国.可证明安全性理论与方法研究[J].软件学报,2005,16(10):1743-1756. 被引量：102
6葛伟平,汪卫,周皓峰,施伯乐.基于隐私保护的分类挖掘[J].计算机研究与发展,2006,43(1):39-45. 被引量：20
7XIANG Guang-li,CHEN Xin-meng,ZHU Ping,MA Jie.A Method of Homomorphic Encryption[J].Wuhan University Journal of Natural Sciences,2006,11(1):181-184. 被引量：8
8徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
9张鹏,童云海,唐世渭,杨冬青,马秀莉.一种有效的隐私保护关联规则挖掘方法[J].软件学报,2006,17(8):1764-1774. 被引量：53
10沈昌祥,张焕国,冯登国,曹珍富,黄继武.信息安全综述[J].中国科学（E辑）,2007,37(2):129-150. 被引量：358

共引文献94

1景运革,黄峻福.一种基于关系矩阵维度增量式约简算法[J].微电子学与计算机,2015,32(4):155-158. 被引量：1
2钱萍,吴蒙.同态加密隐私保护数据挖掘方法综述[J].计算机应用研究,2011,28(5):1614-1617. 被引量：30
3汪明.数据挖掘综述[J].河北软件职业技术学院学报,2012,14(1):45-48. 被引量：11
4钱萍,吴蒙.物联网隐私保护研究与方法综述[J].计算机应用研究,2013,30(1):13-20. 被引量：36
5钱萍,吴蒙.无线传感器网络隐私保护方法[J].电信科学,2013,29(1):23-30. 被引量：4
6陶华,唐旭清.基于模糊邻近关系的聚类结构分析[J].计算机科学,2013,40(1):257-261. 被引量：4
7廖龙龙,叶强,路红.面向移动感知服务的数据隐私保护技术研究[J].计算机工程与设计,2013,34(6):1951-1955. 被引量：12
8孔艺权.“教育云”实验资源加密平台的设计与实现[J].实验技术与管理,2013,30(6):77-79. 被引量：1
9刘晓娜,杜永文,蔺国梁.移动数据库中组合视图对隐私保护的应用[J].计算机光盘软件与应用,2013,16(13):13-14. 被引量：1
10刘晓娜,马少斌,王栋.移动数据库中基于k-匿名的隐私保护模型研究[J].计算机光盘软件与应用,2013,16(14):149-150.

同被引文献14

1杜伟林,苗夺谦,李道国,张年琴.概念格与粒度划分的相关性分析[J].计算机科学,2005,32(12):181-183. 被引量：5
2Yiyu,（Y.Y.）,Yao.Three Perspectives of Granular Computing[J].南昌工程学院学报,2006,25(2):16-21. 被引量：19
3王黎明,张卓.基于iceberg概念格并置集成的闭频繁项集挖掘算法[J].计算机研究与发展,2007,44(7):1184-1190. 被引量：25
4陈杰,吴狄,张娟.分布式仿真系统层次设计商空间粒计算模型[J].自动化学报,2010,36(7):923-930. 被引量：5
5张清华,幸禹可,王国胤.概念知识粒与概念信息粒的相互转化[J].山东大学学报（理学版）,2010,45(9):1-6. 被引量：6
6柴玉梅,王春丽,王黎明.基于频繁项集的互补替代关系挖掘算法[J].模式识别与人工智能,2012,25(1):157-165. 被引量：7
7柴玉梅,张卓,王黎明.基于频繁概念直乘分布的全局闭频繁项集挖掘算法[J].计算机学报,2012,35(5):990-1001. 被引量：19
8孟慧丽,马媛媛,徐久成.基于下近似分布粒度熵的变精度悲观多粒度粗糙集粒度约简[J].计算机科学,2016,43(2):83-85. 被引量：6
9郝晨,范敏,李金海,殷允强,王杜娟.多标记背景下基于粒标记规则的最优标记选择[J].模式识别与人工智能,2016,29(3):272-280. 被引量：17
10顾沈明,万雅虹,吴伟志,徐优红.多粒度决策系统的局部最优粒度选择[J].南京大学学报（自然科学版）,2016,52(2):280-288. 被引量：7

引证文献2

1史进玲,张倩倩,徐久成.多粒度决策系统属性约简的最优粒度选择[J].计算机科学,2018,45(2):152-156. 被引量：9
2李克文,吕萌萌,邵明文.面向对象多粒度概念格的构造[J].工程数学学报,2020,37(5):591-605. 被引量：1

二级引证文献10

1全球片式电容器面面观(之一)[J].世界产品与技术,2000(1):42-43. 被引量：2
2李敏,杨亚锋,李丽红.基于聚类与粒化度量的高效决策表约简[J].电脑知识与技术,2019,15(9Z):246-248. 被引量：2
3王煜,叶赛,范文涛.基于粒度结构分析的数控机床制造信息资源自动化检测方法[J].制造业自动化,2019,41(12):120-124. 被引量：2
4何建仓,侯泽民.信息系统中基于属性贴近度的属性约简算法研究[J].科学技术创新,2020(30):124-126.
5李克文,吕萌萌,邵明文.面向对象多粒度概念格的构造[J].工程数学学报,2020,37(5):591-605. 被引量：1
6刘凤玲,林国平.动态更新属性值变化时的最优粒度[J].小型微型计算机系统,2020,41(10):2063-2067. 被引量：2
7李敏,杨亚锋,雷宇,李丽红.基于可拓域变化代价最小的最优粒度选择[J].山东大学学报（理学版）,2021,56(2):17-27. 被引量：2
8赵欣灿,朱云,毛伊敏.基于MapReduce的高维数据频繁项集挖掘[J].计算机工程,2022,48(3):81-89. 被引量：8
9何银川.基于属性近似度的决策信息系统属性约简算法研究[J].自动化技术与应用,2022,41(7):40-43.
10刘谦,杜宝苍,毛华,郑雷雷,连萌璇,张植明.信息粒化模型在水泥质检分析中的应用[J].建模与仿真,2022,11(4):1185-1194.

1陈军民.浅析利用VB6.0将Access数据表转换为Word文档[J].电脑知识与技术（过刊）,2010,0(23):6407-6408. 被引量：5
2朱幼莲.单片机控制系统软件抗干扰技术[J].常州技术师范学院学报,1995(2):22-26.
3丛爽,杜浩藩.几种消除计算机干扰方法的效果的对比研究[J].工业控制计算机,2002,15(12):43-45. 被引量：1
4刘玉珍.巧用VFP二维数组[J].广东技术师范学院学报,2002,23(S1):189-191.
5代伟光,刘烨.ERP环境下检测中心管理系统的设计与实现[J].现代机械,2006(2):73-75. 被引量：1
6张晓博.基于Python的SQL Server海量数据转移的研究与实现[J].铁路计算机应用,2012,21(2):55-57. 被引量：3
7赵艳,赵志明.一种异构数据库转换的实现方法[J].新浪潮,1996(7):6-7.
8程舒通,徐从富,但红卫.高效隐私保护频繁模式挖掘算法研究[J].计算机科学,2015,42(4):194-198. 被引量：5
9覃环虎,张立福,刘凯.高光谱影像库的数据存取技术研究[J].计算机工程,2012,38(16):65-69.
10杜卫华.浅淡微机测控系统的干扰防范[J].承德石油高等专科学校学报,1997(1):18-22.

计算机应用研究

2015年第11期

浏览历史

内容加载中请稍等...

基于粒度计算的减量式隐私保护数据挖掘被引量：2

参考文献16

二级参考文献163

共引文献94

同被引文献14

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于粒度计算的减量式隐私保护数据挖掘 被引量：2

参考文献16

二级参考文献163

共引文献94

同被引文献14

引证文献2

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于粒度计算的减量式隐私保护数据挖掘被引量：2