MapReduce框架下支持差分隐私保护的随机梯度下降算法被引量：3

Stochastic gradient descent algorithm preserving differential privacy in MapReduce framework

下载PDF

导出

摘要针对现有分布式计算环境下随机梯度下降算法存在效率性与私密性矛盾的问题,提出一种MapReduce框架下满足差分隐私的随机梯度下降算法。该算法基于MapReduce框架,将数据随机分配到各个Map节点并启动Map分任务独立并行执行随机梯度下降算法;启动Reduce分任务合并满足更新要求的分目标更新模型,并加入拉普拉斯随机噪声实现差分隐私保护。根据差分隐私保护原理,证明了算法满足e-差分隐私保护要求。实验表明该算法具有明显的效率优势并有较好的数据可用性。 Aiming at the contradiction between the efficiency and privacy of stochastic gradient descent algorithm in dis-tributed computing environment, a stochastic gradient descent algorithm preserving differential privacy based on Ma-pReduce was proposed. Based on the computing framework of MapReduce, the data were allocated randomly to each Map node and the Map tasks were started independently to execute the stochastic gradient descent algorithm. The Reduce tasks were appointed to update the model when the sub-target update models were meeting the update requirements, and to add Laplace random noise to achieve differential privacy protection. Based on the combinatorial features of differential privacy, the results of the algorithm is proved to be able to fulfill ε-differentially private. The experimental results show that the algorithm has obvious efficiency advantage and good data availability.

作者俞艺涵付钰吴晓平

机构地区海军工程大学信息安全系

出处《通信学报》 EI CSCD 北大核心 2018年第1期70-77,共8页 Journal on Communications

基金国家自然科学基金资助项目(No.61100042) 国家社科基金资助项目(No.15GJ003-201)~~

关键词机器学习随机梯度下降 MAPREDUCE 差分隐私保护拉普拉斯机制 machine learning, stochastic gradient descent, MapReduce, differential privacy preserving, Laplace mechanism

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1陈振宏,兰艳艳,郭嘉丰,程学旗.基于差异合并的分布式随机梯度下降算法[J].计算机学报,2015,38(10):2054-2063. 被引量：19
2何贤芒,王晓阳,陈华辉,董一鸿.差分隐私保护参数ε的选取研究[J].通信学报,2015,36(12):124-130. 被引量：15

二级参考文献50

1Dean J, Corrado G, Monga R, et al. Large scale distributed deep networks//Proceedings of the Conference on Neural Information Processing Systems. Lake Tahoe, USA, 2012: 1223-1231. 被引量：1
2McDonald R, Hall K, Mann G. Distributed training strategies for the structured perceptron//Proceedings of the Human Language Technologies-. The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics. Los Angeles, USA, 2010: 456-464. 被引量：1
3Hall K B, Gilpin S, Mann G. MapReduee/Bigtable for distributed optimization//Proeeedings of the Conference on Neural Information Proeessing Systems. Workshop on Learn- ing on Cores, Clusters and Clouds. Vancouver, Canada, 2010. 被引量：1
4Mann G, McDonald R T, Mohri M, et al. Efficient large- scale distributed training of conditional maximum entropy models//Proceedings of the Conference on Neural Information Processing Systems. Vancouver, Canada,2009:1231-1239. 被引量：1
5Zinkevich M, Weimer M, Smola A J, et al. Parallelized stochastic gradient descent//Proceedings of the Conference on Neural Information Processing Systems. Vancouver, Canada, 2010:4. 被引量：1
6Kleiner A, Talwalkar A, Sarkar P, et al. The big data bootstrap //Proceedings of the International Conference on Machine Learning. Edinburgh, UK, 2012. 被引量：1
7Louppe G, Geurts P. A zealous parallel gradient descent algorithm//Proceedings of the Conference on Neural Infor- mation Processing Systems. Workshop on Learning on Cores, Clusters and Clouds. Vancouver, Canada, 2010. 被引量：1
8Niu F, Recht B, R, C, et al. Hogwildl: A lock-free approach to parallelizing stochastic gradient descent// Proceedings of the Conference on Neural Information Processing Systems. Granada, Spain, 2011:693-701. 被引量：1
9Langford J, Smola A J, Zinkevich M. Slow learners are iast//Proceedings of the Conference on Neural Information Processing Systems. Vancouver, Canada, 2009:2331-2339. 被引量：1
10Dai W, Wei J, Zheng X, et al. Petuum: A framework for iterative- convergent distributed, arXiv preprint arXiv, 1312. 7651, 2013. 被引量：1

共引文献32

1曹司磊,曾维贵,刘明刚.基于区域判别的抗质心式箔条干扰方法[J].兵工自动化,2017,36(6):70-74. 被引量：3
2何明,常盟盟,吴小飞.一种基于差分隐私保护的协同过滤推荐方法[J].计算机研究与发展,2017,54(7):1439-1451. 被引量：19
3王红,葛丽娜,王苏青,王丽颖,张翼鹏,梁竣程.基于OPTICS聚类的差分隐私保护算法的改进[J].计算机应用,2018,38(1):73-78. 被引量：7
4李德权,王俊雅,马驰,周跃进.快速在线分布式对偶平均优化算法[J].计算机应用,2018,38(8):2337-2342. 被引量：1
5郝晨艳,彭长根,张盼盼.重复攻击下差分隐私保护参数ε的选取方法[J].计算机工程,2018,44(7):145-149. 被引量：3
6唐正莉,龙士工.基于混合机制下的差分隐私直方图发布[J].贵州大学学报（自然科学版）,2018,35(4):32-36. 被引量：4
7郭西进,李红强,张帆,郑杰,吴刚.基于卷积神经网络的煤泥浮选泡沫图像分类方法[J].煤炭技术,2018,37(9):348-351. 被引量：5
8王惠中,乔林翰,贺珂珂,段洁.基于Cross-Validation的电机故障诊断振动数据处理方法[J].自动化仪表,2018,39(4):22-25. 被引量：6
9王俊雅.分布式在线随机投影优化[J].阜阳师范学院学报（自然科学版）,2018,35(3):4-7.
10刘黎志,邓介一,吴云韬.基于HBase的多分类逻辑回归算法研究[J].计算机应用研究,2018,35(10):3007-3010. 被引量：11

同被引文献23

1孟德宇,徐晨,徐宗本.基于Isomap的流形结构重建方法[J].计算机学报,2010,33(3):545-555. 被引量：20
2乐阳,龚健雅.Dijkstra最短路径算法的一种高效率实现[J].武汉测绘科技大学学报,1999,24(3):209-212. 被引量：241
3吴俊利,张步涵,王魁.基于Adaboost的BP神经网络改进算法在短期风速预测中的应用[J].电网技术,2012,36(9):221-225. 被引量：61
4何进荣,丁立新,李照奎,胡庆辉.基于边界判别投影的数据降维[J].软件学报,2014,25(4):826-838. 被引量：16
5李俊伟,郭俊先,张学军,胡光辉,程国首.无核白鲜葡萄机器视觉质量预测研究![J].农机化研究,2014,36(7):57-61. 被引量：2
6王锐,吴小俊.基于切空间判别学习的流形降维算法[J].软件学报,2018,29(12):3786-3798. 被引量：4
7马玉良,许明珍,佘青山,高云园,孙曜,杨家强.基于自适应阈值的脑电信号去噪方法[J].传感技术学报,2014,27(10):1368-1372. 被引量：26
8欧阳佳,印鉴,刘少鹏.一种分布式事务数据的差分隐私发布策略[J].软件学报,2015,26(6):1457-1472. 被引量：7
9陈坤杰,杨凯,康睿,章夏夏,吴威.基于机器视觉的鸡胴体表面污染物在线检测技术[J].农业机械学报,2015,46(9):228-232. 被引量：7
10申爱敏,霍晓静,王文娣,王红霞.基于机器视觉的核桃仁大小自动分级技术[J].江苏农业科学,2016,44(9):383-385. 被引量：8

引证文献3

1戚超,徐佳琪,刘超,吴明清,陈坤杰.基于机器视觉和机器学习技术的鸡胴体质量自动分级方法[J].南京农业大学学报,2019,42(3):551-558. 被引量：8
2吴艳萍,王红军,李天瑞,邓萍.基于曲线距离分析的嵌入式增强聚类算法[J].计算机应用与软件,2021,38(10):321-329.
3褚治广,李俊燕,陈昊,张兴.基于分布式多关联属性的高维数据差分隐私保护方法[J].计算机工程与设计,2024,45(4):967-973.

二级引证文献8

1郭峰,刘立峰,张奎彪,刘辉,钟少辉.家禽胴体影像分选技术研究新进展[J].肉类工业,2019,0(11):31-40. 被引量：3
2郭楠,叶金鹏,王子戡,潘满,王道路,蒋俊强.畜禽肉品分割加工智能化发展现状及趋势[J].肉类工业,2020,0(2):37-41. 被引量：9
3邹修国,宋圆圆,徐泽颖,张世凯,张杰,殷正凌.基于PSO-DNN的平养鸡舍冬季氨气浓度预测模型研究[J].南京农业大学学报,2021,44(1):184-193. 被引量：4
4刘昕宇.一种机器视觉的题目符号智能识别系统设计[J].电子制作,2021,29(4):14-16.
5赵正东,王虎虎,徐幸莲.基于机器视觉的肉鸡胴体淤血检测技术[J].农业工程学报,2022,38(16):330-338. 被引量：4
6吴江春,王虎虎,徐幸莲.基于机器视觉的鸡胴体断翅快速检测技术[J].农业工程学报,2022,38(22):253-261. 被引量：2
7赵宁,李星,江勇,王志秀,毕瑜林,陈国宏,白皓,常国斌.图像识别技术在鸡养殖领域的应用[J].中国农业科技导报,2023,25(9):13-22. 被引量：1
8吴江春,王虎虎,徐幸莲.基于机器视觉的鸡胴体原发性皮炎快速检测[J].食品科学,2023,44(20):350-356. 被引量：1

1白云璐.医疗大数据中应用差分隐私保护[J].电子技术与软件工程,2017(24):196-197. 被引量：3
2语录[J].37°女人,2017,0(12):38-38.
3刘爽英,朱勇华.针对社交网络边权重的差分隐私保护[J].计算机工程与设计,2018,39(1):44-48. 被引量：3
4王红,葛丽娜,王苏青,王丽颖,张翼鹏,梁竣程.基于OPTICS聚类的差分隐私保护算法的改进[J].计算机应用,2018,38(1):73-78. 被引量：7
5王换换,吴响,俞啸,胡俊峰.TopN推荐系统的差分隐私保护研究[J].中国科技论文,2017,12(20):2326-2330. 被引量：2
6陈玉华,翟颖佳,卓凤艳,李新庆,陈增境.自动气象站数据可用性影响因素分析和质量提升策略[J].工业技术创新,2017,4(6):52-56. 被引量：5
7孙学波,石飞达.基于Hadoop的Apriori算法研究与优化[J].计算机工程与设计,2018,39(1):126-133. 被引量：18
8黄迪.传统企业破局互联网时代[J].知识经济,2018(2):61-61.
9张龙,董峰,傅雨田.基于神经网络的红外图像非均匀性校正[J].红外技术,2018,40(2):164-169. 被引量：6
10师天浩.把企业化作“符号”[J].风流一代,2017,0(27):43-43.

通信学报

2018年第1期

浏览历史

内容加载中请稍等...

MapReduce框架下支持差分隐私保护的随机梯度下降算法被引量：3

参考文献2

二级参考文献50

共引文献32

同被引文献23

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

MapReduce框架下支持差分隐私保护的随机梯度下降算法 被引量：3

参考文献2

二级参考文献50

共引文献32

同被引文献23

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

MapReduce框架下支持差分隐私保护的随机梯度下降算法被引量：3