期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
差分隐私保护下一种精确挖掘top-k频繁模式方法 被引量:29
1
作者 张啸剑 王淼 孟小峰 《计算机研究与发展》 EI CSCD 北大核心 2014年第1期104-114,共11页
频繁模式挖掘是分析事务数据集常用技术.然而,当事务数据集含有敏感数据时(如用户行为记录、电子病例等),直接发布频繁模式及其支持度计数会给个人隐私带来相当大的风险.对此提出了一种满足ε-差分隐私的top-k频繁模式挖掘算法DP-topkP(... 频繁模式挖掘是分析事务数据集常用技术.然而,当事务数据集含有敏感数据时(如用户行为记录、电子病例等),直接发布频繁模式及其支持度计数会给个人隐私带来相当大的风险.对此提出了一种满足ε-差分隐私的top-k频繁模式挖掘算法DP-topkP(differentially private top-kpattern mining).该算法利用指数机制从候选频繁模式集合中挑选出top-k个携带真实支持度计数的模式;采用拉普拉斯机制产生的噪音扰动所选模式的真实支持度计数;为了增强输出模式的可用性,采用后置处理技术对top-k个模式的噪音支持度计数进行求精处理.从理论角度证明了该算法满足ε-差分隐私,并符合(λ,δ)-useful要求.实验结果证明了DP-topkP算法具有较好的准确性、可用性和可扩展性. 展开更多
关键词 频繁模式挖掘 top-k模式 差分隐私 拉普拉斯机制 指数机制
下载PDF
MapReduce框架下支持差分隐私保护的k-means聚类方法 被引量:24
2
作者 李洪成 吴晓平 陈燕 《通信学报》 EI CSCD 北大核心 2016年第2期124-130,共7页
针对传统隐私保护方法无法应对任意背景知识下恶意分析的问题,提出了分布式环境下满足差分隐私的k-means算法。该算法利用Map Reduce计算框架,由主任务控制k-means迭代执行;指派Mapper分任务独立并行计算各数据片中每条记录与聚类中心... 针对传统隐私保护方法无法应对任意背景知识下恶意分析的问题,提出了分布式环境下满足差分隐私的k-means算法。该算法利用Map Reduce计算框架,由主任务控制k-means迭代执行;指派Mapper分任务独立并行计算各数据片中每条记录与聚类中心的距离并标记其属于的聚类;指派Reducer分任务计算同一聚类中的记录数量num和属性向量之和sum,并利用Laplace机制产生的噪声扰动num和sum,进而实现隐私保护。根据差分隐私的组合特性,从理论角度证明整个算法满足ε-差分隐私保护。实验结果证明了该方法在提高隐私性和时效性的情况下,保证了较好的可用性。 展开更多
关键词 数据挖掘 K-均值聚类 MAP REDUCE 差分隐私保护 laplace机制
下载PDF
基于拉普拉斯机制的差分隐私保护k-means++聚类算法研究 被引量:18
3
作者 傅彦铭 李振铎 《信息网络安全》 CSCD 北大核心 2019年第2期43-52,共10页
k-means++聚类算法是为了解决k-means聚类算法的准确度受其初始中心点选取的影响较大的问题而提出的,在聚类过程中,需要对相关的隐私数据提供保护。差分隐私模型定义了一种具有最大背景知识假设的攻击模型,并且能对隐私保护强度进行量... k-means++聚类算法是为了解决k-means聚类算法的准确度受其初始中心点选取的影响较大的问题而提出的,在聚类过程中,需要对相关的隐私数据提供保护。差分隐私模型定义了一种具有最大背景知识假设的攻击模型,并且能对隐私保护强度进行量化分析。文章提出一种基于拉普拉斯机制的差分隐私保护k-means++聚类算法(DPk-means++聚类算法),在初始化选取中心点和迭代求均值中心点的过程中,分别根据拉普拉斯机制添加噪声,解决了k-means++聚类算法随机选取初始化中心点隐私泄露的问题和迭代求簇心隐私泄露问题。通过实验分别对隐私预算动态变化对比及聚类准确性结果进行分析,DPk-means++聚类算法能够在隐私预算参数范围内且保证聚类准确性的前提下,实现对数据隐私提供不同级别的保护。 展开更多
关键词 差分隐私保护 拉普拉斯机制 k-means++ 聚类
下载PDF
基于差分隐私的多源数据关联规则挖掘方法 被引量:13
4
作者 崔一辉 宋伟 +1 位作者 彭智勇 杨先娣 《计算机科学》 CSCD 北大核心 2018年第6期36-40,56,共6页
随着大数据时代的到来,挖掘大数据的潜在价值越来越受到学术界和工业界的关注。但与此同时,由于互联网安全事件频发,用户越来越多地关注个人隐私数据的泄露问题,用户数据的安全问题成为阻碍大数据分析的首要问题之一。关于用户数据的安... 随着大数据时代的到来,挖掘大数据的潜在价值越来越受到学术界和工业界的关注。但与此同时,由于互联网安全事件频发,用户越来越多地关注个人隐私数据的泄露问题,用户数据的安全问题成为阻碍大数据分析的首要问题之一。关于用户数据的安全性问题,现有研究更多地关注访问控制、密文检索和结果验证,虽然可以保证用户数据本身的安全性,但是无法挖掘出所保护数据的潜在价值。如何既能保护用户的数据安全又能挖掘数据的潜在价值,是亟需解决的关键问题之一。文中提出了一种基于差分隐私保护的关联规则挖掘方法,数据拥有者使用拉普拉斯机制和指数机制在数据发布的过程中对用户数据进行保护,数据分析者在差分隐私的FP-tree上进行关联规则挖掘。其中的安全性假设是:攻击者即使掌握了除攻击目标以外的所有元组数据信息的背景知识,仍旧无法获得攻击目标的信息,因此具有极高的安全性。所提方法是兼顾安全性、性能和准确性,以牺牲部分精确率为代价,大幅增加了用户数据的安全性和处理性能。实验结果表明,所提方法的精确性损失在可接受的范围内,性能优于已有算法的性能。 展开更多
关键词 隐私保护的数据挖掘 差分隐私 拉普拉斯机制 指数机制
下载PDF
基于Laplace机制的加密流量特征集隐私保护方法
5
作者 靳玮琨 郭晓军 杨明芬 《西藏科技》 2024年第4期71-80,共10页
随着网络安全和隐私问题被广泛关注,越来越多的网络流量采用加密技术进行传输,加密流量分类对于网络监管起到了至关重要的作用。针对在加密流量分类过程中容易出现的用户隐私泄露等问题,提出一种基于Laplace机制的加密流量特征集隐私保... 随着网络安全和隐私问题被广泛关注,越来越多的网络流量采用加密技术进行传输,加密流量分类对于网络监管起到了至关重要的作用。针对在加密流量分类过程中容易出现的用户隐私泄露等问题,提出一种基于Laplace机制的加密流量特征集隐私保护方法。该方法通过生成随机扰动间隔区间的方式,按照生成的区间多次变换扰动间隔对加密流量特征集标签栏进行一定程度的扰动,达到保护用户隐私信息的目的。最后在IS‐CXVPN-NonVPN数据集上进行验证,实验结果表明,在保证隐私的前提下,仍能较好地保证加密流量分类精确率,证明了提出方法的有效性和可用性。 展开更多
关键词 加密流量分类 特征集 laplace机制 隐私保护
下载PDF
基于OPTICS聚类的电力通信网跨层保护系统设计
6
作者 梁发亮 岳龙 李树勇 《电子设计工程》 2024年第18期163-167,共5页
电力通信网跨层传输数据时,受到噪声数据影响,导致跨层数据传输耗时长、电流畸变率高。为了保证跨层通信安全,设计基于密度的聚类算法(Ordering Points To Identify the Clustering Structure,OPTICS)的电力通信网跨层保护系统。构建并... 电力通信网跨层传输数据时,受到噪声数据影响,导致跨层数据传输耗时长、电流畸变率高。为了保证跨层通信安全,设计基于密度的聚类算法(Ordering Points To Identify the Clustering Structure,OPTICS)的电力通信网跨层保护系统。构建并联有源电力滤波器安全保护电路,保证三相四线制限幅后具有良好谐波补偿效果。通过跨层控制主动切换模块,实现目标通信链路下达指令的主动切换。对电力通信网跨层数据进行OPTICS聚类处理,结合Laplace机制添加对称指数分布噪声,将Laplace噪声添加到聚类簇中,输出添加噪声后结果存储在输出队列中,完成通信网跨层保护。由系统测试结果可知,该系统传输耗时少,且在10 s测试时间内跨层电流畸变率仅为21%,能够起到保护通信网跨层传输的作用。 展开更多
关键词 OPTICS聚类 电力通信网 跨层保护 laplace机制
下载PDF
面向隐私保护的频繁项集挖掘算法 被引量:6
7
作者 蒋辰 杨庚 +1 位作者 白云璐 马君梅 《信息网络安全》 CSCD 北大核心 2019年第4期73-81,共9页
目前已有多种满足ε-差分隐私的频繁项集挖掘算法,但这些算法在处理高维数据集时难以兼顾安全性和效用性。针对该问题,文章提出一种面向隐私保护的频繁项集挖掘算法——TrunSuper。该算法先对事务数据集进行截断以降维,将事务中的项按... 目前已有多种满足ε-差分隐私的频繁项集挖掘算法,但这些算法在处理高维数据集时难以兼顾安全性和效用性。针对该问题,文章提出一种面向隐私保护的频繁项集挖掘算法——TrunSuper。该算法先对事务数据集进行截断以降维,将事务中的项按支持度从大到小进行排序,剔除支持度较小的项,从而降低发布的频繁项集的支持度误差。文章证明了该算法在满足ε-差分隐私的同时具有较好的可用性,且在真实数据集上验证了算法的优越性。 展开更多
关键词 频繁项集挖掘 差分隐私 事务截断 拉普拉斯机制
下载PDF
基于数据特征相关性和自适应差分隐私的深度学习方法研究
8
作者 康海燕 王骁识 《电子学报》 EI CAS CSCD 北大核心 2024年第6期1963-1976,共14页
基于差分隐私的深度学习隐私保护方法中,训练周期的长度以及隐私预算的分配方式直接制约着深度学习模型的效用.针对现有深度学习结合差分隐私的方法中模型训练周期有限、隐私预算分配不合理导致模型安全性与可用性差的问题,提出一种基... 基于差分隐私的深度学习隐私保护方法中,训练周期的长度以及隐私预算的分配方式直接制约着深度学习模型的效用.针对现有深度学习结合差分隐私的方法中模型训练周期有限、隐私预算分配不合理导致模型安全性与可用性差的问题,提出一种基于数据特征相关性和自适应差分隐私的深度学习方法(deep learning methods based on data feature Relevance and Adaptive Differential Privacy,RADP).首先,该方法利用逐层相关性传播算法在预训练模型上计算出原始数据集上每个特征的平均相关性;然后,使用基于信息熵的方法计算每个特征平均相关性的隐私度量,根据隐私度量对特征平均相关性自适应地添加拉普拉斯噪声;在此基础上,根据加噪保护后的每个特征平均相关性,合理分配隐私预算,自适应地对特征添加拉普拉斯噪声;最后,理论分析该方法(RADP)满足ε-差分隐私,并且兼顾安全性与可用性.同时,在三个真实数据集(MNIST,Fashion-MNIST,CIFAR-10)上的实验结果表明,RADP方法的准确率以及平均损失均优于AdLM(Adaptive Laplace Mechanism)方法、DPSGD(Differential Privacy with Stochastic Gradient Descent)方法和DPDLIGDO(Differentially Private Deep Learning with Iterative Gradient Descent Optimization)方法,并且RADP方法的稳定性仍能保持良好. 展开更多
关键词 差分隐私 深度学习 逐层相关性传播 信息熵 隐私度量 隐私预算 拉普拉斯机制
下载PDF
基于差分隐私保护的二分k均值聚类算法研究 被引量:1
9
作者 马文博 巫朝霞 《智能计算机与应用》 2023年第2期155-160,164,共7页
针对差分隐私保护k均值聚类算法(DP k-means)随机选取初始点,导致算法往往收敛于局部最优,进而影响聚类效果的问题,本文结合差分隐私的相关理论以及层次聚类的思想提出了一种基于差分隐私保护的二分k均值聚类算法(DP Bi-k-means)。首先... 针对差分隐私保护k均值聚类算法(DP k-means)随机选取初始点,导致算法往往收敛于局部最优,进而影响聚类效果的问题,本文结合差分隐私的相关理论以及层次聚类的思想提出了一种基于差分隐私保护的二分k均值聚类算法(DP Bi-k-means)。首先,以得到全局最优为目标,将随机选取初始点的过程进行改进,由上至下对目标数据集进行二分;其次,在迭代过程实现基于拉普拉斯机制的差分隐私保护。经安全性分析以及实验结果证明:该算法与传统差分隐私保护k均值算法(DP k-means)相比,可以避免聚类结果受初始点的影响陷入局部最优解,从而优化聚类效果,并为聚类分析提供了有效的隐私保护能力。 展开更多
关键词 差分隐私 二分k均值聚类算法 拉普拉斯机制
下载PDF
基于差分隐私的高效用项目集挖掘算法
10
作者 马煜 荀亚玲 《太原科技大学学报》 2023年第6期491-497,503,共8页
在大数据时代,互联网安全事件频繁发生,用户数据安全性已成为大数据分析的热门话题。通过有效挖掘高效用项集获得的知识可能包含重要信息,如果被恶意滥用,可能威胁到数据拥有者的隐私或利益。为了防止数据信息泄露,提出了基于隐私保护... 在大数据时代,互联网安全事件频繁发生,用户数据安全性已成为大数据分析的热门话题。通过有效挖掘高效用项集获得的知识可能包含重要信息,如果被恶意滥用,可能威胁到数据拥有者的隐私或利益。为了防止数据信息泄露,提出了基于隐私保护的高效用项目集挖掘算法DPUP-Growth(based on Differential Privacy Utility Pattern Tree).首先在构建树的过程中,使用指数机制来混淆项头表的顺序,将拉普拉斯噪声添加到每个节点,从而得到差分隐私的树结构DPUP-Tree.最终进行高效用项目集挖掘。该方法以牺牲部分完整性为代价,大大提高了用户数据的安全性。实验结果表明,该方法的完整性损失在误差可接受的范围内,安全性能大大提升。 展开更多
关键词 高效用项目集挖掘 隐私保护 差分隐私 拉普拉斯机制 指数机制
下载PDF
差分隐私中噪声添加与精度分析研究
11
作者 王骁识 康海燕 《兰州理工大学学报》 CAS 北大核心 2023年第3期94-103,共10页
国内对于差分隐私定义以及所使用的基本机制缺乏严格清晰的证明与推导过程,对学者入门造成了困难.因此针对这方面空白,通过分析、证明与应用举例的方式,对差分隐私中的拉普拉斯机制与指数机制进行了详细分析,并给出完整的数学推导过程... 国内对于差分隐私定义以及所使用的基本机制缺乏严格清晰的证明与推导过程,对学者入门造成了困难.因此针对这方面空白,通过分析、证明与应用举例的方式,对差分隐私中的拉普拉斯机制与指数机制进行了详细分析,并给出完整的数学推导过程和应用举例.指出了拉普拉斯机制精度公式和指数机制精度公式存在缩放过大的问题,并且在拉普拉斯机制和指数机制精度公式的证明之后给出了放缩过大的理由.通过实验得出结论,拉普拉斯机制精度公式和指数机制精度公式是精度范围过大的公式. 展开更多
关键词 隐私保护 差分隐私 拉普拉斯机制 指数机制
下载PDF
基于差分隐私的健康医疗数据保护方案 被引量:2
12
作者 白伍彤 陈兰香 《计算机应用与软件》 北大核心 2022年第8期304-311,共8页
针对健康医疗数据的高敏感性,需要隐私保护强度更高的隐私保护算法。传统隐私保护模型总是因为新型攻击方法的出现而需要不断改进,而差分隐私保护模型对隐私保护水平给出了严格的数学证明和量化评估方法,保证即使在最大背景知识假设下... 针对健康医疗数据的高敏感性,需要隐私保护强度更高的隐私保护算法。传统隐私保护模型总是因为新型攻击方法的出现而需要不断改进,而差分隐私保护模型对隐私保护水平给出了严格的数学证明和量化评估方法,保证即使在最大背景知识假设下的个体隐私。针对健康医疗数据的数值型数据,提出基于Laplace机制的差分隐私保护方法,而对于非数值型数据,则利用基于指数机制的差分隐私保护方法,设置误差参数δ和满足误差的统计个数θ以进一步满足不同安全性和可用性的需求。对公开的健康医疗数据集进行实验分析,通过调整差分隐私保护参数ε来衡量隐私保护水平,通过实验结果给出不同类型的健康医疗数据的适当的参数取值。 展开更多
关键词 健康医疗数据 差分隐私保护 laplace机制 指数机制
下载PDF
多类别图像数据分类隐私保护算法 被引量:4
13
作者 郑剑 冷碧玉 《科学技术与工程》 北大核心 2020年第29期12007-12013,共7页
为了对所收集的未标记数据进行划分归类,用已知数据生成预测模型成为一种热门方法。针对模型会隐式地记住训练数据集而导致数据隐私泄露的问题,为保护训练集的隐私安全,将差分隐私应用于多类别图像数据集分类任务中,提出差分隐私与深度... 为了对所收集的未标记数据进行划分归类,用已知数据生成预测模型成为一种热门方法。针对模型会隐式地记住训练数据集而导致数据隐私泄露的问题,为保护训练集的隐私安全,将差分隐私应用于多类别图像数据集分类任务中,提出差分隐私与深度残差网络(differential privacy with deep residual networks,Diff-RN)方法。该方法将多类别图像数据分成多个互斥的数据集,通过黑盒的方式对互斥数据集分别进行非公开的教师模型训练,并使用拉普拉斯机制对教师模型结果聚合注入噪声与非敏感公共数据集结合,利用深度残差网络训练公开的学生模型,实验结果表明,在数据集cifar-100上,Diff-RN方法训练得到的模型分类精确度提高,训练过程中数据损失量降低,隐私保护程度更高,并且整个训练过程满足ε-差分隐私。 展开更多
关键词 机器学习 黑盒的方式 拉普拉斯机制 深度残差网络 差分隐私
下载PDF
结合联邦学习和增强学习的车联网数据差分隐私保护
14
作者 邬忠萍 郝宗波 +1 位作者 王文静 刘冬 《汽车技术》 CSCD 北大核心 2023年第11期56-62,共7页
为保证车联网环境下用户数据的安全性和隐私性,提出了结合联邦学习和增强学习的分布式数据差分隐私保护方案。利用联邦学习架构将数据保留在车辆节点或边缘设备上进行学习,通过分布式存储实现数据隐私保护,并减少数据传输开销;基于拉普... 为保证车联网环境下用户数据的安全性和隐私性,提出了结合联邦学习和增强学习的分布式数据差分隐私保护方案。利用联邦学习架构将数据保留在车辆节点或边缘设备上进行学习,通过分布式存储实现数据隐私保护,并减少数据传输开销;基于拉普拉斯机制实现差分隐私,并通过逐层相关传播(LRP)技术管理数据扰动,确保模型参数传递的隐私性和高效率。试验结果表明,所提出的方案在10轮通信内实现了约80%的全局准确度,最高可达98%,能够在消耗较少通信轮数的情况下完成模型聚合,实现了隐私保护和全局数据准确度的较好平衡,且通过增强学习策略准确检测到虚假噪声的注入,能够提升车联网的智能化水平和安全等级。 展开更多
关键词 车联网 联邦学习 增强学习 差分隐私 拉普拉斯机制 逐层相关传播
下载PDF
差分隐私保护下的数据分级发布机制 被引量:4
15
作者 张文静 李晖 《网络与信息安全学报》 2015年第1期58-65,共8页
隐私保护技术解决了数据发布过程中的隐私泄露问题,然而当前的数据发布技术大多只面向查询用户发布同一隐私保护级别的数据,并未考虑查询用户等级不同的情况。在所提出的满足差分隐私的数据分级发布机制中,数据发布方利用隐私预算参数... 隐私保护技术解决了数据发布过程中的隐私泄露问题,然而当前的数据发布技术大多只面向查询用户发布同一隐私保护级别的数据,并未考虑查询用户等级不同的情况。在所提出的满足差分隐私的数据分级发布机制中,数据发布方利用隐私预算参数不同的拉普拉斯机制对数据查询结果进行隐私保护处理,实现了输出隐私保护程度不同的查询结果。在依据付费或权限对查询用户分级后,数据发布方为等级较高(低)的查询用户发布隐私保护程度较低(高)的查询结果,使得查询用户可使用错误率较低(高)的数据,达到了隐私数据分级发布的效果。实验结果与安全性分析表明该机制在抵抗背景知识攻击的同时还可有效地实现输出错误率不同的分级查询结果。 展开更多
关键词 差分隐私 数据分级发布 拉普拉斯机制 隐私保护
下载PDF
一种增强的差分隐私数据发布算法 被引量:3
16
作者 孙奎 张志勇 赵长伟 《计算机工程》 CAS CSCD 北大核心 2017年第4期160-165,共6页
为在同等隐私保护强度下提高发布数据的分类准确率,在Diff Gen算法基础上提出一种改进的差分隐私数据发布算法Gini Diff。该算法将原始数据集完全泛化,在每轮迭代中通过指数机制选择特化方案,并以构建决策树的方式将特化后的记录划归到... 为在同等隐私保护强度下提高发布数据的分类准确率,在Diff Gen算法基础上提出一种改进的差分隐私数据发布算法Gini Diff。该算法将原始数据集完全泛化,在每轮迭代中通过指数机制选择特化方案,并以构建决策树的方式将特化后的记录划归到新的等价类,使用拉普拉斯机制为等价类计数添加噪声并生成发布数据集。运用基尼系数增益衡量不同特化方案的可用性,合理分配隐私预算并动态计算其消耗,发布数据集的可用性得到有效提高。实验结果表明,该算法发布的数据在分类准确率方面优于Diff Gen,接近理想水平。 展开更多
关键词 差分隐私 数据发布 决策树 基尼系数增益 指数机制 拉普拉斯机制
下载PDF
K-means‖隐私保护聚类算法 被引量:2
17
作者 郑剑 冷碧玉 《计算机工程与设计》 北大核心 2022年第1期26-33,共8页
针对异常离群点对k-means‖算法的聚类精确度影响较大且在确定中心点过程中会泄露聚类数据隐私的问题,提出DPk-means‖算法。标记离群点,降低离群点对k-means‖算法聚类精确度的影响,将差分隐私应用于k-means‖聚类算法中保护聚类数据... 针对异常离群点对k-means‖算法的聚类精确度影响较大且在确定中心点过程中会泄露聚类数据隐私的问题,提出DPk-means‖算法。标记离群点,降低离群点对k-means‖算法聚类精确度的影响,将差分隐私应用于k-means‖聚类算法中保护聚类数据隐私。在选择聚类初始中心点和迭代求取均值中心点的过程中,应用拉普拉斯机制注入噪声,解决数据隐私泄露的问题。通过隐私预算动态变化对聚类结果准确性的影响及同类算法对比实验分析验证,DPk-means‖算法能够提供更高的隐私保护水平且保证聚类结果的准确性。 展开更多
关键词 聚类精确度 并行化k均值 离群点 拉普拉斯机制 差分隐私
下载PDF
基于差分隐私的联邦学习数据隐私安全技术 被引量:2
18
作者 黄精武 《通信技术》 2022年第12期1618-1625,共8页
联邦学习方法在大数据时代有效解决了“数据孤岛”问题,也在一定程度上保障了数据隐私安全。然而,联邦学习的许多方面仍面临隐私风险。首先归纳总结了联邦学习面临的常见隐私威胁,并针对不同类型的隐私威胁归纳出对应的隐私保护措施;其... 联邦学习方法在大数据时代有效解决了“数据孤岛”问题,也在一定程度上保障了数据隐私安全。然而,联邦学习的许多方面仍面临隐私风险。首先归纳总结了联邦学习面临的常见隐私威胁,并针对不同类型的隐私威胁归纳出对应的隐私保护措施;其次重点针对差分隐私方法进行了探讨,归纳总结了一些差分隐私的实现方法;最后基于差分隐私设计了一种适用于联邦学习系统的隐私保护手段。 展开更多
关键词 联邦学习 隐私安全 差分隐私 拉普拉斯机制
下载PDF
基于差分隐私与前缀树的搜索日志隐私保护研究 被引量:3
19
作者 陆叶 卢菁 《小型微型计算机系统》 CSCD 北大核心 2016年第3期540-544,共5页
针对搜索日志的发布泄露用户隐私的问题将差分隐私引入到搜索日志中,提出了一种满足ε-差分隐私的隐私保护策略算法,使得搜索日志中的隐私信息不被泄露.采用前缀树的思想对数据源预处理和剪枝,在所得结果中利用拉普拉斯机制添加噪声扰... 针对搜索日志的发布泄露用户隐私的问题将差分隐私引入到搜索日志中,提出了一种满足ε-差分隐私的隐私保护策略算法,使得搜索日志中的隐私信息不被泄露.采用前缀树的思想对数据源预处理和剪枝,在所得结果中利用拉普拉斯机制添加噪声扰动真实结果,并通过理论证明该方法满足差分隐私保护.实验采用多机联机处理策略,大量缩短算法处理时间.通过实验结果分析,选取合适剪枝k阈值,使得发布数据在隐私保护度和数据准确率中达到平衡. 展开更多
关键词 搜索日志 隐私保护 差分隐私 前缀树 拉普拉斯机制
下载PDF
MapReduce框架下支持差分隐私保护的随机梯度下降算法 被引量:3
20
作者 俞艺涵 付钰 吴晓平 《通信学报》 EI CSCD 北大核心 2018年第1期70-77,共8页
针对现有分布式计算环境下随机梯度下降算法存在效率性与私密性矛盾的问题,提出一种MapReduce框架下满足差分隐私的随机梯度下降算法。该算法基于MapReduce框架,将数据随机分配到各个Map节点并启动Map分任务独立并行执行随机梯度下降算... 针对现有分布式计算环境下随机梯度下降算法存在效率性与私密性矛盾的问题,提出一种MapReduce框架下满足差分隐私的随机梯度下降算法。该算法基于MapReduce框架,将数据随机分配到各个Map节点并启动Map分任务独立并行执行随机梯度下降算法;启动Reduce分任务合并满足更新要求的分目标更新模型,并加入拉普拉斯随机噪声实现差分隐私保护。根据差分隐私保护原理,证明了算法满足e-差分隐私保护要求。实验表明该算法具有明显的效率优势并有较好的数据可用性。 展开更多
关键词 机器学习 随机梯度下降 MAPREDUCE 差分隐私保护 拉普拉斯机制
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部