在分布式环境中,垂直分割是一种保护用户隐私的有效方法。然而,当前的垂直分割策略假设参与数据存储的各个云服务提供商(cloud service provider,CSP)之间不存在共谋。针对实际场景中CSP之间可能存在的共谋问题,探讨了如何在这种情况下...在分布式环境中,垂直分割是一种保护用户隐私的有效方法。然而,当前的垂直分割策略假设参与数据存储的各个云服务提供商(cloud service provider,CSP)之间不存在共谋。针对实际场景中CSP之间可能存在的共谋问题,探讨了如何在这种情况下保护用户数据隐私。假设有n个CSP参与数据存储,其中最多k个CSP可能会共谋,给出了垂直分割的(k,n)-安全定义,并提出了MLVP(machine learning vertical partitioning)方案。该方案利用机器学习算法分析属性之间的关联性,对得到的所有关联性进行优化,并将计算垂直分割方法问题转化成可满足性问题,再利用可满足性问题求解器得到分割方法。此外,对MLVP方案的安全性进行理论分析,并在真实数据集上进行实验,比较不同机器学习算法和隐私保护强度对分割效果和性能的影响;与两个不考虑CSP存在共谋的垂直分割方案(Oriol方案和Ciriani方案)在计算速度和查询速度上进行了比较。实验结果表明:在计算速度上,因为要保证CSP共谋时的安全性,MLVP方案略慢,在查询速度上,MLVP方案相较Oriol方案和Ciriani方案分别提升了32.6%和8.8%。展开更多