通用深度学习语言模型的隐私风险评估被引量：3

Evaluating Privacy Risks of Deep Learning Based General-Purpose Language Models

下载PDF

导出

摘要近年来,自然语言处理领域涌现出多种基于Transformer网络结构的通用深度学习语言模型,简称“通用语言模型(general-purpose language models,GPLMs)”,包括Google提出的BERT(bidirectional encoder representation from transformers)模型等,已在多个标准数据集和多项重要自然语言处理任务上刷新了最优基线指标,并已逐渐在商业场景中得到应用.尽管其具有很好的泛用性和性能表现,在实际部署场景中,通用语言模型的安全性却鲜为研究者所重视.近年有研究工作指出,如果攻击者利用中间人攻击或作为半诚实(honest-but-curious)服务提供方截获用户输入文本经由通用语言模型计算产生的文本特征,它将以较高的准确度推测原始文本中是否包含特定敏感词.然而,该工作仅采用了特定敏感词存在与否这一单一敏感信息窃取任务,依赖一些较为严格的攻击假设,且未涉及除英语外其他语种的使用场景.为解决上述问题,提出1条针对通用文本特征的隐私窃取链,从更多维度评估通用语言模型使用中潜在的隐私风险.实验结果表明:仅根据通用语言模型提取出的文本表征,攻击者能以近100%的准确度推断其模型来源,以超70%的准确度推断其原始文本长度,最终推断出最有可能出现的敏感词列表,以重建原始文本的敏感语义.此外,额外针对3种典型的中文预训练通用语言模型开展了相应的隐私窃取风险评估,评估结果表明中文通用语言模型同样存在着不可忽视的隐私风险. Recently,a variety of Transformer-based GPLMs(general-purpose language models),including Google s BERT(bidirectional encoder representation from transformers),are proposed in NLP(natural language processing).GPLMs help achieve state-of-the-art performance on a wide range of NLP tasks,and are applied in industrial applications.Despite their generality and promising performance,a recent research work first shows that an attacker,who has access to the textual embeddings produced by GPLMs,can infer whether the original text contains a specific keyword with high accuracy.However,the previous work has the following limitations.First,they only consider the occurrence of one sensitive word as the sensitive information to steal,which is still far from a threatening privacy violation.Besides,their attack requires several rather strict security assumptions on the attacker s capability,e.g.,the attacker knows which GPLM produces the victim s textual embeddings.Moreover,they only consider the GPLMs designed for English texts.To address the aforementioned limitations and serve as a complement to their work,this paper proposes a more comprehensive privacy theft chain which is designed to explore whether there are even more privacy risks in general-purpose language models.Via experiments on 13 commercial GPLMs,we empirically show that an attacker can step by step infer the GPLM type behind the textual embedding with near 100%accuracy,then infer the textual length with over 70%on average and finally probe sensitive words that possibly occur in the original text,which brings useful information for the attacker to finally reconstruct the sensitive semantics.Besides,this paper also evaluates the privacy risks of three typical general-purpose language models in Chinese.The results confirm that privacy risks also exist in Chinese general-purpose language models,which calls for mitigation studies in the future.

作者潘旭东张谧颜一帆陆逸凡杨珉 Pan Xudong;Zhang Mi;Yan Yifan;Lu Yifan;Yang Min(School of Computer Science,Fudan University,Shanghai 200438)

机构地区复旦大学计算机科学技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2021年第5期1092-1105,共14页 Journal of Computer Research and Development

基金国家自然科学基金项目(61972099,U1636204,U1836213,U1836210,U1736208) 上海市自然科学基金项目(19ZR1404800)。

关键词深度学习隐私通用语言模型自然语言处理深度学习人工智能信息安全 deep learning privacy general-purpose language model(GPLMs) natural language processing deep learning artificial intelligence information security

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1陈宇飞,沈超,王骞,李琦,王聪,纪守领,李康,管晓宏.人工智能系统安全与隐私风险[J].计算机研究与发展,2019,56(10):2135-2150. 被引量：49

二级参考文献2

1范正光,屈丹,闫红刚,张文林.基于深层神经网络的多特征关联声学建模方法[J].计算机研究与发展,2017,54(5):1036-1044. 被引量：6
2王娟娟,乔颖,王宏安.基于图模型的自动驾驶推理任务调度[J].计算机研究与发展,2017,54(8):1693-1702. 被引量：4

共引文献48

1Anmin Li,Xiaohui Yao,Haiying Gu,Yungeng Zhang,Yuan Chang.Towards building a firm metaverse security base[J].Security and Safety,2023,2(2):57-71. 被引量：1
2贺奕静,杨智勇,刘晓倩.人工智能环境下数字档案资源共享的SWOT分析[J].山西档案,2022(4):95-103. 被引量：3
3赵宏,常有康,王伟杰.深度神经网络的对抗攻击及防御方法综述[J].计算机科学,2022,49(S02):662-672. 被引量：7
4杨蓉.从信息安全、数据安全到算法安全——总体国家安全观视角下的网络法律治理[J].法学评论,2021(1):131-136. 被引量：60
5王嘉凯,刘艾杉,李思民,刘祥龙,吴文峻.智能系统全生命周期安全测试理论与方法[J].智能安全,2023,2(1):27-36.
6林彬.试论基于人工智能系统的安全及其隐私风险探析[J].数码设计,2019,8(20):26-26.
7徐大海.人工智能系统安全与隐私风险[J].电子技术与软件工程,2020(6):230-231.
8李辉,王迎春.人工智能与国家安全:主要内涵及美国的战略认知[J].全球科技经济瞭望,2020,35(2):21-25. 被引量：1
9罗长银,陈学斌,宋尚文,刘洋.数据预处理技术在异构数据中的应用[J].软件,2020,41(5):6-13. 被引量：5
10胡启实,余卫星.基于人工智能的多媒体数据库在线整合系统设计[J].现代电子技术,2021,44(2):127-130. 被引量：1

同被引文献32

1张乐.新兴技术风险的挑战及其适应性治理[J].上海行政学院学报,2021,22(1):13-27. 被引量：27
2赵素锦.高科技时代的伦理风险及规避[J].求实,2011(4):30-32. 被引量：3
3蔡晶晶.社会—生态系统视野下的集体林权制度改革:一个新的政策框架[J].学术月刊,2011,43(12):79-86. 被引量：13
4邓一贵,伍玉英.基于文本内容的敏感词决策树信息过滤算法[J].计算机工程,2014,40(9):300-304. 被引量：31
5卢静.北极治理困境与协同治理路径探析[J].国际问题研究,2016(5):62-76. 被引量：19
6范如国.“全球风险社会”治理:复杂性范式与中国参与[J].中国社会科学,2017(2):65-83. 被引量：259
7胡象明,张丽颖.科学主义与人文主义视角下大型工程社会稳定风险评估困境及对策探析[J].行政论坛,2018,25(2):118-125. 被引量：18
8李佩瑄,薛贵.脑机接口的伦理问题及对策[J].科技导报,2018,36(12):38-45. 被引量：12
9李平,杨政银.人机融合智能：人工智能3．0[J].清华管理评论,2018,0(7):73-82. 被引量：43
10马长山.人工智能的社会风险及其法律规制[J].法律科学（西北政法大学学报）,2018,36(6):47-55. 被引量：199

引证文献3

1谭九生,李猛.人机融合智能的伦理风险及其适应性治理[J].昆明理工大学学报（社会科学版）,2022,22(3):37-45. 被引量：5
2潘旭东,张谧,杨珉.基于神经元激活模式控制的深度学习训练数据泄露诱导[J].计算机研究与发展,2022,59(10):2323-2337. 被引量：1
3周军芽,吴进伟,吴广飞,张何为.基于Bi-LSTM神经网络的短文本敏感词识别方法[J].武汉理工大学学报（信息与管理工程版）,2024,46(2):312-316.

二级引证文献6

1冯永刚,席宇晴.人工智能的伦理风险及其规制[J].河北学刊,2023,43(3):60-68. 被引量：15
2沈进兵.社区教育何以“智慧助老”:基于社会行动理论的分析[J].教育与职业,2023(23):54-62.
3胡凯茜,李欣,裴炳森.面向目标用户的深度学习模型可视化综述[J].计算机系统应用,2023,32(11):36-47.
4李猛.深度合成技术的社会安全风险:样态表征、生成机理与敏捷治理[J].中国科技论坛,2024(5):149-159.
5由欣宇.风险与超越:人工智能的伦理审视[J].现代教育与实践,2024,6(9):225-227.
6石玉.信任挑战到信任重构:智慧养老的伦理风险与进路反思[J].老龄化研究,2024,11(4):1492-1497.

1胡万亭,郭建英,张继永.一种基于改进ELMO模型的组织机构名识别方法[J].计算机技术与发展,2020,30(11):25-29.
2肖竹,谢宁,陈佳黎,刘保生,姜峰,杨郭镳.Fast-PPO:最优基线法的近端策略优化算法[J].小型微型计算机系统,2020,41(7):1351-1356. 被引量：2
3脑筋急转弯[J].中学英语之友（新教材初三版）,2009(2):32-32.
4ZHANG Xiaojiang,JIANG Ying.Research and Application of Machine Learning in Automatic Program Generation[J].Chinese Journal of Electronics,2020,29(6):1001-1015. 被引量：1
5董哲,邵若琦,陈玉梁,翟维枫.基于BERT和对抗训练的食品领域命名实体识别[J].计算机科学,2021,48(5):247-253. 被引量：15
6Konstantinos C.Mountzouris,Vasileios V.Paraskeuas,Konstantinos Fegeros.Priming of intestinal cytoprotective genes and antioxidant capacity by dietary phytogenic inclusion in broilers[J].Animal Nutrition,2020(3):305-312.
7刘杰,刘念,秦维,张冬生,谢尚志,郑红斌,李靖.信息安全中的光学加密技术分析[J].信息记录材料,2021,22(3):96-97. 被引量：1
8刘童童,谭方方.坦诚类连接成分语用功能的比较研究[J].现代语言学,2021,9(1):133-140.
9Zhao Peixiong,Liu Jie,Liu Tianqi,Ji Qinggang,Cai Chang,Li Dongqing,He Ze,Ye Bing,Mo Lihua,Zhai Pengfei,Sun Youmei,Hou Mingdong.Heavy-Ion Radiation Effects on MRAM[J].IMP & HIRFL Annual Report,2018(1):111-113.
10John Finnis.NATURAL LAW:PRACTICAL REASON AND CREATIVE INFORMATION[J].Frontiers of Law in China-Selected Publications from Chinese Universities,2020,15(4):373-389.

计算机研究与发展

2021年第5期

浏览历史

内容加载中请稍等...

通用深度学习语言模型的隐私风险评估被引量：3

参考文献1

二级参考文献2

共引文献48

同被引文献32

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

通用深度学习语言模型的隐私风险评估 被引量：3

参考文献1

二级参考文献2

共引文献48

同被引文献32

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

通用深度学习语言模型的隐私风险评估被引量：3