-
题名融入结构先验知识的隐私信息抽取算法
- 1
-
-
作者
赵玉媛
王斌
张泽丹
李青山
胡建斌
-
机构
北京大学软件与微电子学院
中国中医科学院中医药数据中心
博雅正链(北京)科技有限公司
北京大学计算机学院
-
出处
《信息安全研究》
CSCD
北大核心
2024年第2期139-147,共9页
-
基金
国家自然科学基金面上项目(82274685)。
-
文摘
随着数据脱敏技术的持续进步,精确识别隐私数据已成为关键挑战.目前,隐私信息抽取算法主要基于传统自然语言处理技术,如双向循环神经网络和基于注意力机制的预训练语言模型(如BERT).这些模型利用其强大的上下文特征表示能力,克服了传统方法在多义词表示方面的限制.然而,它们在精确判断实体边界方面仍有改进空间.提出了一种新颖的隐私信息抽取算法,该算法融合结构先验知识,通过一种隐私数据结构知识增强机制,提高模型对句子语义结构的理解,从而提高了隐私信息边界判断的准确性.此外,还在多个公开数据集上对模型进行评估,详细的实验结果展示了其有效性.
-
关键词
结构先验知识
结构增强机制
隐私信息抽取算法
实体边界判断
数据脱敏
自然语言处理
-
Keywords
structural prior knowledge
structural enhancement mechanism
privacy information extraction algorithm
entity boundary determination
data desensitization
natural language processing
-
分类号
TP309.2
[自动化与计算机技术—计算机系统结构]
-