-
题名基于差分隐私的网络图像敏感数据挖掘方法
被引量:3
- 1
-
-
作者
杜玉昌
-
机构
厦门软件职业技术学院招生处
-
出处
《新乡学院学报》
2023年第3期30-33,共4页
-
文摘
常规的敏感图像数据挖掘方法是利用原有数据库进行图像敏感信息识别,这使新兴敏感数据无法被有效挖掘。为此,设计了基于差分隐私的网络图像敏感数据挖掘方法。首先,挖掘出图像敏感数据差分特征,剔除疑似敏感的图像数据。然后,利用差分隐私算法,生成网络图像的视觉敏感词典,有效识别新兴敏感数据。最后,构建网络图像敏感数据挖掘模型,进一步提高敏感数据挖掘精准度。实验结果表明所提方法挖掘的敏感数据更加准确。
-
关键词
差分隐私
网络图像
敏感数据
挖掘方法
差分特征
敏感词典
-
Keywords
differential privacy
network image
sensitive data
excavation method
differential characteristics
sensitive dictionary
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合敏感词典和异构图的汉泰跨语言敏感信息识别
- 2
-
-
作者
朱栩冉
余正涛
张勇丙
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《计算机工程与设计》
北大核心
2024年第7期2150-2156,共7页
-
基金
国家自然科学基金项目(U21B2027、61972186、62266028)
云南省重大科技专项计划基金项目(202202AD080003)。
-
文摘
通用跨语言文本分类模型识别毒品、暴力和自然灾害等敏感信息不准确,且汉泰双语敏感词表示多样化、难对齐导致不同语言信息聚合能力较弱,为此提出一种融合敏感词典和异构图的汉泰跨语言敏感信息识别方法。利用汉泰敏感词典构建具有文档对齐和词对齐的跨语言异构图结构,将文档以及所含关键词和敏感词作为节点,双语对齐、相似关系和不同词性作为边构建汉泰跨语言异构图;基于多语言预训练模型对文档节点和词节点进行表征;通过多层图卷积神经网络对输入文档进行编码,使用敏感信息分类器对文档进行分类预测。实验结果表明,所提方法准确率较基线模型提高了5.83%。
-
关键词
敏感词典
跨语言
异构图
图卷积神经网络
敏感信息识别
多语言预训练模型
双语对齐
-
Keywords
sensitive dictionary
cross-lingual
heterogeneous graph
graph convolutional neural network
sensitive information identification
multi-lingual pre-trained model
bilingual alignment
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-