摘要
互联网敏感实体识别是命名实体识别(NER)在特定领域的应用,主要任务是在互联网场景下识别文本数据中的不同类型的敏感实体。本文提出了一种基于CNN和BiGRU-attention并行,并辅以人工特征的针对互联网敏感实体的识别方法。使用卷积神经网络自动提取英文或符号文字字符的特征,再通过BiGRU分别前后向分析文本的字符序列,得到文本的全局特征。再考虑到互联网敏感实体本身的复杂性,加入人工特征作为判别辅助。经实验与现有的几种模型进行对比,本文提出的方法在模型结构更为简洁的同时,在面对中英文混合的互联网敏感实体识别时,精准度更高。
出处
《网络安全技术与应用》
2020年第4期61-65,共5页
Network Security Technology & Application