-
题名基于多特征嵌入的中文医学命名实体识别
- 1
-
-
作者
黄健格
贾真
张凡
李天瑞
-
机构
西南交通大学计算机与人工智能学院
四川省制造业产业链协同与信息化支撑技术重点实验室
综合交通大数据应用技术国家工程实验室
-
出处
《计算机科学》
CSCD
北大核心
2023年第6期243-250,共8页
-
基金
国家自然科学基金(62176221)。
-
文摘
针对基于字符表示的中文医学命名实体识别模型嵌入信息单一、缺失词边界和结构信息的问题,文中提出了一种融合多特征嵌入的医学命名实体识别模型。首先,将字符映射为固定长度的嵌入表示;其次,引入外部资源构建词汇特征,该特征能够补充字符的潜在词组信息;然后,根据中文的象形文字特点和文本序列特点,分别引入字符结构特征和序列结构特征,使用卷积神经网络对两种结构特征进行编码,得到radical-level词嵌入和sentence-level词嵌入;最后,将得到的多种特征嵌入进行拼接,输入长短期记忆网络编码,并使用条件随机场输出实体预测结果。将自建中文医疗数据和CHIP_2020任务提供的医疗数据作为数据集进行实验,实验结果表明,与基准模型相比,所提模型同时融合了词汇特征和文本结构特征,能够有效识别医学命名实体。
-
关键词
命名实体识别
中文医学文本
词汇信息
文本结构特征
深度学习
-
Keywords
Named entity recognition
Chinese medical text
Lexical information
text structure features
Deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于汉明码的无载体文本信息隐藏算法
被引量:3
- 2
-
-
作者
吴金阔
郭振波
-
机构
青岛大学计算机科学技术学院
-
出处
《青岛大学学报(自然科学版)》
CAS
2019年第2期62-66,72,共6页
-
基金
国家自然科学基金(批准号:U1536113)资助
-
文摘
现有文本信息隐藏算法大多针对载体文本结构或语义进行修改,很可能引起明显异常,算法存在隐蔽性不足与抗检测能力较差等问题。基于汉明码的自我纠错能力,提出了一种利用文本结构特征编码的无载体文本信息隐藏算法。对信息码文本进行结构特征编码处理,根据秘密消息的位置编码对信息码进行修改,得到处理后的监督码,搜索匹配的监督码文本载体进行传输。实验结果表明,该算法具有较好的可实现性,安全性也有所增强,能够广泛地应用于即时通信。不需要对载体文本进行修改,因而隐蔽性方面有一定的改进。
-
关键词
信息隐藏
文本结构特征
汉明码
位置编码
-
Keywords
information hiding
text structure features
hamming code
location code
-
分类号
TN911.73
[电子电信—通信与信息系统]
-