融合多模态数据的中文医学实体识别研究

Research on Chinese Medical Named Entity Recognition with Fusion of Multimodal Data

导出

摘要 [目的/意义]医学实体识别是医疗健康知识挖掘和知识组织的关键环节。深入挖掘多模态数据间语义关联可以提升医学实体识别效果,进而为领域知识补全和知识推理提供支撑。[方法/过程]提出一种基于双线性注意力融合机制的多模态中文医学实体识别模型BAF-MNER。首先通过视觉和文本编码器进行多模态医学数据的语义特征学习;接着利用双线性注意力网络实现图像和文本跨模态语义交互,并引入门控机制过滤视觉噪声;然后融合基于注意力机制的视觉特征和文本特征进而构建多模态特征表示,同时增加批量归一化层优化深度神经网络;最后将多模态特征向量输入CRF层解码获取预测标签。[结果/结论]本模型能够有效提升中文医学实体识别效果,在多模态医学数据集上的F1值较单模态基线模型提升4.07%,较多模态基线模型提升1.65%;在多模态公开数据集上的实验表明模型具有良好的泛化能力。 [Purpose/significance]Medical named entity recognition is a critical step for medical and healthcare knowledge mining and knowledge organization.The semantic associations between multimodal data are mined to improve the medical entity recognition effect,which provides support for domain knowledge complementation and knowledge reasoning.[Method/process]In this paper,we propose a multimodal Chinese medical named entity recognition model BAF-MNER(Bilinear Attention Fusion-Multimodal Named Entity Recognition)based on bilinear attention fusion mechanism.The model first learns semantic features from multimodal medical data through visual and text encoders;next a bilinear attention network is utilized to achieve cross-modal semantic interaction between image and text,introducing a gating mechanism to filter the visual noise;then fusing the visual and text features based on the attention mechanism to construct the multimodal feature representations,and adding a batch normalization layer to optimize the deep neural network;finally,inputting the multimodal feature vector into a CRF layer to decode to obtain the predicted labels.[Result/conclusion]The proposed model can effectively improve the Chinese medical named entity recognition,increasing the F1 value on multimodal medical dataset by 4.07%compared with the unimodal baseline model,and 1.65%compared with the multimodal baseline model;the experiments on multimodal public dataset indicate an excellent generalization of our model.

作者韩普陈文祺顾亮叶东宇景慎旗 Han Pu;Chen Wenqi;Gu Liang;Ye Dongyu;Jing Shenqi(School of Management,Nanjing University of Posts&Telecommunications,Jiangsu Nanjing 210003;Jiangsu Provincial Key Laboratory of Data Engineering and Knowledge Service,Jiangsu Nanjing 210023;Data Application Management Center,Jiangsu Provincial People’s Hospital,Jiangsu Nanjing 210029)

机构地区南京邮电大学管理学院江苏省数据工程与知识服务重点实验室江苏省人民医院数据应用管理中心

出处《情报理论与实践》 CSSCI 北大核心 2024年第9期174-182,共9页 Information Studies:Theory & Application

基金国家社会科学基金项目“面向多模态医疗健康数据的知识组织模式研究”的成果,项目编号:22BTQ096。

关键词多模态实体识别多模态学习多模态融合残差网络双线性注意力机制 multimodal named entity recognition multimodal learning multimodal fusion residual network bilinear attention mechanism

分类号 TP391.1 [自动化与计算机技术—计算机应用技术] R319 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献13

1段宇锋,贺国秀.面向中文医学文本命名实体识别的神经网络模块分解分析[J].数据分析与知识发现,2023,7(2):26-37. 被引量：3
2杨善林,丁帅,顾东晓,李霄剑,刘业政.医疗健康大数据驱动的知识发现与知识服务方法[J].管理世界,2022,38(1):219-228. 被引量：45
3赵旸,张智雄,刘欢,丁良萍.基于BERT模型的中文医学文献分类研究[J].数据分析与知识发现,2020,4(8):41-49. 被引量：29
4琚沅红,牟冬梅,王书童,李桦,徐静雯,吕淑贞.少样本高质量医学知识的命名实体识别研究——以肺癌诊疗规范为例[J].现代情报,2023,43(2):9-19. 被引量：6
5刘浏,王东波.命名实体识别研究综述[J].情报学报,2018,37(3):329-340. 被引量：151
6范涛,王昊,陈玥彤.基于深度迁移学习的地方志多模态命名实体识别研究[J].情报学报,2022,41(4):412-423. 被引量：12
7张鑫,袁景凌,李琳,刘佳.基于去偏对比学习的多模态命名实体识别[J].中文信息学报,2023,37(11):49-59. 被引量：1
8吴友政,李浩然,姚霆,何晓冬.多模态信息处理前沿综述:应用、融合和预训练[J].中文信息学报,2022,36(5):1-20. 被引量：19
9余辉,梁镇涛,鄢宇晨.多来源多模态数据融合与集成研究进展[J].情报理论与实践,2020,43(11):169-178. 被引量：44
10马超,李纲,陈思菁,毛进,张霁.基于多模态数据语义融合的旅游在线评论有用性识别研究[J].情报学报,2020,39(2):199-207. 被引量：36

二级参考文献131

1李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：21
2黄春林,李新.陆面数据同化系统的研究综述[J].遥感技术与应用,2004,19(5):424-430. 被引量：45
3JohnHalamka.电子病历与临床信息技术革命美国的现状及深远影响[J].中华医学杂志,2005,85(22):1513-1515. 被引量：37
4张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：67
5孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：87
6徐晓滨,陈丽,文成林.一种基于多源异类信息统一表示的多传感器数据融合算法[J].河南大学学报（自然科学版）,2005,35(3):67-71. 被引量：5
7向晓雯,史晓东,曾华琳.一个统计与规则相结合的中文命名实体识别系统[J].计算机应用,2005,25(10):2404-2406. 被引量：37
8刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
9俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：160
10周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112

共引文献377

1李紫琳,张媛,武睿婕,张同超,陈佳齐,王泽,吕明.数据融合技术及其在疾病“防诊治康”领域中的应用[J].中国公共卫生,2024,40(1):91-97.
2陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：3
3曹树金,曹茹烨,李睿婧.数智时代的知识组织研究进展[J].情报学进展,2024(1):318-347.
4化柏林,陈丹蕾,汪大锟.数据中台在科技情报中的应用[J].情报学进展,2022(1):265-314.
5黄水清,刘浏,王东波.国内外数字人文研究进展[J].情报学进展,2022(1):50-84. 被引量：11
6张景素,魏明珠.基于加权多策略选样的古文断句模型研究——以古籍《宋史》为例[J].情报科学,2022,40(10):164-170.
7刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
8李斌,袁义国,芦靖雅,冯敏萱,许超,曲维光,王东波.第一届古代汉语分词和词性标注国际评测[J].中文信息学报,2023,37(3):46-53. 被引量：5
9张坤丽,赵旭,关同峰,尚柏羽,李羽蒙,昝红英.面向医疗文本的实体及关系标注平台的构建及应用[J].中文信息学报,2020,34(6):36-44. 被引量：14
10孙茜,冯霞,隆云滔,徐宗本.数字技术赋能我国医疗治理现代化建设研究[J].中国科学院院刊,2022,37(12):1705-1715. 被引量：17

1孟伟伦,郭景峰,邢珂萱,魏宁,王巧梭,刘滨.基于字形特征的中文医学命名实体识别方法[J].电子学报,2024,52(6):1945-1954.
2朱柏霖,桂韬,张奇.基于模态相似性路径的统一多模态实体对齐[J].中文信息学报,2024,38(6):34-44.
3李丽双,王泽昊,秦雪洋,袁光辉.基于平行交互注意力网络的中文电子病历实体及关系联合抽取[J].中文信息学报,2024,38(6):108-118. 被引量：1
4张力,陈康,孙光辉.实值无标签图文跨模态检索研究综述[J].哈尔滨工业大学学报,2024,56(9):1-16.
5王琳辉.DOAJ数据库收录中文医学期刊现状及期刊网站建设分析[J].学报编辑论丛,2022(1):516-521.
6张仲维,陈涛,贾旭东,黄智胜.一种大规模推理用文本知识数据集的构建方法[J].五邑大学学报（自然科学版）,2024,38(3):38-47.
7刘兵,李穗,刘明明,刘浩.基于条件变分推断与内省对抗学习的多样化图像描述生成[J].电子学报,2024,52(7):2219-2227.
8陈业,赵生辉.融合HBIM和人文知识的古建筑知识本体构建[J].图书馆论坛,2024,44(9):90-102. 被引量：1
9吉雯璇,曹航.人工智能视域下非遗档案资源开发利用研究[J].档案,2024(7):18-23.
10王炜,赵帅.数智赋能下的学习分析:国际焦点与前瞻[J].数字教育,2024,10(4):85-92.

情报理论与实践

2024年第9期

浏览历史

内容加载中请稍等...

融合多模态数据的中文医学实体识别研究

参考文献13

二级参考文献131

共引文献377

相关作者

相关机构

相关主题

浏览历史