基于神经网络的医疗文本分类研究被引量：6

Medical text classification based on neural network

下载PDF

导出

摘要传统的医学文本数据分类方法忽略了文本的上下文关系,每个词之间相互独立,无法表示语义信息,文本描述和分类效果差;并且特征工程需要人工干预,因此泛化能力不强。针对医疗文本数据分类效率低和精度低的问题,提出了一种基于Transformer双向编码器表示BERT、卷积神经网络CNN和双向长短期记忆BiLSTM神经网络的医学文本分类模型CMNN。该模型使用BERT训练词向量,结合CNN和BiLSTM,捕捉局部潜在特征和上下文信息。最后,将CMNN模型与传统的深度学习模型TextCNN和TextRNN在准确率、精确率、召回率和F1值方面进行了比较。实验结果表明,CMNN模型在所有评价指标上整体优于其他模型,准确率提高了1.69%~5.91%。 The traditional medical text data classification methods ignore the context of the text.Each word is independent of each other and cannot represent semantic information.The text description and classification effect are poor,and feature engineering requires manual intervention,so the generalization ability is not strong.Aiming at the problems of low efficiency and low accuracy of medical text data classification,this paper proposes a medical text classification model CMNN based on bidirectional encoder representations from Transformer(BERT),convolutional neural network(CNN)and Bi-directional long and short-term memory(BiLSTM)neural network.The model uses BERT to train word vectors and combines CNN and BiLSTM to capture local latent features and contextual information.Finally,the proposed model is compared with the traditional deep learning models TextCNN and TextRNN in terms of accuracy,precision,recall and F1 score.The experimental results show that the CMNN model outperforms other models on all evaluation metrics,and the accuracy is improved by 1.69%~5.91%.

作者许浪李代伟张海清唐聃何磊于曦 XU Lang;LI Dai-wei;ZHANG Hai-qing;TANG Dan;HE Lei;YU Xi(School of Software Engineering,Chengdu University of Information Technology,Chengdu 610225;Sichuan Province Engineering Technology Research Center of Support Software of Informatization Application,Chengdu 610225;Stirling College,Chengdu University,Chengdu 610106,China)

机构地区成都信息工程大学软件工程学院四川省信息化应用支撑软件工程技术研究中心成都大学斯特灵学院

出处《计算机工程与科学》 CSCD 北大核心 2023年第6期1116-1122,共7页 Computer Engineering & Science

基金欧盟项目(598649-EPP-1-2018-1-FR-EPPKA2-CBHE-JP) 国家自然科学基金(61602604) 四川省科技厅项目(2021YFH0107,2022YFS0544,2022NSFSC0571)。

关键词自然语言处理医疗文本分类 BERT CNN BiLSTM natural language processing medical text classification BERT CNN BiLSTM

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1Y.M.Ding,J.H.Sohn,M.G.Kawczynski,H.Trivedi,R.Harnish,N.W.Jenkins,朱利华(译),武文婧(校).利用大脑^(18)F-FDG PET的深度学习模型预测阿尔茨海默病的诊断[J].国际医学放射学杂志,2019,0(2):239-240. 被引量：11
2柏挺,朱海云,龚宏伟,程凌.机器学习在远程医疗中文分类中的应用[J].中国数字医学,2017,12(3):79-82. 被引量：2

共引文献11

1Renato Cuocolo,Teresa Perillo,Eliana De Rosa,Lorenzo Ugga,Mario Petretta.Current applications of big data and machine learning in cardiology[J].Journal of Geriatric Cardiology,2019,16(8):601-607.
2Kun Zhao,Yanhui Ding,Ying Han,Yong Fan,Aaron F.Alexander-Bloch,Tong Han,Dan Jin,Bing Liu,Jie Lu,Chengyuan Song,Pan Wang,Dawei Wang,Qing Wang,Kaibin Xu,Hongwei Yang,Hongxiang Yao,Yuanjie Zheng,Chunshui Yu,Bo Zhou,Xinqing Zhang,Yuying Zhou,Tianzi Jiang,Xi Zhang,Yong Liu.Independent and reproducible hippocampal radiomic biomarkers for multisite Alzheimer’s disease:diagnosis,longitudinal progress and biological basis[J].Science Bulletin,2020,65(13):1103-1113. 被引量：13
3赵晶石,马琳莹,司诺,Sarik Raj Panthee(综述),张同(审校).机器学习在前列腺癌 MRI中的应用[J].实用放射学杂志,2021,37(1):145-148. 被引量：1
4续宝红,丁冲(综述),徐桂芝(审校).卷积神经网络在阿尔茨海默病诊断中的应用研究[J].生物医学工程学杂志,2021,38(1):169-177. 被引量：5
5王炯亮,李文轩,陈敏山,周仲国.人工智能在肝细胞癌研究的应用现状与前景[J].中华医学杂志,2021,101(6):435-441. 被引量：8
6佟超,韩勇,冯巍,李伟铭,陶丽新,郭秀花.医学图像深度学习处理方法的研究进展[J].北京生物医学工程,2021,40(2):198-202. 被引量：3
7袁野,廖薇.基于双通道神经网络的疾病文本分类方法[J].中国医学物理学杂志,2021,38(5):655-660. 被引量：1
8贾毛妮,吴亚飞,方亚.基于机器学习方法的老年人认知障碍预测研究[J].中华老年医学杂志,2021,40(12):1493-1497. 被引量：1
9刁万里,张晓玲,马蔚蔚.人工智能在阿尔茨海默病影像诊断中的应用进展[J].浙江医学,2022,44(19):2120-2124.
10朱正群,巩萍,黄栎有,徐兰,章龙珍.联合CT影像组学与深度学习特征建立列线图预测食管鳞癌放疗近期疗效[J].放射学实践,2024,39(2):233-238.

同被引文献49

1徐安迎,胡孔法,杨涛.基于Neo4j的肺癌中医诊疗知识图谱构建研究[J].世界科学技术-中医药现代化,2023,25(4):1456-1461. 被引量：7
2陶全桧,安俊秀,陈宏松.基于跨模态融合ERNIE的多模态情感分析研究[J].成都信息工程大学学报,2022,37(5):501-507. 被引量：1
3林玫,梁大斌,董柏青,王鸣柳,廖和壮,周凌云,黄君,景怀琦.症候群监测系统构建及效果评价[J].中国公共卫生,2014,30(1):43-46. 被引量：7
4李博,高蕊,李睿,陆芳,訾明杰,李庆娜,唐旭东.药物临床试验不良反应/不良事件关联性判定方法研究探讨[J].中国新药杂志,2014,23(12):1465-1470. 被引量：160
5陈诗琪,郑蕊,李幼平,邝心颖,商洪才.不良反应因果关系判定方法对上市后中成药安全性评价的指导意义[J].世界科学技术-中医药现代化,2018,20(10):1729-1733. 被引量：16
6马金辉,王志飞,谢雁鸣,易丹辉.基于大型电子医疗数据的高血压中医证候分析[J].中国中医基础医学杂志,2014,20(9):1236-1238. 被引量：11
7马费成,周利琴.面向智慧健康的知识管理与服务[J].中国图书馆学报,2018,44(5):4-19. 被引量：64
8李岳峰,胡建平,张学高.中国健康医疗大数据资源目录体系与技术架构研究[J].中国卫生信息管理杂志,2019,16(3):249-256. 被引量：20
9董悦,王梦.基于情感分析与LDA模型的网络舆情案例研究[J].价值工程,2019,38(34):169-172. 被引量：6
10李家全,李宝安,游新冬,吕学强.基于专利知识图谱的专利术语相似度计算研究[J].数据分析与知识发现,2020,4(10):104-112. 被引量：5

引证文献6

1郑森,齐晓轩,柳亿霖.非平衡情感数据背景下基于边界度的过采样方法[J].价值工程,2023,42(31):129-131.
2袁辉,赵捷,侯博,李晟飞,韩雪.基于深度学习的法人和其他组织国民经济行业分类标准化流程研究[J].中国标准化,2024(5):61-65.
3贾晋生,刘红亮,王青,侯永芳,李馨龄.基于知识图谱联合ERNIE-DPCNN模型的药品不良反应自动关联性评价方法研究[J].中国药物警戒,2024,21(2):163-166.
4陈天怡.基于专利数据挖掘的我国智慧健康服务发展趋势研判[J].现代信息科技,2024,8(8):161-166.
5李宁.融合AI的中医药教育平台在康复治疗专业教学中的应用探索[J].教育教学研究前沿,2024,2(3):49-52.
6张忆汝,汤永,朱敏,谢杏,魏宏名,刘运喜,马慧.基于自然语言处理和深度学习的急性呼吸道传染病早期识别模型的构建[J].中华医院感染学杂志,2024,34(15):2394-2400.

1陈明,刘蓉,张晔.基于多重注意力机制的中文医疗实体识别[J].计算机工程,2023,49(6):314-320. 被引量：4

计算机工程与科学

2023年第6期

浏览历史

内容加载中请稍等...

基于神经网络的医疗文本分类研究被引量：6

参考文献2

共引文献11

同被引文献49

引证文献6

相关作者

相关机构

相关主题

浏览历史

基于神经网络的医疗文本分类研究 被引量：6

参考文献2

共引文献11

同被引文献49

引证文献6

相关作者

相关机构

相关主题

浏览历史

基于神经网络的医疗文本分类研究被引量：6