医学影像诊断报告的结构化研究被引量：3

Analyzing Structures of Medical Imaging Diagnosis Reports

导出

摘要【目的】研究医学影像诊断报告的结构化方法,实现从医学影像诊断报告中准确高效地提取信息。【方法】分析医学影像诊断报告的文本特征,提出基于实体识别和规则抽取相结合的结构化方法,标注800份医学影像诊断报告构建数据集实验评估。【结果】所提方法对医学影像诊断报告各类实体的识别精确率均达到了0.87,相较于BERT-BiLSTM-CRF在识别精确率上提升了4.03个百分点,召回率提升了2.81个百分点。该医学影像诊断报告结构化方法比基于依存分析的结构化方法对检查项和检查结果的识别精确率分别提升5.62个百分点和2.31个百分点。【局限】研究基于某医院PET-CT影像诊断报告,数据来源单一。【结论】实现医学影像诊断报告从自由文本到结构化数据的转换,不仅优化医学影像诊断报告的分类、检索与存储,还为医学影像领域后续研究提供数据支持。 [Objective]This paper tries to turn medical imaging diagnosis reports into structured data,aiming to effectively extract information from these free-text-reports.[Methods]First,we analyzed the text characteristics of medical imaging diagnosis reports,and proposed a structuring method based on entity recognition and rule extraction.Then,we annotated 800 reports to construct datasets for model evaluation.[Results]The proposed method had a precision rate of 0.87 for all entities from the medical imaging diagnostic reports,which was 4.03% higher than that of the BERT-BiLSTM-CRF.Its recall rate was also 2.81% higher than that of the BERT-BiLSTMCRF.Compared with the method of dependency analysis,the proposed model improved the recognition precision of medical exam items and results by 5.62% and 2.31%.[Limitations]We only examined the proposed method with diagnostic PET-CT imaging reports from one hospital.[Conclusions]This study successfully converts the free texts of medical imaging diagnostic reports to structured data.It not only optimizes the classification,storage,and retrieval of medical reports,but also provides supports for future research on medical imaging.

作者盛羽胡慧荣王聪聪杨晟艺 Sheng Yu;Hu Huirong;Wang Congcong;Yang Shengyi(School of Computer Science and Engineering,Central South University,Changsha 410083,China)

机构地区中南大学计算机学院

出处《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第10期46-56,共11页 Data Analysis and Knowledge Discovery

基金国家自然科学基金面上项目(项目编号:61877059)的研究成果之一。

关键词医学影像诊断报告实体识别规则抽取结构化 Medical Imaging Diagnosis Report Entity Recognition Rule Extraction Structure

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1王平,陈亮,胡磊.人工智能+结构化报告赋能冠脉CT血管成像临床一体化[J].中国数字医学,2021,16(11):50-54. 被引量：7
2史颖欢,王乾.The Artificial Intelligence-Enabled Medical Imaging:Today and Its Future[J].Chinese Medical Sciences Journal,2019,34(2):71-75. 被引量：6
3肖强,吴伟斌,陈联忠,蒲卫,王伟中,李小华,黄家驹.自由结构录入法在电子病历系统中的应用[J].解放军医院管理杂志,2005,12(3):222-222. 被引量：10
4叶枫,陈莺莺,周根贵,李昊旻,李莹.电子病历中命名实体的智能识别[J].中国生物医学工程学报,2011,30(2):256-262. 被引量：47
5张芳丛,秦秋莉,姜勇,庄润涛.基于RoBERTa-WWM-BiLSTM-CRF的中文电子病历命名实体识别研究[J].数据分析与知识发现,2022,6(2):251-262. 被引量：28
6张芳丛,秦秋莉,姜勇,庄润涛.基于RoBERTa-wwm动态融合模型的中文电子病历命名实体识别[J].数据分析与知识发现,2022,6(2):242-250. 被引量：25
7金征宇,龚启勇主编..医学影像学[M].北京:人民卫生出版社,2015:628.
8曹依依,周应华,申发海,李智星.基于CNN-CRF的中文电子病历命名实体识别研究[J].重庆邮电大学学报（自然科学版）,2019,31(6):869-875. 被引量：26
9田驰远,陈德华,王梅,乐嘉锦.基于依存句法分析的病理报告结构化处理方法[J].计算机研究与发展,2016,53(12):2669-2680. 被引量：10

二级参考文献48

1文勖,张宇,刘挺,马金山.基于句法结构分析的中文问题分类[J].中文信息学报,2006,20(2):33-39. 被引量：82
2俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：160
3Doan A,Naughton JF,Ramakrishnan R,et al.Information extraction challenges in managing unstructured data[J].ACM SIGMOD Record,2008,37(4):14-20. 被引量：1
4Vlachos A,Gasperin C.Bootstrapping and evaluating named entity recognition in the biomedical domain[C]//Proceedings of the HLT-NAACL BioNLP Workshop on Linking Natural Language and Biology.New York:Association for Computational Linguistics Morristown,2006:138-145. 被引量：1
5Bundschus M,Dejori M,Stetter M,et al.Extraction of semantic biomedical relations from text using conditional random fields[J].BMC Bioinformatics,2008,9:207. 被引量：1
6Leaman R,Gonzalez GR.BANNER:An executable survey of advances in biomedical named entity recognition[C]//Proceedings of Pacific Symposium on Biocomputing.Hawaii:World Scientific Publishing Co.Pte.Ltd,2008:652-663. 被引量：1
7Leaman R,Miller C,Gonzalez G.Enabling recognition of diseases in biomedical text with machine learning:Corpus and benchmark[C]//Proceedingsof the 3rdInternational Symposium on Lagauges in Biology and Medicine.Seogwipo-si.LBM,2009:82-89. 被引量：1
8Tsai Tzong-ham,Chou Wen-Chi,Wu Shih-Hung,et al.Integrating Linguistic Knowledge into a Conditional Random Field Framework to Identify Biomedical Named Entities[J].Expert Systems with Applications,2006,30(1):117-128. 被引量：1
9Sun ChengJie,Guan Yi,Wang XiaoLong,et al.Biomedical named entities recognition using conditional random fields model[J].Lecture notes in computer science,2006,4223:1279-1288. 被引量：1
10Salem ABM.Case based reasoning technology for medical diagnosis[J].World Academy of Science,Engineering and Technology,2007,25:9-13. 被引量：1

共引文献144

1姜会珍,胡海洋,马琏,赵从朴,张锋,陈婕卿,曾可,王晓露,朱卫国.基于医患对话的病历自动生成技术研究[J].中国数字医学,2021,16(10):36-40. 被引量：3
2刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
3姚元杰,龚毅光,刘佳,陈嫚丽.基于多粒度信息融合的气象知识命名实体识别[J].计算机与数字工程,2023,51(1):186-193.
4刘龙航,赵铁军.融合知识的中文医疗实体识别模型[J].智能计算机与应用,2021,11(3):94-97.
5吕玉波,梁志伟,杨志敏,李小华,陈倩,林英姿,欧爱华,程翼宇,刘保延.从临床诊疗术语发现诊疗规律的方法学研究[J].广州中医药大学学报,2006,23(2):179-182. 被引量：5
6梁志伟,刘保延,吕玉波,何丽芸,文天才,胡镜清,谢雁鸣,李平,程翼宇.中西医结合治疗SARS多中心临床研究数据管理分析系统[J].中国生物医学工程学报,2006,25(6):683-687. 被引量：3
7于一,廖睿,叶大田.电子病历结构化方法概述[J].北京生物医学工程,2007,26(1):103-106. 被引量：16
8罗俊,肖鹏,庞延辉.XML技术在武汉市公共卫生信息网络系统中的应用[J].公共卫生与预防医学,2007,18(6):99-100.
9李俊杰.基于最大熵原理的医疗文本信息结构化[J].临床医学工程,2010,17(10):119-121. 被引量：2
10杨海军.基于XMLSchema的Office Word电子病历模板的设计实现[J].吉林建筑工程学院学报,2010,27(5):61-64. 被引量：4

同被引文献104

1何展翔,胡祖志,王志刚,赵云生,沈义斌,刘雪军.时频电磁(TFEM)技术:数据联合约束反演[J].石油地球物理勘探,2020(4):898-905. 被引量：25
2高凌宇,王效俐.基于患者选择行为的医疗服务供应链定价与协调机制研究[J].管理学报,2020(3):422-430. 被引量：11
3骆小满,阮江军,邓永清,段辞涵,龚若涵,刘相群.基于多物理场计算和模糊神经网络算法的变压器热点温度反演[J].高电压技术,2020,46(3):860-866. 被引量：42
4汲胜昌,张凡,师愉航,占草,朱叶叶,陆伟峰.基于振动信号的电力变压器机械状态诊断方法研究综述[J].高电压技术,2020,46(1):257-272. 被引量：79
5朱晓峰.论政府信息资源生命周期管理[J].中国图书馆学报,2006,32(3):69-72. 被引量：21
6宋恩梅.情报空间构建：情报学的新透视[J].图书情报工作,2008,52(7):63-66. 被引量：4
7万里鹏.信息生命周期研究范式及理论缺失[J].中国图书馆学报,2009,35(5):36-41. 被引量：26
8刘杰,张永志,张秀霞,王宏宇.基于GPS数据的粒子群算法反演断层三维滑动速率[J].大地测量与地球动力学,2010,30(2):40-42. 被引量：8
9冯立新,李媛.确定热流的非标准逆热传导问题的小波正则化方法[J].数学物理学报（A辑）,2012,32(4):709-719. 被引量：1
10毛刚,李贺,靖继鹏.图书馆用户需求生态服务系统初探[J].情报理论与实践,2013,36(9):53-58. 被引量：13

引证文献3

1刘亚东,严英杰,严波,陈思,姜骞,刘庆臻,江秀臣.电力装备内部状态反演重构研究框架与应用展望[J].高电压技术,2022,48(8):2883-2896. 被引量：7
2段宇锋,贺国秀.面向中文医学文本命名实体识别的神经网络模块分解分析[J].数据分析与知识发现,2023,7(2):26-37. 被引量：3
3张传洋,郭宇,庞宇飞,于文倩.数智化医疗信息利用与服务模式框架构建[J].图书情报工作,2023,67(13):49-58. 被引量：7

二级引证文献17

1阳瑞霖,莫凡,金艳,罗周维,喻勇丽,何葵东.基于重心平均动态时间规整算法的有载分接开关机械故障诊断[J].高电压技术,2023,49(4):1515-1525. 被引量：4
2盛戈皞,钱勇,罗林根,宋辉,刘亚东,江秀臣.面向新型电力系统的数字化电力设备关键技术及其发展趋势[J].高电压技术,2023,49(5):1765-1778. 被引量：45
3李旭斌,田付强,郭亦可.新型电力系统中电力设备健康管理与智能运维关键技术探究[J].电网技术,2023,47(9):3710-3726. 被引量：22
4王波,张迎晨,齐冬莲,马富齐,董旭柱.数字化安全管控视角下的全息影像:定义、基本框架及关键技术[J].高电压技术,2023,49(8):3335-3345. 被引量：3
5刘陶,李锦,邱望仁.基于标题相似度聚类新中国陶瓷知识[J].景德镇陶瓷,2024,52(1):9-12.
6姜骞,刘亚东,严英杰,刘庆臻,陈思,江秀臣.面向高变倍场景的变电站巡检机器人云台相机对准方法[J].中国电机工程学报,2024,44(8):3337-3346.
7孙雪松,顾家荣,吴明慧,徐丽婷.物联网+SPD在医院体外诊断试剂管理中的应用研究[J].中国数字医学,2024,19(3):58-63.
8成全,张双宝.基于深度学习的特征增强式安全事故文本实体识别模型研究[J].中国安全生产科学技术,2024,20(6):58-66.
9程瑞动,朱鑫玲,叶祥明.数智化技术在脊髓损伤康复中的应用[J].华西医学,2024,39(6):851-855.
10戴艳清,刘思毓.数智驱动框架下的非遗档案资源展播服务研究——以《清明上河图3.0》为例[J].档案与建设,2024(7):64-71. 被引量：1

1杨正汉,聂芳,杨吉刚,阮恒超,黎尚荣,黄晓明.《住院医师规范化培训影像诊断报告书写指导教学指南(2022年版)》解读[J].中国毕业后医学教育,2022,6(5):430-434. 被引量：7
2倪牟双.教育质量评价领域培训课程结构化研究[J].吉林省教育学院学报,2022,38(10):11-14.
3朱湘文,朱姬莹,韩志江.SPARK学习平台在培养非影像专业住院医师影像结果判读能力中的价值[J].全科医学临床与教育,2022,20(11):1013-1016. 被引量：3
4张友,黄钢,魏伟军,刘建军.纳米抗体分子影像探针的研究进展[J].国际放射医学核医学杂志,2022,46(9):555-560.
5武鑫玥,李红颖,谢雨宸,彭芳,丁银,张静,范刚.藏药水柏枝的质量标准提高研究[J].成都中医药大学学报,2022,45(4):71-75. 被引量：1
6雷婷,谢红宁.人工智能在产前超声领域的应用进展[J].广东医学,2022,43(9):1102-1105. 被引量：6
7豆娟,傅春瑜,顾翔,朱纯良,胡国勇.基于智慧医院的医技检查预约排程智能系统的实践[J].中国医疗设备,2022,37(12):114-118. 被引量：4

数据分析与知识发现

2022年第10期

浏览历史

内容加载中请稍等...

医学影像诊断报告的结构化研究被引量：3

参考文献9

二级参考文献48

共引文献144

同被引文献104

引证文献3

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

医学影像诊断报告的结构化研究 被引量：3

参考文献9

二级参考文献48

共引文献144

同被引文献104

引证文献3

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

医学影像诊断报告的结构化研究被引量：3