目的:通过比较基于不同模态数据训练得到的人工智能(artificial intelligence,AI)模型对甲状腺癌的诊断效能,求证超声多模态人工智能技术在甲状腺癌诊断中的应用价值。方法:回顾性收集2020年8月至2023年8月在超声科行甲状腺检查的病例,...目的:通过比较基于不同模态数据训练得到的人工智能(artificial intelligence,AI)模型对甲状腺癌的诊断效能,求证超声多模态人工智能技术在甲状腺癌诊断中的应用价值。方法:回顾性收集2020年8月至2023年8月在超声科行甲状腺检查的病例,所有甲状腺检查均含有二维灰阶图像、弹性成像图像及彩色Doppler图像,共486个结节。其中386个结节进行5倍扩增后按照10折算法随机分为训练集(1737个)和验证集(193个),其余100个结节不扩增(不参与模型训练)作为测试集。由一名具有十年甲状腺超声扫查及诊断经验的超声医师对所有训练集和验证集中的目标结节进行标注,用于AI模型训练,测试集无需标注。恶性结节均以病理结果为金标准,统计各AI模型验证以及测试的结果,绘制ROC曲线并计算曲线下面积(area under the curve,AUC),采用AUC来评估模型诊断效能,比较不同方法间的统计学差异,并将模型测试结果与低年资住院医师测试结果进行比较。AI模型构建完成后,得到两个AI模型,分别是US-AI模型、多模态-AI模型。结果:验证集与测试集中,多模态-AI模型诊断AUC大于US-AI模型,差异有统计学意义(P<0.05)。测试集中,多模态-AI模型诊断AUC大于低年资住院医师,差异有统计学意义(P<0.05)。测试集中,低年资住院医师诊断AUC大于US-AI模型,差异无统计学意义(P>0.05)。结论:甲状腺多模态人工智能技术提高了超声诊断甲状腺癌的能力,并优于低年资住院医师。展开更多
文摘目的:通过比较基于不同模态数据训练得到的人工智能(artificial intelligence,AI)模型对甲状腺癌的诊断效能,求证超声多模态人工智能技术在甲状腺癌诊断中的应用价值。方法:回顾性收集2020年8月至2023年8月在超声科行甲状腺检查的病例,所有甲状腺检查均含有二维灰阶图像、弹性成像图像及彩色Doppler图像,共486个结节。其中386个结节进行5倍扩增后按照10折算法随机分为训练集(1737个)和验证集(193个),其余100个结节不扩增(不参与模型训练)作为测试集。由一名具有十年甲状腺超声扫查及诊断经验的超声医师对所有训练集和验证集中的目标结节进行标注,用于AI模型训练,测试集无需标注。恶性结节均以病理结果为金标准,统计各AI模型验证以及测试的结果,绘制ROC曲线并计算曲线下面积(area under the curve,AUC),采用AUC来评估模型诊断效能,比较不同方法间的统计学差异,并将模型测试结果与低年资住院医师测试结果进行比较。AI模型构建完成后,得到两个AI模型,分别是US-AI模型、多模态-AI模型。结果:验证集与测试集中,多模态-AI模型诊断AUC大于US-AI模型,差异有统计学意义(P<0.05)。测试集中,多模态-AI模型诊断AUC大于低年资住院医师,差异有统计学意义(P<0.05)。测试集中,低年资住院医师诊断AUC大于US-AI模型,差异无统计学意义(P>0.05)。结论:甲状腺多模态人工智能技术提高了超声诊断甲状腺癌的能力,并优于低年资住院医师。