-
题名基于协同集成学习的医疗实体标准化方法
被引量:2
- 1
-
-
作者
姜京池
侯俊屹
李雪
关毅
关昌赫
-
机构
哈尔滨工业大学物联网与泛在智能中心
哈尔滨工业大学语言技术研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2023年第3期135-142,共8页
-
基金
国家青年自然基金(NSFC62006063)
黑龙江省博士后面上自然基金(LBH-Z20015)
-
文摘
医疗实体标准化旨在将电子病历、患者主诉等文本数据中非标准化术语映射为统一且规范的医疗实体。针对医学文本普遍存在的标注语料规模小、规范化程度低等领域特点,该文提出了一种基于多模型协同的集成学习框架,用以解决医疗实体标准化问题。该框架通过建立多模型之间的“合作与竞争”模式,能够兼具字符级、语义级等不同标准化方法的优势。具体而言,运用知识蒸馏技术进行协同学习,从各模型中汲取有效特征;利用竞争意识综合各模型的实体标准化结果,保证候选集的多样性。在CHIP-CDN 2021医疗实体标准化评测任务中,该文提出的方法在盲测数据集上达到了73.985%的F_(1)值,在包括百度BDKG、蚂蚁金融Antins、思必驰AIspeech在内的255支队伍中,取得了第二名的成绩。后续实验结果进一步表明,该方法可有效对医疗文本中的术语进行标准化处理。
-
关键词
医疗实体标准化
知识蒸馏
集成学习
CHIP-CDN
2021
-
Keywords
medical entity standardization
knowledge distillation
ensemble learning
CHIP-CDN 2021
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-