期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于多来源文本的中文医学知识图谱的构建 被引量:19
1
作者 昝红英 窦华溢 +4 位作者 贾玉祥 奥德玛 张坤丽 穗志方 《郑州大学学报(理学版)》 CAS 北大核心 2020年第2期45-51,共7页
中文医学知识图谱(Chinese medical knowledge graph,CMeKG)是对专业医学知识的结构化描述,构建中文医学知识图谱是各类智慧医疗应用的迫切需要。通过收集多来源医疗文本,详细分析语料的结构特征,结合医学知识的语义特点,制定了医学命... 中文医学知识图谱(Chinese medical knowledge graph,CMeKG)是对专业医学知识的结构化描述,构建中文医学知识图谱是各类智慧医疗应用的迫切需要。通过收集多来源医疗文本,详细分析语料的结构特征,结合医学知识的语义特点,制定了医学命名实体和实体关系的标注体系和规范;并开发了标注工具,在医学专家的指导下,选取106种高发疾病进行人工标注,命名实体一致率达到了87.3%,实体关系一致率达到了82.9%。在人工标注的基础上,进行实体及关系自动抽取,构建出的中文医学知识图谱CMeKG1.0版共包括6310种疾病、19853种药物(西药、中成药、中草药)、1237种诊疗技术及设备,关联到的医学实体达20余万,概念关系实例及属性三元组达100余万。所构建的中文医学知识图谱为医疗问答系统和智能辅助诊疗等领域奠定了专业知识基础。 展开更多
关键词 医学知识图谱 命名实体 实体关系 标注规范 知识图谱构建
下载PDF
面向医学文本的实体关系抽取研究综述 被引量:14
2
作者 昝红英 +2 位作者 张坤丽 奥德玛 穗志方 《郑州大学学报(理学版)》 CAS 北大核心 2020年第4期1-15,共15页
实体抽取和关系抽取作为信息抽取的重要子任务,近些年众多学者利用多种技术在该领域开展了深入研究。将这些技术应用于医学领域,抽取非结构化和半结构化的医学文本构建医学知识图谱,可服务于下游子任务。从医学领域实体关系抽取的相关... 实体抽取和关系抽取作为信息抽取的重要子任务,近些年众多学者利用多种技术在该领域开展了深入研究。将这些技术应用于医学领域,抽取非结构化和半结构化的医学文本构建医学知识图谱,可服务于下游子任务。从医学领域实体关系抽取的相关概念出发,从不同角度对深度学习模型进行分类;进而依据数据集的构建方式,对监督学习和远程监督的多实例学习模型进行分析和讨论;最后展望了面向医学文本的实体关系抽取的未来研究方向。 展开更多
关键词 实体关系抽取 医学领域 监督学习 多实例学习
下载PDF
面向医疗文本的实体及关系标注平台的构建及应用 被引量:14
3
作者 张坤丽 赵旭 +3 位作者 尚柏羽 李羽蒙 昝红英 《中文信息学报》 CSCD 北大核心 2020年第6期36-44,共9页
医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标... 医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标注方法费力费时,已难以适应大数据发展的需求。该文以构建中文医学知识图谱的任务为驱动,构建了半自动化实体及关系标注平台。该平台融合多种算法,能够实现文本预标注、进度控制、质量把控和数据分析等多种功能。利用该平台,进行了医学知识图谱中实体和关系标注,结果表明该平台能够在文本资源建设中控制标注过程,保证标注质量,提高标注效率。同时该平台也被应用于其他文本标注任务,表明该平台具有较好的任务移植性。 展开更多
关键词 文本标注 标注平台 实体标注 关系标注 数据分析
下载PDF
CHIP 2020评测任务2概述:中文医学文本实体关系抽取 被引量:5
4
作者 甘子发 昝红英 +5 位作者 李雯昕 张欢 朱田恬 穗志方 陈清财 《中文信息学报》 CSCD 北大核心 2022年第6期101-108,共8页
第六届中国健康信息处理会议(China conference on Health Information Processing,CHIP 2020)组织了中文医疗信息处理方面的6个评测任务,其中任务2为中文医学文本实体关系抽取任务,该任务的主要目标为自动抽取中文医学文本中的实体关... 第六届中国健康信息处理会议(China conference on Health Information Processing,CHIP 2020)组织了中文医疗信息处理方面的6个评测任务,其中任务2为中文医学文本实体关系抽取任务,该任务的主要目标为自动抽取中文医学文本中的实体关系三元组。共有174支队伍参加了评测任务,最终17支队伍提交了42组结果,该任务以微平均F_(1)值为最终评估标准,提交结果中F_(1)最高值达0.6486。 展开更多
关键词 实体关系抽取 中文医学文本处理 信息抽取
下载PDF
CHIP2020评测任务1概述:中文医学文本命名实体识别 被引量:3
5
作者 李雯昕 张坤丽 +4 位作者 张欢 朱田恬 常宝宝 陈清财 《中文信息学报》 CSCD 北大核心 2022年第4期66-72,共7页
第六届中国健康信息处理会议(China Conference on Health Information Processing,CHIP2020)组织了中文医疗信息处理方面的6个评测任务,其中任务1为中文医学文本命名实体识别任务,该任务的主要目标是自动识别医学文本中的医学命名实体... 第六届中国健康信息处理会议(China Conference on Health Information Processing,CHIP2020)组织了中文医疗信息处理方面的6个评测任务,其中任务1为中文医学文本命名实体识别任务,该任务的主要目标是自动识别医学文本中的医学命名实体。共有253支队伍报名参加评测,最终37支队伍提交了80组结果,该评测以微平均F_(1)值作为最终评估标准,提交结果中最高值达68.35%。 展开更多
关键词 命名实体识别 医学文本 自然语言处理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部