期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
中文病历文档术语提取和否定检出方法 被引量:9
1
作者 李昊旻 李莹 +1 位作者 段会龙 吕旭东 《中国生物医学工程学报》 CAS CSCD 北大核心 2008年第5期716-721,734,共7页
利用生物医学术语系统中的词汇和概念,为存有大量珍贵信息的非结构化临床文档建立有效的索引,以便进行信息挖掘和利用,国际上相关研究已经开展多年,而基于中文病历文档概念索引的研究尚属空白。本研究将现有的中文版的国际疾病分类(ICD... 利用生物医学术语系统中的词汇和概念,为存有大量珍贵信息的非结构化临床文档建立有效的索引,以便进行信息挖掘和利用,国际上相关研究已经开展多年,而基于中文病历文档概念索引的研究尚属空白。本研究将现有的中文版的国际疾病分类(ICD)集成到统一医学语言系统(UMLS)中,依据中文语言处理的特殊性,对中文电子病历文档进行统计分析,提出了一套中文病历文档术语提取和否定检出的方法,可用于建立中文病历文档的概念索引。术语提取阶段利用高灵敏的最大匹配法并结合通用分词技术来控制假阳性;而在概念否定意义检出部分,充分利用中文特点并基于现有中文处理技术提出了一种简化的子句模式匹配方法。选取了两组医疗文本数据集对算法进行了验证,术语提取算法的灵敏性分别为99.51%和100%,误检率分别为1.46%和1.66%。否定检出算法的阳性预测值均为100%,阴性预测值分别为100%和98.99%,除标点使用不规范等文书质量问题外,基本可以正确检出。 展开更多
关键词 医学语言处理 术语提取 否定检出
下载PDF
基于规则和词共现的中文电子病历否定检出
2
作者 张远鹏 王理 董建成 《计算机应用与软件》 CSCD 2015年第3期50-52,共3页
对于中文电子病历文本中的否定术语的检出,目前有很多方法,基于规则的否定检出是比较常用的一种算法。但是该方法无法解决由于标点录入错误造成假阳性的问题。因此,在基于规则算法的基础上,提出一种基于词共现的否定检出算法,通过收集20... 对于中文电子病历文本中的否定术语的检出,目前有很多方法,基于规则的否定检出是比较常用的一种算法。但是该方法无法解决由于标点录入错误造成假阳性的问题。因此,在基于规则算法的基础上,提出一种基于词共现的否定检出算法,通过收集200份中文电子病历约150 865个汉字字符进行实验,新方法的阴性预测值比基于规则的算法提高了7.85%。所以,基于规则和词共现的否定检出算法能够很好地降低由于标点录入错误而出现假阳性术语的概率。 展开更多
关键词 词共现 正向最大匹配 互信息 否定检出
下载PDF
中文电子病历中否定术语检出方法研究
3
作者 张远鹏 董建成 +3 位作者 钱旦敏 蒋葵 陈亚兰 王理 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2015年第1期82-85,共4页
对中文电子病历中的否定术语进行检测,可以为非结构化的电子病历文本的概念索引的建立提供依据。对于电子病历中术语的提取,在经典的正向最大匹配算法的基础上,结合互信息,可以有效地避免覆盖性歧义对提取结果的影响;对于否定语义的确定... 对中文电子病历中的否定术语进行检测,可以为非结构化的电子病历文本的概念索引的建立提供依据。对于电子病历中术语的提取,在经典的正向最大匹配算法的基础上,结合互信息,可以有效地避免覆盖性歧义对提取结果的影响;对于否定语义的确定,在基于规则算法的基础上,结合词共现率模型,有效地降低了由于标点录入错误而出现假阳性术语的概率。通过实验表明,本文提出的方法相对于传统的基于规则的算法,阴性结果的预测值提高了6.85%。 展开更多
关键词 词共现 正向最大匹配 互信息 否定术语检出
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部