期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
中文生物医学文本无词典分词方法研究 被引量:4
1
作者 王军辉 胡铁军 +2 位作者 李丹亚 钱庆 方安 《情报学报》 CSSCI 北大核心 2011年第2期197-203,共7页
为了在不利用词典的条件下实现对中文生物医学文本的有效切分,结合中文生物医学文本专业术语多、新术语不断出现和结构式摘要的特点,引入一种基于重现原理的无词典分词方法,并在实际应用过程中从分词长度上限值的设定和层次特征项抽取... 为了在不利用词典的条件下实现对中文生物医学文本的有效切分,结合中文生物医学文本专业术语多、新术语不断出现和结构式摘要的特点,引入一种基于重现原理的无词典分词方法,并在实际应用过程中从分词长度上限值的设定和层次特征项抽取两方面对其进行了改进.实验结果表明,该方法可以在不需要词典和语料库学习的情况下,实现对生物医学文本中关键性专业术语的有效抽取,分词准确率约为84.51%.最后,基于本研究中的分词结果,对生物医学领域的词长分布进行了初步探讨,结果表明中文生物医学领域的词长分布与普通汉语文本有非常大的差异.研究结果对在处理中文生物医学文本时N-gram模型中N值的确定具有一定的参考价值. 展开更多
关键词 无词典分词 结构式摘要 生物医学文本
下载PDF
利用膜粒子群优化和信息熵的医学文本特征选择 被引量:4
2
作者 豆增发 高琳 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第4期45-51,共7页
针对生物医学文本挖掘中有效特征选择困难的问题,提出了一种新的基于膜粒子群优化和信息熵的文本特征选择方法.该方法以文本信息熵总和为目标函数,以膜系统的层次结构作为框架,以膜系统的消息传递机制作为进化方向,以粒子群优化进化作... 针对生物医学文本挖掘中有效特征选择困难的问题,提出了一种新的基于膜粒子群优化和信息熵的文本特征选择方法.该方法以文本信息熵总和为目标函数,以膜系统的层次结构作为框架,以膜系统的消息传递机制作为进化方向,以粒子群优化进化作为进化规则.作为进化规则的粒子群优化算法,分别以局部搜索速率和全局搜索速率搜索得到文本信息熵最大的解,并在不同膜区域之间传递搜索结果,直到膜区域之间的消息传递结束或者达到限定的迭代次数.实验结果表明,利用提出的方法对医学文本特征进行选择后,对其进行分类,能使分类精确度和召回率分别提高2%和3%左右. 展开更多
关键词 膜系统 粒子群优化 生物医学文本 特征选择 信息熵
下载PDF
基于注意力机制的生物医学文本分类模型 被引量:4
3
作者 李启行 廖薇 《中国医学物理学杂志》 CSCD 2022年第4期518-523,共6页
对生物医学文本进行准确分类,是促进医院信息化发展的一个重要途径。本研究提出一种基于注意力机制的双层次文本分类模型,用于对生物医学文本进行有效分类。该模型结合卷积神经网络与循环神经网络的优势,对用户输入的疾病文本进行特征... 对生物医学文本进行准确分类,是促进医院信息化发展的一个重要途径。本研究提出一种基于注意力机制的双层次文本分类模型,用于对生物医学文本进行有效分类。该模型结合卷积神经网络与循环神经网络的优势,对用户输入的疾病文本进行特征提取。首先,在第一层次通过Bi-GRU通道与Bi-LSTM通道提取文本中的上下文关联信息,同时,为增强模型的特征提取能力,在该层次引入注意力机制。其次,将两个通道提取到的时序特征进行特征拼接,并将拼接后的结果传入第二层次,从而进一步提取文本的局部特征,最后利用分类器输出最终的分类结果。对生物医学文本进行分类性能评估,结果表明,与基线模型相比,该模型的分类准确率可达91.45%,具有显著的分类性能。 展开更多
关键词 生物医学文本 注意力机制 卷积神经网络 循环神经网络 文本分类
下载PDF
利用膜粒子群优化的条件随机域特征选择 被引量:3
4
作者 豆增发 高琳 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2012年第5期107-112,共6页
提出了一种新的基于膜粒子群优化的特征选择方法.该方法利用了膜系统的分层结构和消息传递机制,将粒子群优化算法作为区域子算法部署到各个区域中.不同于传统粒子群优化算法,该方法将粒子群优化的搜索速率分解为局部搜索速率和全局搜索... 提出了一种新的基于膜粒子群优化的特征选择方法.该方法利用了膜系统的分层结构和消息传递机制,将粒子群优化算法作为区域子算法部署到各个区域中.不同于传统粒子群优化算法,该方法将粒子群优化的搜索速率分解为局部搜索速率和全局搜索速率.膜系统的所有外层区域采用局部搜索速率,搜索局部最优解;最内层区域采用全局搜索速率,搜索全局最优解.所有外部区域将最优解传递给相邻内部区域,内部区域将最差解传递给相邻外部区域,最内区域向相邻外部区域传递最差解.当各个区域之间的解传递在一段时间内停止时,或者算法迭代次数达到限定次数时,算法收敛,取最内层区域的最优解为最终解.以条件随机域模型的最大似然估计函数为目标函数,利用膜粒子群优化计算各个特征权重系数,最后剔除那些权重系数小于阈值的特征.实验结果表明,在进行生物文本的基因名称识别时,利用该方法对条件随机域的特征进行选择后,可以消除冗余特征的干扰,能获得更高的准确度。 展开更多
关键词 膜系统 粒子群优化 生物医学文本 特征选择 条件随机域
下载PDF
基于距离学习的生物医学文本聚类算法研究 被引量:1
5
作者 袁伟 朱山风 《计算机应用与软件》 CSCD 2010年第11期4-5,19,共3页
近年来,随着生物医学文献数量的大量增加,对生物医学文献进行搜索和挖掘,查找有用的信息成为了生物信息学的一个重要研究方向。聚类作为一种无监督的自动化程度很高的机器学习方法,在信息检索和生物信息学领域中获得了广泛的运用。针对... 近年来,随着生物医学文献数量的大量增加,对生物医学文献进行搜索和挖掘,查找有用的信息成为了生物信息学的一个重要研究方向。聚类作为一种无监督的自动化程度很高的机器学习方法,在信息检索和生物信息学领域中获得了广泛的运用。针对生物医学文本的特点提出了基于距离学习的聚类算法,实验结果证明了该方法的有效性。 展开更多
关键词 向量空间模型 文本聚类 生物医学文本
下载PDF
基于双代价参数SVM的生物医学文本指代消解研究
6
作者 张丽君 李丽双 范国龙 《大连理工大学学报》 EI CAS CSCD 北大核心 2015年第4期405-410,共6页
生物医学文本中的指代消解是生物医学信息抽取领域的一个重要组成部分.通过引入双代价参数对基本SVM方法进行改进,并在FlyBase语料集上进行了测试,准确率、召回率、F值分别达到53.9%、69.5%、60.7%.同时研究了特征向量的选择和取值对于... 生物医学文本中的指代消解是生物医学信息抽取领域的一个重要组成部分.通过引入双代价参数对基本SVM方法进行改进,并在FlyBase语料集上进行了测试,准确率、召回率、F值分别达到53.9%、69.5%、60.7%.同时研究了特征向量的选择和取值对于实验结果的影响.最后与其他先进方法进行了对比.结果表明,在同样的语料上,基于双代价参数SVM方法优于其他先进的方法. 展开更多
关键词 生物医学文本 指代消解 SVM 双代价参数
下载PDF
文本挖掘在生物医学领域中的应用及其系统工具 被引量:19
7
作者 吕婷 姜友好 《中华医学图书情报杂志》 CAS 2010年第4期56-64,共9页
系统介绍了生物医学文本挖掘的具体流程和文本挖掘技术在生物医学领域中的应用情况,并着重从自然语言处理和本体、命名实体识别、关系抽取、文本分类与聚类、共现分析、系统工具及评价、可视化等方面分别做了阐述。
关键词 生物医学文本挖掘 自然语言处理 命名实体识别 关系抽取 共现分析
下载PDF
面向生物医学实体链接的联合式学习方法 被引量:7
8
作者 胡宇 申德荣 +1 位作者 聂铁铮 寇月 《计算机学报》 EI CAS CSCD 北大核心 2022年第4期748-765,共18页
生物医学文本蕴含着丰富的探索价值,其为生物医学工作者进行研究提供了宝贵的领域知识.充分且高效地利用海量的生物医学文献,并从中发现重要的隐藏信息、获取专业领域知识,对生物医学研究具有重要的意义.生物医学实体链接是对生物医学... 生物医学文本蕴含着丰富的探索价值,其为生物医学工作者进行研究提供了宝贵的领域知识.充分且高效地利用海量的生物医学文献,并从中发现重要的隐藏信息、获取专业领域知识,对生物医学研究具有重要的意义.生物医学实体链接是对生物医学文本中的命名实体进行识别,并将表示该实体的某些字符串映射到生物医学领域知识库中对应概念.生物医学实体链接任务通常面临两个主要的挑战:(1)自然语言描述的歧义性.(2)自然语言文本与生物医学知识库的异构性.传统的方法基于特征选择或规则发现,依赖于手动选择特征或定义规则,处理分阶段模型中也可能出现误差传播.因此,本工作提出了一种深度学习和知识库相结合的实体链接方法,通过深度挖掘自然语言文本的隐藏特征,及其与知识库概念图间结构的相似性,将生物医学实体识别与实体-概念对齐两个任务进行联合式处理.该方法旨在通过标准的生物医学知识库,自动获取生物医学实体的语义信息,挖掘生物医学实体之间的语义关系.实验表明,该方法在实体识别与对齐方面取得了较好的效果,显著提高了任务的精确性,在实体链接核心任务上取得了超过10%的性能提升. 展开更多
关键词 实体识别 实体对齐 语义分析 生物医学文本挖掘 生物医学知识库
下载PDF
生物医学实体关系抽取的研究 被引量:5
9
作者 吴明智 崔雷 《中华医学图书情报杂志》 CAS 2010年第5期5-10,共6页
人类基因组计划使生物医学的研究取得了前所未有的成就,在研究结果中得到了大量的生物医学实体,如基因、蛋白质、器官、疾病和药物等,但这些生物实体之间存在什么样的关系仍不完全清楚。作为生物医学研究成果载体的文献呈指数增长,已成... 人类基因组计划使生物医学的研究取得了前所未有的成就,在研究结果中得到了大量的生物医学实体,如基因、蛋白质、器官、疾病和药物等,但这些生物实体之间存在什么样的关系仍不完全清楚。作为生物医学研究成果载体的文献呈指数增长,已成为科研人员获取知识的瓶颈。文本挖掘能够解决信息超载问题,故对生物医学实体关系的挖掘流程和评价指标进行介绍,对生物医学文本挖掘在研究生物实体关系抽取中采用的基于统计的方法、基于自然语言处理的方法和基于模式匹配的方法进行了阐述,对各种方法进行了综合比较,同时介绍了国内外相关研究。 展开更多
关键词 生物医学文本挖掘 生物医学实体 关系抽取
下载PDF
知识增强的生物医学文本生成式摘要研究 被引量:3
10
作者 邓露 胡珀 李炫宏 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第11期1-12,共12页
【目的】将生物医学文本映射到生物医学领域超级叙词表以获得文本中包含的生物医学术语及其对应概念,并将术语和概念作为背景知识融入文本摘要模型中,提高文本摘要模型在生物医学文本上的摘要生成质量。【方法】通过抽取式摘要技术获取... 【目的】将生物医学文本映射到生物医学领域超级叙词表以获得文本中包含的生物医学术语及其对应概念,并将术语和概念作为背景知识融入文本摘要模型中,提高文本摘要模型在生物医学文本上的摘要生成质量。【方法】通过抽取式摘要技术获取文本的重要内容,然后结合生物医学领域知识库将文本重要内容中包含的术语与其对应的知识库概念一并抽取出来,作为背景知识融入神经网络生成式摘要模型的注意力机制中,使模型在领域知识引导下既可聚焦文本内部的重要信息,又可抑制因外部信息引入而可能产生的噪音问题,显著改善摘要的生成质量。【结果】在三个生物医学领域数据集上的实验结果验证了本文方法的有效性,本文所提模型PG-meta在三个数据集上的ROUGE均值达到31.06,比原PG模型ROUGE均值高1.51。【局限】未探索不同的生物医学领域背景知识获取方式对于模型增强效果的影响。【结论】本文方法可帮助模型更好地学习生物医学文本深层含义,提高摘要生成质量。 展开更多
关键词 生物医学文本挖掘 生成式摘要 领域知识 知识增强
原文传递
基于生物医学文本挖掘工具的白血病和基因关系研究 被引量:2
11
作者 朱祥 张云秋 冯佳 《中华医学图书情报杂志》 CAS 2015年第10期28-32,共5页
利用COREMINE Medical寻找与白血病相关的基因,确定关系最为密切的5种基因,再通过生物医学文本挖掘工具Chilibot对从Pub Med中所获相关文献的摘要进行分析,通过对相互作用的深入分析,发现了白血病和基因的相互作用关系。
关键词 生物医学文本挖掘 白血病 基因 COREMINE MEDICAL Chilibot
下载PDF
子宫内膜癌相关基因的生物医学文本分析研究 被引量:2
12
作者 张凯 刘玲玲 薛凤霞 《中华医学图书情报杂志》 CAS 2019年第6期1-8,共8页
目的:寻找与子宫内膜癌发生、发展相关的关键基因。方法:从医学信息检索平台Coremine Medical中筛选出与子宫内膜癌关系最为密切的几种关键基因,再利用生物医学文本挖掘工具Chilibot对从Pub Med中获取的相关文献摘要进行分析,深入探究... 目的:寻找与子宫内膜癌发生、发展相关的关键基因。方法:从医学信息检索平台Coremine Medical中筛选出与子宫内膜癌关系最为密切的几种关键基因,再利用生物医学文本挖掘工具Chilibot对从Pub Med中获取的相关文献摘要进行分析,深入探究关键基因与子宫内膜癌之间的相互关系,并通过UALCAN在线工具分析关键基因的表达水平和甲基化水平。结果:确定了与子宫内膜癌关系最密切的5种关键基因。在子宫内膜癌组织中,MLH1基因的甲基化水平比正常子宫内膜组织的甲基化水平要高(P<0. 001),MLH1基因甲基化的发生导致了DNA错配修复基因的突变,从而促进了子宫内膜癌的发生。与正常子宫内膜组织相比,MSH2基因和PMS2基因在子宫内膜癌组织中表达量较高(P<0. 001),MSH6基因和抑癌基因PTEN在子宫内膜癌组织中的表达均比正常子宫内膜组织表达要低(P<0. 001)。错配修复基因MLH1、MSH2、MSH6以及PMS2的突变,促进了相应修复蛋白的缺失,进而导致了子宫内膜癌的发生、发展。结论:错配修复基因MLH1、MSH2、MSH6、PMS2以及抑癌基因PTEN是子宫内膜癌发生、发展的关键基因。 展开更多
关键词 生物医学文本挖掘 子宫内膜癌 关键基因 Coremine MEDICAL Chilibot
下载PDF
国外生物医学文本语料库分类及特点研究 被引量:2
13
作者 晏归来 安新颖 +1 位作者 范少萍 周永称 《医学信息学杂志》 CAS 2018年第10期74-80,共7页
通过梳理国外31个生物医学文本语料库标注内容,根据语料库标注实体类型,参照UMLS语义类型将其划分为6大类。总结语料库在语义类型、数据源等方面特点,阐述生物医学文本语料库构建流程及关键步骤,以期为我国生物医学文本语料库相关研究... 通过梳理国外31个生物医学文本语料库标注内容,根据语料库标注实体类型,参照UMLS语义类型将其划分为6大类。总结语料库在语义类型、数据源等方面特点,阐述生物医学文本语料库构建流程及关键步骤,以期为我国生物医学文本语料库相关研究奠定基础。 展开更多
关键词 生物医学文本语料库 语义类型 语义关系
下载PDF
国际生物医学科学数据审编研究热点探析
14
作者 侯丽 吴萌 +1 位作者 侯震 李姣 《医学信息学杂志》 CAS 2017年第5期74-79,共6页
以2015-2016年两届国际生物医学审编会议上领域专家讨论的报告和会议论文集,以及PubMedCentral中近5年来有关Biocuration和Data Biocuration的研究文献为数据源,采用内容分析法对生物医学科学数据审编的研究主题进行分析、归纳和总结,... 以2015-2016年两届国际生物医学审编会议上领域专家讨论的报告和会议论文集,以及PubMedCentral中近5年来有关Biocuration和Data Biocuration的研究文献为数据源,采用内容分析法对生物医学科学数据审编的研究主题进行分析、归纳和总结,重点从Biocuration的工作机制、生物医学数据标准构建与应用、集成与可视化、审编与应用、生物医学文本挖掘等方面进行梳理,以期为我国生物医学科学数据审编的发展提供国际经验。 展开更多
关键词 生物医学数据 数据审编 生物医学文本挖掘 生物医学数据标准与本体
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部