期刊文献+
共找到65篇文章
< 1 2 4 >
每页显示 20 50 100
基于多层条件随机场的中文命名实体识别 被引量:25
1
作者 胡文博 都云程 +1 位作者 吕学强 施水才 《计算机工程与应用》 CSCD 北大核心 2009年第1期163-165,227,共4页
命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识... 命名实体识别属于自然语言处理的基础研究领域,是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。主要研究中文命名实体中对复杂地名和复杂机构名的识别,提出一种基于多层条件随机场的命名实体识别的方法。对大规模真实语料进行开放测试,两项识别的召回率、准确率和F值分别达到91.95%、89.99%、90.50%和90.07%、88.72%、89.39%。 展开更多
关键词 条件随机场 命名实体识别 命名实体
下载PDF
基于词元再评估的新事件检测模型 被引量:17
2
作者 张阔 李涓子 +1 位作者 吴刚 王克宏 《软件学报》 EI CSCD 北大核心 2008年第4期817-828,共12页
新事件检测(new event detection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻.初步实验发现,在对不同类别的新闻报道进行新事件检测时,其不同类型的词元往往具有不同的敏感程度.而传统方法往往将所有的... 新事件检测(new event detection,简称NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻.初步实验发现,在对不同类别的新闻报道进行新事件检测时,其不同类型的词元往往具有不同的敏感程度.而传统方法往往将所有的词元等同看待.重点研究在新事件检测模型中,对于不同词元的权重设定问题.提出利用统计方法优化不同类别新闻对于不同词性词元的权重参数;提出利用已有新闻簇信息动态更新词元权重的方法,采用在新闻之间(而非新闻与新闻簇之间)计算相似度的形式,发挥两种比较形式的优点.在Linguistic Data Consortium(LDC)公共数据集TDT2与TDT3上进行实验,实验结果表明,这两种改进方法的效果明显,性能与同类系统相比有显著提升. 展开更多
关键词 新事件检测 信息检索 命名实体 词元再评估
下载PDF
基于准循环神经网络的中文命名实体识别 被引量:11
3
作者 王栋 李业刚 +1 位作者 张晓 蒲相忠 《计算机工程与设计》 北大核心 2020年第7期2038-2043,共6页
针对中文命名实体识别中长短期记忆网络识别模型缺乏并行性的问题,提出一种融合双向准循环神经网络(BQRNN)与条件随机场(CRF)的中文命名实体识别模型。通过BQRNN网络在序列维度和特征维度上并行获取序列化文本的内部特征,由CRF层选取最... 针对中文命名实体识别中长短期记忆网络识别模型缺乏并行性的问题,提出一种融合双向准循环神经网络(BQRNN)与条件随机场(CRF)的中文命名实体识别模型。通过BQRNN网络在序列维度和特征维度上并行获取序列化文本的内部特征,由CRF层选取最终的标签序列,在模型中添加Attention机制,增强BQRNN网络输出的特征信息。实验结果表明,该模型与BLSTM-CRF模型相比F1值提高了1.81%,缩短了约40%的运行时间。 展开更多
关键词 命名实体 准循环神经网络 条件随机场 注意力机制 并行性
下载PDF
融入集成卷积和注意力的民航业务实体识别 被引量:2
4
作者 邢志伟 戴铮 罗谦 《计算机工程与设计》 北大核心 2022年第2期443-449,共7页
通过识别机场的业务实体能够帮助管理者在网络舆情中快速定位服务中的痛点问题。旅客评价中存在较多的复杂实体并伴随有数据类别失衡的现象,针对此提出融入集成卷积(E-CNN)和注意力机制(Attention)的实体识别方法。主要利用人工标注和... 通过识别机场的业务实体能够帮助管理者在网络舆情中快速定位服务中的痛点问题。旅客评价中存在较多的复杂实体并伴随有数据类别失衡的现象,针对此提出融入集成卷积(E-CNN)和注意力机制(Attention)的实体识别方法。主要利用人工标注和半监督思想结合的方法获取旅客评价的数据集,通过ECNN获取多范围的文本特征信息,由双向长短期记忆网络(BLSTM)获取文本的长依赖特征,使用Attention机制克服数据类别不平衡的缺点。实验结果表明,提出的方法能有效识别民航业务实体,F1值超过其它所对比的模型。 展开更多
关键词 命名实体 集成卷积网络 注意力机制 长短期记忆网络 条件随机场
下载PDF
基于向量相似度修正策略的命名实体关联分析
5
作者 刘路 李弼程 张先飞 《计算机工程与应用》 CSCD 北大核心 2008年第2期179-181,204,共4页
关联分析是数据挖掘技术中的一种重要方法,代表性算法有FP-growth算法和MAXFP-Miner算法。命名实体包含了文本的主要内容,蕴含了丰富的知识模式。针对命名实体的特点,提出一种基于向量相似度比较的关联规则修正策略,将此修正策略应用于M... 关联分析是数据挖掘技术中的一种重要方法,代表性算法有FP-growth算法和MAXFP-Miner算法。命名实体包含了文本的主要内容,蕴含了丰富的知识模式。针对命名实体的特点,提出一种基于向量相似度比较的关联规则修正策略,将此修正策略应用于MAXFP-Miner算法中,得到一种改进的MAXFP-Miner算法;利用该算法对命名实体之间的内在联系进行分析,从中发现有意义的知识模式。实验结果与性能比较表明,改进的MAXFP-Miner算法是有效的,优于传统的FP-growth算法和MAXFP-Miner算法。 展开更多
关键词 命名实体 关联分析 MAXFP-Miner 知识发现
下载PDF
基于学术论文全文的研究方法实体自动识别研究 被引量:34
6
作者 章成志 张颖怡 《情报学报》 CSSCI CSCD 北大核心 2020年第6期589-600,共12页
研究方法的规范程度标志着一门学科发展的成熟程度。在情报学学科中,关于研究方法的理论分析和规范性研究逐渐引起重视,而使用量化方法进行实证分析的研究相对较少。另外,当一个研究方法实体出现在学术文本中,则表示该研究方法实体被该... 研究方法的规范程度标志着一门学科发展的成熟程度。在情报学学科中,关于研究方法的理论分析和规范性研究逐渐引起重视,而使用量化方法进行实证分析的研究相对较少。另外,当一个研究方法实体出现在学术文本中,则表示该研究方法实体被该学术论文使用或该学术论文引用该研究方法实体用于分析或比较。梳理学术论文使用的研究方法实体,可以帮助学者快速了解学术论文的主旨内容。总结学术论文引用的研究方法实体,有助于理清学科领域中研究方法的演变和发展模式。因此,本文将研究方法分为论文使用研究方法和论文引用研究方法。本文比较双向长短时记忆网络等8种神经网络研究方法实体自动抽取模型,从中选择最优的模型进行研究方法实体的识别。实验结果表明,基于字向量的、结合条件随机场的双向长短时记忆网络联合训练模型在研究方法识别任务中表现出最高的性能。以《情报学报》近10年的论文全文为依据,分析抽取出的研究方法实体的使用情况。统计分析结果发现,情报学学科中与实验法相关的研究方法使用频次和引用频次均最高。 展开更多
关键词 研究方法识别 命名实体识别 深度学习 序列标注
下载PDF
基于感知机模型藏文命名实体识别 被引量:27
7
作者 华却才让 姜文斌 +1 位作者 赵海兴 刘群 《计算机工程与应用》 CSCD 2014年第15期172-176,共5页
藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模... 藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模型训练特征模板,训练模型,以及命名实体分类识别方法。提出的藏文命名实体识别方法在测试集上获得86.03%的F值,相对基于分词的基线系统高出10.5%个点。 展开更多
关键词 藏文音节 命名实体 藏文命名实体 感知机模型
下载PDF
基于多步聚类的汉语命名实体识别和歧义消解 被引量:17
8
作者 李广一 王厚峰 《中文信息学报》 CSCD 北大核心 2013年第5期29-34,42,共7页
命名实体识别和歧义消解是自然语言理解的重要研究内容。针对提供实体知识库情况下的命名实体识别和歧义消解任务,该文提出了一种基于多步聚类的方法。首先通过两轮聚类将命名实体与知识库实体定义链接,然后通过层次聚合式聚类对知识库... 命名实体识别和歧义消解是自然语言理解的重要研究内容。针对提供实体知识库情况下的命名实体识别和歧义消解任务,该文提出了一种基于多步聚类的方法。首先通过两轮聚类将命名实体与知识库实体定义链接,然后通过层次聚合式聚类对知识库中未出现的实体进行聚类,最后进行普通词的识别和基于K-Means聚类的结果调整。在CLP-2012的汉语命名实体识别和歧义消解评测数据上的实验表明,该文的方法表现出良好的性能,在测试集上的F值高出评测参赛队伍最好水平6.46%,达到86.68%。 展开更多
关键词 命名实体识别 命名实体消歧 聚类
下载PDF
非结构化信息抽取关键技术研究探讨 被引量:10
9
作者 周法国 王映龙 +1 位作者 杨炳儒 宋泽锋 《计算机工程与应用》 CSCD 北大核心 2009年第14期1-6,21,共7页
以基于内在认知机理的知识发现理论为指导,针对汉语命名实体识别的难点,充分考虑专家知识在命名实体识别中的作用;根据不同的实体类型,采用灵活变化的统计与规则相结合的方式;采用各种技术来研究信息抽取的任务,如:机器学习技术、篇章... 以基于内在认知机理的知识发现理论为指导,针对汉语命名实体识别的难点,充分考虑专家知识在命名实体识别中的作用;根据不同的实体类型,采用灵活变化的统计与规则相结合的方式;采用各种技术来研究信息抽取的任务,如:机器学习技术、篇章分析与理解技术、句法分析技术、图算法与图挖掘技术、词计算技术、快速全文检索技术等;该文探讨的是不仅要从文本中获取简单子句中的关系,还要获得跨句子、段落中的实体关系。 展开更多
关键词 信息抽取 内在认知机理 命名实体识别 共指消解 机器学习
下载PDF
基于关联记忆网络的中文细粒度命名实体识别 被引量:13
10
作者 琚生根 李天宁 孙界平 《软件学报》 EI CSCD 北大核心 2021年第8期2545-2556,共12页
细粒度命名实体识别是对文本中的实体进行定位,并将其分类至预定义的细粒度类别中.目前,中文细粒度命名实体识别仅使用预训练语言模型对句子中的字符进行上下文编码,并没有考虑到类别的标签信息具有区分实体类别的能力.由于预测句子不... 细粒度命名实体识别是对文本中的实体进行定位,并将其分类至预定义的细粒度类别中.目前,中文细粒度命名实体识别仅使用预训练语言模型对句子中的字符进行上下文编码,并没有考虑到类别的标签信息具有区分实体类别的能力.由于预测句子不带有实体标签,使用关联记忆网络来捕获训练集句子的实体标签信息,并将标签信息融入预测句子的字符表示中.该方法将训练集中带实体标签的句子作为记忆单元,利用预训练语言模型获取原句子和记忆单元句子的上下文表示,再通过注意力机制将记忆单元句子的标签信息与原句子的表示结合,从而提升识别效果.在CLUENER2020中文细粒度命名实体识别任务上,该方法对比基线方法获得了提升. 展开更多
关键词 中文细粒度命名实体识别 关联记忆网络 多头自注意力 预训练语言模型
下载PDF
HMM和CRFs在信息抽取应用中的比较研究 被引量:12
11
作者 王昊 邓三鸿 《现代图书情报技术》 CSSCI 北大核心 2007年第12期57-63,共7页
在比较HMM和CRFs数学理论的基础上,分别提出基于HMM词角色标注和基于CRFs字角色标注的人名实体抽取模型,并通过开放性测试和实践应用两次验证、比较两者的有效性,从而在实践中证明从理论比较中得出的结论:CRFs较之HMM更适合于解决序列... 在比较HMM和CRFs数学理论的基础上,分别提出基于HMM词角色标注和基于CRFs字角色标注的人名实体抽取模型,并通过开放性测试和实践应用两次验证、比较两者的有效性,从而在实践中证明从理论比较中得出的结论:CRFs较之HMM更适合于解决序列标注或对象分类问题。 展开更多
关键词 HMM CRFS 信息抽取 人名实体抽取 角色标注 特征
下载PDF
基于GRU的电力调度领域命名实体识别方法 被引量:11
12
作者 吴超 王汉军 《计算机系统应用》 2020年第8期185-191,共7页
电力调度领域命名实体识别是电力知识图谱构建步骤中的重要一环,目前存在基于机器学习和深度学习模型被用于通用领域或是其他专业领域的命名实体识别.为了解决电力调度领域命名实体识别的问题,研究Transformer-BiGRU-CRF模型,该模型可... 电力调度领域命名实体识别是电力知识图谱构建步骤中的重要一环,目前存在基于机器学习和深度学习模型被用于通用领域或是其他专业领域的命名实体识别.为了解决电力调度领域命名实体识别的问题,研究Transformer-BiGRU-CRF模型,该模型可以有效的解决电力调度领域中命名实体识别的问题.通过Transformer模型得到语料的字向量,再通过BiGRU和CRF进行命名实体识别。该模型在训练过程中有两种训练方式,第1种方式是只训练BiGRU和CRF部分的参数;第2种方式是训练包括Transformer部分的整个模型的参数.最后发现,第1种方式达到模型的平稳状态需要的时间更少,但是第2种达到平稳状态准确率会高出接近5%. 展开更多
关键词 Transformer模型 命名实体识别 BiGRU 电力调度
下载PDF
基于人工智能大模型技术的果蔬农技知识智能问答系统 被引量:8
13
作者 王婷 王娜 +1 位作者 崔运鹏 刘娟 《智慧农业(中英文)》 CSCD 2023年第4期105-116,共12页
[目的/意义]乡村振兴战略给农业技术推广提出新的要求,使农业推广知识的供给形式有待进一步创新。以果蔬农技知识服务为需求导向,基于前沿大语言模型技术,面向新型农业知识导读和知识问答等农技推广服务,构建果蔬农技知识智能问答系统。... [目的/意义]乡村振兴战略给农业技术推广提出新的要求,使农业推广知识的供给形式有待进一步创新。以果蔬农技知识服务为需求导向,基于前沿大语言模型技术,面向新型农业知识导读和知识问答等农技推广服务,构建果蔬农技知识智能问答系统。[方法]基于草莓种植户需求分析,把草莓栽培农技知识划分为不同主题,形成知识对象识别和知识问答两种大模型下游任务,结合机器自动标注和人工标注的方法构建小样本高质量训练语料;通过对比已有的4种大语言模型:Baichuan2-13B-Chat、Chat GLM2-6B、Llama-2-13B-Chat、Chat GPT的性能表现,选择性能最优的模型作为基础模型,按照“优质语料+预训练大模型+微调”的研究思路,训练具有语义分析、上下文关联和生成能力,能够适应多种下游任务的深度神经网络,构建农业知识问答大模型;采用数据优化、检索增强生成技术等多种策略缓解大模型幻觉问题;研发果蔬农技知识智能问答系统,生成高精度、无歧义的农业知识答案,同时支持用户多轮问答。[结果和讨论]以精准率和召回率为命名实体识别任务的性能表现指标,参与测评的国内主流模型在微调后不同知识主题下的平均精准率均超过85%,平均召回率表现各异,其中知识实体类型的数量、标注语料数量等因素都会影响大模型性能;以幻觉率和语义相似度为知识问答任务的性能表现指标,数据优化、采用检索增强生成技术等策略以10%~40%的幅度有效降低大模型幻觉率,并有效提高大模型的语义相似度。[结论]在农业领域的命名实体识别和知识问答任务中,预训练大模型Chat GLM的表现性能最优。针对预训练大模型下游任务的微调和基于检索增强生成(Retrieval-Augmented Generation,RAG)技术的模型优化可以缓解大模型幻觉问题,显著提升大模型性能。大模型技术具有创新农技知识服务模式、 展开更多
关键词 大模型 生成式预训练变换器 农技知识 智能问答 命名实体识别
下载PDF
基于BERT_IDCNN_CRF的军事领域命名实体识别研究 被引量:8
14
作者 张祺 李成军 刘敬蜀 《航天电子对抗》 2021年第5期56-60,共5页
提出了一种基于BERT_IDCNN_CRF的命名实体识别模型,旨在识别军事领域文本中的人名、部队、武器装备等实体。采集了公开军事网站上的部分军事文本信息作为生语料,采用BIO标注体系、预处理生成所需的熟语料。利用BERT融合了词的上下文信息... 提出了一种基于BERT_IDCNN_CRF的命名实体识别模型,旨在识别军事领域文本中的人名、部队、武器装备等实体。采集了公开军事网站上的部分军事文本信息作为生语料,采用BIO标注体系、预处理生成所需的熟语料。利用BERT融合了词的上下文信息,输入IDCNN层进行训练,最终将训练结果输入CRF层进行模型微调获得训练结果。与其他三个常见的模型相比,提出的BERT_IDCNN_CRF模型在F1分数上效果较好。 展开更多
关键词 军事领域 命名实体识别 深度学习 膨胀卷积
下载PDF
基于GeoERNIE-BiLSTM-Attention-CRF模型的地质命名实体识别 被引量:7
15
作者 王刘坤 李功权 《地质科学》 CAS CSCD 北大核心 2023年第3期1164-1177,共14页
构建地质知识图谱对深化现有地质数据分析和推进地质大数据的构建至关重要。地质命名实体识别作为构建地质知识图谱的核心技术,仍然面临着地质命名实体不断被引入、符号分隔的命名实体、同一实体表达形式不同等挑战。针对上述问题,本文... 构建地质知识图谱对深化现有地质数据分析和推进地质大数据的构建至关重要。地质命名实体识别作为构建地质知识图谱的核心技术,仍然面临着地质命名实体不断被引入、符号分隔的命名实体、同一实体表达形式不同等挑战。针对上述问题,本文提出了GeoERNIE-BiLSTM-Attention-CRF的地质领域命名实体识别模型,其中预训练模型GeoERNIE学习了地质领域的先验语义知识,并结合自定义地质领域主体词表对复杂命名实体进行准确分词,能够提升模型整体性能和地质命名实体未登录词以及复杂实体的识别效果。然后通过BiLSTM充分学习地质实体上下文语义信息来帮助对命名形式多样的地质命名实体进行识别,接着引入Attention机制对地质实体相关语义增加特征权重,最后由CRF层输出最佳实体标注结果。本文以测试集数据对模型性能进行了评估,模型的准确率、精确率、召回率和F1值分别达到了96.35%、96.90%、96.87%和96.95%。实验表明相比其他模型,本文模型在地质命名实体识别方面效果更优,能有效识别符号分隔和同一实体表达形式不同等复杂地质命名实体。 展开更多
关键词 知识图谱 地质领域 地质命名实体识别 GeoERNIE模型
下载PDF
基于中文Web社会网络的提取、测量与分析 被引量:6
16
作者 邸楠 姚从磊 李晓明 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期169-172,共4页
从中文Web中提取人名实体,设计了3种人物间关系定义,并以此为基础构建一个人物间关系网络。通过计算一些社会网络研究中常用的属性指标,验证了社会网络中的一些常见现象,例如“小世界现象”。对社会网络的分析工作包括两个方面:一方面,... 从中文Web中提取人名实体,设计了3种人物间关系定义,并以此为基础构建一个人物间关系网络。通过计算一些社会网络研究中常用的属性指标,验证了社会网络中的一些常见现象,例如“小世界现象”。对社会网络的分析工作包括两个方面:一方面,使用主成份分析来帮助划分人物关系网络,并将划分结果与对应的人物属性相比较,结果表明人物职业较之籍贯和性别等属性更符合来自Web社会网络中的结构划分;另一方面,根据人名在Web中热点程度排序,并按照顺序依次选择3组不同大小的人物列表分别构建社会网络,以此来观察随着人物的增加该社会网络的演化现象,并发现构建的人物关系网络结构是一个单核心的网络。 展开更多
关键词 社会网络分析 中文WEB 命名实体提取 命名实体关系
下载PDF
基于融合特征相似度的实体消歧方法研究 被引量:7
17
作者 张雄 陈福才 黄瑞阳 《计算机应用研究》 CSCD 北大核心 2017年第2期347-350,396,共5页
在数字资源日益丰富的环境下,人名歧义现象为数据检索带来了很多不确定性,降低了数据检索的准确度。运用人名实体的个人信息特征和作者文献话题等特征,采用多特征的融合方法充分挖掘与实体相关联的信息,实现人名消歧。实验使用爬取的某... 在数字资源日益丰富的环境下,人名歧义现象为数据检索带来了很多不确定性,降低了数据检索的准确度。运用人名实体的个人信息特征和作者文献话题等特征,采用多特征的融合方法充分挖掘与实体相关联的信息,实现人名消歧。实验使用爬取的某数据库文献数据,进行了人名消歧特征的选取和参数的确定等实验,结果表明提出的方法具有较好的性能。 展开更多
关键词 实体特征 主题信息 特征相似度 人名消歧
下载PDF
基于命名实体识别与Neo4j的中文电子病历知识图谱构建和应用 被引量:7
18
作者 许思特 孙木 《医学信息学杂志》 CAS 2022年第12期50-56,共7页
基于真实中文电子病历与网络爬取数据,构建病历实体识别模型,确定实体关系,进行知识图谱可视化展现,搭建基于规则匹配的问答系统。探索适用于中文电子病历的知识图谱与知识体系构建方法,提高医院统计部门相关审核工作效率,为人工智能技... 基于真实中文电子病历与网络爬取数据,构建病历实体识别模型,确定实体关系,进行知识图谱可视化展现,搭建基于规则匹配的问答系统。探索适用于中文电子病历的知识图谱与知识体系构建方法,提高医院统计部门相关审核工作效率,为人工智能技术在医疗卫生行业应用奠定基础。 展开更多
关键词 中文电子病历 RoBERTa 命名实体识别 知识图谱 Neo4j
下载PDF
基于动态词典匹配的语义增强中文命名实体识别算法 被引量:6
19
作者 陈曙东 罗超 +1 位作者 欧阳小叶 李威 《无线电工程》 北大核心 2021年第7期519-525,共7页
在命名实体识别任务中,运用词典匹配的方法能够添加丰富的文本特征,但匹配到的词组信息多使用静态归一化的方法,缺乏自动推理能力。提出了基于动态词典匹配的语义增强中文命名实体识别方法。对输入句子中的字符,在词典中进行动态词组匹... 在命名实体识别任务中,运用词典匹配的方法能够添加丰富的文本特征,但匹配到的词组信息多使用静态归一化的方法,缺乏自动推理能力。提出了基于动态词典匹配的语义增强中文命名实体识别方法。对输入句子中的字符,在词典中进行动态词组匹配,利用神经网络对词组加权,结合word2vec与ALBERT得到字符的增强特征表示;在序列建模层运用BiLSTM对字符的word2vec向量与字符增强特征进行模型训练;在标签推理层运用条件随机场(Conditional Random Field,CRF)识别命名实体。在中文Resume和Weibo数据集上进行实验,验证结果表明,该方法比传统方法具有更好的效果。 展开更多
关键词 命名实体识别 词典匹配 语义增强 神经网络 ALBERT
下载PDF
基于语义相似度及命名实体识别的主观题自动评分方法 被引量:6
20
作者 王逸凡 李国平 《电子测量技术》 2019年第2期84-87,共4页
人工智能技术目前已运用于诸多领域,其中在教育行业的一个重要应用为主观题评分系统。文本相似度计算是主观题评分的一大难点,目前采用的基于同义词词林的词语相似度计算方法已经了取得较好的效果,但文本过长会导致传统词语相似度计算... 人工智能技术目前已运用于诸多领域,其中在教育行业的一个重要应用为主观题评分系统。文本相似度计算是主观题评分的一大难点,目前采用的基于同义词词林的词语相似度计算方法已经了取得较好的效果,但文本过长会导致传统词语相似度计算方法性能下降。该文采用拓展的命名实体识别方法将主观题的候选答案中部分关键词提取出来,采用改进的同义词林词语相似度计算方法将候选关键词与主观题标准答案中目标关键词进行相似度计算。所提方法能有效提升词语匹配效率,在原同义词林词语相似度算法基础上,提升了性能,有效缩短了计算时间。 展开更多
关键词 同义词词林 主观题 语义相似度 命名实体识别 自然语言处理
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部