期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于向量空间模型的有导词义消歧 被引量:37
1
作者 鲁松 白硕 +1 位作者 黄雄 张健 《计算机研究与发展》 EI CSCD 北大核心 2001年第6期662-667,共6页
词义消歧一直是自然语言理解中的一个关键问题 ,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣 .由于自然语言知识表示的困难 ,在手工规则的词义消歧难以达到理想效果的情况下 ,各种有导机器学习方法被应用于词义消... 词义消歧一直是自然语言理解中的一个关键问题 ,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣 .由于自然语言知识表示的困难 ,在手工规则的词义消歧难以达到理想效果的情况下 ,各种有导机器学习方法被应用于词义消歧任务中 .借鉴前人的成果引入信息检索领域中向量空间模型文档词语权重计算技术来解决多义词义项的知识表示问题 ,并提出了上下文位置权重的计算方法 ,给出了一种基于向量空间模型的词义消歧有导机器学习方法 .该方法将多义词的义项和上下文分别映射到向量空间中 ,通过计算多义词上下文向量与义项向量的距离 ,采用 k- NN(k=1)方法来确定上下文向量的义项分类 .在 9个汉语高频多义词的开放和封闭测试中均取得了突出的成绩 (封闭测试平均正确率为 96 .31% ,开放测试平均正确率为 92 .98% ) 。 展开更多
关键词 词义消歧 向量空间模型 义项矩阵 自然语言理解 有导机器学习
下载PDF
一种基于词义向量模型的词语语义相似度算法 被引量:18
2
作者 李小涛 游树娟 陈维 《自动化学报》 EI CSCD 北大核心 2020年第8期1654-1669,共16页
针对基于词向量的词语语义相似度计算方法在多义词、非邻域词和同义词三类情况计算准确性差的问题,提出了一种基于词义向量模型的词语语义相似度算法.与现有词向量模型不同,在词义向量模型中多义词按不同词义被分成多个单义词,每个向量... 针对基于词向量的词语语义相似度计算方法在多义词、非邻域词和同义词三类情况计算准确性差的问题,提出了一种基于词义向量模型的词语语义相似度算法.与现有词向量模型不同,在词义向量模型中多义词按不同词义被分成多个单义词,每个向量分别与词语的一个词义唯一对应.我们首先借助同义词词林中先验的词义分类信息,对语料库中不同上下文的多义词进行词义消歧;然后基于词义消歧后的文本训练词义向量模型,实现了现有词向量模型无法完成的精确词义表达;最后对两个比较词进行词义分解和同义词扩展,并基于词义向量模型和同义词词林综合计算词语之间的语义相似度.实验结果表明本文算法能够显著提升以上三类情况的语义相似度计算精度. 展开更多
关键词 词语语义相似度 word2vec 同义词词林 词义消歧 词义向量
下载PDF
基于语义的词义消歧算法初探 被引量:8
3
作者 龚永恩 袁春风 武港山 《计算机应用研究》 CSCD 北大核心 2006年第3期41-43,52,共4页
词义消歧是自然语言处理中的难题之一。结合《知网》,从语义的角度出发,结合词性信息、搭配实例和语义相关度等信息,提出了一种多策略的词义消歧方法。
关键词 词义消歧 《知网》 搭配度 语义相关度 自然语言处理
下载PDF
基于WordNet词义消歧的系统融合 被引量:12
4
作者 刘宇鹏 李生 赵铁军 《自动化学报》 EI CSCD 北大核心 2010年第11期1575-1580,共6页
最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了... 最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了用词义消歧(Word sense disambiguation,WSD)来指导混淆网络中的对齐.同时骨架翻译的选择也是通过计算句子间的相似度来获得的,句子的相似性计算使用了二分图的最大匹配算法.为了使得基于WordNet词义消歧方法融入到系统中,本文将翻译错误率(Translation error rate,TER)算法进行了改进,实验结果显示本方法的性能好于经典的TER算法的性能. 展开更多
关键词 系统融合 翻译错误率 词义消歧 混淆网络
下载PDF
基于维基百科的自动词义消歧方法 被引量:12
5
作者 史天艺 李明禄 《计算机工程》 CAS CSCD 北大核心 2009年第18期62-64,66,共4页
针对传统词义消歧仅基于上下文语境而导致准确率低的问题,提出一种多策略的无监督自动词义消歧方法。利用从维基百科在线中提炼出的丰富语义知识,线性融合上下文语境、背景知识和语义信息3大特征,根据逻辑回归算法学习各特征的权重,选... 针对传统词义消歧仅基于上下文语境而导致准确率低的问题,提出一种多策略的无监督自动词义消歧方法。利用从维基百科在线中提炼出的丰富语义知识,线性融合上下文语境、背景知识和语义信息3大特征,根据逻辑回归算法学习各特征的权重,选取最大融合值所对应的候选项作为最优词义。在SENSEVAL数据集上取得了85.50%的平均准确率,验证了该方法的有效性。 展开更多
关键词 词义消歧 维基百科 知识库 无监督学习
下载PDF
基于知网语义相关度计算的词义消歧方法 被引量:10
6
作者 王广正 王喜凤 《安徽工业大学学报(自然科学版)》 CAS 2008年第1期71-75,共5页
歧义字段处理一直是中文信息处理领域中最关键也是最困难的问题之一,至今该问题仍没有得到完全而有效的解决,使得以此为基础的多个应用领域都难以取得突破性进展。传统的消歧方法--规则消歧和统计消歧都有不可避免的缺点:规则消歧存在... 歧义字段处理一直是中文信息处理领域中最关键也是最困难的问题之一,至今该问题仍没有得到完全而有效的解决,使得以此为基础的多个应用领域都难以取得突破性进展。传统的消歧方法--规则消歧和统计消歧都有不可避免的缺点:规则消歧存在规则的完备性与合理性问题,统计消歧则只取大概率事件而忽视小概率事件。在研究了知网表达汉语知识的基础上,改进了基于知网语义相关度的计算模型,并应用于汉语的歧义字段处理中。经大量例句作实验,以句子为单位的切分正确率可达到97.1%,验证了该消歧方法的有效性。 展开更多
关键词 汉语自动分词 词义消歧 语义相关度 知网
下载PDF
基于依存句法分析的多特征词义消歧 被引量:12
7
作者 史兆鹏 邹徐熹 向润昭 《计算机工程》 CAS CSCD 北大核心 2017年第9期210-213,共4页
词义消歧在机器翻译、信息检索、语音语义识别等方面具有重要作用。为提高消歧质量,细化特征粒度,提出一种多特征词义消歧方案。通过依存句法分析提取上下文中多义词及义项的词性、依存结构、依存词等特征,细化特征粒度,并根据多特征构... 词义消歧在机器翻译、信息检索、语音语义识别等方面具有重要作用。为提高消歧质量,细化特征粒度,提出一种多特征词义消歧方案。通过依存句法分析提取上下文中多义词及义项的词性、依存结构、依存词等特征,细化特征粒度,并根据多特征构造权值函数,选择权值最大的义项作为多义词的义项。实验结果表明,与单一特征词义消歧相比,采用依存句法分析的多特征词义消歧方案细化了特征粒度,提高了消歧准确率。 展开更多
关键词 词义消歧 依存句法 细化特征 多特征 权值
下载PDF
基于领域知识的图模型词义消歧方法 被引量:10
8
作者 鹿文鹏 黄河燕 吴昊 《自动化学报》 EI CSCD 北大核心 2014年第12期2836-2850,共15页
对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation,WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目... 对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation,WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目标歧义词的各个词义获取词义领域标注作为词义领域知识;利用文本领域关联词和句子上下文词构建消歧图,并根据词义领域知识对消歧图进行调整;使用改进的图评分方法对消歧图的各个词义结点的重要度进行评分,选择正确的词义.该方法能有效地将领域知识整合到图模型中,在Koeling数据集上,取得了同类研究的最佳消歧效果.本文亦对多种图模型评分方法做了改进,进行了详细的对比实验研究. 展开更多
关键词 词义消歧 领域知识 图模型 词义领域 文本领域
下载PDF
一种基于语料库的词义消歧策略 被引量:4
9
作者 郭池 陈家骏 王启祥 《计算机工程与应用》 CSCD 北大核心 2003年第35期33-36,65,共5页
词义消歧一直是一个难点,同时,也是很多领域都需解决的一个环节。该文首先介绍了目前基于语料库进行词义消歧方法的研究进展和各自的特点,在此基础上探讨了一种基于实例和基于统计的方法(即基于语料库的两种主流方法)相结合的混合策略,... 词义消歧一直是一个难点,同时,也是很多领域都需解决的一个环节。该文首先介绍了目前基于语料库进行词义消歧方法的研究进展和各自的特点,在此基础上探讨了一种基于实例和基于统计的方法(即基于语料库的两种主流方法)相结合的混合策略,并对其可能性和优越性进行了讨论。 展开更多
关键词 词义消歧 机器翻译 语料库 基于实例 基于统计 混合策略
下载PDF
基于上下文语境的词义消歧方法 被引量:4
10
作者 杨陟卓 《计算机应用》 CSCD 北大核心 2015年第4期1006-1008,1012,共4页
针对传统词义消歧方法面临的数据稀疏问题,提出一种基于上下文语境的词义消歧方法。该方法假设同一篇文章中的句子之间共享一些相同的话题,首先,抽取在同一篇文章中包含相同歧义词的句子,这些句子可以作为歧义句的上下文语境,为其中的... 针对传统词义消歧方法面临的数据稀疏问题,提出一种基于上下文语境的词义消歧方法。该方法假设同一篇文章中的句子之间共享一些相同的话题,首先,抽取在同一篇文章中包含相同歧义词的句子,这些句子可以作为歧义句的上下文语境,为其中的一个歧义句子提供消歧知识;其次,通过一种无监督的词义消歧方法进行词义消歧。在真实的语料上实验结果表明,使用2个上下文语境句子,窗口大小为1时,该方法的消歧准确率比基线方法(Orig Disam)提高了3.26%。 展开更多
关键词 数据稀疏 词义消歧 上下文语境 网络图模型 参数估计
下载PDF
基于BP神经网络的词义消歧模型 被引量:3
11
作者 谢芳 胡泉 《计算机工程与应用》 CSCD 北大核心 2006年第12期187-189,203,共4页
词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节。文章首先介绍了目前一些常用词义消歧方法的特点和这些方法的研究进展,并在此基础上探讨了一种基于BP神经网络和统计方法相结合的有导词义消... 词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节。文章首先介绍了目前一些常用词义消歧方法的特点和这些方法的研究进展,并在此基础上探讨了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,最后详细讲解了BP神经网络原理,并对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论。 展开更多
关键词 词义消歧 基于统计 BP神经网络 语料库
下载PDF
上下文边界可变的词义消歧 被引量:2
12
作者 闫蓉 高光来 《计算机工程与设计》 北大核心 2015年第10期2843-2848,共6页
传统基于知识的词义消歧方法对所有词性的多义词均采用统一窗口大小作为消歧上下文,没有考虑固定窗口中影响消歧的噪音问题,消歧效果不佳,为此提出一种上下文边界可变的中文词义消歧模型。通过分词性的调整消歧上下文边界,尽可能保证选... 传统基于知识的词义消歧方法对所有词性的多义词均采用统一窗口大小作为消歧上下文,没有考虑固定窗口中影响消歧的噪音问题,消歧效果不佳,为此提出一种上下文边界可变的中文词义消歧模型。通过分词性的调整消歧上下文边界,尽可能保证选取的上下文中各词语和多义词存在语义联系,达到消减噪音目的。通过构建多义词义项搭配库,进一步细化词语间语义相关度计算。实验结果表明,使用该方法比SemEval-2007最好成绩高出8.6个百分点。 展开更多
关键词 语境 语义相关 搭配 词义消歧 知网
下载PDF
统计与神经网络相结合的词义消歧模型 被引量:2
13
作者 曹鸿霞 《武汉理工大学学报》 EI CAS CSCD 北大核心 2006年第8期131-134,共4页
介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,阐述了BP神经网络原理,通过对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论,最后通过试验发现实际和预测结果的误差并不随着试验迭代次数而递减,而是实际误... 介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,阐述了BP神经网络原理,通过对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论,最后通过试验发现实际和预测结果的误差并不随着试验迭代次数而递减,而是实际误差随着次数的增加在零的附近呈现波动状态,即使用很少的迭代次数也可以得到比较好的结果。 展开更多
关键词 词义消歧 基于统计 BP神经网络 语料库
下载PDF
基于HNC理论的汉语词义消歧策略 被引量:2
14
作者 赵星 《丽水学院学报》 2010年第1期34-37,共4页
基于HNC理论的汉语词义消歧策略,是从语义角度出发,利用HNC理论体系的HNC符号和HNC字词库,尤其是HNC符号的词语搭配信息和HNC字词库的语法语义信息,对汉语文本的多义词进行消歧。实验结果表明,该方法对于处理汉语词义消歧是有效的。
关键词 词义消歧 HNC理论 HNC符号 HNC字词库
下载PDF
用于词义排歧的语义剪枝方法研究 被引量:1
15
作者 辛日华 《控制工程》 CSCD 北大核心 2013年第5期887-890,共4页
词义排歧方法的研究在自然语言处理领域具有重要的理论和实践意义。研究了一种基于知网的语义剪枝算法,来解决自然语言处理过程中的词义排歧问题。其目的是通过语义剪枝系统尽可能地减少歧义词在上下文中错误的或最不可能的义项。语义... 词义排歧方法的研究在自然语言处理领域具有重要的理论和实践意义。研究了一种基于知网的语义剪枝算法,来解决自然语言处理过程中的词义排歧问题。其目的是通过语义剪枝系统尽可能地减少歧义词在上下文中错误的或最不可能的义项。语义剪枝以后,形成词和其可能义项的一个列表,尽量将一个词真正正确的义项保留下来。为了对语义剪枝算法进行评价,开发了一个手工标注交互环境,并使用了召回率和简化率2个指标。对窗口的尺寸和分析单元的选取对召回率和简化率的影响进行了研究。 展开更多
关键词 词义排歧 自然语言处理 知网 语义剪枝
下载PDF
一种基于概念关联式的词义消岐方法 被引量:1
16
作者 缪建明 张全 《计算机科学》 CSCD 北大核心 2010年第1期208-210,共3页
词义排岐是自然语言处理中最关键也是最困难的问题之一,至今仍没有得到完全有效的解决。在研究HNC表达汉语知识的基础上,提出了一种基于概念关联式的汉语词义消歧方法,用于处理汉语的歧义字段。该方法综合了词语概念的层次性、网络性、... 词义排岐是自然语言处理中最关键也是最困难的问题之一,至今仍没有得到完全有效的解决。在研究HNC表达汉语知识的基础上,提出了一种基于概念关联式的汉语词义消歧方法,用于处理汉语的歧义字段。该方法综合了词语概念的层次性、网络性、结构性特征,用一种统一的表示式来规范这类特征,解决了多个不同概念之间的知识关联表示问题。实验对20个汉语高频多义词进行了测试,平均正确率为94%,验证了该方法的有效性。 展开更多
关键词 词义消岐 概念关联式 HNC理论
下载PDF
利用BP神经网络的中文词义消歧模型 被引量:1
17
作者 何婷婷 谢芳 《华中师范大学学报(自然科学版)》 CAS CSCD 2005年第4期470-474,共5页
词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节.本文介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,详细讲解了BP神经网络原理;对使用这种混合人工智能的消歧模型的可能性和... 词义消歧在自然语言处理中一直是一个难点问题,同时,也是很多领域都需要解决的一个重要环节.本文介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,详细讲解了BP神经网络原理;对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论;通过试验发现实际和预测结果的误差并不随着试验迭代次数而递减,而是实际误差随着次数的增加在零的附近呈现波动状态,即使用很少的迭代次数也可以得到比较好的结果.由此得出,BP神经网络预测模型在词义消歧的中具有良好的应用前景. 展开更多
关键词 词义消歧 基于统计 BP神经网络 语料库
下载PDF
大规模语料中NV搭配对的提取方法研究 被引量:1
18
作者 辛日华 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第6期624-630,共7页
词汇语义知识是自然语言处理(NLP)必须依靠的基础资源,NLP所涉及到的诸多问题中,多义词的识别与消歧是一个焦点环节.而词语之间的搭配知识是支持词义排歧的基础资源.词语搭配作为描述词间组合能力的一种重要的词汇知识,在自然语言处理... 词汇语义知识是自然语言处理(NLP)必须依靠的基础资源,NLP所涉及到的诸多问题中,多义词的识别与消歧是一个焦点环节.而词语之间的搭配知识是支持词义排歧的基础资源.词语搭配作为描述词间组合能力的一种重要的词汇知识,在自然语言处理中具有重要作用,也是语义学研究中的基础性课题.动词在汉语信息处理中是句子的核心,是计算机对汉语进行分析和处理的基础.研究在大规模语料库中进行名词(Noun)和动词(Verb)搭配对的提取方法,即建立一个包含名词词义、名词、名词对应的动词及动词相应的词义等内容的数据库,以供词义排歧使用. 展开更多
关键词 词义知识 语料库 NV搭配对 词义排歧
下载PDF
面向统计词义消歧的核选择研究进展 被引量:1
19
作者 钟莉云 汪廷华 陈峻婷 《赣南师范学院学报》 2015年第6期17-22,共6页
词义消歧解决自然语言中同形异义词语在不同上下文环境中的义项标注问题,是自然语言处理领域的基础性关键问题.核方法是机器学习中一类强有力的统计学习技术,被广泛应用于分类、回归、聚类等诸多领域.基于核方法的词义消歧的关键是如何... 词义消歧解决自然语言中同形异义词语在不同上下文环境中的义项标注问题,是自然语言处理领域的基础性关键问题.核方法是机器学习中一类强有力的统计学习技术,被广泛应用于分类、回归、聚类等诸多领域.基于核方法的词义消歧的关键是如何构造一个能够充分表达待消歧词上下文信息的核函数.在介绍基于核方法的词义消歧系统的一般框架之后,系统阐述了国内外面向统计词义消歧的核函数构造与选择的研究现状及进展,重点分析了研究中存在的问题及解决方法,最后探讨了未来研究的重点与可能的发展方向. 展开更多
关键词 词义消歧 核函数 核方法 自然语言处理 分类
下载PDF
一种基于全局领域和短期记忆因子的图模型
20
作者 邵玉涵 李培培 胡学钢 《计算机工程与科学》 CSCD 北大核心 2019年第10期1829-1836,共8页
词义消歧是一项具有挑战性的自然语言处理难题。作为词义消歧中的一种优秀的半监督消歧算法,遗传蚁群词义消歧算法能快速进行全文词义消歧。该算法采用了一种局部上下文的图模型来表示语义关系,以此进行词义消歧。然而,在消歧过程中却... 词义消歧是一项具有挑战性的自然语言处理难题。作为词义消歧中的一种优秀的半监督消歧算法,遗传蚁群词义消歧算法能快速进行全文词义消歧。该算法采用了一种局部上下文的图模型来表示语义关系,以此进行词义消歧。然而,在消歧过程中却丢失了全局语义信息,出现了消歧结果冲突的问题,导致算法精度降低。因此,提出了一种基于全局领域和短期记忆因子改进的图模型来表示语义以解决这个问题。该图模型引入了全局领域信息,增强了图对全局语义信息的处理能力。同时根据人的短期记忆原理,在模型中引入了短期记忆因子,增强了语义间的线性关系,避免了消歧结果冲突对词义消歧的影响。大量实验结果表明:与经典词义消歧算法相比,所提的改进图模型提高了词义消歧的精度。 展开更多
关键词 词义消歧 半监督消歧方法 短期记忆模型 全局领域信息
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部