期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
重新审视跨语言信息检索 被引量:10
1
作者 闵金明 孙乐 张俊林 《中文信息学报》 CSCD 北大核心 2006年第4期33-40,共8页
阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题,而跨语言信息检索是解决这个问题的有效方法之一。本文从定义跨语言信息检索系统开始,给出了一个标准的跨语言信息检索系统框架和评价方法,对主流研究方法进行了重新审视... 阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题,而跨语言信息检索是解决这个问题的有效方法之一。本文从定义跨语言信息检索系统开始,给出了一个标准的跨语言信息检索系统框架和评价方法,对主流研究方法进行了重新审视,进一步明确指出了跨语言信息检索中必须解决的核心问题,最后通过分析研究现状给出了未来可能的重点研究方向。 展开更多
关键词 计算机应用 中文信息处理 跨语言信息检索 未登录词 词义消歧 多语言信息检索
下载PDF
基于信息增益改进贝叶斯模型的汉语词义消歧 被引量:8
2
作者 范冬梅 卢志茂 +1 位作者 张汝波 潘树燊 《电子与信息学报》 EI CSCD 北大核心 2008年第12期2926-2929,共4页
词义消歧一直是自然语言处理领域的关键问题和难点之一。通常把词义消歧作为模式分类问题进行研究,其中特征选择是一个重要的环节。该文根据贝叶斯假设提出基于信息增益的特征选择方法,并以此改进贝叶斯模型。通过信息增益计算,挖掘上... 词义消歧一直是自然语言处理领域的关键问题和难点之一。通常把词义消歧作为模式分类问题进行研究,其中特征选择是一个重要的环节。该文根据贝叶斯假设提出基于信息增益的特征选择方法,并以此改进贝叶斯模型。通过信息增益计算,挖掘上下文中词语的位置信息,提高贝叶斯模型知识获取的效率,从而改善词义分类效果。该文在8个歧义词上进行了实验,结果发现改进后的贝叶斯模型在消歧正确率上比改进前平均提高了3.5个百分点,改进幅度较大,效果突出,证明了该方法的有效性。 展开更多
关键词 词义消歧 自然语言处理 信息增益 贝叶斯模型
下载PDF
基于WordNet词义消歧的语义检索研究 被引量:8
3
作者 高雪霞 炎士涛 《湘潭大学自然科学学报》 北大核心 2017年第2期118-121,共4页
针对有监督和基于知识库的词义消歧问题,提出了一种新的基于Jaccard系数的词义消歧算法,以解决词义错误配对问题.利用WordNet知识库中的知识源表示歧义词的词义信息并生成词义资源库,结合提出的基于Jaccard系数词义消歧算法完成信息检索... 针对有监督和基于知识库的词义消歧问题,提出了一种新的基于Jaccard系数的词义消歧算法,以解决词义错误配对问题.利用WordNet知识库中的知识源表示歧义词的词义信息并生成词义资源库,结合提出的基于Jaccard系数词义消歧算法完成信息检索.试验测试结果显示,通过新的词义消歧算法,信息检索系统精确度比传统信息检索系统提高10%. 展开更多
关键词 词义消歧 信息检索 Jaccard系数 wordNET 查准率 查全率
下载PDF
基于多阶段匹配的语义Web服务发现框架 被引量:8
4
作者 杨永齐 符云清 余伟 《计算机科学》 CSCD 北大核心 2010年第9期164-167,共4页
随着Web服务的高速发展和广泛应用,如何在众多的Web服务中找出用户所需要的Web服务成为了一个关键的问题。在语义Web服务研究的基础上,提出了一种新的多阶段匹配的语义Web服务发现框架,将整个发现过程分为服务类别、服务功能、服务名称... 随着Web服务的高速发展和广泛应用,如何在众多的Web服务中找出用户所需要的Web服务成为了一个关键的问题。在语义Web服务研究的基础上,提出了一种新的多阶段匹配的语义Web服务发现框架,将整个发现过程分为服务类别、服务功能、服务名称和服务文本语句匹配4个阶段,并在服务功能匹配阶段针对本体库中概念间的密度问题,提出了基于信息量的改进GCSM算法,在服务名称和服务文本语句匹配阶段,针对中文多义词的问题提出了基于实例搭配和基本义原的消歧策略。最后,实验证明提出的发现框架具有较好的可行性和有效性。 展开更多
关键词 语义WEB服务 服务发现 词义消歧 本体 信息量
下载PDF
基于词义消歧的语义查询扩展研究 被引量:3
5
作者 罗俊丽 李慧娜 路凯 《微电子学与计算机》 CSCD 北大核心 2012年第1期71-75,共5页
为了解决传统查询扩展时查准率低下的问题,基于词义消歧技术提出一种综合扩展语义树和词频共现率的语义查询扩展方法.针对查询词歧义所带来的查询主题漂移现象,利用WordNet知识源及其领域信息进行查询词义消歧,进而根据WordNet的层次结... 为了解决传统查询扩展时查准率低下的问题,基于词义消歧技术提出一种综合扩展语义树和词频共现率的语义查询扩展方法.针对查询词歧义所带来的查询主题漂移现象,利用WordNet知识源及其领域信息进行查询词义消歧,进而根据WordNet的层次结构生成扩展语义树,产生候选扩展词,并根据待扩展词与用户查询的整体最大相关性原则最终确定扩展词及其权重,使得扩展词能够充分表达用户查询请求,提高查询匹配准确率.实验表明,该方法在保证查全率的同时获得了较高的查准率. 展开更多
关键词 词义消歧 信息检索 语义扩展 wordNET
下载PDF
基于中文维基百科的命名实体消歧方法 被引量:3
6
作者 杜婧君 陆蓓 谌志群 《杭州电子科技大学学报(自然科学版)》 2012年第6期57-60,共4页
该文提出一种面向中文命名实体的统计消歧方法。该方法采用中文维基百科作为世界知识,同时以待消歧命名实体在维基百科中的消歧页包含的词义选项为候选的命名实体概念,在充分利用维基百科页面信息和链接信息,以及命名实体上下文信息的... 该文提出一种面向中文命名实体的统计消歧方法。该方法采用中文维基百科作为世界知识,同时以待消歧命名实体在维基百科中的消歧页包含的词义选项为候选的命名实体概念,在充分利用维基百科页面信息和链接信息,以及命名实体上下文信息的基础上,实现中文命名实体的消歧。在一个小规模测试集上进行了实验,并获得87.5%的准确率,表明提出的方法具有可行性和有效性。 展开更多
关键词 命名实体消歧 词义消歧 中文维基百科 中文信息处理
下载PDF
结合语义知识的汉语词义消歧 被引量:2
7
作者 张春祥 邓龙 +1 位作者 高雪瑶 卢志茂 《计算机工程与应用》 CSCD 北大核心 2016年第3期119-122,共4页
词义消歧一直是自然语言处理领域中的关键性问题。为了提高词义消歧的准确率,从目标歧义词汇出发,挖掘左右词单元的语义知识。以贝叶斯模型为基础,结合左右词单元的语义信息,提出了一种新的词义消歧方法。以Sem Eval-2007:Task#5作为训... 词义消歧一直是自然语言处理领域中的关键性问题。为了提高词义消歧的准确率,从目标歧义词汇出发,挖掘左右词单元的语义知识。以贝叶斯模型为基础,结合左右词单元的语义信息,提出了一种新的词义消歧方法。以Sem Eval-2007:Task#5作为训练语料和测试语料,对词义消歧分类器进行优化,并对优化后的分类器进行测试。实验结果表明:词义消歧的准确率有所提高。 展开更多
关键词 词义消歧 歧义词汇 贝叶斯模型 语义信息
下载PDF
汉语框架网中未登录词元的框架选择 被引量:2
8
作者 陈学丽 李茹 +1 位作者 王赛 王智强 《中文信息学报》 CSCD 北大核心 2014年第3期48-54,61,共8页
汉语框架网的低覆盖率导致汉语句子中存在许多未登录的词元,严重制约着汉语的框架语义分析任务。针对未登录词元的框架识别问题,该文借助同义词词林的词义信息,提出基于平均语义相似度计算及最大熵模型两种方法,采用静态特征与动态特征... 汉语框架网的低覆盖率导致汉语句子中存在许多未登录的词元,严重制约着汉语的框架语义分析任务。针对未登录词元的框架识别问题,该文借助同义词词林的词义信息,提出基于平均语义相似度计算及最大熵模型两种方法,采用静态特征与动态特征相结合的特征选择方法。实验证明,这两种方法都能有效地实现未登录词元的框架选择,基于相似度计算的方法(TOP-4)获得78.61%的准确率;基于最大熵的方法结果可达87.29%,同时在新闻语料上达到了75%的准确率。 展开更多
关键词 汉语框架网 未登录词元 词义信息
下载PDF
Chinese word sense disambiguation based on neural networks
9
作者 刘挺 卢志茂 +1 位作者 郎君 李生 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2005年第4期408-414,共7页
The input of a network is the key problem for Chinese word sense disambiguation utilizing the neural network. This paper presents an input model of the neural network that calculates the mutual information between con... The input of a network is the key problem for Chinese word sense disambiguation utilizing the neural network. This paper presents an input model of the neural network that calculates the mutual information between contextual words and the ambiguous word by using statistical methodology and taking the contextual words of a certain number beside the ambiguous word according to (-M,+N).The experiment adopts triple-layer BP Neural Network model and proves how the size of a training set and the value of Mand Naffect the performance of the Neural Network Model. The experimental objects are six pseudowords owning three word-senses constructed according to certain principles. The tested accuracy of our approach on a closed-corpus reaches 90.31%, and 89.62% on an open-corpus. The experiment proves that the Neural Network Model has a good performance on Word Sense Disambiguation. 展开更多
关键词 word sense disambiguation artificial neural network mutual information pseudowords
下载PDF
句法信息指导的汉语词义消歧
10
作者 张春祥 栾博 +1 位作者 高雪瑶 卢志茂 《计算机工程与应用》 CSCD 北大核心 2015年第5期142-145,共4页
词义消歧要解决如何让计算机理解多义词在上下文中的具体含义,对信息检索、机器翻译、文本分类和自动文摘等自然语言处理问题有着十分重要的作用。通过引入句法信息,提出了一种新的词义消歧方法。构造歧义词汇上下文的句法树,提取句法... 词义消歧要解决如何让计算机理解多义词在上下文中的具体含义,对信息检索、机器翻译、文本分类和自动文摘等自然语言处理问题有着十分重要的作用。通过引入句法信息,提出了一种新的词义消歧方法。构造歧义词汇上下文的句法树,提取句法信息、词性信息和词形信息作为消歧特征。利用贝叶斯模型来建立词义消歧分类器,并将其应用到测试数据集上。实验结果表明:消歧的准确率有所提升,达到了65%。 展开更多
关键词 词义消歧 句法信息 消歧特征 贝叶斯模型
下载PDF
基于领域知识的图模型词义消歧方法 被引量:10
11
作者 鹿文鹏 黄河燕 吴昊 《自动化学报》 EI CSCD 北大核心 2014年第12期2836-2850,共15页
对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation,WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目... 对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation,WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目标歧义词的各个词义获取词义领域标注作为词义领域知识;利用文本领域关联词和句子上下文词构建消歧图,并根据词义领域知识对消歧图进行调整;使用改进的图评分方法对消歧图的各个词义结点的重要度进行评分,选择正确的词义.该方法能有效地将领域知识整合到图模型中,在Koeling数据集上,取得了同类研究的最佳消歧效果.本文亦对多种图模型评分方法做了改进,进行了详细的对比实验研究. 展开更多
关键词 词义消歧 领域知识 图模型 词义领域 文本领域
下载PDF
基于句法分析的汉语词义消歧 被引量:3
12
作者 张春祥 栾博 +1 位作者 高雪瑶 卢志茂 《计算机应用研究》 CSCD 北大核心 2014年第1期40-42,共3页
为了提高词义消歧的质量,对歧义词汇的上下文进行结构分析,提出了一种利用句法知识来指导消歧过程的方法。在歧义词汇上下文的句法树中,提取句法信息和词性信息作为消歧特征;同时,使用朴素贝叶斯模型作为消歧分类器。利用词义标注语料... 为了提高词义消歧的质量,对歧义词汇的上下文进行结构分析,提出了一种利用句法知识来指导消歧过程的方法。在歧义词汇上下文的句法树中,提取句法信息和词性信息作为消歧特征;同时,使用朴素贝叶斯模型作为消歧分类器。利用词义标注语料对分类器的参数进行优化,然后对测试数据中的歧义词汇进行消歧。实验结果表明,消歧的准确率有所提升,达到了66.7%。 展开更多
关键词 词义消歧 句法信息 词性 消歧分类器
下载PDF
一种基于全局领域和短期记忆因子的图模型
13
作者 邵玉涵 李培培 胡学钢 《计算机工程与科学》 CSCD 北大核心 2019年第10期1829-1836,共8页
词义消歧是一项具有挑战性的自然语言处理难题。作为词义消歧中的一种优秀的半监督消歧算法,遗传蚁群词义消歧算法能快速进行全文词义消歧。该算法采用了一种局部上下文的图模型来表示语义关系,以此进行词义消歧。然而,在消歧过程中却... 词义消歧是一项具有挑战性的自然语言处理难题。作为词义消歧中的一种优秀的半监督消歧算法,遗传蚁群词义消歧算法能快速进行全文词义消歧。该算法采用了一种局部上下文的图模型来表示语义关系,以此进行词义消歧。然而,在消歧过程中却丢失了全局语义信息,出现了消歧结果冲突的问题,导致算法精度降低。因此,提出了一种基于全局领域和短期记忆因子改进的图模型来表示语义以解决这个问题。该图模型引入了全局领域信息,增强了图对全局语义信息的处理能力。同时根据人的短期记忆原理,在模型中引入了短期记忆因子,增强了语义间的线性关系,避免了消歧结果冲突对词义消歧的影响。大量实验结果表明:与经典词义消歧算法相比,所提的改进图模型提高了词义消歧的精度。 展开更多
关键词 词义消歧 半监督消歧方法 短期记忆模型 全局领域信息
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部