期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
从单语词典中获取定义原语的一种方法 被引量:6
1
作者 张津 黄昌宁 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 1997年第3期28-33,共6页
语义原语是词汇语义学研究中的一个重要概念,但在计算语言学中对它的研究尚未全面展开。文中主要讨论了从单语词典中获取定义原语的方法。对词典建立了数学模型,将获取定义原语的问题转化为图论中的一个问题。对这个问题进行了分析求... 语义原语是词汇语义学研究中的一个重要概念,但在计算语言学中对它的研究尚未全面展开。文中主要讨论了从单语词典中获取定义原语的方法。对词典建立了数学模型,将获取定义原语的问题转化为图论中的一个问题。对这个问题进行了分析求解,指出了问题的计算复杂程度,并且给出了简化问题的算法以及求解问题的两种启发式方法。该方法是一种适合于所有单语词典的一般方法。 展开更多
关键词 计算语言学 语义原语 定义原语 单语词典
原文传递
一种基于贝叶斯分类与机读词典的多义词排歧方法 被引量:5
2
作者 谈文蓉 符红光 +1 位作者 刘莉 杨宪泽 《计算机应用》 CSCD 北大核心 2006年第6期1389-1391,1395,共4页
一词多义是自然语言中普遍存在的现象,词义排歧的成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标。提出了一种基于贝叶斯分类与机读词典的多义词排歧方法,通过小规模语料库的训练和歧义词在机读词典中的语... 一词多义是自然语言中普遍存在的现象,词义排歧的成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标。提出了一种基于贝叶斯分类与机读词典的多义词排歧方法,通过小规模语料库的训练和歧义词在机读词典中的语义定义来完成歧义的消除。实验表明:基于贝叶斯分类与机读词典的多义词排歧算法在标注语料库规模受限的情况下,能取得较高的排歧准确率。 展开更多
关键词 词义排歧 语料库 机读词典 自然语言处理
下载PDF
以词汇知识驱动的词网自动对映 被引量:1
3
作者 柯淑津 《中文信息学报》 CSCD 北大核心 2002年第4期32-38,共7页
机读字典蕴藏着非常丰富的词汇语意知识 ,这些知识可由自动化方式粹取出来 ,有效地利用在各种自然语言处理相关研究上。本研究提出一套方法 ,以英文版的WordNet作为基本骨架 ,结合比对属类词与比对定义内容两种技巧 ,将WordNet同义词集... 机读字典蕴藏着非常丰富的词汇语意知识 ,这些知识可由自动化方式粹取出来 ,有效地利用在各种自然语言处理相关研究上。本研究提出一套方法 ,以英文版的WordNet作为基本骨架 ,结合比对属类词与比对定义内容两种技巧 ,将WordNet同义词集对映到朗文当代英汉双语词典之词条。并藉由这个对映将Word Net同义词集冠上中文翻译词汇。在实验部分 ,我们依岐义程度将词汇分为单一语意与语意岐义两部分进行。在单一语意部分的实验结果 ,以 10 0 %的涵盖率计算 ,可获得 97 7%的精准率。而在语意岐义部分 ,我们得到 85 4 %精准率 ,以及 6 3 4 %涵盖率的实验结果。 展开更多
关键词 词汇知识 词汇网络 机读字典 统计处理 属类词 自动对映 自然语言处理
下载PDF
基于平行语料的查询翻译词典改进方法研究 被引量:2
4
作者 高影繁 徐红姣 王惠临 《图书情报工作》 CSSCI 北大核心 2011年第20期126-128,114,共4页
面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有... 面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有的一部包含若干科技词汇和短语的双语科技词典的基础上,着重研究如何引入平行语料来改进已有的双语词典问题。目标是生成一部基于句对齐平行语料的科技类双语概率词典,为跨语言检索查询翻译消歧提供实时性支持。 展开更多
关键词 查询翻译 机读词典 句对齐平行语料
原文传递
基于机器可读词典的词汇知识抽取
5
作者 樊玉俊 胡熠 陆汝占 《计算机应用与软件》 CSCD 北大核心 2008年第6期8-10,共3页
越来越多的实践证明,词汇知识将是未来自然语言处理系统中不可或缺的组成部分。利用机器可读词典作为资源,首先通过对释义项进行分类,然后基于释义分析自动生成用于抽取词汇知识的模板,然后采用模板匹配的方法,实现词汇知识的自动抽取... 越来越多的实践证明,词汇知识将是未来自然语言处理系统中不可或缺的组成部分。利用机器可读词典作为资源,首先通过对释义项进行分类,然后基于释义分析自动生成用于抽取词汇知识的模板,然后采用模板匹配的方法,实现词汇知识的自动抽取。通过一种基于最大熵模型的有监督的机器学习方法,对结果进行过滤。在应用到《应用汉语词典》中后,取得了良好的抽取效果。 展开更多
关键词 词汇知识 机器可读词典 模板抽取 最大熵
下载PDF
基于双语词典的汉英词语对齐算法研究 被引量:8
6
作者 邓丹 刘群 俞鸿魁 《计算机工程》 EI CAS CSCD 北大核心 2005年第16期45-47,共3页
研究利用多部人读双语词典扩充双语词典的规模来改善词语对齐质量。介绍了一个在Ker算法基础上用双语词典进行汉英词语对齐的算法。提出了对齐窗口的概念,通过在对齐过程中设置对齐窗口,可以找到多对多的词语对应。
关键词 词语对齐 对齐窗口 人读双语词典 机读双语词典
下载PDF
Hash Dictionary Searching Algorithm
7
作者 Tang Jiayi(Department of Computer, Xi’an Institute of Posts and Telecommunications, Xr’an 710061. P. R. China) 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 1995年第2期47-52,共6页
The T-Y codes and T-Z codes of English words and the Hash index tables of a machine-readabledictionary are desigued and their definitions given in this paper. The formulae for calculating the number ofcollisions in a ... The T-Y codes and T-Z codes of English words and the Hash index tables of a machine-readabledictionary are desigued and their definitions given in this paper. The formulae for calculating the number ofcollisions in a Hash index table T and the strategies for handling the collisions are discussed. Demonstrationis given by the analysis of a real machine-readable dictionary with a Hash index table T built in T-Z codes.This algorithm may be used in the study of computational linguistics. 展开更多
关键词 machine-readable dictionary 27 carry digital system hash function
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部