期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
平行语料库中双语术语词典的自动抽取
被引量:
30
1
作者
孙乐
金友兵
+1 位作者
杜林
孙玉芳
《中文信息学报》
CSCD
北大核心
2000年第6期33-39,共7页
本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐 ,并对英文语料和中文语料分别进行词性标注和切分与词性标注。统计已对齐和标注的双语语料中的名词和名词...
本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐 ,并对英文语料和中文语料分别进行词性标注和切分与词性标注。统计已对齐和标注的双语语料中的名词和名词短语生成候选术语集。然后对每个英文候选术语计算与其相关的中文翻译之间的翻译概率。最后通过设定随词频变化的阈值来选取中文翻译。
展开更多
关键词
术语抽取
翻译概率
英汉平行语料库
术语词典
下载PDF
职称材料
基于双语语料库的翻译等价对自动抽取
被引量:
8
2
作者
吕雅娟
李生
+1 位作者
赵铁军
杨沐昀
《高技术通讯》
EI
CAS
CSCD
2003年第5期19-24,共6页
提出了一种利用双语语料库自动抽取多词翻译等价对的方法。首先利用N-gram模型获得候选翻译单元,然后根据统计同现计算候选等价对的翻译概率,并用贪心策略实现翻译等价对的自动抽取。在翻译概率的计算中对3种常用的统计同现测度进行了...
提出了一种利用双语语料库自动抽取多词翻译等价对的方法。首先利用N-gram模型获得候选翻译单元,然后根据统计同现计算候选等价对的翻译概率,并用贪心策略实现翻译等价对的自动抽取。在翻译概率的计算中对3种常用的统计同现测度进行了比较。实验表明,当语料规模较小时,对数似然比(Log Likelihood Ratio)测度对于翻译等价对的抽取具有较好的效果。与现有方法相比,该方法较好地解决了翻译等价对抽取中多词单元对应及间接相关问题。
展开更多
关键词
双语语料库
自动抽取
N-GRAM模型
翻译概率
计算机
知识获取
候选翻译单元
下载PDF
职称材料
基于平行语料和翻译概率的多语种词对齐方法
被引量:
5
3
作者
杨飞扬
赵亚慧
+1 位作者
崔荣一
易志伟
《中文信息学报》
CSCD
北大核心
2019年第12期37-44,共8页
为了实现多语种词对齐,该文提出一种以点互信息为基础的翻译概率作为改进的多语种单词关联强度度量方法。首先,论证了在服从Zipf定律的普通频级词区域,单词间关联强度的点互信息度量法可简化为翻译概率;其次,对汉语、英语、朝鲜语平行...
为了实现多语种词对齐,该文提出一种以点互信息为基础的翻译概率作为改进的多语种单词关联强度度量方法。首先,论证了在服从Zipf定律的普通频级词区域,单词间关联强度的点互信息度量法可简化为翻译概率;其次,对汉语、英语、朝鲜语平行语料进行句子对齐、分词和去停用词等预处理后计算平行语料单词之间的翻译概率,取翻译概率最高的前k个词作为候选翻译词,并通过优化处理提高了词对齐准确率。实验结果表明,该方法可以不完全依赖语料规模,在小规模语料中取得94%以上的准确率,为跨语言小众文献及低资源语言词对齐提供了技术基础。
展开更多
关键词
词对齐
平行语料
翻译概率
Zipf定律
下载PDF
职称材料
基于英汉平行语料库术语词典的自动抽取
被引量:
5
4
作者
梁铭
《电脑知识与技术》
2009年第7期5081-5083,共3页
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性标注工具对英文语料和中文语料分辨进行词性标注。统计双语语料库中的名词和名词短语生成候选术集。然...
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性标注工具对英文语料和中文语料分辨进行词性标注。统计双语语料库中的名词和名词短语生成候选术集。然后对每个英文候选术语计算与其相关的中文翻译间的翻译概率。再通过设定阈值过滤掉一些与该英文候选词无关的中文翻译,最后通过贪心算法选取概率最大的词作为该英文候选词的中文翻译。
展开更多
关键词
术语抽取
平行语料
句子对齐
翻译概率
下载PDF
职称材料
基于网络搜索的英汉人名翻译
5
作者
刘颖
曹项
《中文信息学报》
CSCD
北大核心
2017年第2期49-54,共6页
该文利用搜索引擎从网络中挖掘英语人名的中文翻译。该方法综合利用翻译辅助词、英中人名共现规则、音译相似度和翻译概率。首先,利用搜索引擎从互联网上搜索英文人名的中文翻译候选。把汉语人名标注结果、翻译辅助词、英中人名共现规...
该文利用搜索引擎从网络中挖掘英语人名的中文翻译。该方法综合利用翻译辅助词、英中人名共现规则、音译相似度和翻译概率。首先,利用搜索引擎从互联网上搜索英文人名的中文翻译候选。把汉语人名标注结果、翻译辅助词、英中人名共现规则和英文人名的发音音节长度结合起来提取翻译候选词。翻译辅助词有助于搜索与英文人名更相关的信息,英中人名共现规则和发音音节长度进一步缩小英文人名的翻译范围,使得英文人名的翻译搜索符合人名共现规律和发音规律。然后,根据音译相似度和翻译概率对候选词进行排序。人名翻译的绝大部分是根据发音翻译过来的,音译相似度是帮助判断两个词在发音上的相似性。翻译概率从统计上判断两个词互为翻译的可能性。实验结果表明,翻译辅助词、规则、音译相似度和翻译概率都有助于提高人名翻译的正确率。
展开更多
关键词
人名翻译
音译相似度
规则
翻译概率
下载PDF
职称材料
融合词汇翻译概率的汉越神经机器翻译方法
被引量:
12
6
作者
王卓
余正涛
+2 位作者
文永华
高盛祥
吴飞
《昆明理工大学学报(自然科学版)》
CAS
北大核心
2019年第1期54-60,共7页
神经机器翻译通过序列到序列的学习对翻译任务进行建模,目前使用注意力机制的神经机器翻译方法在多种语言对上都取得了很好的效果,但是在训练数据比较小的情况下(如汉语-越南语)神经机器翻译模型的性能并不理想.此外如何将统计机器翻译...
神经机器翻译通过序列到序列的学习对翻译任务进行建模,目前使用注意力机制的神经机器翻译方法在多种语言对上都取得了很好的效果,但是在训练数据比较小的情况下(如汉语-越南语)神经机器翻译模型的性能并不理想.此外如何将统计机器翻译与神经机器翻译进行融合也是一个值得研究的问题.本文分析了记忆网络和神经机器翻译的特点,利用记忆网络对词汇翻译概率进行存储,将词汇翻译概率转化为向量表示,并与神经机器翻译模型进行融合,提出基于记忆网络融合词汇翻译概率的方法,并据此对神经机器翻译的解码进行指导.实验表明记忆网络是一种可行的翻译知识融合方式,并且在神经机器翻译模型中融入词汇翻译概率可以一定程度上解决训练数据小时模型训练不充分的问题.
展开更多
关键词
神经机器翻译
汉语-越南语
翻译知识融合
词汇翻译概率
原文传递
一种考虑对齐不一致的短语翻译概率估计方法
7
作者
苏劲松
刘群
吕雅娟
《中文信息学报》
CSCD
北大核心
2011年第3期118-122,共5页
在统计机器翻译中,短语翻译概率特征对最终的翻译结果有着重大的影响。传统的估计方法只考虑了双语短语同时出现,满足对齐一致性的情况,而没有对其他情况进行统计,因而短语翻译概率的估计不够准确。该文中,我们修改了传统的短语概率计...
在统计机器翻译中,短语翻译概率特征对最终的翻译结果有着重大的影响。传统的估计方法只考虑了双语短语同时出现,满足对齐一致性的情况,而没有对其他情况进行统计,因而短语翻译概率的估计不够准确。该文中,我们修改了传统的短语概率计算公式,在估计概率的过程中充分地考虑短语的各种出现情况。多个测试集上的实验结果证明了我们方法的有效性。
展开更多
关键词
统计机器翻译
对齐不一致
短语翻译概率
下载PDF
职称材料
题名
平行语料库中双语术语词典的自动抽取
被引量:
30
1
作者
孙乐
金友兵
杜林
孙玉芳
机构
中国科学院软件研究所中文信息处理中心
出处
《中文信息学报》
CSCD
北大核心
2000年第6期33-39,共7页
基金
国家青年自然科学基金!(6 99830 0 9)
文摘
本文提出了一种从英汉平行语料库中自动抽取术语词典的算法。首先采用基于字符长度的改进的统计方法对平行语料进行句子级的对齐 ,并对英文语料和中文语料分别进行词性标注和切分与词性标注。统计已对齐和标注的双语语料中的名词和名词短语生成候选术语集。然后对每个英文候选术语计算与其相关的中文翻译之间的翻译概率。最后通过设定随词频变化的阈值来选取中文翻译。
关键词
术语抽取
翻译概率
英汉平行语料库
术语词典
Keywords
term extraction
parallel corpora
sentence alignment
translation probability
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于双语语料库的翻译等价对自动抽取
被引量:
8
2
作者
吕雅娟
李生
赵铁军
杨沐昀
机构
哈尔滨工业大学计算机科学与技术学院
出处
《高技术通讯》
EI
CAS
CSCD
2003年第5期19-24,共6页
基金
863计划(2001AA114101)资助项目。
文摘
提出了一种利用双语语料库自动抽取多词翻译等价对的方法。首先利用N-gram模型获得候选翻译单元,然后根据统计同现计算候选等价对的翻译概率,并用贪心策略实现翻译等价对的自动抽取。在翻译概率的计算中对3种常用的统计同现测度进行了比较。实验表明,当语料规模较小时,对数似然比(Log Likelihood Ratio)测度对于翻译等价对的抽取具有较好的效果。与现有方法相比,该方法较好地解决了翻译等价对抽取中多词单元对应及间接相关问题。
关键词
双语语料库
自动抽取
N-GRAM模型
翻译概率
计算机
知识获取
候选翻译单元
Keywords
Bilingual corpora, Translational equivalence, N-gram, Knowledge acquisition
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于平行语料和翻译概率的多语种词对齐方法
被引量:
5
3
作者
杨飞扬
赵亚慧
崔荣一
易志伟
机构
延边大学计算机科学与技术学院智能信息处理研究室
出处
《中文信息学报》
CSCD
北大核心
2019年第12期37-44,共8页
基金
国家语委“十三五”科研规划项目(YB135-76)
延边大学外国语言文学世界一流学科建设科研项目(18YLPY13,18YLPY14)
文摘
为了实现多语种词对齐,该文提出一种以点互信息为基础的翻译概率作为改进的多语种单词关联强度度量方法。首先,论证了在服从Zipf定律的普通频级词区域,单词间关联强度的点互信息度量法可简化为翻译概率;其次,对汉语、英语、朝鲜语平行语料进行句子对齐、分词和去停用词等预处理后计算平行语料单词之间的翻译概率,取翻译概率最高的前k个词作为候选翻译词,并通过优化处理提高了词对齐准确率。实验结果表明,该方法可以不完全依赖语料规模,在小规模语料中取得94%以上的准确率,为跨语言小众文献及低资源语言词对齐提供了技术基础。
关键词
词对齐
平行语料
翻译概率
Zipf定律
Keywords
word alignment
parallel corpus
translation probability
Zipf’s law
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于英汉平行语料库术语词典的自动抽取
被引量:
5
4
作者
梁铭
机构
苏州大学计算机科学与技术学院
苏州工业园区职业技术学院
出处
《电脑知识与技术》
2009年第7期5081-5083,共3页
文摘
该文提出了一种从英汉平行语料库中自动抽取术语词典的算法。采用的是已对齐好的双语语料,中文经过了分词处理。利用英文和中文词性标注工具对英文语料和中文语料分辨进行词性标注。统计双语语料库中的名词和名词短语生成候选术集。然后对每个英文候选术语计算与其相关的中文翻译间的翻译概率。再通过设定阈值过滤掉一些与该英文候选词无关的中文翻译,最后通过贪心算法选取概率最大的词作为该英文候选词的中文翻译。
关键词
术语抽取
平行语料
句子对齐
翻译概率
Keywords
term extraction
parallel corpora
sentence alignment
translation probability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于网络搜索的英汉人名翻译
5
作者
刘颖
曹项
机构
清华大学中文系
出处
《中文信息学报》
CSCD
北大核心
2017年第2期49-54,共6页
基金
国家自然科学基金(61171114)
北京市社科基金(16YYB021)
清华大学人文社科振兴基金(20145081042)
文摘
该文利用搜索引擎从网络中挖掘英语人名的中文翻译。该方法综合利用翻译辅助词、英中人名共现规则、音译相似度和翻译概率。首先,利用搜索引擎从互联网上搜索英文人名的中文翻译候选。把汉语人名标注结果、翻译辅助词、英中人名共现规则和英文人名的发音音节长度结合起来提取翻译候选词。翻译辅助词有助于搜索与英文人名更相关的信息,英中人名共现规则和发音音节长度进一步缩小英文人名的翻译范围,使得英文人名的翻译搜索符合人名共现规律和发音规律。然后,根据音译相似度和翻译概率对候选词进行排序。人名翻译的绝大部分是根据发音翻译过来的,音译相似度是帮助判断两个词在发音上的相似性。翻译概率从统计上判断两个词互为翻译的可能性。实验结果表明,翻译辅助词、规则、音译相似度和翻译概率都有助于提高人名翻译的正确率。
关键词
人名翻译
音译相似度
规则
翻译概率
Keywords
name translation
transliteration similarity
rule
translation probability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合词汇翻译概率的汉越神经机器翻译方法
被引量:
12
6
作者
王卓
余正涛
文永华
高盛祥
吴飞
机构
昆明理工大学信息工程与自动化学院
出处
《昆明理工大学学报(自然科学版)》
CAS
北大核心
2019年第1期54-60,共7页
基金
国家自然科学基金面上项目(61672271)
国家自然科学基金重点项目(61732005)
文摘
神经机器翻译通过序列到序列的学习对翻译任务进行建模,目前使用注意力机制的神经机器翻译方法在多种语言对上都取得了很好的效果,但是在训练数据比较小的情况下(如汉语-越南语)神经机器翻译模型的性能并不理想.此外如何将统计机器翻译与神经机器翻译进行融合也是一个值得研究的问题.本文分析了记忆网络和神经机器翻译的特点,利用记忆网络对词汇翻译概率进行存储,将词汇翻译概率转化为向量表示,并与神经机器翻译模型进行融合,提出基于记忆网络融合词汇翻译概率的方法,并据此对神经机器翻译的解码进行指导.实验表明记忆网络是一种可行的翻译知识融合方式,并且在神经机器翻译模型中融入词汇翻译概率可以一定程度上解决训练数据小时模型训练不充分的问题.
关键词
神经机器翻译
汉语-越南语
翻译知识融合
词汇翻译概率
Keywords
Neural Machine Translation
Chinese-Vietnamese
translation knowledge integration
lexicon probability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
一种考虑对齐不一致的短语翻译概率估计方法
7
作者
苏劲松
刘群
吕雅娟
机构
中国科学院计算技术研究所智能信息处理重点实验室
中国科学院研究生院
出处
《中文信息学报》
CSCD
北大核心
2011年第3期118-122,共5页
基金
国家自然科学基金重点资助项目(60736014
60873167)
文摘
在统计机器翻译中,短语翻译概率特征对最终的翻译结果有着重大的影响。传统的估计方法只考虑了双语短语同时出现,满足对齐一致性的情况,而没有对其他情况进行统计,因而短语翻译概率的估计不够准确。该文中,我们修改了传统的短语概率计算公式,在估计概率的过程中充分地考虑短语的各种出现情况。多个测试集上的实验结果证明了我们方法的有效性。
关键词
统计机器翻译
对齐不一致
短语翻译概率
Keywords
statistical machine translation
alignment unconsistency
phrase translation probability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
平行语料库中双语术语词典的自动抽取
孙乐
金友兵
杜林
孙玉芳
《中文信息学报》
CSCD
北大核心
2000
30
下载PDF
职称材料
2
基于双语语料库的翻译等价对自动抽取
吕雅娟
李生
赵铁军
杨沐昀
《高技术通讯》
EI
CAS
CSCD
2003
8
下载PDF
职称材料
3
基于平行语料和翻译概率的多语种词对齐方法
杨飞扬
赵亚慧
崔荣一
易志伟
《中文信息学报》
CSCD
北大核心
2019
5
下载PDF
职称材料
4
基于英汉平行语料库术语词典的自动抽取
梁铭
《电脑知识与技术》
2009
5
下载PDF
职称材料
5
基于网络搜索的英汉人名翻译
刘颖
曹项
《中文信息学报》
CSCD
北大核心
2017
0
下载PDF
职称材料
6
融合词汇翻译概率的汉越神经机器翻译方法
王卓
余正涛
文永华
高盛祥
吴飞
《昆明理工大学学报(自然科学版)》
CAS
北大核心
2019
12
原文传递
7
一种考虑对齐不一致的短语翻译概率估计方法
苏劲松
刘群
吕雅娟
《中文信息学报》
CSCD
北大核心
2011
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部