期刊文献+

一种面向汉英口语翻译的双语语块处理方法 被引量:7

Bilingual Chunking for Chinese-English Spoken-language Translation
下载PDF
导出
摘要 基于语块的处理方法是近年来自然语言处理领域兴起的一条新思路。但是 ,要将其应用于口语翻译当中 ,还需按照口语特点对涉及双语的语块概念做出合理界定。本文在已有单语语块定义的基础上 ,根据中、英文差异和口语翻译特性 ,从句法和语义两个层次提出了一种汉英双语语块概念 ,并对其特点进行了分析。同时 ,针对中、英文并行语料库 ,建立了一套计算机自动划分与人工校对相结合的双语语块加工方法。应用该方法 ,对汉英句子级对齐的口语语料进行双语语块划分和对整 ,并以此为基础进行了基于双语语块的口语统计机器翻译实验。结果表明 ,本文提出的双语语块定义符合口语翻译的实际需要 ,使用基于双语语块的语料处理方法 。 Chunking is a useful step for natural language processing.The paper puts forward a definition of bilingual chunks for Chinese-English spoken-language translation,based on both the characteristics of spoken-language and the differences between Chinese and English.Some special features of these chunks are also analyzed.Based on the definition and analysis,a method is proposed to segment the chunks in bilingual corpora.This method includes two steps of the automatic chunking and the manually modification.Using this method we got a chunk-aligned Chinese-English bilingual corpus.A series of chunk-based statistical machine translation experiments are then conducted which shows that the proposed definition and the bi-chunking method can lead to great improvement to the quality of the Chinese-English spoken-language translation.
出处 《中文信息学报》 CSCD 北大核心 2003年第2期21-27,共7页 Journal of Chinese Information Processing
基金 国家"973"项目 (G19980 30 5 0 1A - 0 6 ) 国家自然科学基金重点资助项目 (6 9835 0 0 3) 国家自然科学基金资助项目 (6 0 2 72 0 4 1)
关键词 人工智能 机器翻译 统计机器翻译 口语翻译 语料库 语块 artificial intelligence machine translation statistical machine translation spoken-language translation corpora chunk
  • 相关文献

参考文献6

二级参考文献34

共引文献58

同被引文献91

引证文献7

二级引证文献20

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部