摘要
在字母语言的文本到语音(text to speech,TTS)系统和自动语音识别(automatic speech recognition,ASR)系统的实际应用中,由于新词的出现和大量专有名词收集、存储的困难,经常会遇到发音词典中不存在的单词,需要自动对这些单词注音。该文对各类自动注音方法做了回顾,对自动注音系统中若干关键问题做了简单的介绍。在此基础上,该文给出了一个自动注音系统的实现,对其中若干技术细节对性能的影响做了分析,最后给出了本系统与基于手写规则的方法的对比实验,结果表明前者的单词转换正确率达63%以上,显著优于后者。
Text to speech(TTS) and automatic speech recognition(ASR) systems for letter-based languages often encounter words that do not exist in the pronunciation lexicons because of newly generated words and limited capacity to store very large numbers of proper names and words used in special areas.Thus,automatic phonetic transcription is essential.This article reviews methods developed for automatic phonetic transcription and discussed some key issues.Then,a classification and regression tree(CART)-based G2P syst...
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第S1期735-740,共6页
Journal of Tsinghua University(Science and Technology)
基金
国家"八六三"高技术项目(2006AA010103)
关键词
信息处理
语音处理
字素音素转换
information processing
speech processing
grapheme-to-phoneme conversion(G2P)