-
题名语音库裁剪的一种不定长递阶聚类方法
被引量:1
- 1
-
-
作者
张巍
吴晓如
刘江
王仁华
-
机构
中国海洋大学计算机科学系
安徽中科大讯飞信息科技有限公司
中国科学技术大学电子工程与信息科学系
-
出处
《计算机学报》
EI
CSCD
北大核心
2007年第11期2017-2024,共8页
-
基金
国家自然科学基金(60602017)
国家"八六三"高技术研究发展计划项目基金(2004AA114030)资助.~~
-
文摘
大量使用不定长是大语料库语音合成质量的一个重要保证,而语音库裁剪方法通常会导致不定长的损失.针对这一关键性问题,该文构建了NuClustering-VPA算法:对不同粒度的不定长变体进行聚类,根据高阶聚类结果调整低阶变体的聚类,使得低阶聚类中心有所偏向.NuClustering-VPA算法保留了最重要的不定长,从而有效减小了裁剪对不定长的破坏.测听实验表明,利用NuClustering-VPA算法,即使在语音库裁减率为39.63%时,合成自然度下降较小,仍然保持在较高的水平.这一技术已被应用在科大讯飞公司的实际语音产品中.
-
关键词
基于语料库的语音合成
语音库裁剪
语音库去冗余
可伸缩语音合成系统
-
Keywords
Corpus-based TTS
Tailoring TTS voice font
pruning redundant synthesis instances
scalable TTS
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-