期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于听感量化编码的神经网络语音合成方法研究 被引量:2
1
作者 刘庆峰 江源 +1 位作者 胡亚军 刘利娟 《电子科技》 2019年第9期76-79,共4页
针对当前神经网络声学建模中数据混用困难的问题,文中提出了一种基于听感量化编码的神经网络语音合成方法。通过设计听感量化编码模型学习海量语音在音色、语种、情感上的不同差异表征,构建统一的多人数据混合训练的神经网络声学模型。... 针对当前神经网络声学建模中数据混用困难的问题,文中提出了一种基于听感量化编码的神经网络语音合成方法。通过设计听感量化编码模型学习海量语音在音色、语种、情感上的不同差异表征,构建统一的多人数据混合训练的神经网络声学模型。在统一的听感量化编码声学模型内通过数据共享和迁移学习,可以显著降低合成系统搭建的数据量要求,并实现对合成语音的音色、语种、情感等属性的有效控制。提升了神经网络语音合成的质量和灵活性,一小时数据构建语音合成系统自然度可达到4.0MOS分,达到并超过普通说话人水平。 展开更多
关键词 语音合成 听感化编码 神经网络 数据量合成 跨语种合成 情感控制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部