期刊文献+

一种汉语语音变换技术 被引量:1

Chinese Speech Conversion Technology Based on LPC and Residual Model
下载PDF
导出
摘要 汉语语音变换技术的目的是将汉语语音中源说话人的语音特征转换为目标说话人语音特征。提出的适用于汉语说话人的变换算法分为3个部分:前两部分用高斯混合模型实现了语音的谱包络(线性预测编码)及其激励(残差)的转换;第三部分采用支持向量回归算法实现语音的韵律变换规则建模,结合汉语语音特点利用基音同步叠加算法实现语音的超音段特征调整。与现有的语音变换算法进行比较,算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,是一种有效的汉语语音变换算法。 Speech conversion is a new technology to change the source speaker's features to the target speaker's features in the speech. In this paper, the Chinese speech conversion system is divided in to three parts. In the first and second part, GMM(Gaussian Mixed Model) is used to transform the spectral envelope[LPC(Linear Prediction Coding)] and the impulse (residual). In the third part, the Chinese speech's super-segmental features is regulated with the SVR(Support Vector Regression) and the TD-PSOLA(Time-Domain Pitch Synchronous OverLap-Add). This algorithm is capital of transforming Chinese speech and producing spontaneous voice.
作者 孙卓 岳振军
出处 《电声技术》 2007年第6期37-40,共4页 Audio Engineering
关键词 汉语语音变换 线性预测编码 残差 高斯混合模型 超音段特征 支持向量回归 Chinese speech conversion LPC residual GMM super-segmental feature SVR
  • 相关文献

参考文献6

  • 1李波,王成友,蔡宣平,唐朝京,张尔扬.语音转换及相关技术综述[J].通信学报,2004,25(5):109-118. 被引量:34
  • 2KAIN A. High Resolution Voice Transformation[D]. Illinois : Rockford College,2001. 被引量:1
  • 3张雄伟 ... ..现代语音处理技术及应用[M],2003.
  • 4曹剑芳.汉语韵律切分的语音字和语音学线索[C]∥新世纪的现代语音学:第五届全国现代语音学术会议论文集.北京:清华大学出版社,2001:176-179. 被引量:1
  • 5符敏,程德福.支持向量回归在声音转换中的应用[J].电声技术,2006,30(3):45-48. 被引量:1
  • 6KAIN A, MACON M. Spectral voice conversion for text- to-speech synthesis[C]// Proceedings of Intemation Conference on Acoustics, Speech, and Signal Processing. Washington: [s.n.], 1998 : 285-288. 被引量:1

二级参考文献39

  • 1左国玉,刘文举,阮晓钢.声音转换技术的研究与进展[J].电子学报,2004,32(7):1165-1172. 被引量:32
  • 2初敏.韵律研究与合成语音的自然度[A].第五届全国现代语音学学术会议.新世纪的现代语音学[C].北京: 清华大学出版社,2001.295-301. 被引量:3
  • 3VERHELST W, MERTENS J. Voice conversion using partitions of spectral feature space[A]. ICCASSP[C]. Atlanta USA, 1996.365-368. 被引量:1
  • 4LEE K S, DOH W, YOUN D H. Voice conversion using low dimensional vector mapping[J]. IEICE Trans Inf & Syst, 2002, E85-D(8):1297-1305. 被引量:1
  • 5MIZUNO H, ABE M. Voice conversion algorithm based on piecewise linear conversion rules for formant frequencies and spectrum tilt[J]. Speech Communication, 1995, 16(2): 153-164. 被引量:1
  • 6NARENDRANATH M, MURTHY H A, RAJENDRAN S. Transformation of formants for voice conversion using artificial neural networks[J]. Speech Communication, 1995, 16(2): 207-216. 被引量:1
  • 7TURK O. New methods for voice conversion. Master Degree Thesis of Science[D]. Bogazici University, 2003. 被引量:1
  • 8ABE M, NAKAMURA S, SHIKANO K, et al. Voice conversion through vector quantization[A]. ICASSP [C]. New York, 1988.655-658. 被引量:1
  • 9ABE M. A segment-based approach to voice conversion[A]. ICASSP[C].Toronto, Canada, 1991. 765-768. 被引量:1
  • 10KAIN A. High Resolution Voice Transformation[D]. OGI School of Science and Engineering at Oregon Health and Science University, 2001. 被引量:1

共引文献33

同被引文献5

  • 1蒋明哲,廖建新,朱晓民,杨波.基于智能网的变声彩话业务的设计与实现[J].电信工程技术与标准化,2006,19(5):84-87. 被引量:1
  • 2LIEBERMAN P, BLUMSTEIN S E. Speech physiology, speech perception, and acoustic phonetics (Cambridge studies in speech science and communication) [M]. London : Cambridge University Press, 1988 : 356-363. 被引量:1
  • 3YAIR M Y, CHAZAN E. Super resolution pitch deterruination of speech signals [J]. IEEE Trans. on Signal Processing, 1991.39 ( 1 ): 40-48. 被引量:1
  • 4MOUI.INES E,CHARPENTIER F. Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones[J]. Speech Communication, 1990,9 (5/6) : 453-467. 被引量:1
  • 5于剑 陶建华.个性化语音生成技术面面观[J].计算机世界,2007,25. 被引量:2

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部