一种汉语语音变换技术被引量：1

Chinese Speech Conversion Technology Based on LPC and Residual Model

下载PDF

导出

摘要汉语语音变换技术的目的是将汉语语音中源说话人的语音特征转换为目标说话人语音特征。提出的适用于汉语说话人的变换算法分为3个部分:前两部分用高斯混合模型实现了语音的谱包络(线性预测编码)及其激励(残差)的转换;第三部分采用支持向量回归算法实现语音的韵律变换规则建模,结合汉语语音特点利用基音同步叠加算法实现语音的超音段特征调整。与现有的语音变换算法进行比较,算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,是一种有效的汉语语音变换算法。 Speech conversion is a new technology to change the source speaker＇s features to the target speaker＇s features in the speech. In this paper, the Chinese speech conversion system is divided in to three parts. In the first and second part, GMM（Gaussian Mixed Model） is used to transform the spectral envelope[LPC（Linear Prediction Coding）] and the impulse （residual）. In the third part, the Chinese speech＇s super-segmental features is regulated with the SVR（Support Vector Regression） and the TD-PSOLA（Time-Domain Pitch Synchronous OverLap-Add）. This algorithm is capital of transforming Chinese speech and producing spontaneous voice.

作者孙卓岳振军

机构地区总参谋部通信工程设计研究院解放军理工大学理学院基础电子学系

出处《电声技术》 2007年第6期37-40,共4页 Audio Engineering

关键词汉语语音变换线性预测编码残差高斯混合模型超音段特征支持向量回归 Chinese speech conversion LPC residual GMM super-segmental feature SVR

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1李波,王成友,蔡宣平,唐朝京,张尔扬.语音转换及相关技术综述[J].通信学报,2004,25(5):109-118. 被引量：34
2KAIN A. High Resolution Voice Transformation[D]. Illinois : Rockford College,2001. 被引量：1
3张雄伟 ... ..现代语音处理技术及应用[M],2003.
4曹剑芳．汉语韵律切分的语音字和语音学线索[C]∥新世纪的现代语音学：第五届全国现代语音学术会议论文集．北京：清华大学出版社，2001：176-179．被引量：1
5符敏,程德福.支持向量回归在声音转换中的应用[J].电声技术,2006,30(3):45-48. 被引量：1
6KAIN A, MACON M. Spectral voice conversion for text- to-speech synthesis[C]// Proceedings of Intemation Conference on Acoustics, Speech, and Signal Processing. Washington: [s.n.], 1998 : 285-288. 被引量：1

二级参考文献39

1左国玉,刘文举,阮晓钢.声音转换技术的研究与进展[J].电子学报,2004,32(7):1165-1172. 被引量：32
2初敏.韵律研究与合成语音的自然度[A].第五届全国现代语音学学术会议.新世纪的现代语音学[C].北京: 清华大学出版社,2001.295-301. 被引量：3
3VERHELST W, MERTENS J. Voice conversion using partitions of spectral feature space[A]. ICCASSP[C]. Atlanta USA, 1996.365-368. 被引量：1
4LEE K S, DOH W, YOUN D H. Voice conversion using low dimensional vector mapping[J]. IEICE Trans Inf & Syst, 2002, E85-D(8):1297-1305. 被引量：1
5MIZUNO H, ABE M. Voice conversion algorithm based on piecewise linear conversion rules for formant frequencies and spectrum tilt[J]. Speech Communication, 1995, 16(2): 153-164. 被引量：1
6NARENDRANATH M, MURTHY H A, RAJENDRAN S. Transformation of formants for voice conversion using artificial neural networks[J]. Speech Communication, 1995, 16(2): 207-216. 被引量：1
7TURK O. New methods for voice conversion. Master Degree Thesis of Science[D]. Bogazici University, 2003. 被引量：1
8ABE M, NAKAMURA S, SHIKANO K, et al. Voice conversion through vector quantization[A]. ICASSP [C]. New York, 1988.655-658. 被引量：1
9ABE M. A segment-based approach to voice conversion[A]. ICASSP[C].Toronto, Canada, 1991. 765-768. 被引量：1
10KAIN A. High Resolution Voice Transformation[D]. OGI School of Science and Engineering at Oregon Health and Science University, 2001. 被引量：1

共引文献33

1岳振军,王浩,张雄伟.基于正弦谐波模型和BP神经网络的语音变换算法及实现[J].信号处理,2005,21(z1):208-211. 被引量：7
2孙健,贾永兴,陈向东.一种基于DCT和PSOLA的语音变换方法[J].军事通信技术,2008,29(2):23-26.
3夏菁,尹俊勋,黄建成,黄锋.基于正弦加噪声模型的说话人转换方法[J].电声技术,2005,29(2):49-52. 被引量：1
4李元良,李波,王成友.语音转换中基于系统单位冲激响应的频谱搬移方法[J].矿业研究与开发,2005,25(5):59-61. 被引量：1
5陆静芳,李波,王成友.语音转换中系统单位冲激响应的频谱搬移方法研究[J].现代电子技术,2005,28(24):40-42.
6王浩,苏巨诗,许胜华,岳振军.基于正弦谐波模型的语音变换算法及实现[J].解放军理工大学学报（自然科学版）,2005,6(6):525-530.
7张辉,李波,王宝良.利用谱包络变换后LPC系数实现频谱搬移[J].空军工程大学学报（自然科学版）,2006,7(6):62-64. 被引量：1
8何峰,于东武,林嘉宇.一种语音更改技术的研究与实现[J].电声技术,2007,31(2):54-56. 被引量：1
9赵建洋,胡泽雄.动态文本-语音编程系统的研究与应用[J].淮阴工学院学报,2007,16(3):36-39. 被引量：2
10何峰,陈晓清,李国锁,林嘉宇.一种新的语音信号共振峰提取的算法[J].信号处理,2007,23(4):618-621. 被引量：6

同被引文献5

1蒋明哲,廖建新,朱晓民,杨波.基于智能网的变声彩话业务的设计与实现[J].电信工程技术与标准化,2006,19(5):84-87. 被引量：1
2LIEBERMAN P, BLUMSTEIN S E. Speech physiology, speech perception, and acoustic phonetics (Cambridge studies in speech science and communication) [M]. London : Cambridge University Press, 1988 : 356-363. 被引量：1
3YAIR M Y, CHAZAN E. Super resolution pitch deterruination of speech signals [J]. IEEE Trans. on Signal Processing, 1991.39 ( 1 ): 40-48. 被引量：1
4MOUI.INES E,CHARPENTIER F. Pitch-synchronous waveform processing techniques for text-to-speech synthesis using diphones[J]. Speech Communication, 1990,9 (5/6) : 453-467. 被引量：1
5于剑陶建华.个性化语音生成技术面面观[J].计算机世界,2007,25. 被引量：2

引证文献1

1陆成刚.语音性别变换的实时实现[J].电声技术,2009,33(12):50-53. 被引量：1

二级引证文献1

1何朝霞,潘平,罗辉.音色变换音频信号的篡改检测技术研究[J].中国测试,2017,43(2):98-103. 被引量：3

1孙卓,岳振军,宋巍.基于LPC及其残差激励模型的汉语语音变换技术[J].军事通信技术,2007,28(2):1-4. 被引量：1
2黄薇.母语负迁移对英语超音段特征的影响与教学探索[J].中小企业管理与科技,2014,0(32):217-218.
3李建民,赵彤青,郑方,方棣棠,吴文虎.基于汉语语音特点的大词表语音识别系统的研究[J].计算机学报,1992,15(5):364-370. 被引量：2
4王富生,胡征.XD-5220汉语语音合成开发系统[J].电信科学,1988,4(10):55-58.
5孔敏.基于基音同步叠加技术的韵律修正的实现[J].安庆师范学院学报（自然科学版）,1999,5(1):41-44.
6杜佳,陈砚圃,杨俊强.特定说话人之间声学特征参数研究[J].计算机应用,2009,29(B12):275-278. 被引量：2
7崔丽珍,宋巍.基于SVR的语音变换映射规则研究[J].电子与信息学报,2008,30(5):1144-1147.
8刘轶,王长富,戴蓓倩.基于小波变换的基音同步叠加技术[J].中国科学技术大学学报,1998,28(4):470-475.
9岳振军,王浩,张雄伟.基于正弦谐波模型和BP神经网络的语音变换算法及实现[J].信号处理,2005,21(z1):208-211. 被引量：7
10刘震,景新幸.汉语情感语音合成的研究[J].科技信息,2008(9):78-79. 被引量：3

电声技术

2007年第6期

浏览历史

内容加载中请稍等...

一种汉语语音变换技术被引量：1

参考文献6

二级参考文献39

共引文献33

同被引文献5

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种汉语语音变换技术 被引量：1

参考文献6

二级参考文献39

共引文献33

同被引文献5

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种汉语语音变换技术被引量：1