基于矩阵线性插值的说话人自适应算法

Speaker adaptation algorithm based on linear matrix interpolation

导出

摘要语音识别技术中说话人快速自适应技术受到普遍关注。最大似然模型插值 (maxim um likelihood model inter-polation,ML MI)算法是一种有效的快速自适应算法 ,它的主要缺点是需要存储大量的特定人模型。为克服这一缺点 ,该文提出一种改进方法——矩阵线性插值自适应算法。该算法用表示说话人特性的矩阵代替 ML MI中的特定人模型进行线性插值。而插值系数由测试者提供的语音数据按照最大似然准则确定。插值后的线性矩阵与非特定人模型相作用得到最终的说话人自适应模型。该算法大大减少了计算存储量 ,且自适应性能基本与 ML Fast speaker adaptation techniques for speech recognition are of great interest. A fast speaker adaptation method named the maximum likelihood model interpolation (MLMI) has been developed as an effective speaker adoptation method. The main shortcoming of MLMI is the large memory need to store speaker dependent (SD) models. A modified method, the matrix linear interpolation adaptation method, is proposed in this paper to overcome the memory limitation. This method uses matrix instead of the SD model used in MLMI to represent the speaker characteristics. An estimated interpolation coefficient maximizes the likelihood of the adaptation data. The interpolated matrix is then used to transform the speaker independent model to the speaker adapted model. This method greatly reduces the memory requirement while maintaining the adaptation performance of MLMI.

作者吕萍王作英陆大■

机构地区清华大学电子工程系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2002年第1期27-29,共3页 Journal of Tsinghua University(Science and Technology)

基金清华大学"九八五"重大项目 ( 985校 -2 2 -攻关 -0 6 )

关键词语音识别说话人自适应算法最大似然模型插值矩阵线性插值自适应算法插值系数 SD模型 continuous speech recognition speaker adaptation maximum likelihood model interpolation matrix linear interpolation

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1王作英.基于段长分布的HMM语音识别模型.第二届全国汉字语音识别会议[M].庐山,1989.. 被引量：15
2刘丰.说话人自适应在汉语连续语音识别中的应用[M].北京:清华大学电子工程系,2000.. 被引量：2

共引文献14

1吴及,刘丰,王作英.连续语音识别系统中测度计算的快速算法研究[J].清华大学学报（自然科学版）,1999,39(5):77-80. 被引量：3
2杨浩荣,王作英,陆大.汉语语音识别中的拼音多候选问题[J].电子学报,1999,27(4):58-62. 被引量：4
3郝杰,李星.汉语连续语音识别中经典HMM的实验评测[J].计算机工程与应用,2001,37(13):1-4. 被引量：6
4吕萍,王作英,陆大金.基于最大似然模型插值的快速说话人自适应算法[J].中文信息学报,2002,16(1):49-53. 被引量：2
5汪俊杰,赵勇,肖熙,王作英.使用SSE技术优化语音识别中的测度计算[J].计算机工程与应用,2002,38(8):85-86.
6乔春雷,吴及,王作英.在汉语语音识别中应用声调信息的研究[J].计算机工程与应用,2002,38(12):51-53. 被引量：5
7郝杰,李星.基于经典隐马尔可夫模型的汉语连续语音识别系统[J].电子与信息学报,2002,24(7):944-947. 被引量：3
8吕萍,吴及,王作英,陆大.连续语音识别中的说话人快速自适应技术[J].清华大学学报（自然科学版）,2002,42(7):977-980. 被引量：4
9余鹏,王作英.语音识别中空间相关性信息的利用[J].电子学报,2002,30(7):964-966. 被引量：1
10欧智坚,王作英.从线性预测HMM到一种新的语音识别的混合模型[J].电子学报,2002,30(9):1313-1316. 被引量：3

1吕萍,王作英,陆大金.基于最大似然模型插值的快速说话人自适应算法[J].中文信息学报,2002,16(1):49-53. 被引量：2
2吕萍,吴及,王作英,陆大.连续语音识别中的说话人快速自适应技术[J].清华大学学报（自然科学版）,2002,42(7):977-980. 被引量：4
3黄辉.快速自适应算法在扩频通信系统中的应用[J].通信与广播电视,2001(1):1-6.
4李小红,钱源诚.高斯白噪声下LMS算法的改进[J].合肥工业大学学报（自然科学版）,1998,21(5):22-27.
5杨海军,郭美凤,滕云鹤.GPS定位信号随机误差自适应模型[J].数值计算与计算机应用,2000,21(1):22-27. 被引量：2
6樊相宇.ISM在辅助SD模型调试中的应用[J].西安邮电学院学报,2004,9(4):67-69.
7蔡铁,朱杰.基于结构化特征语音模型的区别性说话人自适应算法[J].上海交通大学学报,2005,39(S1):138-142.
8屈丹,张文林.基于本征音子说话人子空间的说话人自适应算法[J].电子与信息学报,2015,37(6):1350-1356. 被引量：4
9张建龙,吴成柯,高新波.一种基于双域拉格朗日插值的视频错误隐藏方法[J].电子学报,2007,35(4):653-658. 被引量：5
10王晶莹,王作英.一种利用主曲线的说话人自适应方法[J].高技术通讯,2007,17(5):470-473.

清华大学学报（自然科学版）

2002年第1期

浏览历史

内容加载中请稍等...

基于矩阵线性插值的说话人自适应算法

参考文献2

共引文献14

相关作者

相关机构

相关主题

浏览历史