摘要
语音识别系统往往会受到说话人的改变、信道失真、环境噪声等各种因素的干扰,从而导致预先训练的声学模型与实际环境语音的特征参数之间存在较大的差异,这会严重影响语音识别系统在实际环境下的识别性能。由于噪声主要影响语音的高频非周期部分,传统的最大似然线性回归算法在噪声自适应中难以取得令人满意的效果。文章提出了一种基于语音截止频率的最大似然线性回归算法,以当前测试环境的语音截止频率为频率上限,提取测试语音的特征参数;然后,将声学模型每个高斯单元的均值和方差从倒谱域变换到对数谱域,根据语音截止频率,忽略其高频分量,再变换回倒谱域;最后,根据测试环境下的少量自适应数据,利用最大似然线性回归算法对声学模型的参数进行调整,使其与当前环境相匹配。
出处
《科技创新与应用》
2013年第36期300-300,共1页
Technology Innovation and Application