-
题名基于卷积神经网络的面罩语音识别
被引量:6
- 1
-
-
作者
王霞
杜桂明
王光艳
张艳
-
机构
河北工业大学电子信息工程学院
天津商业大学信息工程学院
-
出处
《传感器与微系统》
CSCD
2017年第10期31-34,37,共5页
-
基金
天津市自然科学基金重点资助项目(14JCZDJC32600)
-
文摘
针对带噪面罩语音识别率低的问题,结合语音增强算法,对面罩语音进行噪声抑制处理,提高信噪比,在语音增强中提出了一种改进的维纳滤波法,通过谱熵法检测有话帧和无话帧来更新噪声功率谱,同时引入参数控制增益函数;提取面罩语音信号的Mel频率倒谱系数(MFCC)作为特征参数;通过卷积神经网络(CNN)进行训练和识别,并在每个池化层后经局部响应归一化(LRN)进行优化。实验结果表明:该识别系统能够在很大程度上提高带噪面罩语音的识别率。
-
关键词
面罩语音识别
卷积神经网络
语音增强
维纳滤波法
-
Keywords
mask speech recognition
speech enhancement
Wiener filtering algorithm
-
分类号
TN912
[电子电信—通信与信息系统]
-
-
题名基于掩码迭代估计的多通道语音识别算法
- 2
-
-
作者
王智国
黄磊
王海坤
-
机构
科大讯飞股份有限公司
-
出处
《信息技术与标准化》
2018年第8期65-69,72,共6页
-
文摘
提出一种基于多通道语音识别的用于波束形成的闭环掩码迭代估计算法,通过神经网络迭代和语音识别获得理想比例掩码估计和语音活动检测信息。结合输入特性数据和输出得分数据,在CHiME-4六通道语音识别实测数据上该算法优于基于复高斯混合模型算法,字识别错误率指标下降了24.1%。
-
关键词
CHiME-4挑战赛
深度学习
理想比例掩码
麦克风阵列
语音识别
-
Keywords
CHIME-4 challenge
deep learning
ideal ratio mask
microphone array
speech recognition
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于渐进比率掩蔽目标的自适应噪声估计方法
- 3
-
-
作者
高建清
屠彦辉
马峰
付中华
-
机构
科大讯飞股份有限公司
西安讯飞超脑信息技术有限公司
-
出处
《计算机应用》
CSCD
北大核心
2023年第4期1303-1308,共6页
-
基金
科技创新2030-“新一代人工智能”重大项目(2018AAA0102200)。
-
文摘
基于深度学习的语音增强算法的性能通常优于传统的基于噪声抑制的语音增强算法。然而当训练数据和测试数据之间存在不匹配时,基于深度学习的语音增强算法通常无法正常工作。针对上述问题,提出一种新的基于渐进比率掩蔽(PRM)的自适应噪声估计(PRM-ANE)方法,并把它作为语音识别系统的预处理方法。所提方法综合利用了具有帧级别的噪声跟踪能力的改进最小统计量控制递归平均(IMCRA)算法和具有学习噪声和语音之间复杂非线性映射关系的渐进学习算法这两种算法。首先,使用二维卷积神经网络(2D-CNN)学习随信噪比(SNR)增加的PRM;其次,通过传统的帧级语音增强算法组合句子级估计的PRM,进行语音增强;最后,将基于多级别信息融合的增强语音直接作为语音识别系统的输入,从而提高识别系统性能。在CHiME-4真实测试集上的实验结果表明,所提方法可以实现7.42%的相对字识别错误率(WER),与IMCRA语音增强方法相比下降了51.41%,可见所提方法能够有效提升下游识别任务的性能。
-
关键词
语音增强
深度学习
渐进比率掩蔽
语音识别
CHiME-4比赛
-
Keywords
speech enhancement
deep learning
Progressive Ratio mask(PRM)
speech recognition
CHiME-4 challenge
-
分类号
TN912.35
[电子电信—通信与信息系统]
-