-
题名基于卷积神经网络的语种识别系统
被引量:7
- 1
-
-
作者
金马
宋彦
戴礼荣
-
机构
中国科学技术大学语音及语言信息处理国家工程实验室
-
出处
《数据采集与处理》
CSCD
北大核心
2019年第2期322-330,共9页
-
基金
国家自然科学基金(U1613211)资助项目
-
文摘
从给定语音中提取有效语音段表示是语种识别的关键点。近年来深度学习在语种识别应用中有重要的进展,通过深度神经网络可以提取音素相关特征,并有效提升系统性能。基于深度学习的端对端语种识别系统也表现出其优异的识别性能。本文针对语种识别任务提出了基于卷积神经网络的端对端语种识别系统,利用神经网络强大的特征提取能力及区分性建模能力,提取具有语种区分性的基本单元,再通过池化层得到有效语音段表示,最后输入全连接层得到识别结果。实验表明,在NIST LRE 2009数据集上,相比于现阶段国际主流语种识别系统,提出的系统在30 s,10 s和3 s等语音段上错误率分别相对下降了1.35%,12.79%和29.84%,且平均错误代价在3种时长上均相对下降30%以上。
-
关键词
语种识别
卷积神经网络
语音段表示
语种区分性基本单元
端对端机制
-
Keywords
language identification
convolutional neural network
utterance representation
language identification(LID)-senone
end-to-end scheme
-
分类号
TN912.34
[电子电信—通信与信息系统]
-