-
题名基于神经网络的英语口音识别
- 1
-
-
作者
刘辉翔
赵云梦
陈雯柏
董立成
-
机构
北京信息科技大学自动化学院
博鼎实华(北京)技术有限公司
-
出处
《北京信息科技大学学报(自然科学版)》
2022年第5期46-52,共7页
-
基金
北京信息科技大学校科研基金(2021XJJ13)。
-
文摘
针对英语口音识别问题,首先基于梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs),以卷积神经网络(convolutional neural network,CNN)-长短时记忆(long short-term memory,LSTM)网络为骨干网络,建立英语口音识别模型;然后对比研究了卷积神经网络-双向门限循环单元(CNN-bidirectional gated recurrent unit,CNN-BiGRU)模型和卷积神经网络-双向长短时记忆(CNN-bidirectional LSTM,CNN-BiLSTM)模型,并引入注意力机制,探索不同衍生模型在英语口音识别中的效果。实验结果表明,在小规模样本情况下,整体而言,CNN-BiLSTM模型对英语地域口音识别取得了较好效果,获得了74.0%的准确率。
-
关键词
英语口音识别
注意力机制
卷积神经网络
双向长短时记忆
梅尔频率倒谱系数
-
Keywords
English accent recognition
attention mechanism
convolutional neural network(CNN)
bidirectional long short-term memory(BiLSTM)
Mel-frequency cepstral coefficients(MFCCs)
-
分类号
TP520.20
[自动化与计算机技术]
-