期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于CTC准则的普通话识别及改进 被引量:7
1
作者 张立民 王彦哲 +1 位作者 张兵强 朱念斌 《计算机工程》 CAS CSCD 北大核心 2019年第6期249-253,266,共6页
主流神经网络训练的交叉熵准则针对声学数据的每个帧进行分类优化,而连续语音识别需以序列级的转录准确性为性能度量指标。针对这一差异,构建一种基于序列级转录的端到端语音识别系统。以音素为基本单元建模,并采用连接时序分类(CTC)的... 主流神经网络训练的交叉熵准则针对声学数据的每个帧进行分类优化,而连续语音识别需以序列级的转录准确性为性能度量指标。针对这一差异,构建一种基于序列级转录的端到端语音识别系统。以音素为基本单元建模,并采用连接时序分类(CTC)的目标函数改进长短时记忆网络的结构。在解码过程中引入词典和语言模型,并在前端增加音调特征以丰富声学特征。利用序列区分度训练技术提升CTC模型的建模效果。实验结果表明,该系统的识别效率和识别准确率得到提高,词错误率最低可降至19.09%±0.16%。 展开更多
关键词 序列级 端到端 解码 声学特征 区分度训练
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部