期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度学习的长语音口音识别研究
1
作者
朱丹浩
王震
+2 位作者
黄肖宇
马壮
徐杰
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2022年第4期110-118,共9页
普通话口音识别是物证鉴定的重要技术之一.目前普通话口音识别技术主要基于传统机器学习方法建立,也未针对长语音做专门设计,识别精度不高.针对以上问题,本文提出了基于深度学习的长语音口音识别方法.该方法首先将长语音切分为句子级别...
普通话口音识别是物证鉴定的重要技术之一.目前普通话口音识别技术主要基于传统机器学习方法建立,也未针对长语音做专门设计,识别精度不高.针对以上问题,本文提出了基于深度学习的长语音口音识别方法.该方法首先将长语音切分为句子级别的多个短语音,然后使用经过预训练的X-vectors模型提取特征,再基于不同方法对句子特征进行融合,最后采用Amsoftmax最大化口音类别间隔并进行分类.在真实的物证口音识别数据集上的实验结果显示,本文方法的识别精确率为94.1%,比非深度学习的基准方法和基于X-vectors的基准方法分别提升了21.6%和2.1%,验证了本文方法的有效性和针对长语音的口音识别能力.
展开更多
关键词
深度学习
口音识别
长语音
普通话
下载PDF
职称材料
题名
基于深度学习的长语音口音识别研究
1
作者
朱丹浩
王震
黄肖宇
马壮
徐杰
机构
江苏
警官学院刑事科学技术系
江苏
警官学院干训部
江苏
警官学院计算机信息与网络安全系
江苏省
苏州市
张家港市
公安局
出处
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2022年第4期110-118,共9页
基金
国家自然科学基金项目(71974094)
江苏省社科基金项目(19TQD002)
+1 种基金
江苏省教育厅自科项目(21KJB520004)
江苏高校优势学科工程资助项目(PAPD).
文摘
普通话口音识别是物证鉴定的重要技术之一.目前普通话口音识别技术主要基于传统机器学习方法建立,也未针对长语音做专门设计,识别精度不高.针对以上问题,本文提出了基于深度学习的长语音口音识别方法.该方法首先将长语音切分为句子级别的多个短语音,然后使用经过预训练的X-vectors模型提取特征,再基于不同方法对句子特征进行融合,最后采用Amsoftmax最大化口音类别间隔并进行分类.在真实的物证口音识别数据集上的实验结果显示,本文方法的识别精确率为94.1%,比非深度学习的基准方法和基于X-vectors的基准方法分别提升了21.6%和2.1%,验证了本文方法的有效性和针对长语音的口音识别能力.
关键词
深度学习
口音识别
长语音
普通话
Keywords
deep learning
accent recognition
long speech
mandarin
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TN912.34 [自动化与计算机技术—控制科学与工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度学习的长语音口音识别研究
朱丹浩
王震
黄肖宇
马壮
徐杰
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部