期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于支持向量机的民族语口音识别 被引量:5
1
作者 徐翔俊 毕福昆 杨鉴 《计算机工程与应用》 CSCD 北大核心 2008年第13期71-73,136,共4页
基于母语分别为傣语、傈僳语、纳西语和汉语普通话的发音人所发汉语普通话语句,利用支持向量机进行民族口音识别研究。实验结果表明,采用对每个语句提取12维MFCC参数、9维基频派生参数和9维短时平均能量派生参数等作为特征参数集及使用... 基于母语分别为傣语、傈僳语、纳西语和汉语普通话的发音人所发汉语普通话语句,利用支持向量机进行民族口音识别研究。实验结果表明,采用对每个语句提取12维MFCC参数、9维基频派生参数和9维短时平均能量派生参数等作为特征参数集及使用高斯径向基函数支持向量机的方法,男、女声的口音识别率均超过93%。 展开更多
关键词 口音识别 支持向量机(SVM) 高斯径向基函数
下载PDF
一种用于方言口音语音识别的字典自适应技术 被引量:5
2
作者 潘复平 赵庆卫 颜永红 《计算机工程与应用》 CSCD 北大核心 2005年第23期4-6,9,共4页
基于标准普通话的语音识别系统在识别带有方言口音的普通话时,识别率会下降很多。针对这一问题,论文介绍了一种“字典自适应技术”。文中首先提出了一种自动标注算法,然后以此为基础,通过分析语音数据,统计出带有方言口音普通话的发音规... 基于标准普通话的语音识别系统在识别带有方言口音的普通话时,识别率会下降很多。针对这一问题,论文介绍了一种“字典自适应技术”。文中首先提出了一种自动标注算法,然后以此为基础,通过分析语音数据,统计出带有方言口音普通话的发音规律,然后把这个规律编码到标准普通话字典里,构造出体现这种方言发音特征的新字典,最后把新字典整合于搜索框架,用于识别带有该方言口音的普通话,使识别率得到显著提高。 展开更多
关键词 字典自适应 方言识别 自动标注 音节 搜索路径
下载PDF
基于深度学习的长语音口音识别研究
3
作者 朱丹浩 王震 +2 位作者 黄肖宇 马壮 徐杰 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2022年第4期110-118,共9页
普通话口音识别是物证鉴定的重要技术之一.目前普通话口音识别技术主要基于传统机器学习方法建立,也未针对长语音做专门设计,识别精度不高.针对以上问题,本文提出了基于深度学习的长语音口音识别方法.该方法首先将长语音切分为句子级别... 普通话口音识别是物证鉴定的重要技术之一.目前普通话口音识别技术主要基于传统机器学习方法建立,也未针对长语音做专门设计,识别精度不高.针对以上问题,本文提出了基于深度学习的长语音口音识别方法.该方法首先将长语音切分为句子级别的多个短语音,然后使用经过预训练的X-vectors模型提取特征,再基于不同方法对句子特征进行融合,最后采用Amsoftmax最大化口音类别间隔并进行分类.在真实的物证口音识别数据集上的实验结果显示,本文方法的识别精确率为94.1%,比非深度学习的基准方法和基于X-vectors的基准方法分别提升了21.6%和2.1%,验证了本文方法的有效性和针对长语音的口音识别能力. 展开更多
关键词 深度学习 口音识别 长语音 普通话
下载PDF
基于语言学音系例字的口音自动识别探究 被引量:2
4
作者 杨伟 杨俊杰 《中国司法鉴定》 2021年第2期38-42,共5页
目的以方言语音学为视角,通过计算机分析和选择模型训练数据,探究提高口音自动识别准确率及优化模型训练数据的方法。方法采用音系分析、语音信号处理、数学模型实验和统计的方法,对包含约81400段电子语音的37个方言点(每个方言点约2200... 目的以方言语音学为视角,通过计算机分析和选择模型训练数据,探究提高口音自动识别准确率及优化模型训练数据的方法。方法采用音系分析、语音信号处理、数学模型实验和统计的方法,对包含约81400段电子语音的37个方言点(每个方言点约2200段),逐一进行音系提炼、挑选音系例字、电子语音预处理和提取梅尔倒谱系数(MFCC),构建高斯混合模型(GMM)进行口音识别分析。结果从方言语音中提取的音系例字作为训练集(约260字)的识别模型可以较好地完成口音识别任务,对比任选300个例字作为训练集的识别模型,无论是识别准确度还是待测语音数量的要求都有显著优势。结论基于语言学音系例字的口音自动识别方法,已经完成37个方言点高斯混合模型的建立,可以用于口音识别中辅助辨别分析。 展开更多
关键词 高斯混合模型 口音自动识别 音系 语言学
下载PDF
A Comparison of Classifiers in Performing Speaker Accent Recognition Using MFCCs
5
作者 Zichen Ma Ernest Fokoué 《Open Journal of Statistics》 2014年第4期258-266,共9页
An algorithm involving Mel-Frequency Cepstral Coefficients (MFCCs) is provided to perform signal feature extraction for the task of speaker accent recognition. Then different classifiers are compared based on the MFCC... An algorithm involving Mel-Frequency Cepstral Coefficients (MFCCs) is provided to perform signal feature extraction for the task of speaker accent recognition. Then different classifiers are compared based on the MFCC feature. For each signal, the mean vector of MFCC matrix is used as an input vector for pattern recognition. A sample of 330 signals, containing 165 US voice and 165 non-US voice, is analyzed. By comparison, k-nearest neighbors yield the highest average test accuracy, after using a cross-validation of size 500, and least time being used in the computation. 展开更多
关键词 SPEAKER accent recognition Mel-Frequency Cepstral Coefficients (MFCCs) DISCRIMINANT Analysis Support Vector Machines (SVMs) k-Nearest NEIGHBORS
下载PDF
基于神经网络的英语口音识别
6
作者 刘辉翔 赵云梦 +1 位作者 陈雯柏 董立成 《北京信息科技大学学报(自然科学版)》 2022年第5期46-52,共7页
针对英语口音识别问题,首先基于梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs),以卷积神经网络(convolutional neural network,CNN)-长短时记忆(long short-term memory,LSTM)网络为骨干网络,建立英语口音识别模型;然... 针对英语口音识别问题,首先基于梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs),以卷积神经网络(convolutional neural network,CNN)-长短时记忆(long short-term memory,LSTM)网络为骨干网络,建立英语口音识别模型;然后对比研究了卷积神经网络-双向门限循环单元(CNN-bidirectional gated recurrent unit,CNN-BiGRU)模型和卷积神经网络-双向长短时记忆(CNN-bidirectional LSTM,CNN-BiLSTM)模型,并引入注意力机制,探索不同衍生模型在英语口音识别中的效果。实验结果表明,在小规模样本情况下,整体而言,CNN-BiLSTM模型对英语地域口音识别取得了较好效果,获得了74.0%的准确率。 展开更多
关键词 英语口音识别 注意力机制 卷积神经网络 双向长短时记忆 梅尔频率倒谱系数
下载PDF
混合口音语音识别中的声学和语音层发音变异性研究
7
作者 张超 刘轶 《中国科技论文在线》 CAS 2011年第10期743-749,共7页
通过在语音层使用多发音字典对完全发音变异进行建模,在声学层分别使用上下文无关部分变异音子模型(partial change phone model,PCPM)对部分发音变异进行建模,从而探究了语音层和声学层发音变异模型的特征、区别和联系,并将它们整合到... 通过在语音层使用多发音字典对完全发音变异进行建模,在声学层分别使用上下文无关部分变异音子模型(partial change phone model,PCPM)对部分发音变异进行建模,从而探究了语音层和声学层发音变异模型的特征、区别和联系,并将它们整合到语音识别系统的不同部分中,实现了对发音变异的分层处理。应用分层发音变异模型,对带方言口音汉语普通话朗读语音进行测试,提高了识别结果。最好情况下,应用多发音字典使音节准确率提高了1.24%;应用上下文无关PCPM使音节的准确率提高了9.7%。分别使用带有重庆、广州和上海口音的普通话进行实验,从实验结果对汉语不同方言口音之间发音变异的区别和关联进行了分析。 展开更多
关键词 电信技术 口音语音识别 完全变异 部分变异 分层发音变异模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部