-
题名MFSC系数特征局部有限权重共享CNN语音识别
被引量:9
- 1
-
-
作者
黄玉蕾
罗晓霞
刘笃仁
-
机构
西安培华学院中兴电信学院
西安科技大学计算机科学与技术学院
西安电子科技大学电子工程学院
-
出处
《控制工程》
CSCD
北大核心
2017年第7期1507-1513,共7页
-
基金
陕西省教育科学十三五规划2016年度规划课题(SGH16H258)
-
文摘
针对传统语音识别应用中识别效果不理想的问题,提出一种基于美尔谱系数(MFSC)特征的有限局部权重共享卷积神经网络(CNN)语音识别。首先,借鉴图像处理中对输入图像信息的处理方式,构建语音信号的二维阵列特征映射输入形式,每个映射表示为含静态数据、一阶导数、二阶导数的MFSC系数特征,便于应用图像处理方式进行识别;其次,引入图像处理的卷积神经网络,并且针对语音信号特征的局部特性,构建有限局部权重共享卷积神经网络学习算法,提高语音信号辨识度并降低算法复杂度;最后,通过实验对所提算法进行验证,并且给出算法参数变化影响实验,为具体应用提供依据。
-
关键词
卷积神经网络
局部权重共享
语音识别
特征映射
美尔谱系数
-
Keywords
Convolutional neural network
local weight sharing
speech recognition
feature mapping
Melfrequency spectral coefficient
-
分类号
TP912
[自动化与计算机技术]
-
-
题名美尔谱系数与卷积神经网络相组合的环境声音识别方法
被引量:9
- 2
-
-
作者
刘亚荣
黄昕哲
谢晓兰
刘鑫
-
机构
桂林理工大学广西嵌入式技术与智能系统重点实验室
桂林理工大学信息科学与工程学院
-
出处
《信号处理》
CSCD
北大核心
2020年第6期1020-1028,共9页
-
基金
国家自然科学基金资助项目(61762031)
国家自然科学基金(61961010)
+2 种基金
广西创新驱动重大项目(AA19046004)
广西重点研发项目(桂科AB17195029,桂科AB18126006)
广西嵌入式技术与智能系统重点实验室开放基金资助(编号:2019-02-03)。
-
文摘
通过对复杂环境下声音识别技术进行研究,本文提出了美尔谱系数(MFSC)与卷积神经网络(CNN)相组合的环境声音识别方法。对声音事件提取其MFSC特征,将特征参数作为输入送入设计好的CNN模型中对声音事件进行分类。实验数据集采用ESC-10,将构建的卷积神经网络模型与随机森林、支持向量机(SVM)、深度神经网络(DNN)及DCASE比赛中常用的三种识别模型进行对比实验。实验结果表明,在相同数据集下,本文所设计的美尔谱系数与卷积神经网络相组合的环境声音识别方法相较传统的声音识别方法在识别率上分别有13.1%,18.3%,15.7%的提升,相较于DCASE比赛中的三种常用识别模型,本文所设计识别模型识别率及识别效率均有明显的优势。
-
关键词
卷积神经网络
美尔谱系数
环境声音识别
-
Keywords
convolutional neural network
Mel-spectral coefficient
ambient sound recognition
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于感知模型的美尔谱失真测度
被引量:4
- 3
-
-
作者
陈华伟
靳蕃
-
机构
西南交通大学信息科学与技术学院
-
出处
《西南交通大学学报》
EI
CSCD
北大核心
2006年第6期723-728,共6页
-
文摘
为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特征参数的提取,提出了用于语音质量客观评价的美尔谱失真测度(M el-SD),并将其应用于干扰条件下的无线通信系统语音质量评价.实验结果表明,M el-SD的平均相关值为0.942,分别比M el-CD和PESQ(语音质量感知评价)提高了0.089和0.031.
-
关键词
语音质量
客观评价
美尔谱系数
Mel谱失真测度
Mel倒谱距离测度
-
Keywords
speech quality
objective speech quality evaluation
Mel-frequency spectral coefficient
Mel-spectral distortion measure
Mel-cepstral distance measure
-
分类号
TN912.3
[电子电信—通信与信息系统]
-