期刊文献+
共找到265篇文章
< 1 2 14 >
每页显示 20 50 100
基于CBHG的Mel谱精细结构重建 被引量:1
1
作者 唐君 张连海 李嘉欣 《信息工程大学学报》 2022年第2期135-140,共6页
在大多数语音合成系统中,预测的Mel谱的质量直接决定了最终合成语音的质量。基于Tacotron 2的框架预测的Mel谱通常缺乏接近真实数据的精细结构,为解决此问题,提出一种基于CBHG的后处理网络。该后处理网络通过对解码输出的Mel谱进行分析... 在大多数语音合成系统中,预测的Mel谱的质量直接决定了最终合成语音的质量。基于Tacotron 2的框架预测的Mel谱通常缺乏接近真实数据的精细结构,为解决此问题,提出一种基于CBHG的后处理网络。该后处理网络通过对解码输出的Mel谱进行分析并预测其缺失的精细结构,最后将这些精细结构叠加到解码输出的Mel谱中以生成细化后的Mel谱,从而提高合成语音的质量。实验结果表明,提出的后处理网络有效恢复了Mel谱在解码过程中丢失的精细结构,同时通过结合高性能、高效率的HiFi-GAN声码器,最终合成语音的平均主观意见分(Mean Opinion Score,MOS)达到4.10,相比基线提升了0.26。 展开更多
关键词 语音合成 CBHG mel 后处理网络 Tacotron 2 HiFi-GAN
下载PDF
基于感知模型的美尔谱失真测度 被引量:4
2
作者 陈华伟 靳蕃 《西南交通大学学报》 EI CSCD 北大核心 2006年第6期723-728,共6页
为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特... 为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特征参数的提取,提出了用于语音质量客观评价的美尔谱失真测度(M el-SD),并将其应用于干扰条件下的无线通信系统语音质量评价.实验结果表明,M el-SD的平均相关值为0.942,分别比M el-CD和PESQ(语音质量感知评价)提高了0.089和0.031. 展开更多
关键词 语音质量 客观评价 美尔系数 mel失真测度 mel距离测度
下载PDF
一种基于双路径深度卷积网络的声场景分类方法研究
3
作者 王丽 龚君 黄裕磊 《电子器件》 CAS 北大核心 2021年第2期417-422,共6页
声场景分类,就是训练计算机通过声音中所包含的信息将声音正确的划分到其所属的场景中,其在物联网设备、智能助听器、自动驾驶等领域有着广泛的应用。根据声学特征谱图的特点和深度学习中的卷积神经网络理论,提出了一种基于卷积神经网... 声场景分类,就是训练计算机通过声音中所包含的信息将声音正确的划分到其所属的场景中,其在物联网设备、智能助听器、自动驾驶等领域有着广泛的应用。根据声学特征谱图的特点和深度学习中的卷积神经网络理论,提出了一种基于卷积神经网络的声场景分类方法。首先提取音频的对数Mel谱图及其一阶二阶差分谱图,并在通道维度上进行拼接,随后利用中值滤波器对融合谱图进行分层,得到2个融合谱图分量。然后搭建了双路径深度卷积神经网络分别对每个谱图分量进行建模,并在系统输出前将2个路径获得的特征图进行融合,最后通过全连接层进行分类。并在TUT数据集上进行实验,分类准确率可达79.2%。 展开更多
关键词 声场景分类 mel 图分层 卷积神经网络
下载PDF
基于深度学习的机器异常声音检测
4
作者 朱鹏 黎春玲 +3 位作者 郑荣璞 刘琳 魏喜庆 吕品 《计算机科学与应用》 2023年第11期2089-2096,共8页
随着大规模工业生产的发展,机器设备的健康管理越来越重要。由于机器设备潜在的故障,机器异常声音的检测对工业生产的保障有待提高。不同的机器运作时发出的声音有规律性,可以根据这一特性判断机器是否处于一个正常运作状态,通过对机器... 随着大规模工业生产的发展,机器设备的健康管理越来越重要。由于机器设备潜在的故障,机器异常声音的检测对工业生产的保障有待提高。不同的机器运作时发出的声音有规律性,可以根据这一特性判断机器是否处于一个正常运作状态,通过对机器运作时的声音特征进行研究,提出一种基于深度学习的机器异常声音的检测,通过对声音特征的提取,经过模型的训练,判断机器是否处于异常状态,防患于未然。首先对数据集通过等高梅尔滤波器处理后提取出对数Mel谱作为声音特征,之后针对实际中异常声音的缺失等问题,使用mobilenetv2对声音模型进行训练,通过模型输出的逻辑回归值来计算异常分数和确定异常阈值。经过对比分析,表明对原始音频进行特征提取后训练的模型,机器异常声音检测性能有所提升。 展开更多
关键词 异常声音检测 深度学习 对数mel Mobilenetv2
下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:44
5
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 mel频率倒系数 Gammatone滤波器
下载PDF
基于MFCC的说话人识别系统 被引量:19
6
作者 郭春霞 裘雪红 《电子科技》 2005年第11期53-56,共4页
说话人识别可以被看作语音识别的一种,是当前的研究热点之一。本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数。试验比较了MFCC、差分MFCC组合MFCC分... 说话人识别可以被看作语音识别的一种,是当前的研究热点之一。本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数。试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率。得出差分MFCC组合MFCC优于MFCC。 展开更多
关键词 说话人识别 mel频率倒系数 特征提取
下载PDF
基于MFCC参数和VQ的说话人识别系统 被引量:30
7
作者 王伟 邓辉文 《仪器仪表学报》 EI CAS CSCD 北大核心 2006年第z3期2253-2255,共3页
采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别系统。MFCC主要的是模拟人耳的听觉过程,相对于其它参数它对语音波形的变化不敏感,更加稳定,系统取得很... 采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数,以及为避免时间规整问题采用矢量量化技术开发的说话人识别系统。MFCC主要的是模拟人耳的听觉过程,相对于其它参数它对语音波形的变化不敏感,更加稳定,系统取得很好的识别结果,实验表明系统训练和识别的计算量和存储量都比较低。 展开更多
关键词 说话人识别 mel系数 矢量量化
下载PDF
分布式光纤振动传感信号识别的研究 被引量:28
8
作者 邹东伯 刘海 +1 位作者 赵亮 康迎杰 《激光技术》 CAS CSCD 北大核心 2016年第1期86-89,共4页
为了能够更好地识别入侵振动信号,通过研究分布式光纤振动传感器及振动信号的识别技术,根据振动信号的特点,借鉴语音信号的处理方法,对比原有基于快速傅里叶变换频谱分析算法,引入了基于Mel频率倒谱系数的识别算法。新算法从频域的角度... 为了能够更好地识别入侵振动信号,通过研究分布式光纤振动传感器及振动信号的识别技术,根据振动信号的特点,借鉴语音信号的处理方法,对比原有基于快速傅里叶变换频谱分析算法,引入了基于Mel频率倒谱系数的识别算法。新算法从频域的角度对振动信号进行分析,提取不同环境状态下的Mel频率倒谱系数,并将其作为新的特征参量。通过实验对比分析两种算法,两者的误报率分别为27.5%和7.5%。结果表明,基于Mel频率倒谱系数的算法相比基于快速傅里叶变换的频谱分析算法,在误报率上可以降低20%甚至更多,在不漏报的前提下,显然误报率更低的基于Mel频率倒谱系数的算法更加适用于安防体系。 展开更多
关键词 传感器技术 分布式光纤振动传感器 振动信号 快速傅里叶变换 mel频率倒系数
下载PDF
基于MFCC特征提取和改进SVM的语音情感数据挖掘分类识别方法研究 被引量:27
9
作者 张钰莎 蒋盛益 《计算机应用与软件》 北大核心 2020年第8期160-165,212,共7页
设计一种语音情感数据挖掘分类识别方法。对语音情感信号进行预处理,进一步从语音话语中提取Mel频率倒谱系数(MFCC)和Mel能谱动态系数(MEDC);使用支持向量机(SVM)来分类不同的情绪状态,如愤怒、快乐、悲伤、中立、恐惧等,并基于径向基函... 设计一种语音情感数据挖掘分类识别方法。对语音情感信号进行预处理,进一步从语音话语中提取Mel频率倒谱系数(MFCC)和Mel能谱动态系数(MEDC);使用支持向量机(SVM)来分类不同的情绪状态,如愤怒、快乐、悲伤、中立、恐惧等,并基于径向基函数(RBF)内核进行训练阶段;应用柏林情感数据库和CASIA汉语情感语料库从情绪语音文件中提取特征。实验结果表明,柏林数据库和CASIA汉语情感语料库的正确识别率分别为82%和90.39%。与几种先进的对比方法进行比较,该方法在不同降维、不同信噪比下均取得了最优的识别精度。 展开更多
关键词 语音情感识别 支持向量机 数据挖掘 mel频率倒系数 mel动态系数
下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
10
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 mel频率倒系数(MFCC) 语音识别 特征提取
下载PDF
一种改进的基于倒谱特征的带噪端点检测方法 被引量:13
11
作者 于迎霞 史家茂 《计算机工程》 CAS CSCD 北大核心 2004年第19期85-87,共3页
影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分... 影响语音识别性能的一个关键因素是端点检测的准确性。实际应用中的信噪比较低,使得某些高信噪比下性能好的检测算法不能有效地工作,影响系统的识别率。该文针对基于倒谱特征的带噪端点检测算法提出了3点改进:(1) 将语音信号经滤波后分成高低频两子带,分别进行分析;(2) 用LPC美尔倒谱特征LPCCMCC代替常规倒谱特征作为特征参数;(3) 改进噪声估计,使其具有自适应性。实验结果表明本方法在低信噪比下有较好的检测性能。 展开更多
关键词 端点检测 LPC美尔倒系数 语音识别 滤波 mel距离
下载PDF
基于MFCC特征提取的故障预测与评价方法 被引量:19
12
作者 常飞 乔欣 +1 位作者 张申 许华栋 《计算机应用研究》 CSCD 北大核心 2015年第6期1716-1719,共4页
针对渐变故障的准确预测问题,提出了一种基于Mel频率倒谱系数(Mel frequency cestrum coefficient,MFCC)特征提取的故障预测方法。首先通过监测对象上安装的声传感器获得机器当前运行的声音信号;然后声音信号经过预处理后,将其进行Mel变... 针对渐变故障的准确预测问题,提出了一种基于Mel频率倒谱系数(Mel frequency cestrum coefficient,MFCC)特征提取的故障预测方法。首先通过监测对象上安装的声传感器获得机器当前运行的声音信号;然后声音信号经过预处理后,将其进行Mel变换,获得其MFCC特征向量;最后经SVM分析器对机器运行时的测试数据和所存机器正常运行样本数据进行聚类分析,给出机器的健康评价。测试了海马M3发动机存在撞击声、轻敲声、轰鸣声时的健康度以及分析了采集的声信号存在噪声时的抗噪性能。实验结果表明,MFCC特征值能够作为机器健康预测的特征向量,且方法在预测的准确性和鲁棒性方面具有优势。 展开更多
关键词 故障预测 mel频率倒系数 聚类分析 支持向量机
下载PDF
混合MFCC特征参数应用于语音情感识别 被引量:19
13
作者 周萍 李晓盼 +1 位作者 李杰 景新幸 《计算机测量与控制》 北大核心 2013年第7期1966-1968,1986,共4页
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提... 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 展开更多
关键词 mel频率倒系数(MFCC) 增减分量法 特征提取
下载PDF
MFCC特征改进算法在语音识别中的应用 被引量:15
14
作者 俸云 景新幸 叶懋 《计算机工程与科学》 CSCD 北大核心 2009年第12期146-148,共3页
本文的目的是阐明一种Mel频率倒谱参数特征的改进算法。该算法是通过线性预测的方法从语音信号中提取出残差相位,同时将残差相位与传统的MFCC相结合,并应用到语音识别系统中。该改进算法比传统的MFCC算法具有更好的识别率。
关键词 语音识别 mel系数 残差相位 线性预测
下载PDF
利用抗噪幂归一化倒谱系数的鸟类声音识别 被引量:17
15
作者 颜鑫 李应 《电子学报》 EI CAS CSCD 北大核心 2013年第2期295-300,共6页
针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪... 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC).最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验.实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别. 展开更多
关键词 鸟类声音识别 非平稳噪声估计 多频带减法 抗噪幂归一化倒系数 mel频率倒系数
下载PDF
基于LPC美尔倒谱特征的带噪语音端点检测 被引量:6
16
作者 古丽拉.阿东别克 于迎霞 《电声技术》 北大核心 2004年第2期53-55,58,共4页
复杂的噪声环境是语音识别系统在实际应用中性能下降的原因之一,识别预处理中的带噪端点检测作为关键技术,其性能的优劣某种程度上决定了识别率的高低。笔者提出了基于LPC美尔倒谱特征的带噪端点检测方法,对语音信号分高低频段分别提取... 复杂的噪声环境是语音识别系统在实际应用中性能下降的原因之一,识别预处理中的带噪端点检测作为关键技术,其性能的优劣某种程度上决定了识别率的高低。笔者提出了基于LPC美尔倒谱特征的带噪端点检测方法,对语音信号分高低频段分别提取LPC美尔倒谱特征分析,根据Mel倒谱距离判决,采用自适应噪声估计,实验结果表明,该方法计算效率较高,低信噪比下有较好的检测性能。 展开更多
关键词 语音识别 带噪端点检测 LPC美尔倒特征 mel距离
下载PDF
基于DSP的嵌入式语音识别系统的实现 被引量:10
17
作者 李鹏怀 徐佩霞 《计算机工程》 EI CAS CSCD 北大核心 2005年第16期160-162,共3页
设计并实现了一种嵌入式语音识别系统。硬件核心处理器是ADSP2181,语音接口芯片为AD1847。软件模块包括语音端点检测、MFCC求取、动态时间弯折算法、识别结果判定、模板训练等。系统使用定点DSP实现了浮点DSP运算,提高了运算的精度,扩... 设计并实现了一种嵌入式语音识别系统。硬件核心处理器是ADSP2181,语音接口芯片为AD1847。软件模块包括语音端点检测、MFCC求取、动态时间弯折算法、识别结果判定、模板训练等。系统使用定点DSP实现了浮点DSP运算,提高了运算的精度,扩大了信号处理的动态范围。实验结果表明,该系统对孤立词特定人的识别率为98%。它可用于声控玩具、智能家电等,具有较大的市场应用价值。 展开更多
关键词 语音识别 数字信号处理 mel系数
下载PDF
基于MFCC特征的声纹同一性鉴定方法 被引量:16
18
作者 王学光 诸珺文 张爱新 《计算机科学》 CSCD 北大核心 2021年第12期343-348,共6页
声纹作为当代司法鉴定技术发展的产物,在现代声像资料鉴定中发挥了至关重要的作用。传统的声纹分析方法是基于声音处理工具进行手工分析的,考虑到其具有严格的文本相关性以及比对的臆断性的缺点,其作为证据鉴定意见的证明力有待加强。... 声纹作为当代司法鉴定技术发展的产物,在现代声像资料鉴定中发挥了至关重要的作用。传统的声纹分析方法是基于声音处理工具进行手工分析的,考虑到其具有严格的文本相关性以及比对的臆断性的缺点,其作为证据鉴定意见的证明力有待加强。文中提出了一种基于Mel频率倒谱系数的同一性鉴定方法,即提取并量化包含原始声音的共振峰及其时间轴信息的包络作为声纹特征进行同一性比对。此方法改进了传统Mel频率倒谱系数的不足,提取共振峰的突变并将元音与响辅音的转变特性加入声纹特征,以提高其识别度。实验证明,此方法在检材与样本无关的情况下,同一性鉴定的准确率达到了85%,方差控制在9%左右,具有良好的同一性识别;而在非同一性鉴定中,该方法也能在结合人工分析的情况下给出较准确的结果。 展开更多
关键词 MFCC特征 mel频率倒系数 同一性鉴定 证明力补强
下载PDF
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
19
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 mel频率倒参数 相关系数
下载PDF
时频谱图和数据增强的水声信号深度学习目标识别方法 被引量:15
20
作者 刘峰 罗再磊 +1 位作者 沈同圣 赵德鑫 《应用声学》 CSCD 北大核心 2021年第4期518-524,共7页
水声目标识别一直是水声领域研究的重点问题之一,深度学习方法可以有效地解决目标识别问题,然而,水声样本的稀少限制了该方法的应用。该文提出一种基于数据增强的水声信号深度学习目标识别方法,该方法以Mel功率谱作为网络的输入特征,通... 水声目标识别一直是水声领域研究的重点问题之一,深度学习方法可以有效地解决目标识别问题,然而,水声样本的稀少限制了该方法的应用。该文提出一种基于数据增强的水声信号深度学习目标识别方法,该方法以Mel功率谱作为网络的输入特征,通过对原始信号在时域和时频域的拉伸和掩蔽等变换,实现数据扩展和增加泛化性能的目的,最后,利用改进的VGG网络模型实现目标分类。实验结果表明,该文方法得到的水下目标识别准确率(95.2%)要优于其他4种对比方法,证明了该文提出的网络模型和数据增强方法均有助于提高目标分类性能。 展开更多
关键词 水声目标识别 卷积神经网络 数据增强 mel功率
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部