期刊文献+
共找到411篇文章
< 1 2 21 >
每页显示 20 50 100
MFCC特征训练技术在声纹识别中的应用 被引量:1
1
作者 陶雨昂 《集成电路应用》 2024年第2期386-387,共2页
阐述MFCC声纹特征提取的原理、MFCC特征提取模式和基于MFCC声纹识别的实现。提取模式包括MFCC提取流程、短时傅立叶变换STFT、梅尔滤波器组的构造、离散余弦变换(DCT)与MFCC特征值的提取。针对融合特征提取方案可分性与鲁棒性的缺陷提... 阐述MFCC声纹特征提取的原理、MFCC特征提取模式和基于MFCC声纹识别的实现。提取模式包括MFCC提取流程、短时傅立叶变换STFT、梅尔滤波器组的构造、离散余弦变换(DCT)与MFCC特征值的提取。针对融合特征提取方案可分性与鲁棒性的缺陷提出改进方案。 展开更多
关键词 模式识别 频率 特征提取 音频信息
下载PDF
基于MFCC与GFCC混合特征参数的说话人识别 被引量:44
2
作者 周萍 沈昊 郑凯鹏 《应用科学学报》 CAS CSCD 北大核心 2019年第1期24-32,共9页
针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,... 针对说话人识别中单一参数表征不够全面的特点,将抗噪性能一般的传统MFCC参数与鲁棒性更强的GFCC参数相互融合,并结合它们的动态特性构成一种新的混合参数.针对特征参数维数过高造成的冗余,研究了每种特征参数各分量与识别结果的关系,舍弃其中贡献较低的分量以实现特征参数降维的目的,并将混合参数应用于基于高斯混合模型的说话人识别系统.仿真实验表明,该混合特征参数具有更好的识别性能和抗噪性. 展开更多
关键词 说话人识别 混合特征参数 MEL频率系数 Gammatone滤波器
下载PDF
基于MFCC的说话人识别系统 被引量:19
3
作者 郭春霞 裘雪红 《电子科技》 2005年第11期53-56,共4页
说话人识别可以被看作语音识别的一种,是当前的研究热点之一。本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数。试验比较了MFCC、差分MFCC组合MFCC分... 说话人识别可以被看作语音识别的一种,是当前的研究热点之一。本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数。试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率。得出差分MFCC组合MFCC优于MFCC。 展开更多
关键词 说话人识别 MEL频率系数 特征提取
下载PDF
地震和爆破事件源波形信号的卷积神经网络分类研究 被引量:29
4
作者 陈润航 黄汉明 柴慧敏 《地球物理学进展》 CSCD 北大核心 2018年第4期1331-1338,共8页
本文首先从震源波形中提取梅尔频率倒谱系数(MFCC)图,然后采用卷积神经网络(CNN)进行地震波形信号的震源类型—天然地震和爆破事件—分类识别.事件为首都圈及其附近的72个天然地震和101个人工爆破事件,用于提取梅尔频率倒谱系数图的波... 本文首先从震源波形中提取梅尔频率倒谱系数(MFCC)图,然后采用卷积神经网络(CNN)进行地震波形信号的震源类型—天然地震和爆破事件—分类识别.事件为首都圈及其附近的72个天然地震和101个人工爆破事件,用于提取梅尔频率倒谱系数图的波形信号为各观测台站波形3分量中的垂直分量波形.在各个事件的所有观测台站的垂直分量波形中,通过滑动窗口按同一准则去除被噪声淹没的部分台站波形,只选择留下未被噪声淹没的台站波形.每一个事件有107个观测台站,故有107份垂直分量波形,而不同事件被留下未被噪声淹没的波形则有几份至几十份不等.然后提取被留下未被噪声淹没的波形的梅尔频率倒谱系数图,以梅尔频率倒谱系数图作为CNN的输入,CNN的输出则为波形的震源类型(天然地震事件或爆破事件).若以单份波形为识别单元,采用五折交叉验证法进行测试,得到的平均准确率为95.78%.使用训练集中单份波形为识别单元,提取梅尔频率倒谱系数图,采用CNN训练出了天然地震事件与爆破事件波形分类器,一个事件在测试集中的多份波形信号通常不会都被正确识别,很可能有些波形被识别为天然地震事件,另一些波形被识别为爆破事件;这时,若识别单元改为事件,一个事件各台站的有效垂直分量波形中,超过一半的波形被识别为某一事件类型,则这个事件被归类为该事件类型,得到的正确识别率为97.1%.实验结果表明:卷积神经网络在天然地震事件与爆破事件的识别方面表现出色.这说明MFCC与卷积神经网络可以用于识别天然地震和爆破事件,尤其是深度学习更值得在地震信号处理方面做进一步的研究. 展开更多
关键词 天然地震事件 爆破事件 震源波形 震源类型识别 梅尔频率系数 卷积神经网络
原文传递
分布式光纤振动传感信号识别的研究 被引量:28
5
作者 邹东伯 刘海 +1 位作者 赵亮 康迎杰 《激光技术》 CAS CSCD 北大核心 2016年第1期86-89,共4页
为了能够更好地识别入侵振动信号,通过研究分布式光纤振动传感器及振动信号的识别技术,根据振动信号的特点,借鉴语音信号的处理方法,对比原有基于快速傅里叶变换频谱分析算法,引入了基于Mel频率倒谱系数的识别算法。新算法从频域的角度... 为了能够更好地识别入侵振动信号,通过研究分布式光纤振动传感器及振动信号的识别技术,根据振动信号的特点,借鉴语音信号的处理方法,对比原有基于快速傅里叶变换频谱分析算法,引入了基于Mel频率倒谱系数的识别算法。新算法从频域的角度对振动信号进行分析,提取不同环境状态下的Mel频率倒谱系数,并将其作为新的特征参量。通过实验对比分析两种算法,两者的误报率分别为27.5%和7.5%。结果表明,基于Mel频率倒谱系数的算法相比基于快速傅里叶变换的频谱分析算法,在误报率上可以降低20%甚至更多,在不漏报的前提下,显然误报率更低的基于Mel频率倒谱系数的算法更加适用于安防体系。 展开更多
关键词 传感器技术 分布式光纤振动传感器 振动信号 快速傅里叶变换 MEL频率系数
下载PDF
GMM文本无关的说话人识别系统研究 被引量:27
6
作者 蒋晔 唐振民 《计算机工程与应用》 CSCD 北大核心 2010年第11期179-182,195,共5页
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。... 在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。 展开更多
关键词 说话人识别 高斯混合模型 美尔频率系数(MFCC) 分裂法与K均值聚类结合法
下载PDF
基于MFCC特征提取和改进SVM的语音情感数据挖掘分类识别方法研究 被引量:27
7
作者 张钰莎 蒋盛益 《计算机应用与软件》 北大核心 2020年第8期160-165,212,共7页
设计一种语音情感数据挖掘分类识别方法。对语音情感信号进行预处理,进一步从语音话语中提取Mel频率倒谱系数(MFCC)和Mel能谱动态系数(MEDC);使用支持向量机(SVM)来分类不同的情绪状态,如愤怒、快乐、悲伤、中立、恐惧等,并基于径向基函... 设计一种语音情感数据挖掘分类识别方法。对语音情感信号进行预处理,进一步从语音话语中提取Mel频率倒谱系数(MFCC)和Mel能谱动态系数(MEDC);使用支持向量机(SVM)来分类不同的情绪状态,如愤怒、快乐、悲伤、中立、恐惧等,并基于径向基函数(RBF)内核进行训练阶段;应用柏林情感数据库和CASIA汉语情感语料库从情绪语音文件中提取特征。实验结果表明,柏林数据库和CASIA汉语情感语料库的正确识别率分别为82%和90.39%。与几种先进的对比方法进行比较,该方法在不同降维、不同信噪比下均取得了最优的识别精度。 展开更多
关键词 语音情感识别 支持向量机 数据挖掘 MEL频率系数 Mel能动态系数
下载PDF
羊咳嗽声的特征参数提取与识别方法 被引量:25
8
作者 宣传忠 武佩 +3 位作者 张丽娜 马彦华 张永安 邬娟 《农业机械学报》 EI CAS CSCD 北大核心 2016年第3期342-348,共7页
为在设施圈养羊只产生呼吸道疾病的初期,通过监测其咳嗽声进行疾病预警和健康状况诊断,以内蒙古地区广泛推广的杜泊羊为例,对杜泊羊的咳嗽声信号进行自动采集和计算机识别,在不增加羊咳嗽声特征参数维数的前提下,提出一种改进的梅尔频... 为在设施圈养羊只产生呼吸道疾病的初期,通过监测其咳嗽声进行疾病预警和健康状况诊断,以内蒙古地区广泛推广的杜泊羊为例,对杜泊羊的咳嗽声信号进行自动采集和计算机识别,在不增加羊咳嗽声特征参数维数的前提下,提出一种改进的梅尔频率倒谱系数(MFCC),试验结果表明,该参数和短时能量、过零率组合的14维特征参数,经过羊咳嗽声隐马尔可夫模型(HMM)识别系统,其识别率、误识别率和总识别率分别达到了86.23%、7.17%和88.43%,该组合特征参数经主成分分析可降到9维,而通过BP神经网络改善的HMM咳嗽声识别系统,对咳嗽声的识别率、误识别率和总识别率分别达到了92.54%、5.37%和95.04%,满足了杜泊羊咳嗽声识别的要求。 展开更多
关键词 杜泊羊 咳嗽声 特征参数提取 梅尔频率系数 隐马尔可夫模型
下载PDF
基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法 被引量:22
9
作者 胡峰松 张璇 《计算机应用》 CSCD 北大核心 2012年第9期2542-2544,共3页
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFC... 为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。 展开更多
关键词 说话人识别 梅尔频率系数 翻转梅尔频率系数 FISHER准则 高斯混合模型
下载PDF
改进的混合MFCC语音识别算法研究 被引量:18
10
作者 袁正午 肖旺辉 《计算机工程与应用》 CSCD 北大核心 2009年第33期108-110,共3页
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音... 针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。 展开更多
关键词 Mel频率系数(MFCC) 语音识别 特征提取
下载PDF
基于Fisher线性判别分析的语音信号端点检测方法 被引量:20
11
作者 王明合 张二华 +1 位作者 唐振民 许昊 《电子与信息学报》 EI CSCD 北大核心 2015年第6期1343-1349,共7页
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fis... 传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 展开更多
关键词 语音处理 语音端点检测 梅尔频率系数 FISHER线性判别分析
下载PDF
基于声信号特征加权的设施养殖羊行为分类识别 被引量:19
12
作者 宣传忠 马彦华 +3 位作者 武佩 张丽娜 郝敏 张曦宇 《农业工程学报》 EI CAS CSCD 北大核心 2016年第19期195-202,共8页
中国西部地区正在发展集约化和规模化的设施养羊业,通过监测羊舍内的声信号可以判别羊只的行为状态,从而为设施养羊的福利化水平评估提取基础依据。梅尔频率倒谱系数(mel frequency cepstrum coefficient,MFCC)模拟了人耳对语音的处理... 中国西部地区正在发展集约化和规模化的设施养羊业,通过监测羊舍内的声信号可以判别羊只的行为状态,从而为设施养羊的福利化水平评估提取基础依据。梅尔频率倒谱系数(mel frequency cepstrum coefficient,MFCC)模拟了人耳对语音的处理特点且抗噪音性强,被广泛用于畜禽发声信号的特征提取,但其没有考虑各个特征分量表征声信号的能力。该研究构建羊舍无线声音数据采集系统,采集20只羊在设施羊舍内的打斗、饥饿、咳嗽、啃咬和寻伴共5种行为下的声信号,并通过Audacity音频处理软件选出720个清晰且不重叠的声音样本数据。根据MFCC各分量对羊舍声信号表征能力,特征参数提取采用一种熵值加权的MFCC参数,再求其一、二阶差分并进行主成分分析降维,得到优化的19维特征参数。通过对羊舍声信号的声谱图分析,设计了支持向量机二叉树识别模型,并对模型内的4个分类器参数进行网格化寻优测试,该识别模型对羊只5种行为下的声信号进行分类识别,用改进的特征参数与传统MFCC和线性预测倒谱系数(linear predictive cepstrum coefficient,LPCC)进行对比分析。结果表明,该特征参数对5种行为的识别率平均可达83.6%,分别高于MFCC和LPCC参数14.1%和26.8%,羊只打斗和咳嗽行为的声信号属于相似的短时爆发类声音,其识别率分别仅为80.6%和79.5%,啃咬声特征显著不易混淆,其查全率可达到为92.5%,改进特征参数更好的表征了羊舍声信号的特征,提高了羊只不同行为的识别率,为羊只健康和福利状况的监测提供理论依据。 展开更多
关键词 动物 设施 声信号处理 梅尔频率系数 特征提取 支持向量机 行为识别
下载PDF
基于MFCC特征提取的故障预测与评价方法 被引量:19
13
作者 常飞 乔欣 +1 位作者 张申 许华栋 《计算机应用研究》 CSCD 北大核心 2015年第6期1716-1719,共4页
针对渐变故障的准确预测问题,提出了一种基于Mel频率倒谱系数(Mel frequency cestrum coefficient,MFCC)特征提取的故障预测方法。首先通过监测对象上安装的声传感器获得机器当前运行的声音信号;然后声音信号经过预处理后,将其进行Mel变... 针对渐变故障的准确预测问题,提出了一种基于Mel频率倒谱系数(Mel frequency cestrum coefficient,MFCC)特征提取的故障预测方法。首先通过监测对象上安装的声传感器获得机器当前运行的声音信号;然后声音信号经过预处理后,将其进行Mel变换,获得其MFCC特征向量;最后经SVM分析器对机器运行时的测试数据和所存机器正常运行样本数据进行聚类分析,给出机器的健康评价。测试了海马M3发动机存在撞击声、轻敲声、轰鸣声时的健康度以及分析了采集的声信号存在噪声时的抗噪性能。实验结果表明,MFCC特征值能够作为机器健康预测的特征向量,且方法在预测的准确性和鲁棒性方面具有优势。 展开更多
关键词 故障预测 MEL频率系数 聚类分析 支持向量机
下载PDF
混合MFCC特征参数应用于语音情感识别 被引量:19
14
作者 周萍 李晓盼 +1 位作者 李杰 景新幸 《计算机测量与控制》 北大核心 2013年第7期1966-1968,1986,共4页
引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提... 引入两种新的特征参数Mid-MFCC和IMFCC,采用MFCC、Mid-MFCC和IMFCC相结合的改进算法,解决MFCC特征参数在语音识别中对中、高频信号的识别精度不高的特点,并使用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成了新的特征参数;实验结果表明,在相同环境下新的特征参数比经典MFCC特征参数的语音情感的识别率稍高。 展开更多
关键词 Mel频率系数(MFCC) 增减分量法 特征提取
下载PDF
利用抗噪幂归一化倒谱系数的鸟类声音识别 被引量:17
15
作者 颜鑫 李应 《电子学报》 EI CAS CSCD 北大核心 2013年第2期295-300,共6页
针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪... 针对真实环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术.首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱.其次,使用多频带谱减法对声音功率谱进行降噪处理.接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC).最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验.实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别. 展开更多
关键词 鸟类声音识别 非平稳噪声估计 多频带减法 抗噪幂归一化系数 MEL频率系数
下载PDF
基于多核学习特征融合的语音情感识别方法 被引量:17
16
作者 王忠民 刘戈 宋辉 《计算机工程》 CAS CSCD 北大核心 2019年第8期248-254,共7页
在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基... 在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基础上,使用多核学习算法融合音频特征,并将生成的核函数应用于支持向量机进行情感分类。在2种语音情感数据集上的实验结果表明,与单一特征的分类器相比,该方法的语音情感识别准确率高达96 %。 展开更多
关键词 语音情感识别 多核学习 卷积神经网络 梅尔频率系数
下载PDF
基于MFCC和时频图等多种特征的综合鸟声识别分类器设计 被引量:17
17
作者 徐淑正 孙忆南 +1 位作者 皇甫丽英 方玮骐 《实验室研究与探索》 CAS 北大核心 2018年第9期81-86,91,共7页
基于音节长度、梅尔频率倒谱系数(MFCC),基于线性预测编码(LPC)系数的动态时间规整(DTW)模板和结合时-频纹理特征,应用于鸟声识别的多标签分类器,通过在特征提取和分类器选择上进行优化并综合不同分类器的决策结果以改善单一分类器的性... 基于音节长度、梅尔频率倒谱系数(MFCC),基于线性预测编码(LPC)系数的动态时间规整(DTW)模板和结合时-频纹理特征,应用于鸟声识别的多标签分类器,通过在特征提取和分类器选择上进行优化并综合不同分类器的决策结果以改善单一分类器的性能。同时,系统在消除噪声和稳定性方面也做出了提高。经最终测试,本系统在多达11类的鸟声分类中可以达到92%的准确率。 展开更多
关键词 音频增强 语音信号处理 机器学习 梅尔频率系数
下载PDF
基于音频技术的白羽肉鸡咳嗽识别算法研究 被引量:17
18
作者 秦伏亮 沈明霞 +3 位作者 刘龙申 孙玉文 郑荷花 陆鹏宇 《南京农业大学学报》 CAS CSCD 北大核心 2020年第2期372-378,共7页
[目的]咳嗽是肉鸡呼吸道发病初期的主要症状,为实现肉鸡呼吸道疾病非接触式监测,本研究提出一种肉鸡咳嗽声识别算法。[方法]利用网络拾音器采集白羽肉鸡咳嗽及其他声音数据,选用最小均方误差(MMSE)谱减法对其进行滤波去噪;经预处理后人... [目的]咳嗽是肉鸡呼吸道发病初期的主要症状,为实现肉鸡呼吸道疾病非接触式监测,本研究提出一种肉鸡咳嗽声识别算法。[方法]利用网络拾音器采集白羽肉鸡咳嗽及其他声音数据,选用最小均方误差(MMSE)谱减法对其进行滤波去噪;经预处理后人工截取肉鸡咳嗽样本与噪声样本;提取样本基于小波变换的梅尔频率倒谱系数(WMFCC)特征,构建高斯混合模型-隐马尔科夫模型(GMM-HMM)识别算法,训练并调整优化咳嗽识别模型。[结果]试验表明,在隐状态数为3,高斯元个数为3时,该模型在测试集上达到最优识别效果,正确率为98.7%。将算法识别结果与人工分类结果比较,肉鸡咳嗽识别算法的平均准确率为95%。[结论]本文提出的肉鸡咳嗽算法模型能较好地检测肉鸡咳嗽,为肉鸡呼吸道疾病的早期自动预警提供技术支持。 展开更多
关键词 白羽肉鸡 咳嗽识别 最小均方误差(MMSE)减法 基于小波变换的梅尔频率系数(WMFCC) 机器学习
下载PDF
基于深度神经网络的猪咳嗽声识别方法 被引量:16
19
作者 沈明霞 王梦雨 +3 位作者 刘龙申 陈佳 太猛 张伟 《农业机械学报》 EI CAS CSCD 北大核心 2022年第5期257-266,共10页
猪只呼吸道疾病易传染,影响猪的养殖生产效率,咳嗽是呼吸道疾病的显著症状之一,为识别猪只咳嗽声,提出了一种基于深度神经网络的识别方法。对声音信号进行谱减法去噪和双门限端点检测后分别提取梅山猪咳嗽及喷嚏、鸣叫、呼噜声的滤波器... 猪只呼吸道疾病易传染,影响猪的养殖生产效率,咳嗽是呼吸道疾病的显著症状之一,为识别猪只咳嗽声,提出了一种基于深度神经网络的识别方法。对声音信号进行谱减法去噪和双门限端点检测后分别提取梅山猪咳嗽及喷嚏、鸣叫、呼噜声的滤波器组(Log_filter bank,logFBank)和梅尔频率倒谱系数(Mel frequency cepstral coefficents,MFCC)特征,每种特征与其一阶及二阶差分组合作为卷积神经网络(Convolutional neural networks,CNNs)和深层前馈序列记忆神经网络(Deep feed forward sequential memory networks,DFSMN)咳嗽声识别模型的输入,进行多分类训练。对比不同特征提取方法及不同迭代次数对模型效果的影响,实验结果表明,以MFCC作为特征输入的CNNs模型效果较优,测试集上咳嗽声识别精确率为97%,召回率为96%,F1值为98%,总体识别准确率为96.71%。表明该模型有效可行,可为生猪福利养殖中猪咳嗽声识别提供技术支持。 展开更多
关键词 梅山猪 咳嗽声识别 滤波器组 梅尔频率系数 深度神经网络
下载PDF
基于MFCC特征与GMM的输电线路渉鸟故障相关鸟种智能识别 被引量:16
20
作者 陈瀚翔 邱志斌 +2 位作者 王海祥 况燕军 李阳林 《水电能源科学》 北大核心 2021年第7期171-174,67,共5页
鸟类的频繁活动严重影响输电线路的安全运行,为实现渉鸟故障的差异化防治,提出了一种基于鸣声信号Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的鸟种识别方法。以引起渉鸟故障的16种典型鸟类为对象,建立其鸣声信号数据库,并对鸟鸣信号进... 鸟类的频繁活动严重影响输电线路的安全运行,为实现渉鸟故障的差异化防治,提出了一种基于鸣声信号Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的鸟种识别方法。以引起渉鸟故障的16种典型鸟类为对象,建立其鸣声信号数据库,并对鸟鸣信号进行筛选和裁剪处理,提取其MFCC特征参数。建立GMM分类识别模型,随机选取640个训练样本的MFCC特征参数作为输入量,对模型进行训练,并识别320个测试样本,16种鸟类的识别准确率在80.0%-96.7%。研究结果可为运维人员正确识别输电线路附近鸟种并进行精准化防治提供参考,有助于降低渉鸟故障发生率。 展开更多
关键词 输电线路 涉鸟故障 鸟种识别 梅尔频率系数 高斯混合模型
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部