期刊文献+
共找到67篇文章
< 1 2 4 >
每页显示 20 50 100
话者识别系统中语音特征参数的研究与仿真 被引量:17
1
作者 王金明 张雄伟 《系统仿真学报》 CAS CSCD 2003年第9期1276-1278,共3页
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用... 在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响。通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。 展开更多
关键词 说话者识别 动态特征 线性预测倒谱系数 美尔倒谱系数 仿真
下载PDF
基于改进梅尔倒谱系数的GIS机械故障诊断方法 被引量:21
2
作者 徐明月 李喆 +2 位作者 孙汉文 盛戈皞 江秀臣 《高压电器》 CAS CSCD 北大核心 2020年第9期122-128,共7页
机械故障是GIS常见的故障,若不及时发现会造成分合闸失误等重大安全隐患。文中提出了一种用于GIS机械故障在线监测的基于改进梅尔倒谱系数诊断方法。首先对预处理后的声音信号提取MFCC;为适应GIS运行声音能量变化平缓的特点,对MFCC进行... 机械故障是GIS常见的故障,若不及时发现会造成分合闸失误等重大安全隐患。文中提出了一种用于GIS机械故障在线监测的基于改进梅尔倒谱系数诊断方法。首先对预处理后的声音信号提取MFCC;为适应GIS运行声音能量变化平缓的特点,对MFCC进行优化得到改进特征;引入SVM构建基于声学的GIS机械故障诊断模型,并采用袋装算法对SVM模型进行集成。本研究通过在真型GIS上模拟机械故障,获取真实的故障声音信号进行训练和测试。实验结果表明,改进MFCC相较于传统MFCC在GIS故障声音识别系统中有着更高的识别精度。并且对比传统MFCC特征,改进的特征在噪声条件下也有更好的表现,尤其在信噪比低时,F1分数提升幅度可以达到30%左右。 展开更多
关键词 气体绝缘组合电器(GIS) 机械故障 故障诊断 梅尔倒谱系数 说话人识别
下载PDF
基于DSP的嵌入式语音识别系统的实现 被引量:10
3
作者 李鹏怀 徐佩霞 《计算机工程》 EI CAS CSCD 北大核心 2005年第16期160-162,共3页
设计并实现了一种嵌入式语音识别系统。硬件核心处理器是ADSP2181,语音接口芯片为AD1847。软件模块包括语音端点检测、MFCC求取、动态时间弯折算法、识别结果判定、模板训练等。系统使用定点DSP实现了浮点DSP运算,提高了运算的精度,扩... 设计并实现了一种嵌入式语音识别系统。硬件核心处理器是ADSP2181,语音接口芯片为AD1847。软件模块包括语音端点检测、MFCC求取、动态时间弯折算法、识别结果判定、模板训练等。系统使用定点DSP实现了浮点DSP运算,提高了运算的精度,扩大了信号处理的动态范围。实验结果表明,该系统对孤立词特定人的识别率为98%。它可用于声控玩具、智能家电等,具有较大的市场应用价值。 展开更多
关键词 语音识别 数字信号处理 mel倒谱系数
下载PDF
基于MFCC-SVM和交叉验证方法的环境音分类 被引量:8
4
作者 李玲俐 《计算机与现代化》 2016年第8期36-39,共4页
用于音乐和语音的识别方法不适用于环境音的识别。提出一种基于MFCC(Mel频率倒谱系数)-SVM(支持向量机)的方法,使用特征表示和学习优化共同来实现办公室10种环境音的分类。环境音数据使用的是IEEE Audio and Acoustic Signal Processing... 用于音乐和语音的识别方法不适用于环境音的识别。提出一种基于MFCC(Mel频率倒谱系数)-SVM(支持向量机)的方法,使用特征表示和学习优化共同来实现办公室10种环境音的分类。环境音数据使用的是IEEE Audio and Acoustic Signal Processing(AASP)Challenge Dataset下载的标准数据集。在分析和优化SVM参数过程中,通过改变Mel系数参数的个数,充分考虑有效的MFCC特征表示。实验结果表明,使用MFCC特征和SVM分类器,采用5-折交叉验证的测试方法,得到的平均分类准确率可达88.05%,分类效果明显优于默认的MFCC-SVM算法。 展开更多
关键词 mel频率倒谱系数 支持向量机 交叉验证 环境音分类 特征提取
下载PDF
基于LPCMCC的音频数据检索方法 被引量:5
5
作者 江星华 李应 《计算机工程》 CAS CSCD 北大核心 2009年第11期246-247,253,共3页
LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法... LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数(MFCC)。 展开更多
关键词 LPC倒谱系数 LPC美尔倒谱系数 音频检索 美尔倒谱系数
下载PDF
有效的基于内容的音频特征提取方法 被引量:6
6
作者 郑继明 魏国华 吴渝 《计算机工程与应用》 CSCD 北大核心 2009年第12期131-133,137,共4页
音频特征提取是音频分类的基础,好的特征将会有效提高分类精度。在提取频域特征Mel频率倒谱系数(MFCC)的同时,对每一帧信号做离散小波变换,提取小波域特征,把频域和小波域特征相结合计算其统计特征。通过SVM模型建立音频模板,对纯语音... 音频特征提取是音频分类的基础,好的特征将会有效提高分类精度。在提取频域特征Mel频率倒谱系数(MFCC)的同时,对每一帧信号做离散小波变换,提取小波域特征,把频域和小波域特征相结合计算其统计特征。通过SVM模型建立音频模板,对纯语音、音乐及带背景音乐的语音进行分类识别,取得了较高的识别精度。 展开更多
关键词 特征提取 小波变换 mel频率倒谱系数 支持向量机
下载PDF
基于GMM和聚类方法的储粮害虫声信号识别研究 被引量:6
7
作者 郭敏 张明真 《南京农业大学学报》 CAS CSCD 北大核心 2012年第6期44-48,共5页
通过储粮害虫声信号判断害虫活动情况对安全储粮意义重大。本研究采集了2种储粮害虫的活动声信号,首先提取声信号梅尔倒谱系数(MFCC)特征,然后以特征数据建立高斯混合模型(GMM),最后使用聚类方法对2种储粮害虫的4种活动声信号进行识别,... 通过储粮害虫声信号判断害虫活动情况对安全储粮意义重大。本研究采集了2种储粮害虫的活动声信号,首先提取声信号梅尔倒谱系数(MFCC)特征,然后以特征数据建立高斯混合模型(GMM),最后使用聚类方法对2种储粮害虫的4种活动声信号进行识别,识别率均达到80%以上。本研究验证了声检测法识别储粮害虫的可行性和有效性,具有较大的实际应用价值。 展开更多
关键词 高斯混合模型 梅尔倒谱系数 聚类 储粮害虫 声检测
下载PDF
基于多特征融合的GMM汉语普通话口音识别 被引量:3
8
作者 庞程 王秀玲 +1 位作者 张结 刘宏 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第S1期381-384 388,388,共5页
提出一种基于MFCC和共振峰频率特征的汉语普通话口音识别方法.该方法首先提取Mel频率倒谱系数(MFCC)和共振峰频率特征作为混合高斯模型(GMM)的输入,然后采用期望最大化(EM)算法训练模型,对两种特征分别建模,最后采用基于最大似然准则(ML... 提出一种基于MFCC和共振峰频率特征的汉语普通话口音识别方法.该方法首先提取Mel频率倒谱系数(MFCC)和共振峰频率特征作为混合高斯模型(GMM)的输入,然后采用期望最大化(EM)算法训练模型,对两种特征分别建模,最后采用基于最大似然准则(ML)的信息融合策略进行口音判别.实验数据库为7个地区的语音数据.经过交叉验证,该方法对于中国典型地区普通话口音的识别率达到85.61%,比单一使用MFCC特征或共振峰频率特征分别提高了6.62%和32.90%. 展开更多
关键词 口音识别 汉语普通话 mel频率倒谱系数 共振峰频率 信息融合 加权判别
原文传递
基于稀疏非负矩阵分解的低空声目标识别 被引量:3
9
作者 杨博 杨立学 +1 位作者 王志峰 周印龙 《声学技术》 CSCD 北大核心 2020年第1期93-97,共5页
借鉴人耳听觉原理和特征学习的优势,提出了梅尔(Mel)频率谱提取和稀疏非负矩阵分解相结合的方法用于低空飞行目标声信号识别。首先,以不同目标的Mel频率谱为特征矩阵,利用稀疏非负矩阵分解方法学习得到各自的模板矩阵;然后,利用按列合... 借鉴人耳听觉原理和特征学习的优势,提出了梅尔(Mel)频率谱提取和稀疏非负矩阵分解相结合的方法用于低空飞行目标声信号识别。首先,以不同目标的Mel频率谱为特征矩阵,利用稀疏非负矩阵分解方法学习得到各自的模板矩阵;然后,利用按列合并后的模板矩阵对训练/测试样本进行特征分解获得编码系数,该系数可作为分类特征;最后,结合不同目标的特点,采用分频段特征提取和顺序二类分类的方法进行多目标分类,并与Mel频率倒谱系数进行性能比较。结果显示,无论在单类目标辨识还是在多类目标分类中,稀疏非负矩阵分解方法均取得了更好的效果。 展开更多
关键词 低空声目标识别 梅尔频率倒谱系数 非负矩阵分解
下载PDF
基于BP网络的孤立数字识别 被引量:1
10
作者 金琰 张健 《辽宁工学院学报》 2007年第6期365-367,371,共4页
通过Mel频率倒谱系数的方法对语音信号波形进行处理,采用BP网络作为分类器,实现了孤立数字的语音识别系统,在matlab环境下对算法进行仿真。实验表明,这种方法具有计算简单,识别精度高的特点。
关键词 语音识别 mel频率倒谱系数 人工神经网络 BP网络
下载PDF
基于LLR融合基频与MFCC的说话人性别识别 被引量:1
11
作者 陈月朝 付卓 刘宏 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第S1期184-187,共4页
提出了一种基于线性逻辑回归的方法,对利用基频和MFCC特征获得的分数进行融合来进行说话人的性别识别,其中包括了基于基频特征的单高斯模型和基于MFCC特征的混合高斯模型.采用语音库包括男性语音文件150个,女性语音文件190个.实验结果... 提出了一种基于线性逻辑回归的方法,对利用基频和MFCC特征获得的分数进行融合来进行说话人的性别识别,其中包括了基于基频特征的单高斯模型和基于MFCC特征的混合高斯模型.采用语音库包括男性语音文件150个,女性语音文件190个.实验结果中识别率可高达97.65%,比传统单用基频或是MFCC特征的识别率都要高,具有更好的判别性能. 展开更多
关键词 音频信号处理 声流 鉴定 性别识别 基频 mel频率倒谱系数 线性逻辑回归
原文传递
基于多特征融合的乐器声品质评价方法研究
12
作者 陈燕文 李坤 +1 位作者 韩焱 王燕平 《测试技术学报》 2019年第5期421-427,共7页
在乐器声品质研究中,以往研究主要是从乐器的结构以及物理特性出发,忽略了乐音本身的重要性以及客观评价测量的不易实现性.为此,提出了一种基于多特征融合的乐器声品质评价方法.通过主观评价法获取乐器琵琶的声品质评价结果,建立具有主... 在乐器声品质研究中,以往研究主要是从乐器的结构以及物理特性出发,忽略了乐音本身的重要性以及客观评价测量的不易实现性.为此,提出了一种基于多特征融合的乐器声品质评价方法.通过主观评价法获取乐器琵琶的声品质评价结果,建立具有主观评价的乐音信号库作为实验对象;提取乐音信号的相关系数(CC)、常数Q变换(CQT)和梅尔频率倒谱系数(MFCC)作为单一特征输入,以及多特征融合输入;并构建基于BP神经网络的乐器声品质评价模型.实验结果表明,该方法可以很好地应用于乐器声品质评价. 展开更多
关键词 乐器声品质 主观评价 相关系数 mfcc 常数Q变换 多特征融合 BP神经网络
下载PDF
基于深度学习的低空声目标识别
13
作者 王显云 王志峰 黄山 《电声技术》 2022年第3期67-70,74,共5页
本文提出采用人耳听觉特征和深度神经网络(Deep Neural Network,DNN)相结合的方式对低空飞行目标进行分类。首先,以不同目标的梅尔频率谱(Mel-Frequency Cepstrum Coefficients,MFCC)和伽玛通功率谱(Gammatone Filterbank spectra,GF)... 本文提出采用人耳听觉特征和深度神经网络(Deep Neural Network,DNN)相结合的方式对低空飞行目标进行分类。首先,以不同目标的梅尔频率谱(Mel-Frequency Cepstrum Coefficients,MFCC)和伽玛通功率谱(Gammatone Filterbank spectra,GF)为静态特征,并以它们的差分谱作为动态特征;其次,利用谐波处理技术获得具有谐波保护的上述静态特征和动态特征;最后,将上述特征进行组合,作为深度神经网络的输入参数进行网络训练,来进行不同低空声目标的鉴别。试验结果表明,基于深度学习的方法在低空飞行目标识别方面可以取得较好的识别效果。 展开更多
关键词 低空声目标识别 深度神经网络(DNN) 梅尔频率倒谱系数(mfcc) 伽玛通功率谱(GF)
下载PDF
基于声音多特征贝叶斯网络融合的话者识别研究 被引量:14
14
作者 朱坚民 张雷 +1 位作者 翟东婷 雷静桃 《仪器仪表学报》 EI CAS CSCD 北大核心 2013年第9期2058-2067,共10页
针对基于语音单一特征提取方法所存在的话者识别准确率较低的问题,提出将话者语音中反映人耳听觉感知特性的MFCC特征和接近心理声学临界频带的1/3倍频程(1/3 octave)特征作为话者声音的特征参数,设计话者识别的贝叶斯网络,融合2种声音... 针对基于语音单一特征提取方法所存在的话者识别准确率较低的问题,提出将话者语音中反映人耳听觉感知特性的MFCC特征和接近心理声学临界频带的1/3倍频程(1/3 octave)特征作为话者声音的特征参数,设计话者识别的贝叶斯网络,融合2种声音特征参数,通过贝叶斯网络推理实现话者识别。贝叶斯网络通过学习过程确定已注册话者各声音特征的条件概率。进行话者识别时,贝叶斯网络利用贝叶斯定理及条件独立性假设融合待识别话者声音的MFCC特征和1/3倍频程特征,计算每个已注册话者对输入语音特征矢量的后验概率,根据后验概率的大小实现待识别话者的推断。话者识别实验结果表明:提出的基于声音多特征贝叶斯网络融合的话者识别方法可行有效,识别正确率达到100%。 展开更多
关键词 mfcc特征 1 3倍频程特征 贝叶斯网络 后验概率 话者识别 融合
下载PDF
基于音频特征的水车室工作状态异常检测 被引量:2
15
作者 曾广栋 魏学锋 +2 位作者 何林 孙长江 张旋 《水电能源科学》 北大核心 2024年第8期168-172,共5页
水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采... 水电站的水车室包含轴承和顶盖等机械设备,受水力因素影响,水车室的异常工作会带来较大的安全隐患,基于大数据分析的精确维护对于水车室的可靠运行至关重要。针对水车室的异常工作状态,通过模型训练、特征工程和分类模型的开发等过程,采用STFT、Log-Mel、MFCC等方法对音频数据进行了预处理,建立了基于音频数据的异常检测模型,并对溪洛渡水电站水车室工作状态进行了异常检测。结果表明,Log-Mel方法具有有效性。研究结果不仅降低了异常检测的成本,还为水电机组的健康监测提供了参考。 展开更多
关键词 音频数据 水车室 STFT Log-mel 梅尔频率倒频谱系数(mfcc) 时域特征 支持向量机
下载PDF
基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法 被引量:22
16
作者 胡峰松 张璇 《计算机应用》 CSCD 北大核心 2012年第9期2542-2544,共3页
为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFC... 为提高说话人识别系统的识别率,提出了基于梅尔频率倒谱系数(MFCC)与翻转梅尔频率倒谱系数(IMFCC)为特征参数的特征提取新方法。该方法利用Fisher准则将MFCC和IMFCC相结合,构造了一种混合特征参数。实验结果表明,新的混合特征参数与MFCC相比,在纯净语音库及噪声环境中均具有较好的识别性能。 展开更多
关键词 说话人识别 梅尔频率倒谱系数 翻转梅尔频率倒谱系数 FISHER准则 高斯混合模型
下载PDF
基于Fisher线性判别分析的语音信号端点检测方法 被引量:20
17
作者 王明合 张二华 +1 位作者 唐振民 许昊 《电子与信息学报》 EI CSCD 北大核心 2015年第6期1343-1349,共7页
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fis... 传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 展开更多
关键词 语音处理 语音端点检测 梅尔频率倒谱系数 FISHER线性判别分析
下载PDF
一种基于MFCC和LPCC的文本相关说话人识别方法 被引量:14
18
作者 于明 袁玉倩 +1 位作者 董浩 王哲 《计算机应用》 CSCD 北大核心 2006年第4期883-885,共3页
在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。... 在说话人识别的建模过程中,为传统矢量量化模型的码字增加了方差分量,形成了一种新的连续码字分布的矢量量化模型。同时采用美尔倒谱系数及其差分和线性预测倒谱系数及其差分相结合作为识别的特征参数,来进行与文本有关的说话人识别。通过与动态时间规整算法和传统的矢量量化方法进行比较表明,在系统响应时间并未明显增加的基础上,该模型识别率有一定提高。 展开更多
关键词 说话人识别 线性预测倒谱系数 美尔倒谱系数 矢量量化 动态时间规整
下载PDF
基于神经网络的说话人识别实验设计 被引量:17
19
作者 杨瑶 陈晓 《实验室研究与探索》 CAS 北大核心 2020年第9期38-41,50,共5页
针对目前国内人工智能教学和科研活动中缺乏真实现场验证,设计了利用BP神经网络进行说话人识别实验。先对已有说话人语音数据库的样本进行采集,将所采集的语音进行梅尔倒谱系数(MFCC)特征参数的提取,构建了利用BP神经网络实现说话人识... 针对目前国内人工智能教学和科研活动中缺乏真实现场验证,设计了利用BP神经网络进行说话人识别实验。先对已有说话人语音数据库的样本进行采集,将所采集的语音进行梅尔倒谱系数(MFCC)特征参数的提取,构建了利用BP神经网络实现说话人识别功能的系统。然后利用Matlab软件进行编程测试。实验时既可用训练好的网络直接进行说话人识别的验证性实验,也可作为创新性实验,由学生自行设计并编程实现神经网络进行说话人识别。 展开更多
关键词 说话人识别 梅尔倒谱系数 BP神经网络 特征提取
下载PDF
基于Mel频率倒谱参数相似度的语音端点检测算法 被引量:16
20
作者 王宏志 徐玉超 李美静 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第5期1331-1335,共5页
为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似... 为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。 展开更多
关键词 通信技术 端点检测 mel频率倒谱参数 相关系数
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部