期刊文献+
共找到179篇文章
< 1 2 9 >
每页显示 20 50 100
音频事件检测算法在计量费控用电压开关柜局部放电检测中的应用研究 被引量:9
1
作者 张思建 梁荣业 +1 位作者 赵闻 张捷 《电子器件》 CAS 北大核心 2020年第2期309-314,共6页
有效检测开关柜故障是影响电网安全的因素,如何进行有效的非浸入式检测是国内外的研究热点之一。提出一种基于音频信号的电压开关柜局部放电检测算法,可识别开关柜正常态、电晕态和放电态3种状态。算法首先提取电压开关柜放电声音的MFC... 有效检测开关柜故障是影响电网安全的因素,如何进行有效的非浸入式检测是国内外的研究热点之一。提出一种基于音频信号的电压开关柜局部放电检测算法,可识别开关柜正常态、电晕态和放电态3种状态。算法首先提取电压开关柜放电声音的MFCC特征作为识别特征,然后构建基于支持向量机的分类器来识别出电压开关柜的状态,从而进行故障检测。实验表明本文提出的检测算法具有较高的局部放电检测正确率。 展开更多
关键词 电压开关柜 局部放电 支持向量机 美尔倒谱系数
下载PDF
面向多场景的环境异常声音识别 被引量:8
2
作者 郑文宾 何蔚 《科学技术与工程》 北大核心 2023年第17期7444-7449,共6页
随着人工智能和大数据的发展,各种场景中对异常声音识别的需求日益增长,基于人工智能的声音识别技术正在兴起并被高度重视。现行主流的异常声音识别算法多为浅层机器学习模型结构,对异常声音的识别率较低,且识别的声音类型单一。为了有... 随着人工智能和大数据的发展,各种场景中对异常声音识别的需求日益增长,基于人工智能的声音识别技术正在兴起并被高度重视。现行主流的异常声音识别算法多为浅层机器学习模型结构,对异常声音的识别率较低,且识别的声音类型单一。为了有效识别异常声音,提出一种基于梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)和卷积神经网络(convolution neural network,CNN)的环境声音识别算法,对各类异常声音进行采集和有效识别,并及时反馈声音状态,为各类声识别应用场景提供精细化管理技术手段。结果表明:提出的算法对5类场景下环境异常声音的识别率得到极大提高,适用于更广泛的声学场景,具有明显的优势。 展开更多
关键词 异常声音 梅尔频率倒谱系数 卷积神经网络 音频事件检测
下载PDF
采用离散HMM的孤立词识别系统 被引量:3
3
作者 陈建良 吕小红 《信息技术》 2006年第1期83-84,共2页
探讨了离散马尔可夫模型的基本原理及在孤立词识别中的应用,并且实现了一个文本有关的孤立词识别系统,其正确识别率达到96.3%。
关键词 隐马尔可夫模型 mel频率倒谱系数 矢量量化 语音识别
下载PDF
基于基频的梅尔倒谱系数在车辆识别中的应用 被引量:5
4
作者 李成娟 易强 +1 位作者 李宝清 王国辉 《重庆大学学报》 CSCD 北大核心 2021年第11期17-23,共7页
用传统的梅尔倒谱系数作为特征进行车辆识别时,识别效果易受噪声干扰。为增强特征鲁棒性,提出一种加权的基频自适应梅尔倒谱系数特征提取算法。首先用能熵比法对车辆声音信号进行端点检测;然后提取车辆信号的基频,自适应构建三角滤波器... 用传统的梅尔倒谱系数作为特征进行车辆识别时,识别效果易受噪声干扰。为增强特征鲁棒性,提出一种加权的基频自适应梅尔倒谱系数特征提取算法。首先用能熵比法对车辆声音信号进行端点检测;然后提取车辆信号的基频,自适应构建三角滤波器组,提高滤波器对基频的感知敏感度;最后对基频自适应梅尔倒谱系数进行F比加权。实验结果表明,与传统梅尔倒谱系数相比,在识别车辆时,加权的基频自适应梅尔倒谱系数识别准确率提高7.10%,虚警率降低3.93%,漏警率降低7.10%。 展开更多
关键词 梅尔倒谱系数 特征提取 车辆识别 基频
下载PDF
线性判别分析和支持向量机的音乐分类方法 被引量:4
5
作者 姚斯强 胡剑凌 《电声技术》 2006年第12期6-10,共5页
提出了一种新的音乐分类方法,该方法使用线性判别分析(LDA)和支持向量机(SVMs)对音乐数据进行分类。在实现音乐分类中,先使用傅里叶变换等方法从每一段音乐中提取音频特征,包括Mel倒谱系数及基音频率等,并将它们按比例组成一个高维向量... 提出了一种新的音乐分类方法,该方法使用线性判别分析(LDA)和支持向量机(SVMs)对音乐数据进行分类。在实现音乐分类中,先使用傅里叶变换等方法从每一段音乐中提取音频特征,包括Mel倒谱系数及基音频率等,并将它们按比例组成一个高维向量;再使用LDA对这些高维向量进行降维,使得各类音乐的类间离散度与类内离散度的比值最大;最后使用SVM等4种分类器对降维后的特征进行分类。实验证明LDA及SVM使得音乐分类的精确度有了较大的提高。 展开更多
关键词 特征提取 mel倒谱系数 线性判别分析 支持向量机 音乐 分类
下载PDF
试验环境水下声信号的特征提取方法
6
作者 王红滨 王永乐 +1 位作者 何鸣 薛垚 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第3期489-495,共7页
水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用... 水下试验环境参数的反演是水声学研究领域的重要内容。而当前研究的关键是通过对水下声信号做特征提取从而获取参数信息。针对特征提取较难、模型很难拟合等问题。本文提出了一种试验环境水下声信号的特征提取方法。将水下声信号同时用梅尔频谱倒谱系数及线性预测系数处理,两者运用特征加权组合方法得到新的特征矩阵;再应用映射插值算法对特征矩阵进行处理,获得适应神经网络输入的三通道矩阵。本文选取的网络模型为残差神经网络。利用实验室所录制的对河口水库数据集测试表明,本文提出的特征提取方法普遍优于仅利用梅尔频谱倒谱系数或线性预测系数的特征处理方法。利用单频矩形脉冲信号对环境进行深度5分类,准确率平均提升2%。利用线性调频信号对环境进行深度5分类,准确率平均提升2.03%。本文提出的特征提取方法对线性调频信号在深度分类任务下处理的结果要优于单频矩形脉冲信号处理的结果。 展开更多
关键词 环境反演 特征提取 梅尔频谱倒谱系数 线性预测系数 特征加权组合方法 残差神经网络 神经网络 水下声信号
下载PDF
融合语音和脉搏的多模态情感识别研究 被引量:4
7
作者 周红标 《微电子学与计算机》 CSCD 北大核心 2015年第6期5-9,共5页
针对单独利用语音或某种生理信号进行情感识别容易误判的问题,提出融合语音和脉搏的多模态情感识别方法.首先对预处理后的语音信号提取梅尔倒谱系数特征,并用隐马尔科夫构建语音情感识别模型,然后计算脉搏信号K值和小波包系数能量值,并... 针对单独利用语音或某种生理信号进行情感识别容易误判的问题,提出融合语音和脉搏的多模态情感识别方法.首先对预处理后的语音信号提取梅尔倒谱系数特征,并用隐马尔科夫构建语音情感识别模型,然后计算脉搏信号K值和小波包系数能量值,并输入到最小二乘支持向量机识别模型中进行判别,最后对两个模型的判别结果进行决策级的融合.实验结果表明:对于哀伤和平静两种情感,语音识别率较高,融合后识别率达到100%;对于高兴和愤怒两种情感,语音识别率为75%和80%,融合后提高到95%和90%. 展开更多
关键词 多模态情感识别 语音 脉搏 梅尔倒谱系数 隐马尔科夫 决策级融合
下载PDF
预制裂纹砂岩受载破裂声发射梅尔倒谱系数响应特征 被引量:2
8
作者 李振雷 杨菲 +4 位作者 李娜 宋大钊 何学秋 薛雅荣 殷山 《中国矿业大学学报》 EI CAS CSCD 北大核心 2023年第4期713-726,共14页
针对煤岩失稳的监测预警问题,开展预制裂纹砂岩的单轴压缩试验,同步采集砂岩受载破坏的声发射全波形数据、应力数据和图像信息,提取了声发射的梅尔倒谱系数(MFCC),分析其随预制裂纹砂岩破裂的响应特征.结果表明:不同角度预制裂纹砂岩的... 针对煤岩失稳的监测预警问题,开展预制裂纹砂岩的单轴压缩试验,同步采集砂岩受载破坏的声发射全波形数据、应力数据和图像信息,提取了声发射的梅尔倒谱系数(MFCC),分析其随预制裂纹砂岩破裂的响应特征.结果表明:不同角度预制裂纹砂岩的破裂特征存在差异,预制裂纹角度越大,发生局部破坏脱落的可能性越小;对于同一角度预制裂纹砂岩试样,各声发射通道得到的同号梅尔倒谱系数的变化规律具有一致性,不同角度预制裂纹砂岩试样的声发射梅尔倒谱系数的变化规律存在差异;各个编号的声发射梅尔倒谱系数在试样加载之初至完全破坏的各个阶段变化敏感,不同编号的声发射梅尔倒谱系数的变化规律不尽相同,编号1和2的声发射梅尔倒谱系数的离散度可用于区分试样的破裂状态,辨识出试样的塑性阶段和破裂阶段;声发射梅尔倒谱系数的周期性波动对应试样的周期性应力降和内部破裂,系数波动性剧烈时刻对应声发射事件大量产生,其中,2号梅尔倒谱系数出现较大突降时刻对应试样表观裂隙产生,系数的波动性及其强弱可表征试样的破裂及破裂的剧烈程度.声发射梅尔倒谱系数在反映裂隙扩展演化及判识试样破坏方面具有优势.研究结果可为进一步完善煤岩失稳的预测预警提供借鉴. 展开更多
关键词 动力灾害 预制裂纹 砂岩 声发射 梅尔倒谱系数
原文传递
基于声发射特征提取和机器学习的煤破坏状态预测 被引量:2
9
作者 李振雷 李娜 +5 位作者 杨菲 SOBOLEV Aleksei 宋大钊 王洪磊 纳然 曹亚利 《工程科学学报》 EI CSCD 北大核心 2023年第1期19-30,共12页
同步采集了煤样单轴压缩破坏过程的声发射全波形数据和应力数据,提取了声发射梅尔倒谱系数作为样本特征,定义煤样当前受力与其峰值载荷的比值为煤样的应力状态并将其作为样本标签,利用机器学习方法构建了煤样破坏状态的预测模型.结果表... 同步采集了煤样单轴压缩破坏过程的声发射全波形数据和应力数据,提取了声发射梅尔倒谱系数作为样本特征,定义煤样当前受力与其峰值载荷的比值为煤样的应力状态并将其作为样本标签,利用机器学习方法构建了煤样破坏状态的预测模型.结果表明:梅尔倒谱系数可以很好地表征煤样的破坏状态,该参量在煤样达到受力峰值80%后表现出明显突增或突降或先增加然后突降的规律,机器学习能够利用该样本特征建立煤样破坏状态预测模型进而预测煤样的危险状态,利用五折交叉验证方法评价模型的预测准确度达到88.61%,模型预测效果和稳定性良好;进一步讨论了不同重要度的梅尔倒谱系数组合作为样本特征对于模型预测效果的影响,发现样本特征中含有重要度高的特征和关键特征是模型预测准确度高的关键.这可为进一步完善煤岩动力灾害预测预警提供借鉴. 展开更多
关键词 动力灾害 监测预警 声发射 机器学习 梅尔倒谱系数 特征提取
下载PDF
基于循环神经网络的双耳助听器语音增强算法 被引量:3
10
作者 朱亚涛 陈霏 +1 位作者 张雨晨 陶源 《传感技术学报》 CAS CSCD 北大核心 2021年第9期1165-1172,共8页
基于神经网络的语音增强算法相比于传统方法具有更好的语音增强效果,但因网络规模大导致其难以实时实施于助听器中。对此,本文提出了一种具有低复杂度的循环神经网络用于增强双耳语音。该算法结合双耳语音提取梅尔频率倒谱系数和耳间相... 基于神经网络的语音增强算法相比于传统方法具有更好的语音增强效果,但因网络规模大导致其难以实时实施于助听器中。对此,本文提出了一种具有低复杂度的循环神经网络用于增强双耳语音。该算法结合双耳语音提取梅尔频率倒谱系数和耳间相位差作为网络的输入特征,在使用双耳语音振幅信息的基础上结合语音空间线索更好的映射目标语音和带噪语音之间的关系。实验结果表明,与助听器常用算法相比,本文算法的双耳平均信噪比和短时语音可懂度平均提高了4.68 dB和4.5%;与基于神经网络的算法相比,本文算法的双耳平均信噪比和短时语音可懂度分别提高了1.63 dB和4.8%。当时钟频率为10 MHz时,本文网络的硬件设计需要4.2 ms左右的处理时间,可以满足助听器的实时需求。 展开更多
关键词 语音增强 双耳助听器 循环神经网络 梅尔频率倒谱系数 耳间相位差 FPGA
下载PDF
基于最小方差无失真响应谱的语音特征提取 被引量:2
11
作者 王民 李弼程 屈丹 《信息工程大学学报》 2008年第3期334-338,共5页
对最小方差无失真响应谱进行了研究,并将其应用到语音特征参数的提取中,对传统的美尔频率倒谱系数提取方法进行了有效的改进。该方法首先计算短时语音信号的最小方差无失真响应谱,在该谱的基础上提取美尔频率倒谱系数。基于最小方差无... 对最小方差无失真响应谱进行了研究,并将其应用到语音特征参数的提取中,对传统的美尔频率倒谱系数提取方法进行了有效的改进。该方法首先计算短时语音信号的最小方差无失真响应谱,在该谱的基础上提取美尔频率倒谱系数。基于最小方差无失真响应谱的美尔频率倒谱系数在保留语义信息的同时有效抑制了说话人信息,更加适合于关键词检出。 展开更多
关键词 最小方差无失真响应谱 美尔频率倒谱系数 关键词检出
下载PDF
基于发声特征和深度学习的白羽肉鸡全生命周期咳嗽检测方法
12
作者 袁超 沈明霞 +2 位作者 姚文 刘龙申 陈佳 《南京农业大学学报》 CAS CSCD 北大核心 2023年第5期975-985,共11页
[目的]高密度养殖模式下笼养肉鸡呼吸系统疾病易发作且难防治,为此本文设计了一种基于发声特征和深度学习的白羽肉鸡全生命周期咳嗽检测方法,自动监测鸡只咳嗽发声,及时提供预警信息。[方法]对10~19日龄、20~29日龄、30日龄后3种不同生... [目的]高密度养殖模式下笼养肉鸡呼吸系统疾病易发作且难防治,为此本文设计了一种基于发声特征和深度学习的白羽肉鸡全生命周期咳嗽检测方法,自动监测鸡只咳嗽发声,及时提供预警信息。[方法]对10~19日龄、20~29日龄、30日龄后3种不同生长阶段的鸡只发声信号进行数字滤波、谱减法去噪、端点检测等处理,提取滤波器组(filter bank,FBank)和梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCC)特征,并与其各自一阶及二阶差分组合,作为VGG16与ResNet18神经网络的输入,完成咳嗽声、鸣叫声、其他声三分类模型训练。[结果]各日龄段利用不同发声特征与神经网络所构建的识别模型均能准确实现发声分类,在10~19日龄、20~29日龄FBank-VGG16模型效果较优,准确率分别为94.29%、97.65%,30日龄后MFCC-ResNet18模型准确率高于其他模型,为98.66%。随着日龄的增长,各模型的总体识别准确率均上升,增幅为3%~7%。[结论]本方法可快速准确对实际生产环境中不同生长阶段的鸡只咳嗽进行识别,为笼养鸡呼吸系统疾病的早期检测提供技术支撑。 展开更多
关键词 白羽肉鸡 咳嗽检测 滤波器组 梅尔频率倒谱系数 卷积神经网络
下载PDF
SVAC音频编码的特征参数量化器改进
13
作者 舒若 李世宝 潘辛 《信息技术》 2014年第6期50-54,共5页
SVAC监控音频编码器在前端对提取的特征参数量化编码,以防止语音编码失真影响说话人识别。特征参数编码占用码率较低,因此对其量化器有一定的技术要求。分析了SVAC的特征参数量化器编码性能,对多种情况下的量化失真进行了实验对比,根据... SVAC监控音频编码器在前端对提取的特征参数量化编码,以防止语音编码失真影响说话人识别。特征参数编码占用码率较低,因此对其量化器有一定的技术要求。分析了SVAC的特征参数量化器编码性能,对多种情况下的量化失真进行了实验对比,根据结果有针对性地设计了新码本。 展开更多
关键词 监控音频编码 梅尔频率倒谱系数 分裂矢量量化 LBG算法
下载PDF
基于HTK的连接数字语音识别的研究
14
作者 黄少龙 《山西电子技术》 2016年第5期86-88,共3页
HTK是剑桥大学工程系开发的一套基于C语言的语音处理工具包,目前在语音识别、语音合成以及字符序列等领域已得到广泛应用。本文首先简单介绍了语音识别的一些基本原理,接着从HTK的主要原理和软件结构出发,阐述了基于HTK语音识别系统的... HTK是剑桥大学工程系开发的一套基于C语言的语音处理工具包,目前在语音识别、语音合成以及字符序列等领域已得到广泛应用。本文首先简单介绍了语音识别的一些基本原理,接着从HTK的主要原理和软件结构出发,阐述了基于HTK语音识别系统的搭建过程以及每部分用到的工具或函数,最终完成了7字长的连续语音识别系统,并验证了其识别率。 展开更多
关键词 HTK 语音识别 HMM模型 梅尔倒谱系数MFCC
下载PDF
一种改进的基于说话者的语音分割算法 被引量:17
15
作者 卢坚 毛兵 +1 位作者 孙正兴 张福炎 《软件学报》 EI CSCD 北大核心 2002年第2期274-279,共6页
: 语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的... : 语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的阈值选取方法;(2) 引入BIC可测度概念来度量其适用范围;(3) BIC信息准则校准非冗余的候选分割点的偏差.实验结果表明,此改进算法优于原算法. 展开更多
关键词 贝叶斯信息准则 语音分割算法 说话者 语音识别
下载PDF
实时说话人辨识系统中改进的DTW算法 被引量:20
16
作者 李邵梅 刘力雄 陈鸿昶 《计算机工程》 CAS CSCD 北大核心 2008年第4期218-219,共2页
识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明... 识别正确率和抗噪性能是语音识别的研究重点,而识别响应速度也是决定系统实用化的关键。文章改进了传统的动态时间弯折算法结构,将其应用于实时说话人辨识系统中,极大地提高了系统运行速度,随着待识别语音数目的增多,该算法优势更加明显。实验表明,在不影响系统识别率的情况下,该方法使系统的运行速度平均提高了1.5倍。 展开更多
关键词 说话人辨识 美尔倒谱系数 动态时间弯折
下载PDF
基于MFCC和时频图等多种特征的综合鸟声识别分类器设计 被引量:17
17
作者 徐淑正 孙忆南 +1 位作者 皇甫丽英 方玮骐 《实验室研究与探索》 CAS 北大核心 2018年第9期81-86,91,共7页
基于音节长度、梅尔频率倒谱系数(MFCC),基于线性预测编码(LPC)系数的动态时间规整(DTW)模板和结合时-频纹理特征,应用于鸟声识别的多标签分类器,通过在特征提取和分类器选择上进行优化并综合不同分类器的决策结果以改善单一分类器的性... 基于音节长度、梅尔频率倒谱系数(MFCC),基于线性预测编码(LPC)系数的动态时间规整(DTW)模板和结合时-频纹理特征,应用于鸟声识别的多标签分类器,通过在特征提取和分类器选择上进行优化并综合不同分类器的决策结果以改善单一分类器的性能。同时,系统在消除噪声和稳定性方面也做出了提高。经最终测试,本系统在多达11类的鸟声分类中可以达到92%的准确率。 展开更多
关键词 音频增强 语音信号处理 机器学习 梅尔频率倒谱系数
下载PDF
一种适用于说话人识别的改进Mel滤波器 被引量:8
18
作者 项要杰 杨俊安 +1 位作者 李晋徽 陆俊 《计算机工程》 CAS CSCD 2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适... Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 展开更多
关键词 说话人识别 mel倒谱系数 个性信息 mel倒谱系数 频谱分布 语音信号
下载PDF
Improved MFCC-Based Feature for Robust Speaker Identification 被引量:7
19
作者 吴尊敬 曹志刚 《Tsinghua Science and Technology》 SCIE EI CAS 2005年第2期158-161,共4页
The Mel-frequency cepstral coefficient (MFCC) is the most widely used feature in speech and speaker recognition. However, MFCC is very sensitive to noise interference, which tends to drastically de- grade the perfor... The Mel-frequency cepstral coefficient (MFCC) is the most widely used feature in speech and speaker recognition. However, MFCC is very sensitive to noise interference, which tends to drastically de- grade the performance of recognition systems because of the mismatches between training and testing. In this paper, the logarithmic transformation in the standard MFCC analysis is replaced by a combined function to improve the noisy sensitivity. The proposed feature extraction process is also combined with speech en- hancement methods, such as spectral subtraction and median-filter to further suppress the noise. Experi- ments show that the proposed robust MFCC-based feature significantly reduces the recognition error rate over a wide signal-to-noise ratio range. 展开更多
关键词 mel-frequency cepstral coefficient (MFCC) robust speaker identification feature extraction
原文传递
基于GMM模型和LPC-MFCC联合特征的声道谱转换研究 被引量:8
20
作者 曾歆 张雄伟 +2 位作者 孙蒙 苗晓孔 姚琨 《声学技术》 CSCD 北大核心 2020年第4期451-455,共5页
声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略... 声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略了不同声道特征参数之间可能存在的互补性。针对这一问题,研究了不同声道特征参数之间进行联合建模的方法,引入了一种由线性预测系数(LinearPredictionCoefficient,LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)联合构成的LPC-MFCC特征参数,提出了一种基于高斯混合模型(Gaussian Mixture Model, GMM)和LPC-MFCC联合特征参数的语音转换方法。为验证文中方法的有效性,仿真实验选取了基于GMM和LPC的语音转换方法进行对比,对多组实验数据进行主观和客观测试,结果表明,文中提出的语音转换方法可以获得相似度更高的转换语音。 展开更多
关键词 语音转换 声道谱转换 高斯混合模型 联合建模 线性预测系数-梅尔频率倒谱系数
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部