期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于FPGA的高性能MFCC特征参数提取 被引量:6
1
作者 高谦 张国杰 张树才 《通信技术》 2008年第6期153-154,157,共3页
为了实现高速语音特征参数的提取,在分析了美尔频率倒谱特征参数提取算法的基础上,提出了算法的硬件设计方案,介绍了各模块的设计原理。该方案增加了语音激活检测功能,可对语音信号中的噪音帧进行检测,提高了特征参数的可靠性。最后将... 为了实现高速语音特征参数的提取,在分析了美尔频率倒谱特征参数提取算法的基础上,提出了算法的硬件设计方案,介绍了各模块的设计原理。该方案增加了语音激活检测功能,可对语音信号中的噪音帧进行检测,提高了特征参数的可靠性。最后将设计实现于Stratix II系列FPGA上,仿真结果表明设计可以实现高速、高精度的MFCC特征参数提取。 展开更多
关键词 美尔频率 特征提取 FPGA
原文传递
分组网络环境下的实时语音质量客观评价 被引量:2
2
作者 张军 张德运 《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第8期936-939,共4页
提出了一种利用前馈随机神经网络在分组网络中进行实时语音质量评价的新方法.从接收到的语音分组中提取美尔频率倒谱系数向量,利用实时传输控制协议计算语音分组传输过程中的丢包率、延迟和抖动,构成网络传输参数向量.将随机神经元组织... 提出了一种利用前馈随机神经网络在分组网络中进行实时语音质量评价的新方法.从接收到的语音分组中提取美尔频率倒谱系数向量,利用实时传输控制协议计算语音分组传输过程中的丢包率、延迟和抖动,构成网络传输参数向量.将随机神经元组织成具有1个输入层、1个隐含层和1个输出层的3层前馈网络结构,再以上述2种向量作为输入的多类别信号,以相应的主观平均意见(MOS)评分值作为输出对网络进行训练,从而获得稳定的权值矩阵.利用训练过的网络进行多类别信号的语音质量评分映射,并将映射结果与MOS进行二次多项式拟合,得到最终的语音质量评分值.实验表明,所提算法与主观评价之间的平均相关度可达到0.881. 展开更多
关键词 分组网络 美尔频率 随机神经网络 语音质量评价
下载PDF
GMM文本无关的说话人识别系统研究 被引量:27
3
作者 蒋晔 唐振民 《计算机工程与应用》 CSCD 北大核心 2010年第11期179-182,195,共5页
在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。... 在高斯混合模型(Gaussian Mixture Model,GMM)训练时,对传统的模型参数初始化方法(随机法、K均值聚类法)进行改进,提出分裂法与K均值聚类相结合的新方法。实验表明,采用改进的方法与传统方法相比,系统平均识别率有15.47%和7.5%的提高。研究了GMM的阶数、协方差阈值、预加重系数对系统识别率的影响。对实验结果进行详细分析,并根据实验数据,取它们各自表现最好的值,从而使构建的说话人识别系统获得一个较高的识别率。实验表明,在规定的实验条件下,系统可达到90%以上的识别率。 展开更多
关键词 说话人识别 高斯混合模型 美尔频率系数(MFCC) 分裂法与K均值聚类结合法
下载PDF
基于HMM与SVM的语音活动检测 被引量:10
4
作者 肖佳林 赵聿晴 王英 《计算机工程》 CAS CSCD 2014年第1期203-208,共6页
工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通... 工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通过Viterbi算法得到N维最佳识别结果,将其转换为SVM特征向量输入到SVM分类器中进行分类判别,得到判决结果。实验结果表明,该算法在机械工作噪音的情况下,语音检测率较静态统计类算法平均提高9%,比小波支持向量机方法提高11%,在驾驶室噪音的情况下比小波SVM方法有较小幅度的提高,但其增长速度较快,且比传统的统计类算法提高9%。 展开更多
关键词 美尔频率系数 隐马尔科夫模型 支持向量机 语音活动检测 核函数
下载PDF
一种改进的特定人语音识别系统及算法研究 被引量:9
5
作者 赵智琦 房建东 《电子设计工程》 2014年第16期31-34,37,共5页
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统。在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效... 针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统。在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题。利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上。仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法。 展开更多
关键词 语音识别 动态时间规整算法 美尔频率系数 孤立词
下载PDF
基于MFCC与LPCC的滚动轴承故障音频诊断法 被引量:8
6
作者 周宴宇 杨胜跃 +1 位作者 何正明 龙慧 《微计算机信息》 2009年第31期123-124,74,共3页
本文结合语音识别中运用较广的美尔频率倒谱系数(MFCC)和线形预测倒谱系数(LPCC)作为滚动轴承音频信号的特征参数,并使用具有强学习能力的神经网络方法进行故障诊断,最后依靠Dempster-Shafrg(D-S)证据理论进行分析得出可信度高的判定结... 本文结合语音识别中运用较广的美尔频率倒谱系数(MFCC)和线形预测倒谱系数(LPCC)作为滚动轴承音频信号的特征参数,并使用具有强学习能力的神经网络方法进行故障诊断,最后依靠Dempster-Shafrg(D-S)证据理论进行分析得出可信度高的判定结果。实验结果表明,该方法在滚动轴承的音频信号故障诊断中有效可行。在积累足够量的样本数后,可望建立相应的专家库,实现轴承故障的快速智能诊断。 展开更多
关键词 轴承 故障诊断 人工神经网络 美尔频率系数 线形预测系数 音频信号
下载PDF
基于K-L距离的两步固定音频检索方法 被引量:8
7
作者 齐晓倩 陈鸿昶 黄海 《计算机工程》 CAS CSCD 北大核心 2011年第19期160-162,共3页
根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的... 根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的效果。实验结果证明,该方法能使检索准确率达到90%左右。 展开更多
关键词 固定音频检索 过零率 直方图 美尔频率系数 K-L距离
下载PDF
基于动态MFCC的说话人识别算法 被引量:7
8
作者 董志峰 汪增福 《模式识别与人工智能》 EI CSCD 北大核心 2005年第5期596-601,共6页
提出了一种基于动态MFCC特征的说话人识别算法,该算法根据说话人的基音频率随语境变化的特点,通过动态构建基于说话人基音频率的Mel-滤波器组,以抽取可以表征说话人身份特征的动态MFCC参数,提高说话人辨识的准确性和鲁棒性。此外,本文... 提出了一种基于动态MFCC特征的说话人识别算法,该算法根据说话人的基音频率随语境变化的特点,通过动态构建基于说话人基音频率的Mel-滤波器组,以抽取可以表征说话人身份特征的动态MFCC参数,提高说话人辨识的准确性和鲁棒性。此外,本文还讨论了基于高斯混合模型的分类器设计问题,给出了一个通过聚类分析获得高斯混合模型的最优混合度与相关模型参数的初始估计的方法。实验证明,本文所提出的方法在实际中能够获得较好的识别结果。 展开更多
关键词 美尔频率系数(MFCC) 基音检测 说话人识别 高斯混合模型
原文传递
基于DSP和FPGA的机器人声控系统设计与实现 被引量:7
9
作者 刘京诚 高海英 廖志勇 《现代电子技术》 2006年第14期109-112,共4页
介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,... 介绍了一种基于DSP和FPGA的机器人声控系统。在语音采集上,将DSP芯片TMS320C5509和音频芯片TLV320AIC23相结合进行语音的采集。在软件开发上,开发环境采用CCS 3.1,语音特征向量采用美尔频率倒谱系数,模式匹配和训练采用隐马尔可夫模型,实现了语音指令的识别。在动作控制上,采用FPGA作为机器人头部动作逻辑控制器,使机器人能够根据非特定人的语音命令做出规定的头部动作。 展开更多
关键词 语音识别 DSP FPGA 机器人 美尔频率系数 隐马尔可夫模型
下载PDF
基于小波变换的鲁棒性语音特征提取新方法 被引量:6
10
作者 张君昌 李艳艳 《计算机仿真》 CSCD 北大核心 2010年第8期355-358,362,共5页
提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降。为了能得到无噪音的语音识别特性,让语音识别系统在含噪的环境下获得令人满意的... 提高语音识别系统的鲁棒性是语音识别技术一个重要的研究课题。语音识别系统往往由于训练环境下的数据和识别环境下的数据不匹配造成系统的识别性能下降。为了能得到无噪音的语音识别特性,让语音识别系统在含噪的环境下获得令人满意的工作性能,根据人听觉特性提出了一种鲁棒语音特征提取方法。将小波变换和MFCC算法相结合,在MFCC的前端用小波包变换代替FFT和Mel滤波器组,同时在后端用临界小波变换代替DCT,最后得到鲁棒语音特征。通过实验结果分析表明,将方法用于抗噪声分析可以提高系统的抗噪声能力;同时特征的处理方法对不同噪声有很好的适应性。 展开更多
关键词 语音识别 特征提取 小波变换 美尔频率系数 鲁棒性
下载PDF
基于MFCC和HMM的腭裂语音辅音省略识别算法 被引量:6
11
作者 袁亚南 何凌 +2 位作者 龚晓峰 尹恒 李杨 《计算机工程与设计》 CSCD 北大核心 2014年第2期615-619,共5页
为了弥补国内外在腭裂语音辅音发音错误识别方面的漏缺,以及为临床腭裂语音类型的诊断提供一种非主观的辅助措施,提出了一种基于语音识别系统的腭裂语音辅音省略识别算法。对腭裂语音辅音发音错误特点进行了语谱图上的能量研究,建立了... 为了弥补国内外在腭裂语音辅音发音错误识别方面的漏缺,以及为临床腭裂语音类型的诊断提供一种非主观的辅助措施,提出了一种基于语音识别系统的腭裂语音辅音省略识别算法。对腭裂语音辅音发音错误特点进行了语谱图上的能量研究,建立了改进参数的基于美尔频率倒谱系数和隐马尔科夫模型的腭裂语音识别系统。实验结果表明,该语音辅音省略识别算法取得了较高的正确率,实现了对腭裂语音清晰度的自动量化评估,可以用于临床辅助诊断。 展开更多
关键词 腭裂语音 辅音省略 美尔频率系数 隐马尔科夫模型 语音识别
下载PDF
一种改进动态特征参数的话者语音识别系统 被引量:4
12
作者 申小虎 万荣春 张新野 《计算机仿真》 CSCD 北大核心 2015年第4期154-158,共5页
研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种... 研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法。上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度。利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类。在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率。 展开更多
关键词 话者语音识别系统 美尔频率系数 滑动差分特征 动态时频系数 混合高斯-通用背景模型
下载PDF
基于DSP的高速实时语音识别系统的设计与实现 被引量:4
13
作者 李邵梅 陈鸿昶 王凯 《现代电子技术》 2007年第15期109-111,共3页
识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱... 识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱系数为特征参数,采用动态时间弯折算法的高速语音实时识别系统,识别速率达0.29倍实时,可实现多路语音的并行识别。 展开更多
关键词 多路实时语音识别 数字信号处理器 美尔频率系数 动态时间弯折
下载PDF
重录语音检测算法 被引量:5
14
作者 李山路 王泳 甘俊英 《信号处理》 CSCD 北大核心 2017年第1期95-101,共7页
非法认证者可通过播放重新录制合法认证者的语音欺骗说话人识别系统以获得进入系统的权限,为社会安全带来威胁。因此,重录语音的检测具有现实的紧迫性,但相关的研究报道仍较缺乏。为此,本文提出一种重录语音的检测算法。该算法以MFCC(Me... 非法认证者可通过播放重新录制合法认证者的语音欺骗说话人识别系统以获得进入系统的权限,为社会安全带来威胁。因此,重录语音的检测具有现实的紧迫性,但相关的研究报道仍较缺乏。为此,本文提出一种重录语音的检测算法。该算法以MFCC(Mel-Frequency Cepstral Coefficients,美尔频率倒谱系数)的统计量作为SVM(Support Vector Machine,支持向量机)和KNN(K-Nearest Neighbors,K最近邻)分类方法的特征;除以上两种分类方法外,本文亦考察使用SAE(Sparse Autoencoder,稀疏自动编码器)的检测性能。为模拟现实生活中重录语音的真实情景,本文实验通过不同的录音设备、录音距离及录音环境对算法进行全面的测试。实验结果表明,通过增加重录语音的多样性作为训练可以使该算法的正确率提高到99.67%,达到了较好的检测性能。 展开更多
关键词 重录语音检测 社会安全 美尔频率系数 支持向量机 K最近邻 稀疏自动编码器
下载PDF
基于GMM的说话人识别系统研究及其MATLAB实现 被引量:4
15
作者 何建军 《软件导刊》 2021年第8期49-57,共9页
为在嵌入式平台上实现说话人识别,分析研究说话人语音信号预处理、特征提取及GMM模型基本原理,并应用MATLAB实现基于GMM模型的说话人识别系统。基于TIMIT语料库,通过调整GMM阶数和语音时长,对系统性能进行验证分析。实验结果表明:①随着... 为在嵌入式平台上实现说话人识别,分析研究说话人语音信号预处理、特征提取及GMM模型基本原理,并应用MATLAB实现基于GMM模型的说话人识别系统。基于TIMIT语料库,通过调整GMM阶数和语音时长,对系统性能进行验证分析。实验结果表明:①随着GMM模型阶数的增加,识别率随之提升,但计算量也急剧增加,当阶数达到16附近时,识别率则不再提升,反而出现了降低的趋势;②增加训练样本时长可从总体上提升识别率,但达到一定程度后便很难再继续提升。该结果对于在嵌入式平台上实现说话人识别具有较高参考价值。 展开更多
关键词 说话人识别 语音识别 美尔频率系数 高斯混合模型 MATLAB
下载PDF
脑电信号驱动的个性化情绪音乐播放系统算法研究及初步实现 被引量:3
16
作者 马勇 李娟 吕彬 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2016年第1期38-41,共4页
为了能实时监测听众的情绪状态变化并据此调整音乐播放列表,本文中,我们基于便携式干电极脑电数据提出了一种脑电驱动的个性化情绪音乐推荐系统的算法框架,并在Android平台上进行了初步开发实现。我们以效价和唤醒度二维情绪模型为基准... 为了能实时监测听众的情绪状态变化并据此调整音乐播放列表,本文中,我们基于便携式干电极脑电数据提出了一种脑电驱动的个性化情绪音乐推荐系统的算法框架,并在Android平台上进行了初步开发实现。我们以效价和唤醒度二维情绪模型为基准,将脑电和相应种子歌曲映射到各个情绪坐标象限内,从而建立映射关系。然后应用美尔频率倒谱系数分析音乐库中各歌曲与种子歌曲之间的相似度并进行排序。最后,在播放歌曲阶段,我们通过脑电来识别听众的情绪状态,根据事先获得的情绪状态匹配关系播放并实时调整相应的歌曲曲目列表。 展开更多
关键词 脑电图 个性化音乐推荐系统 情绪 美尔频率系数 安卓
原文传递
MFCC中DCT结构的设计与实现 被引量:3
17
作者 孔维功 张国杰 张效军 《计算机工程》 CAS CSCD 北大核心 2009年第5期265-267,共3页
根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实... 根据MFCC中DCT的特点,设计一种基于DA算法的实现结构,采用先分解ROM再偏移二进制编码的方法对DA算法进行优化,将ROM表的大小由2~N减小到(N/K)2^(K-1)。通过仿真与FPGA测试,验证了该设计的正确性,能够满足说话人识别中MFCC参数提取的实时性要求和精度要求。 展开更多
关键词 说话人识别 美尔频率系数 离散余弦变换 分布式算法
下载PDF
基于信息融合的短语音说话人识别方法研究 被引量:3
18
作者 周萍 唐李珍 《计算机工程》 CAS CSCD 北大核心 2011年第2期169-171,共3页
针对短训练语音的说话人识别系统,提出一种基于决策层融合的识别算法。识别时运用经验模式分解法对语音信号进行处理,对获取的固有模态函数分量提取语音特征序列,分别进行匹配,通过决策层融合算法,将所得的匹配结果与传统独立识别结果... 针对短训练语音的说话人识别系统,提出一种基于决策层融合的识别算法。识别时运用经验模式分解法对语音信号进行处理,对获取的固有模态函数分量提取语音特征序列,分别进行匹配,通过决策层融合算法,将所得的匹配结果与传统独立识别结果相结合,最终输出识别结果。利用信号分解的方法,实现待测语音信号的重复识别,同时采用决策层融合算法优化识别结果,从而在短训练语音情况下,使系统的识别率得到保障。实验结果表明,该算法在短训练语音识别系统中的识别效果优于传统方法。 展开更多
关键词 短语音 说话人识别 美尔频率系数 经验模式分解 决策层融合
下载PDF
基于最小方差无失真响应谱的语音特征提取 被引量:2
19
作者 王民 李弼程 屈丹 《信息工程大学学报》 2008年第3期334-338,共5页
对最小方差无失真响应谱进行了研究,并将其应用到语音特征参数的提取中,对传统的美尔频率倒谱系数提取方法进行了有效的改进。该方法首先计算短时语音信号的最小方差无失真响应谱,在该谱的基础上提取美尔频率倒谱系数。基于最小方差无... 对最小方差无失真响应谱进行了研究,并将其应用到语音特征参数的提取中,对传统的美尔频率倒谱系数提取方法进行了有效的改进。该方法首先计算短时语音信号的最小方差无失真响应谱,在该谱的基础上提取美尔频率倒谱系数。基于最小方差无失真响应谱的美尔频率倒谱系数在保留语义信息的同时有效抑制了说话人信息,更加适合于关键词检出。 展开更多
关键词 最小方差无失真响应 美尔频率系数 关键词检出
下载PDF
语音信息查询虚拟仪器的设计
20
作者 朱立忠 华宇宁 范长青 《沈阳理工大学学报》 CAS 2009年第4期6-10,共5页
在虚拟仪器开发软件LABVIEW平台上,利用LABVIEW和MATLAB混合编程,通过声卡获得原始语音信号,经过小波消噪处理、预加重处理和端点检测处理得到干净的语音信号,提取语音信号的美尔频率倒谱系数及其一阶?二阶差分系数作为语音识别的特征参... 在虚拟仪器开发软件LABVIEW平台上,利用LABVIEW和MATLAB混合编程,通过声卡获得原始语音信号,经过小波消噪处理、预加重处理和端点检测处理得到干净的语音信号,提取语音信号的美尔频率倒谱系数及其一阶?二阶差分系数作为语音识别的特征参数,通过矢量量化(VQ)与隐马尔可夫模型(HMM)实现非特定人连续语音的训练与识别,构建了基于LabVIEW平台的连续语音识别系统.实验表明,系统的识别速度较快,识别率达到90%左右,而且成本比较低廉,具有一定的应用价值. 展开更多
关键词 LABVIEW 连续语音识别 美尔频率系数 VQ和HMM
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部