基于MFCC和HMM的语音识别优化方法研究

Research on Speech Recognition Optimization Method Based on MFCC and HMM

下载PDF

导出

摘要为探究基于梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和隐马尔可夫模型(Hidden Markov Model,HMM)的语音识别优化方法,首先探讨语音识别系统的基本框架设计,其次分析MFCC特征提取方法,再次引入期望最大化(Expectation Maximization,EM)算法优化HMM参数,最后利用THCHS-30数据集进行实验验证。结果表明,引入EM算法优化HMM,可有效克服传统HMM在复杂语音环境下的识别困难问题,显著提升系统的识别精度和健壮性。 In order to explore the speech recognition optimization method based on Mel-Frequency Cepstral Coefficients(MFCC)and Hidden Markov Model(HMM),the basic framework design of the speech recognition system is first discussed.Secondly,the MFCC feature extraction method is analyzed,and the Expectation Maximization(EM)algorithm is introduced again to optimize HMM parameters.Finally,the THCHS-30 dataset is used for experimental verification.The results show that the introduction of EM algorithm to optimize HMM can effectively overcome the recognition difficulties of traditional HMM model in complex speech environment,and significantly improve the recognition accuracy and robustness of the system.

作者郭佳淇张继通 GUO Jiaqi;ZHANG Jitong(Zhengzhou University of Industrial Technology,Zhengzhou 451100,China)

机构地区郑州工业应用技术学院

出处《电声技术》 2024年第10期83-85,共3页 Audio Engineering

关键词语音识别梅尔频率倒谱系数(MFCC) 隐马尔可夫模型(HMM) 期望最大化(EM) speech recognition Mel-Frequency Cepstral Coefficients(MFCC) Hidden Markov Model(HMM) Expectation Maximization(EM)

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1应长鸣,何志学.利用语音识别实现盲人对智能手机的声控操作[J].电脑知识与技术,2022,18(9):49-51. 被引量：2
2黄玲,周裕滨,黄源俊.基于语音识别技术的智能家居系统设计[J].电脑知识与技术,2023,19(31):38-40. 被引量：6
3赵一鸣,陈宇,刘齐平.智能语音助手用户研究:理论进展与实践启示[J].数字图书馆论坛,2023,19(5):26-34. 被引量：1
4胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：22
5李志忠,滕光辉.基于改进MFCC的家禽发声特征提取方法[J].农业工程学报,2008,24(11):202-205. 被引量：25
6解滔,郑晓东,张?.基于线性预测倒谱系数的地震相分析[J].地球物理学报,2016,59(11):4266-4277. 被引量：12
7艾长胜,何光伟,董全成,昃向博.基于切削声LPCC的刀具磨损监测[J].中国机械工程,2009(17):2045-2048. 被引量：6
8张经,杨健,苏鹏.语音识别中单音节识别研究综述[J].计算机科学,2020,47(S02):172-174. 被引量：2
9刘铭,于子奇.一种改进的期望最大化算法[J].吉林大学学报（理学版）,2022,60(5):1176-1182. 被引量：1
10李荪,曹峰,刘姿杉.面向算法模型的语音数据集质量评估方法研究[J].计算机科学,2022,49(S02):519-524. 被引量：4

二级参考文献82

1薛辉.基于语音识别的智能家居控制系统的研究与设计[J].微型电脑应用,2020,36(2):149-151. 被引量：11
2刘连元.现代汉语语料库研制[J].语言文字应用,1996(3):3-9. 被引量：28
3汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
4鄢卉,李仁发.语音信号倒谱特征提取建模与仿真[J].系统仿真学报,2005,17(7):1774-1778. 被引量：8
5印兴耀,周静毅.地震属性优化方法综述[J].石油地球物理勘探,2005,40(4):482-489. 被引量：129
6凌云,俞寿朋,周熙襄.零相位同态反褶积[J].石油地球物理勘探,1995,30(3):299-309. 被引量：20
7白亮,老松杨,陈剑赟,吴玲达.音频自动分类中的特征分析和抽取[J].小型微型计算机系统,2005,26(11):2029-2034. 被引量：13
8杨勇,别爱芳,杨彩娥,孟海泉.神经网络微地震相分析方法及应用[J].地球学报,2005,26(5):483-486. 被引量：8
9张玲华,郑宝玉,杨震.基于LPC分析的语音特征参数研究及其在说话人识别中的应用[J].南京邮电学院学报（自然科学版）,2005,25(6):1-6. 被引量：13
10于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14

共引文献71

1赵丹群,王心玥,郭磬馨.开放科学时代学术评价研究的新机遇与新挑战——从系列开放获取宣言/倡议或行动计划谈起[J].情报学进展,2024(1):247-277.
2吕苗荣,李梅.车刀振动信号研究及磨损工况的识别[J].机床与液压,2012,40(1):65-71. 被引量：4
3余礼根,滕光辉,李保明,劳凤丹,邢永正.蛋鸡发声音频数据库的构建与应用[J].农业工程学报,2012,28(24):150-156. 被引量：20
4余礼根,滕光辉,李保明,劳凤丹,曹晏飞.栖架养殖模式下蛋鸡发声分类识别[J].农业机械学报,2013,44(9):236-242. 被引量：32
5曹晏飞,滕光辉,余礼根,李乔伟.含风机噪声的蛋鸡声音信号去噪方法比较[J].农业工程学报,2014,30(2):212-218. 被引量：26
6鲜晓东,樊宇星.基于Fisher比的梅尔倒谱系数混合特征提取方法[J].计算机应用,2014,34(2):558-561. 被引量：17
7沈明霞,刘龙申,闫丽,陆明洲,姚文,杨晓静.畜禽养殖个体信息监测技术研究进展[J].农业机械学报,2014,45(10):245-251. 被引量：45
8曹晏飞,余礼根,滕光辉,赵淑梅,刘旭明.蛋鸡发声与机械噪声特征提取及分类识别[J].农业工程学报,2014,30(18):190-197. 被引量：15
9黄锐,陆安江,张正平.一种改进型的MEL滤波器混合特征参数提取方法研究[J].通信技术,2014,47(12):1388-1391. 被引量：2
10李晶,孙农亮,滕升华.基于声音识别的设备状态检测算法[J].信息技术,2015,39(6):94-98. 被引量：6

1王素,王嘉澳,单大国.基于不变矩改进HMM的人体异常行为识别研究[J].广东公安科技,2022,30(4):45-49.
2肖大军,徐遐龄,刘涛,陈艳明,李鑫,于文娟.基于HMM的远动联调语音多层次背景噪音滤除模型[J].长江信息通信,2023,36(10):70-72.
3胡辉.基于用户语音情感分析的景区反馈评估方法[J].电声技术,2024,48(10):95-97.
4高鹤,郑学汉.智慧高速供电系统的能源管理与优化策略[J].中华传奇（中旬）,2021(35):0179-0181.
5李利,梁晶,陈旭东,寇发荣,潘红光.基于多注意融合网络的输煤皮带异物识别方法[J].西安科技大学学报,2024,44(5):976-984.
6李昆.基于数字音频的LED显示屏运维数据识别技术[J].电声技术,2024,48(10):32-35.
7吕虎.声音识别技术在计算机信息检测中的应用研究[J].电声技术,2024,48(10):101-103.
8刘洋,廉咪咪.基于一维卷积神经网络的语音识别系统构建方法[J].电声技术,2024,48(10):77-79.
9刘维博,季策.基于区块链的智慧停车平台应用[J].数字技术与应用,2024,42(9):112-115.
10苏银松,李志勇,叶敏,李忠玉.长纤维抗裂复合封层机远程监控系统[J].机械设计与制造,2024(10):277-281.

电声技术

2024年第10期

浏览历史

内容加载中请稍等...

基于MFCC和HMM的语音识别优化方法研究

参考文献10

二级参考文献82

共引文献71

相关作者

相关机构

相关主题

浏览历史