语音识别ASIC中端点检测算法研究与实现被引量：2

Research and Realization of Endpoint Detection Algorithm in Speech Recognition ASIC

下载PDF

导出

摘要提出基于短时能量和过零率的简化语音信号双门限端点检测算法,搭建Matlab的算法仿真平台,实验结果表明,基于短时能量和过零率的双门限端点检测算法在保证检测率的前提下,运算复杂度和运算量均优于倒谱、分形、加权门限端点检测方法。采用Verilog语言完成了该模块的设计和仿真,并成功应用于孤立词语音识别系统中。该语音识别系统采用定点数设计方式,语音信号的采样频率为8kHz,每次采样的数据为8bits,晶片内部稳定工作频率为20MHz。实验结果表明,在200个词源的条件下,平均可以达到90%以上的识别效果。 This paper puts forward a simplified two-threshold speech endpoint detection algorithm for speech signal based on shortterm energy and zero-crossing rate. Building a simulation platform of Matlab algorithm, and the experimental results show that the two-threshold speech endpoint detection algorithm for speech signal based on short-term energy and zero-crossing rate is better than cepstrum, fraetal, and spectrum entropy method of endpoint detection, under the premise of computing complexity and computing quantity. This paper completes the various modules of the design, simulation and systems integration with the Verilog language, using fixed-point design approach, the voice signal sampling frequency of 8kHz, the data for each sample 8bits, the internal stability of the chip operates at 20MHz, the coefficient of linear prediction obtained by the circuit compares with simulation results on Matlab platform, the error rate less than 0.2 percent, on conditions of 200 source words, it can achieve an average of more than 90% of the resuh of recognition.

作者靳月英

机构地区中国航油西北公司

出处《计算机与现代化》 2011年第12期57-59,70,共4页 Computer and Modernization

关键词端点检测语音识别专用集成电路 endpoint detection speech recognition ASIC

分类号 TN492 [电子电信—微电子学与固体电子学] TN495

引文网络
相关文献

参考文献13

1易克初等编著..语音信号处理[M].北京:国防工业出版社,2000:363.
2Shih Ming-Chi.VLSI System Design and Implementation of 1.6k Low Bit Rate Speech Coder[D].National Cheng Kung University,2001. 被引量：1
3林波,吕明.基于DTW改进算法的孤立词识别系统的仿真与分析[J].信息技术,2006,30(4):56-59. 被引量：12
4RabinerL JuangBH.Fundamentals of speech recognition[M].北京：清华大学出版社,1999.200-240. 被引量：5
5Maria Markaki,Michael Wohlmayer,Yannis Stylianou.Extraction of speech-relevant information from modulation spectrograms[M]// Progress in Nonlinear Speech Processing,2007:78-88. 被引量：1
6赵力编著..语音信号处理[M].北京:机械工业出版社,2003:316.
7叶桂弘.整合语音编码与辨识之模组化设计及其FPGA实现[D].台北:中原大学,2003. 被引量：1
8王安娜,王勤万,刘俊芳,袁文静.改进的语音特征提取方法及其应用[J].计算机工程,2008,34(5):196-197. 被引量：8
9章熙春,曹燕,张军,韦岗.基于WDFT的语音PLP特征提取算法[J].模式识别与人工智能,2005,18(4):469-473. 被引量：4
10徐霄鹏,吴及,刘庆升,黄文浩.孤立词语音识别算法性能研究与改进[J].计算机工程与应用,2001,37(21):144-146. 被引量：5

二级参考文献22

1Oppenheim A, Johanson D. Computation of Spectra with Unequal Resolution Using the Fast Fourier Transform. IEEE Proceedings Letters, 1971, 59(2); 299-301. 被引量：1
2Bagchi S, Mitra S K. Nonuniform Discrete Fourier Transform and its Signal Processing Applications. Norwell, USA: Kluwer,1999. 被引量：1
3Markur A, Mitra S K. Warped Discrete Fourier Trans form:Theory and Applications. IEEE Trans on Circuits and Systems Ⅰ : Fundamental Theory and Applications, 2001, 48 (9):1086-1093. 被引量：1
4Franz S, Mitra S K, Doblinger G. Frequency Estimation Using Warped Discrete Fourier Transform. Signal Processing, 2003,83(8):1661-1671. 被引量：1
5Hermansky H. Perceptual IAnear Predictive (PLP) Analysis of Speech. Journal Acoustical Society of America, 1990, 87(4):1738-1752. 被引量：1
6Hermansky H, Hanson B A. Perceptually Based Linear Predictive Analysis of Speech. In: Proc of the IEEE International Conference on Acoustics, Speech and Signal Processing. Tampa USA, 1985, Ⅹ: 509-512. 被引量：1
7Yong S, et al. The HTK Book(for HTK Version 3.0). Cambridge, UK: Cambridge University Technical Services. 2000. 被引量：1
8Xu J F, Wei G. Noise-Robust Speech Recognition Based on Difference of Power Spectrum. Electronics Letters, 2000, 36(14): 1247-1248. 被引量：1
9Thomas F.Qualieri,Discrete-Time Speech Signal Processing[M].Beijing:Publishing House of Electronics Industry,2004:197-230. 被引量：1
10Huang Xuedong, Acero A. Spoken Language Processing: A Guide to Theory, Algorithm and System Development[M]. New Jersey: Prentice-Hall, 2001. 被引量：1

共引文献29

1刘建辉,卢珞先,黄涛.一种小词汇量快速语音识别系统的实现[J].武汉理工大学学报（信息与管理工程版）,2006,28(2):10-13. 被引量：3
2蔡妍,陈苗苗.语音识别和语音合成在航管雷达模拟系统中的应用[J].中国民航飞行学院学报,2007,18(3):53-56. 被引量：3
3马莉,党幼云.特定人孤立词语音识别系统的仿真与分析[J].西安工程科技学院学报,2007,21(3):371-373. 被引量：11
4丁志中,蒋建国,夏娜.部分国外电子信息类教材编写特点[J].合肥工业大学学报（社会科学版）,2007,21(4):56-59. 被引量：1
5申毅,简志华,杨震.改进的GMM模型语声转换系统[J].南京邮电大学学报（自然科学版）,2007,27(5):11-15. 被引量：2
6姚徐,李永宏,单广荣,于洪志.藏语孤立词语音识别系统研究[J].西北民族大学学报（自然科学版）,2009,30(1):29-36. 被引量：10
7刘其洪,李仲阳,徐孟龙.基于语音识别的智能家居系统研究[J].信息化纵横,2009(14):80-83. 被引量：3
8马钧,许嘉璐.基于中国消费者使用习惯的车载语音控制技术发展研究[J].上海汽车,2010(6):43-46.
9张宁,施毅,黄卫.基于OGS-DTW算法的交通事件自动检测方法[J].公路交通科技,2010,27(8):103-108. 被引量：2
10王飞飞,吾守尔.斯拉木,那斯尔江.吐尔逊.基于DDBHMM的维吾尔语音声学识别[J].计算机工程,2011,37(2):197-199.

同被引文献7

1林波,吕明.基于DTW改进算法的孤立词识别系统的仿真与分析[J].信息技术,2006,30(4):56-59. 被引量：12
2李昱,林志谋,黄云鹰,卢贵主.基于短时能量和短时过零率的VAD算法及其FPGA实现[J].电子技术应用,2006,32(9):110-113. 被引量：5
3梁涛,张国杰,张效军.基于FPGA的说话人识别算法的实现[J].通信技术,2008,41(2):66-69. 被引量：4
4王娜,刘政连.基于DTW的孤立词语音识别系统的研究与实现[J].九江学院学报（自然科学版）,2010,23(3):31-33. 被引量：2
5周明忠,吉立新.基于平均幅度和加权过零率的VAD算法及其FPGA实现[J].信息工程大学学报,2010,11(6):713-718. 被引量：3
6徐利军.基于DTW的孤立词语音识别研究[J].软件导刊,2012,11(2):137-139. 被引量：6
7胡亚洲,王新民,曹江涛.基于改进DTW的机器人语音指令识别系统研究[J].计算机技术与发展,2013,23(7):70-72. 被引量：3

引证文献2

1杜海涛,张峰,高曼颖,胡入祯,杨光华.基于话音识别的骚扰电话呼叫检测技术分析[J].电信工程技术与标准化,2014,27(12):5-9. 被引量：5
2张羊,姜汉钧,王志华.一种双门限语音端点检测算法的ASIC实现[J].微电子学与计算机,2016,33(11):69-73. 被引量：3

二级引证文献8

1朱宏毅,林建洪,王彦青,张锦然,王敬宇.违规语音电话的治理方法与实践[J].电信科学,2015,31(7):104-112. 被引量：3
2王彦青,王瀚辰.一种识别骚扰电话的组合算法研究[J].电信科学,2017,33(7):112-119. 被引量：4
3许乃利.基于大数据技术的疑似骚扰和电信欺诈电话监测系统设计与实现[J].信息通信技术,2017,11(4):27-33. 被引量：3
4王晓华,要鹏超,广夏桐,王文杰,张蕾.基于ROS的移动机器人语音控制设计与实现[J].传感器与微系统,2019,38(5):100-103. 被引量：8
5韩研.“呼死你”骚扰电话防治方案[J].电信科学,2018,34(S1):269-274. 被引量：1
6郭来功,陈松.基于改进ESC算法的语音端点检测及FPGA实现[J].电视技术,2019,43(2):56-60.
7全俊斌,张士珣,刘峥.一种基于信令数据的业务推销类骚扰电话识别方法[J].移动通信,2020,44(7):93-96.
8崔智恒,焦继业,祝禛天.双麦克风语音增强算法研究与实现[J].电子设计工程,2022,30(10):109-114. 被引量：1

1纪正红.“盱眙”词源考[J].教育界（高等教育）,2012(9):112-112.
2田园,张峰,刘佳.基于Simulink的CMMB算法仿真平台的实现[J].电视技术,2012,36(5):5-7.
3天语推全新电商品牌nibiru[J].石油工业计算机应用,2014(2):52-52.
4李建宁,冯宏伟.基于变帧长自适应门限的端点检测方法[J].电声技术,2007,31(9):53-55. 被引量：1
5小春.你了解EQ吗?[J].个人电脑,2005,11(4):234-235.
6黄东平,刘铎,戴一奇.加权门限秘密共享[J].计算机研究与发展,2007,44(8):1378-1382. 被引量：9
7肖艳,程淑芳.主成分分析的高光谱异常检测研究[J].激光杂志,2017,38(1):119-122. 被引量：2
8CT.看一看数码潮人的家中学的记忆[J].电脑爱好者,2010(2):93-93.
9颜飞,周长久,田彦涛.用于目标定位的图像边缘点检测算法[J].吉林大学学报（工学版）,2016,46(6):2103-2110. 被引量：3
10CT.看一看数码潮人的家圣诞礼物篇[J].电脑爱好者,2009(24):86-86.

计算机与现代化

2011年第12期

浏览历史

内容加载中请稍等...

语音识别ASIC中端点检测算法研究与实现被引量：2

参考文献13

二级参考文献22

共引文献29

同被引文献7

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

语音识别ASIC中端点检测算法研究与实现 被引量：2

参考文献13

二级参考文献22

共引文献29

同被引文献7

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

语音识别ASIC中端点检测算法研究与实现被引量：2