-
题名基于顺序统计滤波的实时语音端点检测算法
被引量:6
- 1
-
-
作者
郭丽惠
何昕
张亚昕
吕岳
-
机构
华东师范大学计算机科学技术系
摩托罗拉中国研究中心
-
出处
《自动化学报》
EI
CSCD
北大核心
2008年第4期419-425,共7页
-
基金
国家自然科学基金(60475006)
教育部新世纪优秀人才支持计划(NCET-05-0430)资助
-
文摘
针对嵌入式语音识别系统,提出了一种高效的实时语音端点检测算法.算法以子带频谱熵为语音/噪声的区分特征,首先将每帧语音的频谱划分成若干个子带,计算出每个子带的频谱熵,然后把相继若干帧的子带频谱熵经过一组顺序统计滤波器获得每帧的频谱熵,根据频谱熵的值对输入的语音进行分类.实验结果表明,该算法能够有效地区分语音和噪声,可以显著地提高语音识别系统的性能.在不同的噪声环境和信噪比条件下具有鲁棒性.此外,本文提出的算法计算代价小,简单易实现,适合实时嵌入式语音识别系统的应用.
-
关键词
语音端点检测
顺序统计滤波
子带频谱熵
语音识别
-
Keywords
Voice activity detection, order statistics filtering, subband spectrum entropy, speech recognition
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名实时语音端点鲁棒检测
被引量:4
- 2
-
-
作者
王景芳
-
机构
湖南涉外经济学院电气工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第20期147-150,170,共5页
-
基金
湖南省教育厅科学研究资助项目(No.08C512)
-
文摘
提出了一种适应复杂环境下的高效的实时语音端点检测算法,给出了每帧声信号在滤波中的噪声功率谱的推算方法。先将每帧语音的频谱进行迭代维纳滤波,再将它划分成若干个子带并计算出每个子带的频谱熵,然后把相继若干帧的子带频谱熵经过一组中值滤波器获得每帧的频谱熵,根据频谱熵的值对输入的语音进行分类。实验结果表明,该算法能够有效地区分语音和噪声,可以显著地提高语音识别系统的性能,在不同的噪声环境条件下具有鲁棒性。该算法计算代价小,简单易实现,适合实时语音识别系统的应用。
-
关键词
语音端点检测
迭代维纳滤波
子带频谱熵
自适应处理
鲁棒性
-
Keywords
voice activity detection
iterative Wiener filtering
subband spectrum entropy
adaptive processing
robustness
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于子带谱熵的仿生小波语音增强
被引量:5
- 3
-
-
作者
刘艳
倪万顺
-
机构
大连大学信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2015年第3期868-871,共4页
-
基金
辽宁省教育厅科学计划项目(L2013463)
-
文摘
前端噪声处理直接关系着语音识别的准确性和稳定性,针对小波去噪算法所分离出的信号不是原始信号的最佳估计,提出一种基于子带谱熵的仿生小波变换(BWT)去噪算法。充分利用子带谱熵端点检测的精确性,区分含噪语音部分和噪声部分,实时更新仿生小波变换中的阈值,精确地区分出噪声信号小波系数,达到语音增强目的。实验结果表明,提出的基于子带谱熵的仿生小波语音增强方法与维纳滤波方法相比,信噪比(SNR)平均提高约8%,所提方法对噪声环境下语音信号有显著的增强效果。
-
关键词
语音增强
子带谱熵
仿生小波变换
去噪
阈值
-
Keywords
speech enhancement
subband spectrum entropy
Bionic Wavelet Transform (BWT)
denoising
threshold
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名一种婴儿哭声识别优化算法的研究
被引量:2
- 4
-
-
作者
林浩文
张正道
张明馨
高超宏
-
机构
江南大学物联网工程学院
江南大学轻工过程先进控制教育部重点实验室
-
出处
《测控技术》
2019年第12期46-51,共6页
-
文摘
针对现有婴儿哭声识别方法在噪声环境下和不同婴儿间鲁棒性不足的问题,提出一种婴儿哭声识别的优化算法。利用子带谱熵法端点确定婴儿哭声信号的有效区间,增强算法在噪声环境下的鲁棒性;从有效哭声信号中提取平滑Mel频率倒谱系数(SMFCC)作为特征参数;基于SMFCC构建婴儿哭声模板,增强算法在不同婴儿间的鲁棒性;使用动态时间规整算法(DTW)计算哭声信号与模板的距离,得到识别结果。实验表明:在具有噪声的婴儿哭声测试集中,哭声识别准确率均达到72%以上,该方案在噪声环境下和不同婴儿个体的哭声识别中表现出较强的鲁棒性。
-
关键词
婴儿哭声识别
平滑Mel频率倒谱系数
子带谱熵法
基音频率
动态时间规整
-
Keywords
infant crying recognition
smooth Mel frequency cepstrum coefficient
subband spectrum entropy
fundamental frequency
dynamic time warping
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语音转折点检测的改进波形相似叠加时长规整算法
被引量:1
- 5
-
-
作者
雷颖思
杨燕
-
机构
兰州交通大学电子与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第10期260-264,共5页
-
基金
甘肃省科技厅自然科学基金资助项目(1310RJZA050)
-
文摘
波形相似叠加算法忽略语音本身感知特性,对整段语音统一规整,在采样率较低或规整比例较大时处理效果不佳。为此,通过分析人耳听觉系统的预测特点,提出一种改进的波形相似叠加时长规整算法。采用子带谱熵法检测出语音的转折部分并保持其不变,以保证转折区的语音信息不受损坏,并给出一种局部补偿法以修正整体规整精度。仿真结果表明,该算法在整体规整比例不变的情况下可提高合成语音的自然度。
-
关键词
时长规整算法
波形相似叠加算法
听觉预测
转折点检测
子带谱熵
局部补偿法
-
Keywords
time warping algorithm
Waveform Similarity Overlap-and-Add(WSOLA)algorithm
acoustic prediction
turning point detection
subband spectrum entropy
local compensation method
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于子带二次谱熵的语音端点检测
被引量:3
- 6
-
-
作者
朱建伟
孙水发
但志平
雷帮军
-
机构
三峡大学智能视觉与图像信息研究所
三峡大学电气与新能源学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2011年第3期77-80,共4页
-
基金
国家自然科学基金项目(60972162)
湖北省自然科学基金项目(2008CDB346)
+6 种基金
湖北省教育厅重大项目(Z20081301)
湖北省高等学校优秀中青年科技创新团队计划项目(T201002)
湖北省教育厅中青年项目(Q20101202
Q20101205)
宜昌市科学技术研究与开发项目(A09302-31
A09302-32
A2010-302-10)
-
文摘
为了提高在强噪声环境下语音端点检测的准确度,提出基于子带二次谱熵的端点检测算法.该算法把子带二次谱熵作为端点检测新的特征参数,首先计算每帧语音信号的二次谱,再多子带分析,计算二次谱熵;引入顺序统计滤波对二次谱熵平滑处理;将有限状态机判别方法与子带二次谱熵相合,形成新的语音/噪声判别算法,有效地解决单门限法易出现的两类误判.实验表明:与传统的两种方法相比,提出的端点检测算法具有准确性高、抗噪性强等优点.
-
关键词
端点检测
子带二次谱熵
有限状态机
顺序统计滤波
-
Keywords
voice activity detection
subband reprocessed power spectrum entropy
finite state machine
order statistics filter
-
分类号
TN912.3
[电子电信—通信与信息系统]
-