期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于HHT和OSF的复杂环境语音端点检测 被引量:12
1
作者 卢志茂 金辉 +1 位作者 张春祥 任明溪 《电子与信息学报》 EI CSCD 北大核心 2012年第1期213-217,共5页
希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含... 希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含噪语音信号进行经验模态分解,通过对固有模态函数进行自适应权重选取获得信号的希尔伯特能量谱,利用顺序统计滤波器对每帧的能量谱进行平滑处理作为语音/非语音的鉴别特征。实验结果表明,该方法适用于复杂噪声环境的端点检测,在低信噪比情况下仍然能够有效地检测出语音信号,降低信号误检率。 展开更多
关键词 语音信号处理 端点检测 希尔伯特-黄变换 顺序统计滤波 经验模态分解
下载PDF
一种自适应语音端点检测算法 被引量:6
2
作者 孙战先 储飞黄 王江 《计算机工程与应用》 CSCD 2014年第1期206-210,共5页
针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡... 针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡了音节之间的差异,放大了语音与噪声之间的差异,最后通过一个动态检测门限,实现了不同信噪比下的端点检测。 展开更多
关键词 语音活动检测(端点检测) 自适应 噪声评估 特征融合 voice activity detection(vad)
下载PDF
基于LPCC和能量熵的端点检测 被引量:6
3
作者 朱晓晶 侯旭初 +1 位作者 崔慧娟 唐昆 《电讯技术》 北大核心 2010年第6期41-45,共5页
为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率... 为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率的比较作出有声无声初判决;联合能量熵端点检测结果得到最终判决,最后通过Hangover机制最大限度的保护了语音。实验结果表明,此方法改善了能量熵端点检测法在babble噪声下的劣势,且在不同噪声环境下均优于G.729 Annex B的性能。 展开更多
关键词 语音信号处理 话音端点检测 谱熵 线性预测系数 倒谱系数 高斯混合模型
下载PDF
基于短时能量和噪声谱自适应估计的语音激活性检测方法 被引量:5
4
作者 董恩清 万东辉 +1 位作者 周亚同 蔡毓 《模式识别与人工智能》 EI CSCD 北大核心 2004年第2期227-231,共5页
文中综合语音短时能量和由Sohn等提出的自适应估计噪声统计量,提出一个适合于各种类型环境噪声的更鲁棒、更有效的语音激活性判别准则.该方法较Sohn方法正确识别率平均提高5%,且仍然保留着原来Sohn方法较好地自适应追踪噪声谱变化的优点... 文中综合语音短时能量和由Sohn等提出的自适应估计噪声统计量,提出一个适合于各种类型环境噪声的更鲁棒、更有效的语音激活性判别准则.该方法较Sohn方法正确识别率平均提高5%,且仍然保留着原来Sohn方法较好地自适应追踪噪声谱变化的优点,经过大量实验表明新方法是一个有效的、鲁棒的语音激活性检测器. 展开更多
关键词 语音激活性检测 语音分析 统计方法 语音编码 短时能量
原文传递
基于Teager能量算子和经验模态分解的语音端点检测算法 被引量:5
5
作者 沈希忠 郑晓修 《电子与信息学报》 EI CSCD 北大核心 2018年第7期1612-1618,共7页
Teager能量算子是近年来提出的非线性方法,具有跟踪时变信号的特点,该文结合该算子和经验模态分解方法,提出一种新的语音端点检测算法,用于寻找合理的语音起始和终止端点。该算法利用经验模态分解,提出本征模态函数的有效性筛选条件,通... Teager能量算子是近年来提出的非线性方法,具有跟踪时变信号的特点,该文结合该算子和经验模态分解方法,提出一种新的语音端点检测算法,用于寻找合理的语音起始和终止端点。该算法利用经验模态分解,提出本征模态函数的有效性筛选条件,通过筛选本征模态函数,使得该算法能够处理含噪语音信号,同时分解所得单模态特性正好满足TEO算子对单成份能量跟踪的要求,最后利用Hilbert变换解决了可能存在的模态混叠问题。经过这些处理,算法能够处理语音信号中清音段的端点标识,比直接TEO、双门限法效果好。通过大量实验验证了该算法的有效性。 展开更多
关键词 语音端点检测 TEAGER能量算子 经验模态分解 本征模态函数 HILBERT变换
下载PDF
连续汉语语音的自动切分研究
6
作者 李琦 张二华 《计算机与数字工程》 2023年第4期959-964,共6页
连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱... 连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱域等多个层次对连续语音信号进行分析,结合端点检测技术、频谱分析和倒等方法对音节切分点进行检测,研究了一种连续语音多级切分方法。相比传统的基于双门限和倒谱的端点检测方法,该方法将单字切分的正确率达到了92.8%。 展开更多
关键词 语音切分 端点检测 语谱图 双门限法 频带能量
下载PDF
基于盲源分离理论的麦克风阵列信号有音/无音检测方法 被引量:4
7
作者 马晓红 梁丽丽 殷福亮 《电子与信息学报》 EI CSCD 北大核心 2007年第3期589-592,共4页
该文提出一种在方向性噪声场中多路麦克风信号同时进行有音/无音检测(VAD)的方法。在方向性噪声场中,由于各个麦克风接收信号中的噪声彼此之间相关,因而,可以利用盲源分离理论将方向噪声与语音源信号分离,从而获得相对比较纯净的语音源... 该文提出一种在方向性噪声场中多路麦克风信号同时进行有音/无音检测(VAD)的方法。在方向性噪声场中,由于各个麦克风接收信号中的噪声彼此之间相关,因而,可以利用盲源分离理论将方向噪声与语音源信号分离,从而获得相对比较纯净的语音源信号。对分离出的语音源信号进行有音/无音检测,获得VAD结果,同时估计出各个麦克风信号相对于该信号的时延值。以相对纯净语音源信号的VAD检测结果为参考,将其分别平移相应的时延值,即可同时获得多路麦克风信号的VAD结果。计算机模拟结果表明,在方向性噪声场的多种情况下,该方法对具有加性噪声的多路麦克风信号均具有较好的有音/无音检测能力。 展开更多
关键词 有音/无音检测 盲源分离 时延估计 广义互相关 四阶统计量
下载PDF
RTP流音频回放技术在400 MHz数字列调系统中的应用
8
作者 赵文杰 《铁路通信信号工程技术》 2023年第12期43-46,共4页
介绍DRTD系统中无线列调语音业务的音频回放技术。DRTD系统有线通信基于SIP协议和R T P流进行音频传输,通过混音、加窗语音检测、缓存、格式转换、信令控制等处理流程,将音频流在无线空口上进行传输,并最终在移动终端上实现语音波形回放... 介绍DRTD系统中无线列调语音业务的音频回放技术。DRTD系统有线通信基于SIP协议和R T P流进行音频传输,通过混音、加窗语音检测、缓存、格式转换、信令控制等处理流程,将音频流在无线空口上进行传输,并最终在移动终端上实现语音波形回放,从而桥接无线列调中的有线通信和无线通信,为DRTD系统的核心业务提供支撑。 展开更多
关键词 400 MHz数字列调系统 实时传输协议 音频回放 语音活动性检测
下载PDF
基于常Q变换与深度神经网络的VDR语音端点检测 被引量:2
9
作者 杜晗 张维维 +1 位作者 张巧灵 闫凌宇 《大连海事大学学报》 CAS CSCD 北大核心 2022年第2期128-135,共8页
基于采集的真实船舶航行数据记录仪音频数据,提出一种基于常Q变换(Constant-Q Transform, CQT)幅度谱与深度神经网络(DNN)的语音端点检测方法。为获得适合不同频段的变频率分辨率,采用CQT对VDR音频信号进行谱分析,并利用DNN自动学习基于... 基于采集的真实船舶航行数据记录仪音频数据,提出一种基于常Q变换(Constant-Q Transform, CQT)幅度谱与深度神经网络(DNN)的语音端点检测方法。为获得适合不同频段的变频率分辨率,采用CQT对VDR音频信号进行谱分析,并利用DNN自动学习基于CQT幅度谱的复杂特征表示,实现端到端的VDR音频数据语音端点检测,真实VDR音频数据验证了本文方法的有效性。实验结果表明,该方法具有较高的正确率和鲁棒性。 展开更多
关键词 船舶航行数据记录仪(VDR) 语音端点检测(vad) 常Q变换(CQT) 深度神经网络(DNN)
原文传递
基于动态特性的D-LTSV语音端点检测方法 被引量:3
10
作者 赵欢 冯璐 +1 位作者 陈佐 张希翔 《计算机工程》 CAS CSCD 2014年第12期277-281,共5页
端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的... 端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的熵,利用倒谱的动态特性分析方法提取连续帧熵值的动态变化特征。实验结果表明,D-LTSV综合考虑了语音的非平稳性和帧间非平稳性的动态变化情况,具有比LTSV更好的分辨能力,特别是在低性噪比和非平稳噪声的环境下,D-LTSV的分辨能力提升了50.77%,能够准确地进行端点检测,具有更强的鲁棒性。 展开更多
关键词 语音端点检测 语音谱 长时特征 动态特性 分辨力
下载PDF
基于噪声倒谱阈值频谱估计的语音活动检测 被引量:3
11
作者 李宇 郭雷勇 谭洪舟 《计算机工程》 CAS CSCD 北大核心 2011年第14期140-142,共3页
针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析... 针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析与仿真结果表明,该方法的检测性能与Welch方法相当,计算量降低约18%,同时降低整个VAD的时间复杂度。 展开更多
关键词 语音活动检测 频谱估计 倒谱阈值方法 功率谱密度 快速傅里叶变换
下载PDF
一种用于3G系统中复杂背景噪声环境下的话音激活检测算法 被引量:2
12
作者 陈东 赵胜辉 匡镜明 《通信学报》 EI CSCD 北大核心 2001年第4期45-50,共6页
本文讨论了一种新的应用在 3G自适应多速率系统中复杂背景噪声环境下的话音激活检测算法。这种算法基于谱估计理论和周期信号检测方法 ,应用一个IIR滤波器组把输入窄带语音信号分成九个频带 ,进而估计每个频带的语音信号和背景噪声的电... 本文讨论了一种新的应用在 3G自适应多速率系统中复杂背景噪声环境下的话音激活检测算法。这种算法基于谱估计理论和周期信号检测方法 ,应用一个IIR滤波器组把输入窄带语音信号分成九个频带 ,进而估计每个频带的语音信号和背景噪声的电平 ,结合基音和音调检测 ,在区分语音和移动环境中的大多数背景噪声时表现得足够健壮。最后 ,基于欧洲电信标准委员会建议的 3G平台对这种算法进行了仿真评估 。 展开更多
关键词 话音激活检测 复杂背景噪声估计 第三代移动通信 CDMA
下载PDF
基于DSP的实时语音检测的设计与实现 被引量:3
13
作者 杨永超 付中华 蒋冬梅 《计算机应用》 CSCD 北大核心 2008年第2期491-493,498,共4页
提出了一种基于DSP的实时语音检测的方法,通过设置中断服务程序实现DSP与DMA的并行处理,采用双缓冲加一缓冲的方法保持语音连续性,利用短时能量状态转换图的方法对语音进行检测及存储,最后利用自制控制板实现程序控制和状态显示。实验... 提出了一种基于DSP的实时语音检测的方法,通过设置中断服务程序实现DSP与DMA的并行处理,采用双缓冲加一缓冲的方法保持语音连续性,利用短时能量状态转换图的方法对语音进行检测及存储,最后利用自制控制板实现程序控制和状态显示。实验结果表明,检测的语音数据和标注的语音数据相比较平均正确率可达94.98%,有效地实现了语音的实时处理。 展开更多
关键词 数字信号处理器 中断服务程序 语音检测 短时能量
下载PDF
基于EEMD域统计模型的话音激活检测算法 被引量:2
14
作者 吴其前 张雄伟 《数据采集与处理》 CSCD 北大核心 2012年第1期51-56,共6页
提出了一种基于EEMD域统计模型的话音激活检测算法。算法首先利用总体平均经验模态分解(Ensemble empirical mode decomposition,EEMD)对带噪语音进行分解,得到信号的本征模式函数(Intrinsicmode function,IMF)分量,选择与原信号的相关... 提出了一种基于EEMD域统计模型的话音激活检测算法。算法首先利用总体平均经验模态分解(Ensemble empirical mode decomposition,EEMD)对带噪语音进行分解,得到信号的本征模式函数(Intrinsicmode function,IMF)分量,选择与原信号的相关性最高的两个分量相加组成主分量;然后对主分量进行频域分解,引入统计模型,求出EEMD域特征参数;最后利用噪声与语音的EEMD域特征参数的不同来进行语音激活检测。实验结果表明,在不同信噪比情况下,本文算法性能优于目前常用的VAD算法,特别在噪声强度大时体现出明显的优势。 展开更多
关键词 话音激活检测 经验模式分解 总体平均经验模式分解 EEMD域统计模型
下载PDF
基于小波变分辨率频谱特征的静音检测 被引量:2
15
作者 薛卫 都思丹 叶迎宪 《计算机工程》 CAS CSCD 北大核心 2009年第13期232-233,236,共3页
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检... 针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。 展开更多
关键词 静音检测 小波 变分辨率频谱 支持向量机
下载PDF
基于复高斯混合模型的鲁棒VAD算法 被引量:2
16
作者 雷建军 杨震 +1 位作者 刘刚 郭军 《天津大学学报》 EI CAS CSCD 北大核心 2009年第4期353-356,共4页
针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了... 针对语音激活检测的鲁棒性问题,提出在非平稳噪声环境下使用基于复高斯混合模型的鲁棒语音激活检测算法.算法中假设纯净语音谱满足复高斯混合模型,先验信噪比利用预先训练好的复高斯混合模型计算得到.复高斯混合模型的引入一方面提高了语音激活检测的性能,另一方面避免了使用基于最小均方误差语音增强的先验信噪比估计过程.实验中使用NOISEX-92噪声库来验证系统在噪声环境下的性能.结果表明,该种算法在非平稳噪声环境下具有良好的检测性能. 展开更多
关键词 复高斯混合模型 语音激活检测 似然比测试
下载PDF
基于RASTA和SVM的话音激活检测算法 被引量:1
17
作者 寇钰鑫 景小宁 禹航 《微计算机信息》 2009年第18期231-232,227,共3页
提出了一种基于RASTA滤波技术的多维语音特征和支持向量机分类的VAD算法,适用于低信噪比情况下的话音检测。算法在语音特征选择上使用了RASTA-PLP滤波方法,提取出了多维倒谱参数,并将其作为特征向量输入给支持向量机进行分类检测。算法... 提出了一种基于RASTA滤波技术的多维语音特征和支持向量机分类的VAD算法,适用于低信噪比情况下的话音检测。算法在语音特征选择上使用了RASTA-PLP滤波方法,提取出了多维倒谱参数,并将其作为特征向量输入给支持向量机进行分类检测。算法所提取的特征是基于人类听觉感知系统特性的,因此具有普遍意义和稳定性,多维特征与支持向量机的结合则提高了语音分类判决的可靠性。实验结果表明,算法在低信噪比环境下对话音和噪声均具有较高的检出率。 展开更多
关键词 RASTA 支持向量机(SVM) 话音激活检测(vad)
下载PDF
android系统通话中回声消除的实现 被引量:1
18
作者 曾光 侯嘉 《通信技术》 2011年第11期41-43,共3页
为了消除android系统电话免提通话时产生的声学回声,利用静音检测(VAD)机制,在android系统开源代码软件asterisk模块中,加入声学回声消除算法。通过不断比较来话音和去话音数据,判断是否为声学回声并进行白噪声替换,测试结果表明在一般... 为了消除android系统电话免提通话时产生的声学回声,利用静音检测(VAD)机制,在android系统开源代码软件asterisk模块中,加入声学回声消除算法。通过不断比较来话音和去话音数据,判断是否为声学回声并进行白噪声替换,测试结果表明在一般的通话环境中,可以消除正常语音通话时90%以上的回声,实现半双工通信,适合于嵌入式android终端设备的开发。 展开更多
关键词 声学回声 vad 白噪声
原文传递
基于语音端点检测和子空间方法的语音增强算法 被引量:1
19
作者 张慧 马建芬 《计算机应用》 CSCD 北大核心 2009年第B06期340-341,共2页
利用子空间方法来实现语音的增强,在语音失真和残留噪声之间进行折中处理:既最小化语音失真,同时又使残留噪声保持在一个预先设定的值。传统的子空间法在平稳噪声环境下是有效的,但在非平稳环境下效果却不是很明显,因此利用语音端点检测... 利用子空间方法来实现语音的增强,在语音失真和残留噪声之间进行折中处理:既最小化语音失真,同时又使残留噪声保持在一个预先设定的值。传统的子空间法在平稳噪声环境下是有效的,但在非平稳环境下效果却不是很明显,因此利用语音端点检测(VAD)对噪声的协方差进行及时地更新。实验表明,采用基于VAD的子空间方法实现语音增强可以达到很好的效果。 展开更多
关键词 语音增强 信号子空间 噪声子空间 奇异值分解/特征值分解 语音端点检测
下载PDF
基于概率密度并联距离的话音检测算法 被引量:1
20
作者 吴其前 张雄伟 邹霞 《电子与信息学报》 EI CSCD 北大核心 2008年第12期2886-2889,共4页
该文提出了一种基于概率密度并联距离的话音激活检测算法。算法根据语音信号和噪声信号的Mel域子带能量概率密度的不同特性,引入并联距离定义构造判决函数,通过判断该函数的值来进行语音激活检测。实验结果表明,在不同信噪比情况下,该... 该文提出了一种基于概率密度并联距离的话音激活检测算法。算法根据语音信号和噪声信号的Mel域子带能量概率密度的不同特性,引入并联距离定义构造判决函数,通过判断该函数的值来进行语音激活检测。实验结果表明,在不同信噪比情况下,该文算法性能优于G.729BVAD算法。 展开更多
关键词 话音激活检测 概率密度 并联距离
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部