期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
一种自适应语音端点检测算法 被引量:6
1
作者 孙战先 储飞黄 王江 《计算机工程与应用》 CSCD 2014年第1期206-210,共5页
针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡... 针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡了音节之间的差异,放大了语音与噪声之间的差异,最后通过一个动态检测门限,实现了不同信噪比下的端点检测。 展开更多
关键词 语音活动检测(端点检测) 自适应 噪声评估 特征融合 VOICE Activity detection(vad)
下载PDF
Novel DTD and VAD assisted voice detection algorithm for VoIP systems
2
作者 Ming Meng Wang Ke Ji Hong 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2016年第4期9-16,76,共9页
Echo cancellation plays an important role in current Internet protocol(IP) based voice interactive systems. Voice state detection is an essential part in echo cancellation. It mainly comprises two parts: double tal... Echo cancellation plays an important role in current Internet protocol(IP) based voice interactive systems. Voice state detection is an essential part in echo cancellation. It mainly comprises two parts: double talk detection(DTD) and voice activity detection(VAD). DTD is used to detect doubletalk and prevent filter divergence in the presence of near-end speech, and VAD is used to determine the near-end voice activity and output silence indicator when near-end is silent. However, DTD straightforwardly proceeded may mistakenly declare double talk under double silent condition, coefficients update under the far-end silence condition may lead to filter divergence, and current VAD algorithms may misjudge the residual echo from the near end to be far-end voice. Therefore, a voice detection algorithm combining DTD and far-end VAD is proposed. DTD is implemented when VAD declares far-end speech, filtering and coefficients update will be halted when VAD declares far-end silence, and the far-end VAD adopted is multi-feature VAD based on short-time energy and correlation. The new algorithm can improve the accuracy of DTD, prevent filter divergence, and exclude the circumstance that far-end signal only contains residual echo from near end. Actual test results show that the voice state decision of the new algorithm is accurate, and the performance of echo cancellation is improved. 展开更多
关键词 echo cancellation double talk detection(DTD) voice activity detectionvad adaptive filter
原文传递
基于HHT和OSF的复杂环境语音端点检测 被引量:12
3
作者 卢志茂 金辉 +1 位作者 张春祥 任明溪 《电子与信息学报》 EI CSCD 北大核心 2012年第1期213-217,共5页
希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含... 希尔伯特-黄变换是一种全数据驱动的自适应非平稳信号时频分析方法,但是在强噪声环境下语音信号的希尔伯特能量谱曲线波动较大,对语音端点检测造成很大的影响,该文提出了一种基于希尔伯特-黄变换和顺序统计滤波的检测方法。该方法将含噪语音信号进行经验模态分解,通过对固有模态函数进行自适应权重选取获得信号的希尔伯特能量谱,利用顺序统计滤波器对每帧的能量谱进行平滑处理作为语音/非语音的鉴别特征。实验结果表明,该方法适用于复杂噪声环境的端点检测,在低信噪比情况下仍然能够有效地检测出语音信号,降低信号误检率。 展开更多
关键词 语音信号处理 端点检测 希尔伯特-黄变换 顺序统计滤波 经验模态分解
下载PDF
基于HMM与SVM的语音活动检测 被引量:10
4
作者 肖佳林 赵聿晴 王英 《计算机工程》 CAS CSCD 2014年第1期203-208,共6页
工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通... 工程机械强噪音环境下的噪声源较多,导致电话语音通话无法进行,且强噪声造成无效数据占用带宽。为此,提出基于隐马尔科夫模型(HMM)和支持向量机(SVM)的语音活动检测算法。该算法将提取的美尔频率倒谱系数特征向量输入到HMM识别器中,并通过Viterbi算法得到N维最佳识别结果,将其转换为SVM特征向量输入到SVM分类器中进行分类判别,得到判决结果。实验结果表明,该算法在机械工作噪音的情况下,语音检测率较静态统计类算法平均提高9%,比小波支持向量机方法提高11%,在驾驶室噪音的情况下比小波SVM方法有较小幅度的提高,但其增长速度较快,且比传统的统计类算法提高9%。 展开更多
关键词 美尔频率倒谱系数 隐马尔科夫模型 支持向量机 语音活动检测 核函数
下载PDF
基于LPCC和能量熵的端点检测 被引量:6
5
作者 朱晓晶 侯旭初 +1 位作者 崔慧娟 唐昆 《电讯技术》 北大核心 2010年第6期41-45,共5页
为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率... 为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率的比较作出有声无声初判决;联合能量熵端点检测结果得到最终判决,最后通过Hangover机制最大限度的保护了语音。实验结果表明,此方法改善了能量熵端点检测法在babble噪声下的劣势,且在不同噪声环境下均优于G.729 Annex B的性能。 展开更多
关键词 语音信号处理 话音端点检测 谱熵 线性预测系数 倒谱系数 高斯混合模型
下载PDF
基于短时能量和噪声谱自适应估计的语音激活性检测方法 被引量:5
6
作者 董恩清 万东辉 +1 位作者 周亚同 蔡毓 《模式识别与人工智能》 EI CSCD 北大核心 2004年第2期227-231,共5页
文中综合语音短时能量和由Sohn等提出的自适应估计噪声统计量,提出一个适合于各种类型环境噪声的更鲁棒、更有效的语音激活性判别准则.该方法较Sohn方法正确识别率平均提高5%,且仍然保留着原来Sohn方法较好地自适应追踪噪声谱变化的优点... 文中综合语音短时能量和由Sohn等提出的自适应估计噪声统计量,提出一个适合于各种类型环境噪声的更鲁棒、更有效的语音激活性判别准则.该方法较Sohn方法正确识别率平均提高5%,且仍然保留着原来Sohn方法较好地自适应追踪噪声谱变化的优点,经过大量实验表明新方法是一个有效的、鲁棒的语音激活性检测器. 展开更多
关键词 语音激活性检测 语音分析 统计方法 语音编码 短时能量
原文传递
基于Teager能量算子和经验模态分解的语音端点检测算法 被引量:5
7
作者 沈希忠 郑晓修 《电子与信息学报》 EI CSCD 北大核心 2018年第7期1612-1618,共7页
Teager能量算子是近年来提出的非线性方法,具有跟踪时变信号的特点,该文结合该算子和经验模态分解方法,提出一种新的语音端点检测算法,用于寻找合理的语音起始和终止端点。该算法利用经验模态分解,提出本征模态函数的有效性筛选条件,通... Teager能量算子是近年来提出的非线性方法,具有跟踪时变信号的特点,该文结合该算子和经验模态分解方法,提出一种新的语音端点检测算法,用于寻找合理的语音起始和终止端点。该算法利用经验模态分解,提出本征模态函数的有效性筛选条件,通过筛选本征模态函数,使得该算法能够处理含噪语音信号,同时分解所得单模态特性正好满足TEO算子对单成份能量跟踪的要求,最后利用Hilbert变换解决了可能存在的模态混叠问题。经过这些处理,算法能够处理语音信号中清音段的端点标识,比直接TEO、双门限法效果好。通过大量实验验证了该算法的有效性。 展开更多
关键词 语音端点检测 TEAGER能量算子 经验模态分解 本征模态函数 HILBERT变换
下载PDF
基于自适应阈值活动语音检测和最小均方误差对数谱幅度估计的低信噪比降噪算法 被引量:5
8
作者 张皓然 王学渊 李小霞 《计算机应用》 CSCD 北大核心 2020年第6期1763-1768,共6页
针对低信噪比(SNR)环境下传统方法对声信号降噪的局限性,提出了一种联合自适应阈值活动语音检测(VAD)算法和最小均方误差对数谱幅度估计(MMSE-LSA)的实时降噪算法。首先,在VAD算法中通过基于能量概率最大值的概率统计来对背景噪声进行估... 针对低信噪比(SNR)环境下传统方法对声信号降噪的局限性,提出了一种联合自适应阈值活动语音检测(VAD)算法和最小均方误差对数谱幅度估计(MMSE-LSA)的实时降噪算法。首先,在VAD算法中通过基于能量概率最大值的概率统计来对背景噪声进行估计,对得到的背景噪声进行实时更新并保存;然后,将实时更新的背景噪声作为MMSE-LSA的参考噪声,并对噪声幅度谱进行自适应更新,最后进行降噪处理。通过在真实场景中对四类声信号进行实验,结果表明,该算法在保证对低SNR声信号的实时处理的情况下,相较于传统MMSE-LSA算法,降噪信号的SNR能够提高10~15 dB,且不存在信号过减的情况,可应用于实际工程。 展开更多
关键词 真实环境 自适应阈值 活动语音检测算法 实时最小均方误差对数谱幅度估计算法 实时背景 低信噪比
下载PDF
连续汉语语音的自动切分研究
9
作者 李琦 张二华 《计算机与数字工程》 2023年第4期959-964,共6页
连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱... 连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱域等多个层次对连续语音信号进行分析,结合端点检测技术、频谱分析和倒等方法对音节切分点进行检测,研究了一种连续语音多级切分方法。相比传统的基于双门限和倒谱的端点检测方法,该方法将单字切分的正确率达到了92.8%。 展开更多
关键词 语音切分 端点检测 语谱图 双门限法 频带能量
下载PDF
基于常Q变换与深度神经网络的VDR语音端点检测 被引量:2
10
作者 杜晗 张维维 +1 位作者 张巧灵 闫凌宇 《大连海事大学学报》 CAS CSCD 北大核心 2022年第2期128-135,共8页
基于采集的真实船舶航行数据记录仪音频数据,提出一种基于常Q变换(Constant-Q Transform, CQT)幅度谱与深度神经网络(DNN)的语音端点检测方法。为获得适合不同频段的变频率分辨率,采用CQT对VDR音频信号进行谱分析,并利用DNN自动学习基于... 基于采集的真实船舶航行数据记录仪音频数据,提出一种基于常Q变换(Constant-Q Transform, CQT)幅度谱与深度神经网络(DNN)的语音端点检测方法。为获得适合不同频段的变频率分辨率,采用CQT对VDR音频信号进行谱分析,并利用DNN自动学习基于CQT幅度谱的复杂特征表示,实现端到端的VDR音频数据语音端点检测,真实VDR音频数据验证了本文方法的有效性。实验结果表明,该方法具有较高的正确率和鲁棒性。 展开更多
关键词 船舶航行数据记录仪(VDR) 语音端点检测(vad) 常Q变换(CQT) 深度神经网络(DNN)
原文传递
基于盲源分离理论的麦克风阵列信号有音/无音检测方法 被引量:4
11
作者 马晓红 梁丽丽 殷福亮 《电子与信息学报》 EI CSCD 北大核心 2007年第3期589-592,共4页
该文提出一种在方向性噪声场中多路麦克风信号同时进行有音/无音检测(VAD)的方法。在方向性噪声场中,由于各个麦克风接收信号中的噪声彼此之间相关,因而,可以利用盲源分离理论将方向噪声与语音源信号分离,从而获得相对比较纯净的语音源... 该文提出一种在方向性噪声场中多路麦克风信号同时进行有音/无音检测(VAD)的方法。在方向性噪声场中,由于各个麦克风接收信号中的噪声彼此之间相关,因而,可以利用盲源分离理论将方向噪声与语音源信号分离,从而获得相对比较纯净的语音源信号。对分离出的语音源信号进行有音/无音检测,获得VAD结果,同时估计出各个麦克风信号相对于该信号的时延值。以相对纯净语音源信号的VAD检测结果为参考,将其分别平移相应的时延值,即可同时获得多路麦克风信号的VAD结果。计算机模拟结果表明,在方向性噪声场的多种情况下,该方法对具有加性噪声的多路麦克风信号均具有较好的有音/无音检测能力。 展开更多
关键词 有音/无音检测 盲源分离 时延估计 广义互相关 四阶统计量
下载PDF
RTP流音频回放技术在400 MHz数字列调系统中的应用
12
作者 赵文杰 《铁路通信信号工程技术》 2023年第12期43-46,共4页
介绍DRTD系统中无线列调语音业务的音频回放技术。DRTD系统有线通信基于SIP协议和R T P流进行音频传输,通过混音、加窗语音检测、缓存、格式转换、信令控制等处理流程,将音频流在无线空口上进行传输,并最终在移动终端上实现语音波形回放... 介绍DRTD系统中无线列调语音业务的音频回放技术。DRTD系统有线通信基于SIP协议和R T P流进行音频传输,通过混音、加窗语音检测、缓存、格式转换、信令控制等处理流程,将音频流在无线空口上进行传输,并最终在移动终端上实现语音波形回放,从而桥接无线列调中的有线通信和无线通信,为DRTD系统的核心业务提供支撑。 展开更多
关键词 400 MHz数字列调系统 实时传输协议 音频回放 语音活动性检测
下载PDF
一种语音端点检测电路的设计 被引量:2
13
作者 马瑞 张盛兵 郑乔石 《计算机工程与应用》 CSCD 北大核心 2010年第14期69-71,74,共4页
在基于短时能量和短时过零率的双门限语音端点检测算法基础上,改进其有效语音的判断条件,采用MATLAB工具分析了改进算法的有效性。提出了基于改进算法的语音端点检测电路的设计,该设计减少了实现语音端点检测电路对硬件资源的需求。Mode... 在基于短时能量和短时过零率的双门限语音端点检测算法基础上,改进其有效语音的判断条件,采用MATLAB工具分析了改进算法的有效性。提出了基于改进算法的语音端点检测电路的设计,该设计减少了实现语音端点检测电路对硬件资源的需求。ModelSim仿真验证表明,改进后的算法有较好的实时性,在采集完一帧语音数据后第4拍给出语音有效信号。最后给出该语音检测电路的FPGA验证平台。 展开更多
关键词 双门限检测 语音端点检测 MATLAB工具箱 现场可编程门阵列
下载PDF
基于动态特性的D-LTSV语音端点检测方法 被引量:3
14
作者 赵欢 冯璐 +1 位作者 陈佐 张希翔 《计算机工程》 CAS CSCD 2014年第12期277-281,共5页
端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的... 端点检测是语音信号处理的一个关键环节。为提高语音在低性噪比以及非平稳噪声环境下的端点检测性能,在长时信号变化特征(LTSV)的基础上提出一种新的D-LTSV语音端点检测方法。采用Bartlett-Welch方法估计语音谱,分析语音谱在长时域上的熵,利用倒谱的动态特性分析方法提取连续帧熵值的动态变化特征。实验结果表明,D-LTSV综合考虑了语音的非平稳性和帧间非平稳性的动态变化情况,具有比LTSV更好的分辨能力,特别是在低性噪比和非平稳噪声的环境下,D-LTSV的分辨能力提升了50.77%,能够准确地进行端点检测,具有更强的鲁棒性。 展开更多
关键词 语音端点检测 语音谱 长时特征 动态特性 分辨力
下载PDF
基于噪声倒谱阈值频谱估计的语音活动检测 被引量:3
15
作者 李宇 郭雷勇 谭洪舟 《计算机工程》 CAS CSCD 北大核心 2011年第14期140-142,共3页
针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析... 针对低方差频谱估计的语音活动检测(VAD)中Welch频谱估计方法计算量大的问题,提出利用倒谱阈值方法估计VAD中的噪声功率谱。该方法在静音时期为噪声的倒谱设置阈值,利用快速傅里叶变换计算频谱,再更新VAD中的判决阈值。算法复杂度分析与仿真结果表明,该方法的检测性能与Welch方法相当,计算量降低约18%,同时降低整个VAD的时间复杂度。 展开更多
关键词 语音活动检测 频谱估计 倒谱阈值方法 功率谱密度 快速傅里叶变换
下载PDF
一种用于3G系统中复杂背景噪声环境下的话音激活检测算法 被引量:2
16
作者 陈东 赵胜辉 匡镜明 《通信学报》 EI CSCD 北大核心 2001年第4期45-50,共6页
本文讨论了一种新的应用在 3G自适应多速率系统中复杂背景噪声环境下的话音激活检测算法。这种算法基于谱估计理论和周期信号检测方法 ,应用一个IIR滤波器组把输入窄带语音信号分成九个频带 ,进而估计每个频带的语音信号和背景噪声的电... 本文讨论了一种新的应用在 3G自适应多速率系统中复杂背景噪声环境下的话音激活检测算法。这种算法基于谱估计理论和周期信号检测方法 ,应用一个IIR滤波器组把输入窄带语音信号分成九个频带 ,进而估计每个频带的语音信号和背景噪声的电平 ,结合基音和音调检测 ,在区分语音和移动环境中的大多数背景噪声时表现得足够健壮。最后 ,基于欧洲电信标准委员会建议的 3G平台对这种算法进行了仿真评估 。 展开更多
关键词 话音激活检测 复杂背景噪声估计 第三代移动通信 CDMA
下载PDF
基于DSP的实时语音检测的设计与实现 被引量:3
17
作者 杨永超 付中华 蒋冬梅 《计算机应用》 CSCD 北大核心 2008年第2期491-493,498,共4页
提出了一种基于DSP的实时语音检测的方法,通过设置中断服务程序实现DSP与DMA的并行处理,采用双缓冲加一缓冲的方法保持语音连续性,利用短时能量状态转换图的方法对语音进行检测及存储,最后利用自制控制板实现程序控制和状态显示。实验... 提出了一种基于DSP的实时语音检测的方法,通过设置中断服务程序实现DSP与DMA的并行处理,采用双缓冲加一缓冲的方法保持语音连续性,利用短时能量状态转换图的方法对语音进行检测及存储,最后利用自制控制板实现程序控制和状态显示。实验结果表明,检测的语音数据和标注的语音数据相比较平均正确率可达94.98%,有效地实现了语音的实时处理。 展开更多
关键词 数字信号处理器 中断服务程序 语音检测 短时能量
下载PDF
基于RASTA和SVM的话音激活检测算法 被引量:1
18
作者 寇钰鑫 景小宁 禹航 《微计算机信息》 2009年第18期231-232,227,共3页
提出了一种基于RASTA滤波技术的多维语音特征和支持向量机分类的VAD算法,适用于低信噪比情况下的话音检测。算法在语音特征选择上使用了RASTA-PLP滤波方法,提取出了多维倒谱参数,并将其作为特征向量输入给支持向量机进行分类检测。算法... 提出了一种基于RASTA滤波技术的多维语音特征和支持向量机分类的VAD算法,适用于低信噪比情况下的话音检测。算法在语音特征选择上使用了RASTA-PLP滤波方法,提取出了多维倒谱参数,并将其作为特征向量输入给支持向量机进行分类检测。算法所提取的特征是基于人类听觉感知系统特性的,因此具有普遍意义和稳定性,多维特征与支持向量机的结合则提高了语音分类判决的可靠性。实验结果表明,算法在低信噪比环境下对话音和噪声均具有较高的检出率。 展开更多
关键词 RASTA 支持向量机(SVM) 话音激活检测(vad)
下载PDF
android系统通话中回声消除的实现 被引量:1
19
作者 曾光 侯嘉 《通信技术》 2011年第11期41-43,共3页
为了消除android系统电话免提通话时产生的声学回声,利用静音检测(VAD)机制,在android系统开源代码软件asterisk模块中,加入声学回声消除算法。通过不断比较来话音和去话音数据,判断是否为声学回声并进行白噪声替换,测试结果表明在一般... 为了消除android系统电话免提通话时产生的声学回声,利用静音检测(VAD)机制,在android系统开源代码软件asterisk模块中,加入声学回声消除算法。通过不断比较来话音和去话音数据,判断是否为声学回声并进行白噪声替换,测试结果表明在一般的通话环境中,可以消除正常语音通话时90%以上的回声,实现半双工通信,适合于嵌入式android终端设备的开发。 展开更多
关键词 声学回声 vad 白噪声
原文传递
基于小波变分辨率频谱特征的静音检测 被引量:2
20
作者 薛卫 都思丹 叶迎宪 《计算机工程》 CAS CSCD 北大核心 2009年第13期232-233,236,共3页
针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检... 针对静音检测提出基于小波变分辨率频谱特征的检测算法。算法采用多门限过零率对静音进行初判,并提取多个语音感觉特征与基于小波变分辨率频谱的Mel频率倒谱系数(MFCC)组合成语音特征,通过二分类支持向量机对该特征进行分类实现静音检测。测试结果表明,该算法在不同信噪比下语音识别正确率高于G.729b,MFCC特征静音检测算法,基于该算法的视频会议服务器运算量低于使用G.729b静音检测算法的视频系统。 展开更多
关键词 静音检测 小波 变分辨率频谱 支持向量机
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部