期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
噪声鲁棒性说话人识别语音高频加权MFCC提取 被引量:15
1
作者 陈迪 龚卫国 李波 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第3期668-672,共5页
本文提出了一种可提高噪声环境下的说话人确认识别率的语音MFCC参数高频加权方法。由于Mel频率与线性频率成对数关系,频谱能量在高频部分分辨率逐减,而语音经过基音同步可变窗长加窗后的语音会在一定程度上避免语音信号的谐波泄露,从而... 本文提出了一种可提高噪声环境下的说话人确认识别率的语音MFCC参数高频加权方法。由于Mel频率与线性频率成对数关系,频谱能量在高频部分分辨率逐减,而语音经过基音同步可变窗长加窗后的语音会在一定程度上避免语音信号的谐波泄露,从而保留更多高次谐波信息。将语音频谱能量高频部分进行加权,则可使语音增强,提高语音鲁棒性。该方法被用于基音同步预处理MFCC参数提取中,并进行了说话人确认实验。实验结果表明,即使在信噪比较低的情况下,该方法都会在一定程度上提高多种噪声环境下的说话人确认识别率。 展开更多
关键词 高频加权 说话人确认 基音同步 鲁棒性 MFCC
下载PDF
基音同步特征波形内插语音编码算法 被引量:4
2
作者 徐金标 杜利民 《声学学报》 EI CSCD 北大核心 2000年第6期499-503,共5页
研究了在特征波形语音编码算法中的特征波形分解算法,提出了一种基于基音同步的特征波形内插语音编码算法。特征波形的量化采用变维矢量量化(VDVQ)。通过实现的2.4kb/s的语音质量表明,这种语音压缩算法在低码率时能得到高通信质... 研究了在特征波形语音编码算法中的特征波形分解算法,提出了一种基于基音同步的特征波形内插语音编码算法。特征波形的量化采用变维矢量量化(VDVQ)。通过实现的2.4kb/s的语音质量表明,这种语音压缩算法在低码率时能得到高通信质量的重建语音。 展开更多
关键词 基音同步 特征波形内插语音编码算法 语音识别
下载PDF
天津话语音合成系统 被引量:4
3
作者 王兵 苏恩泽 《计算技术与自动化》 1995年第4期37-39,共3页
本文运用时域基音同步叠加的语音合成方法,以汉语无调音节为音库的基本单元,对天津话连续语句的合成做了研究,并制做了一个天津话连续语音合成系统。该系统应用变词规则,轻声规则和句型规则,对输出语句的各个音节的声进行调整,在... 本文运用时域基音同步叠加的语音合成方法,以汉语无调音节为音库的基本单元,对天津话连续语句的合成做了研究,并制做了一个天津话连续语音合成系统。该系统应用变词规则,轻声规则和句型规则,对输出语句的各个音节的声进行调整,在改善系统合成语句的自然反方面取得了一定的效果。 展开更多
关键词 语音合成 天津话 基音同步 基音标记
下载PDF
基音同步帧长特征在英语词重音检测中的应用 被引量:4
4
作者 陈楠 贺前华 +1 位作者 王伟凝 陈荣研 《计算机应用》 CSCD 北大核心 2008年第6期1533-1536,共4页
对于英语等"重音节拍语言",重音是一个非常重要的韵律学特征。针对传统特征提取中固定帧长方式存在的缺点,使用基音同步帧特征分析方法,提出了基于动态帧长的基音同步能量和基音同步峰值特征。在使用新特征对英语连续语音进... 对于英语等"重音节拍语言",重音是一个非常重要的韵律学特征。针对传统特征提取中固定帧长方式存在的缺点,使用基音同步帧特征分析方法,提出了基于动态帧长的基音同步能量和基音同步峰值特征。在使用新特征对英语连续语音进行词重音检测时发现,联合使用新特征与传统特征,可使误识率下降6.65%。 展开更多
关键词 重音检测 动态帧长 基音同步
下载PDF
自动精确测定浊音中最大激励值的位置 被引量:2
5
作者 陶建华 华一满 《应用声学》 CSCD 北大核心 1997年第5期21-25,共5页
本文阐述了一种改进的自相关算法原理和HILBERT变换原理[1];提出了运用这些原理以及精确的搜索算法来精确确定语音浊音中最大激励值的位置的方法,同时设计了能自动确定语音最大激励位置的软件.通过对大量的不同种类的语音进行运算和... 本文阐述了一种改进的自相关算法原理和HILBERT变换原理[1];提出了运用这些原理以及精确的搜索算法来精确确定语音浊音中最大激励值的位置的方法,同时设计了能自动确定语音最大激励位置的软件.通过对大量的不同种类的语音进行运算和统计,证明了这种算法的可靠性是较高的. 展开更多
关键词 最大激励值位置 基音同步 语音信号处理
下载PDF
非线性加权能量特征在英语词重音检测中的应用 被引量:2
6
作者 陈楠 贺前华 《声学学报》 EI CSCD 北大核心 2008年第6期520-525,共6页
为了解决传统特征在重音检测中鲁棒性不高的问题,根据重音的定义,以单词为单位,考察词内各音素携带基音同步动态短时帧能量的差异,同时引入非线性加权因子,提出非线性加权能量特征。使用非线性加权能量特征以及与传统特征的特征组合对... 为了解决传统特征在重音检测中鲁棒性不高的问题,根据重音的定义,以单词为单位,考察词内各音素携带基音同步动态短时帧能量的差异,同时引入非线性加权因子,提出非线性加权能量特征。使用非线性加权能量特征以及与传统特征的特征组合对英语连续语音的实验结粜表明,非线性加权能量特征比传统特征鲁棒性更高,联合使用新特征与传统特征,可使系统误识率下降3.58%。 展开更多
关键词 非线性加权 能量特征 重音 检测 传统特征 应用 语词 基音同步
下载PDF
基于小波变换的汉语语音合成方法
7
作者 刘轶 王长富 +1 位作者 戴蓓倩 王昕 《小型微型计算机系统》 EI CSCD 北大核心 1998年第3期14-18,共5页
本文提出了一种汉语语音合成的新方法。利用小波变换检测语音信号的声门闭合时刻 (GCI) ,利用语音信号的 GCI进行基音同步和样本选择的多脉冲线性预测分析 ,将得到的语音参数保存到语音库中。通过改变相应的语音参数可以灵活地调节音节... 本文提出了一种汉语语音合成的新方法。利用小波变换检测语音信号的声门闭合时刻 (GCI) ,利用语音信号的 GCI进行基音同步和样本选择的多脉冲线性预测分析 ,将得到的语音参数保存到语音库中。通过改变相应的语音参数可以灵活地调节音节的时长、基音频率和音强。本方法得到的语音参数比传统方法得到的参数更加精确 ,合成语音清晰、自然、并且大大降低了语音库的存储量 ,非常适合于小型微型计算机系统。 展开更多
关键词 小波变换 基音同步 汉语语音合成 语音信号处理
下载PDF
高质量线性预测分析语音的一种方法
8
作者 王长富 戴蓓倩 +1 位作者 李辉 刘轶 《中国科学技术大学学报》 CAS CSCD 北大核心 1998年第2期149-154,共6页
提出了高质量线性预测分析语音的一种方法:首先用语音信号的小波变换检测声门闭合的时刻(GCI),而两个相邻GCI的间隔即为基音周期,从而可进行基音周期同步分析;其次,选择声门闭合时刻附近以外的声道受到弱激励的语音样本进... 提出了高质量线性预测分析语音的一种方法:首先用语音信号的小波变换检测声门闭合的时刻(GCI),而两个相邻GCI的间隔即为基音周期,从而可进行基音周期同步分析;其次,选择声门闭合时刻附近以外的声道受到弱激励的语音样本进行线性预测分析.该方法使选择样本的预测误差明显降低,大大提高声道参数估计的精度。 展开更多
关键词 线性预测 GCI检测 基音同步 语音信号分析
下载PDF
基于正弦模型的汉语语音时长和音高的修正
9
作者 周江扬 柴佩琪 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第3期312-316,共5页
把一种基于语音的正弦模型的音高和时长修正算法应用于汉语普通话语音的韵律调整 ,可调范围比较大 ,而且保证了合成语音的清晰度与自然度 .非正式测听结果表明 :该算法是一种很适合汉语语音的韵律调整的算法 .
关键词 正弦模型 基音同步 频率匹配 韵律修正 汉语语音 时长修正 音高修正 语音信号处理
下载PDF
变帧长和变帧率在说话人确认中的应用
10
作者 王明 肖熙 《计算机应用》 CSCD 北大核心 2007年第8期2051-2052,2076,共3页
从变帧长、变帧率角度考虑提出一种新的提取MFCC的方法。该方法先将帧长和帧率都限制为基音周期的整数倍,即基音同步算法;然后基于变帧率算法的原理在语音特征变化缓慢的地方去除一些帧来降低帧率。在NIST 99说话人评测上进行的说话人... 从变帧长、变帧率角度考虑提出一种新的提取MFCC的方法。该方法先将帧长和帧率都限制为基音周期的整数倍,即基音同步算法;然后基于变帧率算法的原理在语音特征变化缓慢的地方去除一些帧来降低帧率。在NIST 99说话人评测上进行的说话人确认实验表明,该方法不但提升了系统性能,而且降低了帧率,节省了特征文件的存储空间。 展开更多
关键词 说话人确认 基音同步 变帧率算法
下载PDF
用逆滤波基音同步分析提取声门波的方法
11
作者 王成友 郑林华 黄小严 《国防科技大学学报》 EI CAS CSCD 北大核心 1994年第3期25-28,共4页
根据语音研究的要求,提出一种运用逆滤波基音同步分析提取声门波的方法,此方法可以比较准确地提取声门波。文中讨论了这种方法的原理、实现及其结果。
关键词 基音同步 声门波 滤波 语音
下载PDF
基于基音同步的时频域插值的汉语语音合成
12
作者 邵艳秋 韩纪庆 +1 位作者 王东东 刘挺 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2007年第1期110-113,共4页
针对TD-PSOLA韵律调整能力的不足,将基于基音同步的时频域插值(TFI)方法应用于汉语语音合成中,该方法能够保证基频调整和时长的调整不会相互影响.为了提高计算精度,在频谱的插值计算中还引入了差商型插值方法.实验结果表明,采用差商型... 针对TD-PSOLA韵律调整能力的不足,将基于基音同步的时频域插值(TFI)方法应用于汉语语音合成中,该方法能够保证基频调整和时长的调整不会相互影响.为了提高计算精度,在频谱的插值计算中还引入了差商型插值方法.实验结果表明,采用差商型插值的TFI方法能取得比较好的合成效果. 展开更多
关键词 语音合成 基音同步 韵律调整 时频域插值 差商型插值
下载PDF
基于时频分步处理的PSOLA韵律合成方法 被引量:7
13
作者 韩民 田岚 《山东大学学报(工学版)》 CAS 2004年第6期35-37,共3页
结合FD PSOLA和TD PSOLA算法的优势 ,提出一种音高、时长分步处理的语音韵律拼接合成方法 .根据韵律生成模型计算得到的基频参数和时长参数 ,分别在频域和时域对语音拼接单元进行调整 ,在保持音库语音拼接单元清晰度和自然度基本不变的... 结合FD PSOLA和TD PSOLA算法的优势 ,提出一种音高、时长分步处理的语音韵律拼接合成方法 .根据韵律生成模型计算得到的基频参数和时长参数 ,分别在频域和时域对语音拼接单元进行调整 ,在保持音库语音拼接单元清晰度和自然度基本不变的情况下 ,合成语音的韵律调控能力得到提高 .以汉语短语词组合成实验证明了该方法实现的有效性 . 展开更多
关键词 语音合成 基音同步叠加(PSOLA)算法 韵律特征
下载PDF
基于韵律特征参数的情感语音合成算法研究 被引量:8
14
作者 何凌 黄华 刘肖珩 《计算机工程与设计》 CSCD 北大核心 2013年第7期2566-2569,2584,共5页
为了合成更为自然的情感语音,提出了基于语音信号声学韵律参数及时域基音同步叠加算法的情感语音合成系统。实验通过对情感语音数据库中生气、无聊、高兴和悲伤4种情感的韵律参数分析,建立4种情感模板,采用波形拼接语音合成技术,运用时... 为了合成更为自然的情感语音,提出了基于语音信号声学韵律参数及时域基音同步叠加算法的情感语音合成系统。实验通过对情感语音数据库中生气、无聊、高兴和悲伤4种情感的韵律参数分析,建立4种情感模板,采用波形拼接语音合成技术,运用时域基音同步叠加算法合成含有目标感情色彩的语音信号。实验结果表明,运用波形拼接算法,调节自然状态下语音信号的韵律特征参数,可合成较理想的情感语音。合成的目标情感语音具有明显的感情色彩,其主观情感类别判别正确率较高。 展开更多
关键词 情感语音合成 韵律参数 时域基音同步叠加 波形拼接 基音频率
下载PDF
基于基音同步帧叠接的吴语语音合成 被引量:3
15
作者 段凯宇 俞一彪 石汝杰 《通信技术》 2002年第3X期1-3,共3页
吴语语音和普通话一样,也是由声母、韵母和声调这三个要素构成。语音的平稳段存在于韵母中,波形具有周期性,周期的变化趋势决定语音的声调;非平稳段包括声母、过渡音和鼻音。根据这些特点,提出了一种利用基音同步帧和声调曲线来合成语... 吴语语音和普通话一样,也是由声母、韵母和声调这三个要素构成。语音的平稳段存在于韵母中,波形具有周期性,周期的变化趋势决定语音的声调;非平稳段包括声母、过渡音和鼻音。根据这些特点,提出了一种利用基音同步帧和声调曲线来合成语音的新方法PSFC,并用该方法合成吴方言。实验表明,该方法简单实用,合成语音有较好的自然度和可懂度。 展开更多
关键词 吴语合成 基音同步 声调曲线 基音同步帧叠接合成法
原文传递
一种语音更改技术的研究与实现 被引量:1
16
作者 何峰 于东武 林嘉宇 《电声技术》 2007年第2期54-56,59,共4页
基于时域基音同步叠加算法完成了对语音信号的更改。首先求出语音信号的基音周期,接着对语音信号进行基音标注,然后对基音周期进行更改,最后,将语音信号按照更改后的基音周期基于时域基音同步叠加算法进行语音合成。实验表明,语音更改... 基于时域基音同步叠加算法完成了对语音信号的更改。首先求出语音信号的基音周期,接着对语音信号进行基音标注,然后对基音周期进行更改,最后,将语音信号按照更改后的基音周期基于时域基音同步叠加算法进行语音合成。实验表明,语音更改方法可得到很好的效果。 展开更多
关键词 基音周期 基音标注 时域基音同步叠加 语音合成
下载PDF
基于PSOLA与DCT的情感语音合成方法 被引量:5
17
作者 李勇 魏珰 王柳渝 《计算机工程》 CAS CSCD 北大核心 2017年第12期278-282,291,共6页
情感语音合成可以增强语音的表现力,为使合成的情感语音更自然,提出一种结合时域基音同步叠加(PSOLA)和离散余弦变换(DCT)的情感语音合成方法。根据情感语音数据库中的高兴、悲伤、中性语音进行韵律参数分析归纳情感规则,调整中性语音... 情感语音合成可以增强语音的表现力,为使合成的情感语音更自然,提出一种结合时域基音同步叠加(PSOLA)和离散余弦变换(DCT)的情感语音合成方法。根据情感语音数据库中的高兴、悲伤、中性语音进行韵律参数分析归纳情感规则,调整中性语音各音节的基音频率、能量和时长。使用DCT方法对基音标记过的语音段进行基音频率的调整,并利用PSOLA算法修改基音频率使其逼近目标情感语音的基频。实验结果表明,该方法比单独使用PSOLA算法合成的情感语音更具情感色彩,其主观情感的识别率更高,合成的情感语音质量更好。 展开更多
关键词 情感语音合成 离散余弦变换 基音同步叠加 基频 时长 能量
下载PDF
用峰值校正自相关函数检测的汉语基音周期 被引量:1
18
作者 应志伟 柴佩琪 岳东剑 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第3期366-370,共5页
对大量的汉语普通话的语音波形进行分析之后发现汉语普通话的基音提取不能用简单的中心削波自相关方法 ,在进行基音标记时会存在一种基音标记偏移的现象 ,为此在自相关理论的基础上 ,根据声调语言的语音信号音高变化特征 ,对声调语言的... 对大量的汉语普通话的语音波形进行分析之后发现汉语普通话的基音提取不能用简单的中心削波自相关方法 ,在进行基音标记时会存在一种基音标记偏移的现象 ,为此在自相关理论的基础上 ,根据声调语言的语音信号音高变化特征 ,对声调语言的基音标记的偏移现象提出了一种基于自相关法和峰值校正的算法 .经实践检验 ,这种算法对声调语言的基音标记的偏移现象能够得到很好的校正 . 展开更多
关键词 基音检测 声调语言 汉语普通话 语音波形分析 语音信号处理 自相关函数 基音同步叠加法
下载PDF
基于情感基音模板的情感语音合成 被引量:4
19
作者 陈明义 党培霞 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第6期2258-2263,共6页
为了合成能够模拟表达说话人的情感状态的语音,提出一种基于情感基音模板的情感语音合成方法。该方法分别建立高兴、愤怒、悲伤和中立4种不同情感下的韵母基音模板库,建立4种声调模型,统计分析语音库中情感语音的韵律特征参数,运用基音... 为了合成能够模拟表达说话人的情感状态的语音,提出一种基于情感基音模板的情感语音合成方法。该方法分别建立高兴、愤怒、悲伤和中立4种不同情感下的韵母基音模板库,建立4种声调模型,统计分析语音库中情感语音的韵律特征参数,运用基音同步叠加算法(PSOLA)合成含情感色彩的语音。实验以音节为合成单位,根据情感特征参数的统计分析结果调节合成语音的韵律特征,合成各种情感的语音。仿真实验结果表明:用情感基音模板合成的目标情感语音具有目标情感的音质色彩,再通过韵律参数调节,可合成较理想的情感语音。该方法可用于增加语音合成系统的智能化,提高人机交互的能力。 展开更多
关键词 情感语音合成 情感基音模板 基音同步叠加算法 韵律参数
下载PDF
火电厂语音报警系统中的动态文语转换方法 被引量:4
20
作者 陈坚红 李蔚 +1 位作者 盛德仁 任浩仁 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第12期1997-2001,共5页
针对火电厂实时动态语音报警系统的特点,提出了基于动态文语转换技术的火电厂实时动态语音报警系统的实现框架.阐述了实时、动态文语转换子系统的各组成部分,研究了基于基音同步叠加算法(PSOLA)的实时动态文语转换方法,讨论了采用组件... 针对火电厂实时动态语音报警系统的特点,提出了基于动态文语转换技术的火电厂实时动态语音报警系统的实现框架.阐述了实时、动态文语转换子系统的各组成部分,研究了基于基音同步叠加算法(PSOLA)的实时动态文语转换方法,讨论了采用组件对象模型(COM)技术进行包括语音合成数据库、文本预处理、韵律处理和语音波形的生成在内的程序实现的要点.分析测试的结果表明,采用这种方法合成的语音质量高、实时性好,完全可以应用到包括火电厂实时动态语音报警系统在内的其他实时语音处理场合中. 展开更多
关键词 火电厂 文语转换技术 基音同步叠加算法 语音报警
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部