期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
应用于短时语音语种识别的时长扩展方法 被引量:7
1
作者 苗晓晓 张健 +2 位作者 索宏彬 周若华 颜永红 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第3期254-259,共6页
为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题,该文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变。首先,对一段待识别语音,应用TSM技术转换... 为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题,该文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变。首先,对一段待识别语音,应用TSM技术转换为多条时域压缩和时域拉伸后的语音;其次,将这些不同语速的语音与原语音拼接起来,生成一个时长较长的语音;最后,送入语种识别系统进行识别。实验结果表明:所提出的语音时长扩展算法可以显著提升短时语音的语种识别性能。 展开更多
关键词 语种识别 短时 时域伸缩 语速
原文传递
语音时长规整技术的研究回溯 被引量:6
2
作者 周俊 高悦 +1 位作者 谭薇 陈砚圃 《现代电子技术》 2006年第18期102-105,共4页
语音时长规整技术是在不改变语音音调并保证良好音质的情况下,对语音进行一定的压缩或拉伸的技术。首先给出了语音时长规整技术的发展历程和主要实现方法,重点阐述了主要实现算法的原理,并仿真实现了适合实时处理的两种时域算法,比较分... 语音时长规整技术是在不改变语音音调并保证良好音质的情况下,对语音进行一定的压缩或拉伸的技术。首先给出了语音时长规整技术的发展历程和主要实现方法,重点阐述了主要实现算法的原理,并仿真实现了适合实时处理的两种时域算法,比较分析了两种时域方法的效果。最后对语音时长规整技术进行了展望。 展开更多
关键词 时长规整 固定同步叠加 相位声码器 正弦模型
下载PDF
基于WSOLA算法的语音时长调整研究 被引量:4
3
作者 叶锡恩 张巧文 《科技通报》 2005年第5期593-596,611,共5页
目前的PSOLA算法进行时长调整时,其计算量大,很难实现实时变速不变调处理。利用波形相似性来解决语音时长调整的WSOLA算法,实验证明能生成高品质的语音;在算法上高效、鲁棒,可以通过修改调整因子α实现连续范围内的在线语音时长调整。... 目前的PSOLA算法进行时长调整时,其计算量大,很难实现实时变速不变调处理。利用波形相似性来解决语音时长调整的WSOLA算法,实验证明能生成高品质的语音;在算法上高效、鲁棒,可以通过修改调整因子α实现连续范围内的在线语音时长调整。此算法已应用在数字语音教学系统中,具有良好的实时性和高品质语音。 展开更多
关键词 信号与信息处理 短时傅立叶变换 时长调整 互相关系数 调整因子α
下载PDF
Modeling of Fluid Turbulence Modification Using Two-time-scale Dissipation Models and Accounting for the Particle Wake Effect 被引量:3
4
作者 于勇 周力行 王保国 《Chinese Journal of Chemical Engineering》 SCIE EI CAS CSCD 2006年第3X期314-320,共7页
Presently developed two-phase turbulence models under-predict the gas turbulent fluctuation, because their turbulence modification models cannot fully reflect the effect of particles. In this paper, a two-time-scale d... Presently developed two-phase turbulence models under-predict the gas turbulent fluctuation, because their turbulence modification models cannot fully reflect the effect of particles. In this paper, a two-time-scale dis- sipation model of turbulence modification, developed for the two-phase velocity correlation and for the dissipation rate of gas turbulent kinetic energy, is proposed and used to simulate sudden-expansion and swirling gas-particle flows. The proposed two-time scale model gives better results than the single-time scale model. Besides, a gas tur- bulence augmentation model accounting for the finite-size particle wake effect in the gas Reynolds stress equation is proposed. The proposed turbulence modification models are used to simulate two-phase pipe flows. It can prop- erly predict both turbulence reduction and turbulence enhancement for a certain size of particles observed in ex- periments. 展开更多
关键词 TURBULENCE modification two time scale DISSIPATION model WAKE effect
下载PDF
基于共振峰合成和韵律调整的语音验证码方法研究 被引量:4
5
作者 汪成亮 张玉维 《计算机应用研究》 CSCD 北大核心 2011年第7期2458-2461,共4页
为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使... 为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使得语速和韵律具有不确定性和不可预测性,从而有效降低了自动语音识别技术(ASR)对语音码的识别率,增强了语音验证码的抗攻击性。合成的语音验证码的人耳识别率达到了90%左右,ASR的识别率为28.8%,主观平均判分(MOS)为4分,语音码的可懂度和清晰度达到了满意的效果。实验结果验证了所提方法的可行性。 展开更多
关键词 语音合成 验证码 共振峰合成 韵律调整 时长规整
下载PDF
分段语音时长规整算法 被引量:4
6
作者 黄昊 郭立 郑东飞 《声学技术》 CSCD 北大核心 2007年第6期1191-1195,共5页
一般的同步叠加算法在进行语音时长规整时,当压扩程度大且语音采样率低时,所得合成信号的语音质量会显著下降。其原因在于同步叠加算法忽略了语音本身的感知重要部分,过度压扩会损害语音的感知效果。针对此现象文章提出一种先根据频谱... 一般的同步叠加算法在进行语音时长规整时,当压扩程度大且语音采样率低时,所得合成信号的语音质量会显著下降。其原因在于同步叠加算法忽略了语音本身的感知重要部分,过度压扩会损害语音的感知效果。针对此现象文章提出一种先根据频谱变化快慢和能量大小将语音划分为感知敏感,非敏感和次敏感部分,对各部分采用不同压扩比进行同步叠加的分段时长规整算法,希望能够提高合成语音质量。实验证明该算法在压扩程度高、低采样率时对语音质量有显著改善。 展开更多
关键词 语音处理 时长规整 同步叠加 梅尔倒谱系数
下载PDF
基于感知敏感成分划分的语音时长规整算法 被引量:4
7
作者 黄昊 郭立 李琳 《数据采集与处理》 CSCD 北大核心 2008年第6期740-745,共6页
一般的同步叠加算法在进行语音时长规整时,当压扩程度较大且语音采样率较低时,所得合成信号的语音质量会显著下降。其原因在于忽略了语音本身各部分对感知的贡献,对感知敏感成分过度压扩会损害语音的感知质量。本文提出一种先识别语音... 一般的同步叠加算法在进行语音时长规整时,当压扩程度较大且语音采样率较低时,所得合成信号的语音质量会显著下降。其原因在于忽略了语音本身各部分对感知的贡献,对感知敏感成分过度压扩会损害语音的感知质量。本文提出一种先识别语音中的瞬态成分、稳态成分和安静成分,再对各部分采用不同压扩比进行同步叠加的时长规整算法。对语音信号的感知敏感成分压扩较小,希望能够提高合成语音质量。实验证明本方法对低采样率合成语音质量有显著改善,在低码率语音编码中可以有效提高编码效率。 展开更多
关键词 语音处理 时长规整 同步叠加 瞬态成分 梅尔倒谱系数
下载PDF
一种调整汉语语速的新方法 被引量:2
8
作者 沙泉 周江扬 《计算机工程与科学》 CSCD 2000年第4期64-66,共3页
本文针对 PSOL A算法会引起频域上的不连续 ,提出了一种汉语语速调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速的调整 ,实验结果证明 ,合成的语音信号... 本文针对 PSOL A算法会引起频域上的不连续 ,提出了一种汉语语速调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速的调整 ,实验结果证明 ,合成的语音信号保持了原有语音的清晰度和自然度。 展开更多
关键词 时长修正 汉语语速 语音信号 语音合成
下载PDF
基于PAOLA的丢包补偿算法 被引量:2
9
作者 黄华华 邱小军 《电声技术》 2007年第4期53-55,58,共4页
VoIP的语音质量受到丢包、延时、时延抖动等因素影响。为提高语音质量,需要进行丢包补偿处理,如采用WSOLA算法。首先介绍了WSOLA算法的原理,然后提出了用PAOLA对其进行优化的方法,最后对恢复语音质量进行了比较。
关键词 丢包补偿 时域尺度修改 WSOLA PAOLA
下载PDF
基于对象传播神经网络的抗TSM攻击音频水印算法 被引量:2
10
作者 金文标 戴红亮 《计算机应用研究》 CSCD 北大核心 2009年第12期4758-4760,4796,共4页
提出了一种基于对象传播神经网络的抗TSM攻击音频水印算法。利用CPN自学习和自适应的特征,通过自适应改变段长的分段算法,选用具有较强稳定性的小波低频系数方差作为输入向量训练CPN,建立音频特征与水印信号的对应关系,以达到嵌入水印... 提出了一种基于对象传播神经网络的抗TSM攻击音频水印算法。利用CPN自学习和自适应的特征,通过自适应改变段长的分段算法,选用具有较强稳定性的小波低频系数方差作为输入向量训练CPN,建立音频特征与水印信号的对应关系,以达到嵌入水印的目的。实验结果表明,该算法对常规音频信号处理和TSM等同步攻击具有很强的鲁棒性。 展开更多
关键词 数字音频水印 对象传播神经网络 时间缩放 小波低频系数方差
下载PDF
语音时长调整快速算法 被引量:1
11
作者 莫双燕 关海欣 郑可欣 《声学技术》 CSCD 2010年第5期507-511,共5页
针对目前使用的时域语音时长调整算法计算量大、难以保证实时性的问题,深入研究语音时长调整算法的原理,并结合语音自身的短时平稳性、准周期特性和信号的频率特性,提出三种解决途径(只搜索叠加部分原则、隔点搜索原则、隔点计算相似性... 针对目前使用的时域语音时长调整算法计算量大、难以保证实时性的问题,深入研究语音时长调整算法的原理,并结合语音自身的短时平稳性、准周期特性和信号的频率特性,提出三种解决途径(只搜索叠加部分原则、隔点搜索原则、隔点计算相似性原则),在保证语音质量不降低的同时,大幅减少冗余的计算量,实验结果表明,该方法调整后的语音质量高、计算速度快,通过与原始算法的对比证明了以上结论,该方法能广泛应用于实际中,尤其是应用于实时性要求较高的场合。 展开更多
关键词 语音 时长调整 快速算法
下载PDF
Adaptive audio watermarking based on SNR in localized regions 被引量:1
12
作者 吴国民 庄越挺 +1 位作者 吴飞 潘云鹤 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第B08期53-57,共5页
In this paper, a novel localized audio watermarking scheme based on signal to noise ratio (SNR) to determine a scaling parameter a is proposed. The basic idea is to embed watermark in selected high inflexion regions... In this paper, a novel localized audio watermarking scheme based on signal to noise ratio (SNR) to determine a scaling parameter a is proposed. The basic idea is to embed watermark in selected high inflexion regions, and the intensity of embedded watermarks are modified by adaptively adjusting a. As these high inflexion local regions usually correspond to music edges like sound of percussion instruments, explosion or transition of mixed music, which represent the music rhythm or tempo and are very important to human auditory perception, the embedded watermark is especially expected to escape the distortions caused by time domain synchronization attacks. Taking advantage of localization and SNR, the method shows strong robustness against common problems in audio signal processing, random cropping, time scale modification, etc. 展开更多
关键词 Copyright protection Audio watermarking time scale modification MDCT
下载PDF
基于正弦模型的汉语文—语转换系统
13
作者 沙泉 《上海应用技术学院学报(自然科学版)》 2001年第2期118-121,共4页
针对PSOLA算法会引起频域上的不连续的不足 ,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速和音高的调整 ,实验结果证明 ,合成的语音... 针对PSOLA算法会引起频域上的不连续的不足 ,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论 ,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量 ,然后进行语速和音高的调整 ,实验结果证明 ,合成的语音信号保持了原有语音的清晰度和自然度。将该方法应用于汉语文语转换系统中 。 展开更多
关键词 正弦模型 时长修正 音高修正 文—语转换
下载PDF
改进波形相似叠加算法的音频时长调整 被引量:2
14
作者 许雪琼 余小清 +1 位作者 李昌莲 万旺根 《应用科学学报》 CAS CSCD 北大核心 2009年第5期514-519,共6页
针对波形相似叠加算法在处理高采样率音频时效率低的缺点,提出由短时均值包络到细化波形的逐步匹配方法.首先基于短时均值包络进行粗匹配,在此基础上细化包络,进行再匹配以实现音频时长调整.该算法降低了计算量,提高了运算效率.在进行... 针对波形相似叠加算法在处理高采样率音频时效率低的缺点,提出由短时均值包络到细化波形的逐步匹配方法.首先基于短时均值包络进行粗匹配,在此基础上细化包络,进行再匹配以实现音频时长调整.该算法降低了计算量,提高了运算效率.在进行音频时长调整过程中,还利用音频的优化低能量率特征参数动态调整分析窗长度,实验表明这种处理方法对混合音频的处理效果有很大改进. 展开更多
关键词 音频时长调整 调整因子 短时均值包络 互相关系数 优化低能量率
下载PDF
基于重心的抗同步攻击的音频水印算法 被引量:1
15
作者 黄雄华 王宏霞 +1 位作者 蒋伟贞 崔更申 《自动化学报》 EI CSCD 北大核心 2013年第8期1321-1329,共9页
抗同步攻击是音频水印领域公开的难题.相对重心是音频的一个稳定的全局特征量,对TSM(Time scale modification)等同步攻击不敏感.本文提出一种基于相对重心的抗同步攻击的音频水印算法,提出的算法通过量化音频的相对重心生成水印,生成... 抗同步攻击是音频水印领域公开的难题.相对重心是音频的一个稳定的全局特征量,对TSM(Time scale modification)等同步攻击不敏感.本文提出一种基于相对重心的抗同步攻击的音频水印算法,提出的算法通过量化音频的相对重心生成水印,生成的水印由混沌序列加密后以量化的方法嵌入载体音频三级小波近似分量均值中.为了降低同步攻击后同步位置的连续偏移,水印嵌入提取过程采用了均匀分帧的方法.实验结果表明提出的算法能抵抗常规信号处理操作,同时能抵抗20%的TSM操作(包含音调不变TSM和重采样操作)和1/10的抖动操作,有很好的鲁棒性. 展开更多
关键词 音频水印 相对重心 TSM 均匀分帧
下载PDF
基于发音机制的贪婪自适应语音时长规整算法
16
作者 杨燕 雷颖思 岳辉 《计算机工程》 CAS CSCD 北大核心 2015年第8期212-217,共6页
语音时长规整的同步叠加算法未考虑真实声音信号中不同类型语音帧受语速影响变化不同的特性,对所有语音帧都采用相同的规整因子,当规整比例过大时,导致输出语音失真。针对该问题,提出一种贪婪自适应算法。对不同类型语音段使用不同的规... 语音时长规整的同步叠加算法未考虑真实声音信号中不同类型语音帧受语速影响变化不同的特性,对所有语音帧都采用相同的规整因子,当规整比例过大时,导致输出语音失真。针对该问题,提出一种贪婪自适应算法。对不同类型语音段使用不同的规整因子,动态改变规整因子,进一步改进整体规整比例缺陷,从而设计贪婪自适应语音时长规整算法。在Matlab环境下对TIMIT语音库进行语音对比的结果表明,与波形相似同步叠加算法、时域基音同步叠加算法相比,该算法能提高合成语音的自然度,减小规整时长误差。 展开更多
关键词 语音时长规整 规整因子 同步叠加算法 自适应算法 贪婪自适应算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部