期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
汉语语音合成语料库的研究与建立 被引量:6
1
作者 蔡莲红 赵世霞 《语言文字应用》 CSSCI 北大核心 1999年第3期97-102,共6页
本文介绍了一个语音合成语料库。语料的设计考虑了音段和韵律,语料库中包含汉语的音节、词语、独白语句和情景对话语篇。语音的录制在卦限录音室中进行。语料库中还包括了科学的语料管理系统,它具有查询、浏览和更新等功能。
关键词 语料库 汉语语音合成 三音子 管理系统 韵律结构 语音语料库 韵律短语 系统设计 语音波 标音
下载PDF
用于语音合成的PSOLA算法简介 被引量:8
2
作者 涂相华 蔡莲红 《微型计算机》 北大核心 1996年第4期5-9,共5页
本文介绍了基于波形编辑的语音合成中,用于改善合成语音的自然度的PSOLA算法的一般过程,及具体的TD-PSOLA,LP-PSOLA和FD-PSOLA算法。分析了时域和频域的算法分别在宽带和窄带条件下的谱特性和它们之间... 本文介绍了基于波形编辑的语音合成中,用于改善合成语音的自然度的PSOLA算法的一般过程,及具体的TD-PSOLA,LP-PSOLA和FD-PSOLA算法。分析了时域和频域的算法分别在宽带和窄带条件下的谱特性和它们之间的关系,最后比较了这三种算法的适用范围及其在语音合成中的应用。 展开更多
关键词 语音合成 PSOLA算法 语音波
下载PDF
在波形网络中融合相位信息的骨导语音增强 被引量:4
3
作者 郑昌艳 杨吉斌 +1 位作者 张雄伟 孙蒙 《声学学报》 EI CAS CSCD 北大核心 2021年第2期309-320,共12页
已有骨导语音增强算法重点关注语音幅度谱增强,在波形合成时会因为相位不匹配导致语音质量下降。为解决该问题,提出了一种融合相位信息的波形网络(WaveNet)模型实现骨导语音增强波形生成。该方法以频带扩展WaveNet为基础,融合骨导语音... 已有骨导语音增强算法重点关注语音幅度谱增强,在波形合成时会因为相位不匹配导致语音质量下降。为解决该问题,提出了一种融合相位信息的波形网络(WaveNet)模型实现骨导语音增强波形生成。该方法以频带扩展WaveNet为基础,融合骨导语音相位谱信息与增强的语音幅度谱作为模型的条件特征,根据融合特征生成增强语音波形,实现了相位信息的有效利用。仿真实验综合对比了群时延谱和瞬时频率偏差谱相位特征,主客观结果表明,不论是采用串联融合还是卷积融合方式,骨导语音相位信息均有效补充了原有幅度谱条件特征,改善了语音增强效果。利用串联方式融合群时延谱特征可得到最佳结果,相比于原始骨导语音,平均意见得分(MOS)提升了约54.3%。 展开更多
关键词 语音增强 幅度谱 群时延 频带扩展 语音波 瞬时频率 骨导 合成
下载PDF
基于数字信号处理的嗓音控制开关(VOX)算法研究 被引量:2
4
作者 张天骐 李伟 +1 位作者 林孝康 刘林 《应用声学》 CSCD 北大核心 2005年第3期157-163,共7页
本文提出了一种基于数字谱分析的嗓音控制开关(VOX,Voice-OperatedTransmit)的新算法,该算法简单、实用,在某种程度上克服了传统VOX算法的结构复杂、参数难调等局限,对噪声的鲁棒性也较好,而且易于用数字信号处理实现。首先利用信号功... 本文提出了一种基于数字谱分析的嗓音控制开关(VOX,Voice-OperatedTransmit)的新算法,该算法简单、实用,在某种程度上克服了传统VOX算法的结构复杂、参数难调等局限,对噪声的鲁棒性也较好,而且易于用数字信号处理实现。首先利用信号功率谱二次处理,提取出语音的平均幅度包络,然后对所得包络进行阈值处理、限幅放大,最后就得到VOX函数。理论分析和计算机模拟结果表明,该算法不仅能较为准确地提取出语音波形的平均幅度包络,而且能工作在较低的信噪比条件下。 展开更多
关键词 数字信号处理 控制开关 算法研究 嗓音 Voice 信号功率谱 二次处理 阈值处理 模拟结果 语音波 VOX 谱分析 新算法 鲁棒性 包络 计算机 信噪比 幅度 平均 提取 限幅
下载PDF
基于语音波形外观的基音提取算法
5
作者 王兵 苏恩泽 《数据采集与处理》 CSCD 1995年第1期73-76,共4页
在对人用视觉提取基音周期过程模拟的基础上,提出一种基于语音波形外观形状的时城基音周期提取算法。该算法利用语音波形的一次峰值点和二次峰值点的幅度和位置以及后峰到前峰的距离等几种属性,来判断决定基音周期值,具有算法简单、... 在对人用视觉提取基音周期过程模拟的基础上,提出一种基于语音波形外观形状的时城基音周期提取算法。该算法利用语音波形的一次峰值点和二次峰值点的幅度和位置以及后峰到前峰的距离等几种属性,来判断决定基音周期值,具有算法简单、运算量小、能准确定位各基音周期位置的特点。此外,由于不需加窗处理,免去了加窗处理所带来的平均效应,该算法在处理相邻基音周期差值较大的语音信号时具有明显优势。该算法比较适合于做各种基音同步算法的前处理。 展开更多
关键词 语音信号处理 基音估值 基音提取 语音波
下载PDF
微机实现语音波形的显示与分析
6
作者 周文举 《枣庄师专学报》 2000年第5期33-36,共4页
英语语音测试一直是大家关心的难题 ,传统的测试方法主观因素大 ,本文利用微机通过对软件编程、对硬件设计 ,可将语音变为可视的波形 ,显示在微机屏幕上 ,并方便地将被测语音波形与标准语音波形相比较 ,找出它们之间的差别 ,即可随机矫正。
关键词 语音波 采样频率 采样精度 模拟波 数字波 相似度 语音测试 显式 英语语音教学
下载PDF
多级矢量量化语音波形
7
作者 陈移风 《中南矿冶学院学报》 CSCD 1989年第1期93-99,共7页
本文介绍了一种通用多级矢量量化器的设计方法。这种量化器能有效地克服运算复杂度与存贮器需要量随矢量维数成指数律增长的困难,因而能采用较大的矢量维数以达到较佳的数据压缩率。该方法允许任意指定量化器的级数、矢量维数、每采样... 本文介绍了一种通用多级矢量量化器的设计方法。这种量化器能有效地克服运算复杂度与存贮器需要量随矢量维数成指数律增长的困难,因而能采用较大的矢量维数以达到较佳的数据压缩率。该方法允许任意指定量化器的级数、矢量维数、每采样码数或传输速率,并按任意指定的数目生成初始码本并将它们优化到局部最优点,然后从中挑出最佳者。该方法中误差计算为一独立模块,可通过更换不同模块来实现以不同误差测量准则来优化码本。由于该方法能方便地设计出具有各种不同参数的多级矢量量化器,故能对量化器级数、矢量维数、每采样码数及不同误差测量方法与量化器性能的关系作有效地研究模拟。本文还给出用该法设计的传输速率为16kbit/s及9.6kbit/s两个多级语音波形矢量量化器的模拟结果。 展开更多
关键词 矢量量化 语音波 矢量量化器
下载PDF
语音处理技术及其在外语教学、科研中的应用
8
作者 赵汗青 《解放军外国语学院学报》 CSSCI 1997年第2期66-70,共5页
一、引言语言是人类相互间进行交际的最自然和最方便的形式,而语音是众多信息载体中具有最大信息容量和最高智能水平的载体。如果计算机具备了语言功能,既能听懂人说话,又可以用语言表达"思想",则其智能化水平和应用价值将会... 一、引言语言是人类相互间进行交际的最自然和最方便的形式,而语音是众多信息载体中具有最大信息容量和最高智能水平的载体。如果计算机具备了语言功能,既能听懂人说话,又可以用语言表达"思想",则其智能化水平和应用价值将会大大提高,会给人机通讯带来一次革命性的飞跃。为此,美国DARPA战略计划提出了研究口语系统(Spoken Language System),旨在使计算机能理解对话型自然语言。语音处理技术是一个多学科、综合性研究领域,它涉及到人工智能、模式识别、数字信号处理。 展开更多
关键词 语音处理技术 外语教学 语音识别 语音合成 语音波 语音信号 数字信号处理 自然语言 文语转换系统 智能化
下载PDF
信号处理、分析与设计
9
《电子科技文摘》 2003年第3期37-39,共3页
Y2002-63329-3297 0305365激励源相位频谱感知距离测量的研究=A Study onperceptual distance measure for phase spectrum of stimuli[会,英]/Banno,H.& Takeda,K.//The 2001 IEEEInternatioml Conference on Acoustics.Speech,and... Y2002-63329-3297 0305365激励源相位频谱感知距离测量的研究=A Study onperceptual distance measure for phase spectrum of stimuli[会,英]/Banno,H.& Takeda,K.//The 2001 IEEEInternatioml Conference on Acoustics.Speech,and Sig-nal Processing Vol.V of Ⅵ.—3297~3300(HE)Y2002-63329-3309 03053662元从粗至细检索的有源语言信源定位=Activespeech source localization by a dual coarse-to-fine search[会,英]/Duraiswami,R.& Zotkin,D.//The 2001IEEE Interntional Conference on Acoustics,Speech,and Signal Processing Vol.V of Ⅵ.—3309~3312(HE) 展开更多
关键词 源定位 频谱感知 LOCALIZATION 距离测量 倒谱 coarse 语音增强 语音波 水印检测 子空间投影
原文传递
语音编码技术的发展
10
作者 倪维桢 《邮电商情》 1998年第7期12-14,共3页
1937年A.H.Reeves提出脉码调制(PCM),开创了语音数字化通信的历程。直至今日,64Kbit/s标准PCM系统仍占有统治地位。然而,随着微电子技术的发展,CCITT在八十年代初着手研究低于64Kbit/s的非PCM编码算法,并于1984、1992、1995和1996年分... 1937年A.H.Reeves提出脉码调制(PCM),开创了语音数字化通信的历程。直至今日,64Kbit/s标准PCM系统仍占有统治地位。然而,随着微电子技术的发展,CCITT在八十年代初着手研究低于64Kbit/s的非PCM编码算法,并于1984、1992、1995和1996年分别通过了32Kbit/s AD-PCM的G.721、16Kbit/s LD-CELP的G.728、8Kbit/s CS-ACELP的G.729和G.729附件等建议文件。相应地,各国厂家相继推出有关编码芯片。同时,语音中低速编码的实用化也取得可喜成果。本文拟就语音编技术的发展作一简要回顾,并探讨这一技术的发展趋向。 展开更多
关键词 语音编码技术 语音信号 语音质量 线性预测编码 滤波器 语音波 编码 激励信号 参数编码 编码方法
下载PDF
用峰值校正自相关函数检测的汉语基音周期 被引量:1
11
作者 应志伟 柴佩琪 岳东剑 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第3期366-370,共5页
对大量的汉语普通话的语音波形进行分析之后发现汉语普通话的基音提取不能用简单的中心削波自相关方法 ,在进行基音标记时会存在一种基音标记偏移的现象 ,为此在自相关理论的基础上 ,根据声调语言的语音信号音高变化特征 ,对声调语言的... 对大量的汉语普通话的语音波形进行分析之后发现汉语普通话的基音提取不能用简单的中心削波自相关方法 ,在进行基音标记时会存在一种基音标记偏移的现象 ,为此在自相关理论的基础上 ,根据声调语言的语音信号音高变化特征 ,对声调语言的基音标记的偏移现象提出了一种基于自相关法和峰值校正的算法 .经实践检验 ,这种算法对声调语言的基音标记的偏移现象能够得到很好的校正 . 展开更多
关键词 基音检测 声调语言 汉语普通话 语音波分析 语音信号处理 自相关函数 基音同步叠加法
下载PDF
基于数字信号处理的声音控制开关(VOX)算法研究 被引量:1
12
作者 张天骐 李伟 +1 位作者 林孝康 刘林 《电声技术》 北大核心 2004年第8期46-51,共6页
基于数字谱分析的声控开关VOX(Voice-Operated Transmit)新算法首先利用功率谱二次处理结果进行处理,提取出语音波形的包络,然后对所得包络进行阈值处理、限幅放大,最后得到VOX函数。该算法具有简单、实用、对噪声的鲁棒性也较好,而且... 基于数字谱分析的声控开关VOX(Voice-Operated Transmit)新算法首先利用功率谱二次处理结果进行处理,提取出语音波形的包络,然后对所得包络进行阈值处理、限幅放大,最后得到VOX函数。该算法具有简单、实用、对噪声的鲁棒性也较好,而且易于用数字信号处理实现,在某种程度上克服了传统VOX算法的结构复杂、参数难调、易受环境噪声影响等局限。理论分析和仿真结果表明,该算法不仅能较为准确的提取出语音波形的包络,而且能在较低的信噪比条件下工作。 展开更多
关键词 声控开关 功率谱二次处理 数字谱分析 语音波包络
下载PDF
中低速率语音波形编码 被引量:1
13
作者 李志军 华继钊 《电声技术》 北大核心 2002年第1期5-6,10,共3页
提出了一种波形编码的新方法,阐述了其编码原理。该编码算法简单,恢复的语音质量较好。由于利用了矢量量化技术,所以该编码速率较低。
关键词 语音波编码 清/浊音判决 矢量量化 语音信号处理
下载PDF
波形变换域语音波形的帧间差分编码
14
作者 伍康文 陈云凤 《中山大学学报(自然科学版)》 CAS CSCD 1995年第1期41-45,共5页
本文提出一种新的语音波形的帧间差分编码算法,文中对帧间差分编码所遇到的帧匹配、过渡帧处理和量化器设计等问题进行了讨论,文末给出了汉语普通话几个常见单元音量化信噪比的测试结果。实验表明:采用四比特帧间差分编码,当信号采... 本文提出一种新的语音波形的帧间差分编码算法,文中对帧间差分编码所遇到的帧匹配、过渡帧处理和量化器设计等问题进行了讨论,文末给出了汉语普通话几个常见单元音量化信噪比的测试结果。实验表明:采用四比特帧间差分编码,当信号采样频率为8kHz时,其短时量化信噪比的平均值超过29dB,利用归一化新波形的对称性、半周期取零技术和基音重复,预测误差用4比特量化时,可在数码率2k~4kbps情况下得到优质重建语音。 展开更多
关键词 变换 差分编码 帧间编码 语音波编码
下载PDF
基于线性分形插值的实现与应用
15
作者 韩伟 尹树云 王波 《昭乌达蒙族师专学报(汉文哲学社会科学版)》 2001年第4期5-7,共3页
本文给出了分形插值提取特征点和确定比例因子的一种方法。这种方法操作简单 ,易于实现 ,并给出了一些实验结果。
关键词 线性分插值 图象压缩 提取方法 特征点 比例因子 应用 weiersrass曲线 语音波曲线
下载PDF
一种中低码率语音波形编码的新方法
16
作者 牟峰 俞铁城 杨道淳 《数据采集与处理》 CSCD 2002年第2期131-136,共6页
在对语音实验分析的基础上 ,提出一种语音波形编码的新方法——半波编码。文中较详细地阐述了清、浊音码本各自的制作方法 ,并给出编解码实现的过程。实验结果表明 :本语音波形编码方法具有复杂度低、压缩比高等特点 ,重建的语音质量接... 在对语音实验分析的基础上 ,提出一种语音波形编码的新方法——半波编码。文中较详细地阐述了清、浊音码本各自的制作方法 ,并给出编解码实现的过程。实验结果表明 :本语音波形编码方法具有复杂度低、压缩比高等特点 ,重建的语音质量接近 G.72 9编码的水平。本编码方法的特点 :对含噪语音编码可获得良好的质量 ;有很强的保密性能 ,适用于保密通讯 ;具有良好的算法可扩展性。因此 。 展开更多
关键词 中低码率 语音波编码 矢量量化 信噪比 码本 语音信号处理 半波编码
下载PDF
FT-VQ话音编码系统
17
作者 胡象源 《铁道学报》 EI CAS CSCD 北大核心 1992年第4期121-125,共5页
为提高数字话音的传输效率,话音质量与普通脉码调制(PCM)相仿,而所需比特率却甚低的高效波形编码方式如差分脉码调制(DPCM),子频带编码(SBC)及变换编码(TC)等相继问世,这些编码方式均利用了语音信号相邻取样之间的相关性,使具有非平坦... 为提高数字话音的传输效率,话音质量与普通脉码调制(PCM)相仿,而所需比特率却甚低的高效波形编码方式如差分脉码调制(DPCM),子频带编码(SBC)及变换编码(TC)等相继问世,这些编码方式均利用了语音信号相邻取样之间的相关性,使具有非平坦频谱的语音信息所含的冗余度获得不同程度的降低,从而提高了编码效率,使本来在PCM下需要用高速(64kb/s)传送的话音,可用中速(16~32kb/s)甚至低速(2.4~9.6kb/s)传送。 展开更多
关键词 编码 语音波编码
下载PDF
标量-矢量量化(SVQ)在子带编码中的应用
18
作者 李萍 张师东 冷建华 《信息工程学院学报》 1997年第4期20-24,共5页
子带编码(SBC)作为中低码率的波形编码方法,已经广泛应用于语音及声频编码。SBC可以通过给各子带分配不同的量化及编码比特数,使压缩编码后的重建语音具有较高的质量。SVQ是一种低复杂度、结构化的标量-矢量量化编码[1... 子带编码(SBC)作为中低码率的波形编码方法,已经广泛应用于语音及声频编码。SBC可以通过给各子带分配不同的量化及编码比特数,使压缩编码后的重建语音具有较高的质量。SVQ是一种低复杂度、结构化的标量-矢量量化编码[1],它的码书结构可由标量量化的变长码得到。本文将SVQ量化编码方法用于子带编码,设计了语音信号SVQ子带编码模拟系统,模拟结果表明重建语音具有较高的主、客观质量。 展开更多
关键词 子带编码 标量-矢量量化 语音波编码
下载PDF
一种新的基于语音波形图像模板匹配的S/U/V判别法
19
作者 邓立新 杨震 郑宝玉 《南京邮电学院学报》 2000年第1期38-42,共5页
提出了一种判别语音静、清、浊三态S/U/V的新方法———语音波形图像模板匹配法。它的基本原理是首先利用语音信号的波形图 ,导出静、清、浊三态的标准矢量模板 ,然后将输入信号波形转换成矢量图 ,与标准模板进行比较。此法不仅简单、高... 提出了一种判别语音静、清、浊三态S/U/V的新方法———语音波形图像模板匹配法。它的基本原理是首先利用语音信号的波形图 ,导出静、清、浊三态的标准矢量模板 ,然后将输入信号波形转换成矢量图 ,与标准模板进行比较。此法不仅简单、高效 ,而且对于过渡帧的判别精度高于其它一些判别法 ,并具有一定的抗突发噪音性能。 展开更多
关键词 模板匹配 语音信号处理 语音波图像
下载PDF
科大讯飞语音云打造语音声纹识别 被引量:1
20
《中国信息安全》 2010年第11期82-82,共1页
10月28日,科大讯飞'语音云'正式在京发布。'讯飞语音云'的诞生,宣告移动互联网进入语音应用新时代。'讯飞语音云',是基于云计算技术基础,将智能语音技术向广大移动互联网开发者开放,为各类合作伙伴提供低门槛... 10月28日,科大讯飞'语音云'正式在京发布。'讯飞语音云'的诞生,宣告移动互联网进入语音应用新时代。'讯飞语音云',是基于云计算技术基础,将智能语音技术向广大移动互联网开发者开放,为各类合作伙伴提供低门槛的语音合成、语音声纹识别以及语音听写等智能语音交互式服务。其中Inter Veri是语音云中独创的说话人确认和鉴别产品。说话人识别(Speaker Recognize)技术即声纹识别(Voiceprint Recognize)。 展开更多
关键词 语音 声纹识别 语音波 科大讯飞
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部