期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
局部-全局频率信息耦合的说话人验证
1
作者 陈君玉 郭小英 +2 位作者 梁新彦 郭倩 钱宇华 《江苏科技大学学报(自然科学版)》 CAS 北大核心 2023年第2期61-67,共7页
残差神经网络(ResNets)被广泛应用于说话人验证任务中,具有捕获局部频率信息的能力,但缺乏建模全局频率信息的能力.全局频率信息(如说话人的基音)可有效提高说话人验证任务的性能.同时,在视觉、语言等领域的研究表明全局和局部信息之间... 残差神经网络(ResNets)被广泛应用于说话人验证任务中,具有捕获局部频率信息的能力,但缺乏建模全局频率信息的能力.全局频率信息(如说话人的基音)可有效提高说话人验证任务的性能.同时,在视觉、语言等领域的研究表明全局和局部信息之间是相互补充的.因此,全局和局部频率信息的融合可提高说话人验证任务的性能.为了获取更鲁棒、更具辨别能力的说话人表征,提出了一种全局和局部频率信息耦合的说话人验证模型,利用频率多头注意力机制捕获频率带的全局信息.在VoxCeleb1-O、VoxCeleb1-E和VoxCeleb1-H这3个测试数据集下,实验结果显示提出的方法性能优于对比方法.同时,研究了话语长度对模型性能的影响,结果表明提出的融合模型在不同话语长度上仍然有效. 展开更多
关键词 说话人验证 说话人嵌入 信息融合 频率带交互 注意力机制
下载PDF
用于拟人机器人的嵌入式语音交互系统研究 被引量:7
2
作者 陈斌 郭大勇 施克仁 《机器人》 EI CSCD 北大核心 2003年第5期452-455,共4页
本文介绍了一种用于拟人机器人的嵌入式语音交互系统 .系统采用高质量的语音采集模块及语音输出模块 ,以高性能数字信号处理器 (DSP)TMS32 0VC5 4 0 2为硬件核心 .HMM语音识别引擎以LPC倒谱及其差分分量作为语音特征表达 ,改进的Baum We... 本文介绍了一种用于拟人机器人的嵌入式语音交互系统 .系统采用高质量的语音采集模块及语音输出模块 ,以高性能数字信号处理器 (DSP)TMS32 0VC5 4 0 2为硬件核心 .HMM语音识别引擎以LPC倒谱及其差分分量作为语音特征表达 ,改进的Baum Welch重估算法完成了多观察值序列下的语音模板训练 .同时进行了语音特征不同表达形式对识别结果影响的对比实验 .系统外围控制程序完成识别结果提示以及与上位机的通讯 .系统在词汇量为 2 0 0的非特定人。 展开更多
关键词 拟人机器人 语音识别 非特定人 嵌入式系统 DSP
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部