期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
局部-全局频率信息耦合的说话人验证
1
作者
陈君玉
郭小英
+2 位作者
梁新彦
郭倩
钱宇华
《江苏科技大学学报(自然科学版)》
CAS
北大核心
2023年第2期61-67,共7页
残差神经网络(ResNets)被广泛应用于说话人验证任务中,具有捕获局部频率信息的能力,但缺乏建模全局频率信息的能力.全局频率信息(如说话人的基音)可有效提高说话人验证任务的性能.同时,在视觉、语言等领域的研究表明全局和局部信息之间...
残差神经网络(ResNets)被广泛应用于说话人验证任务中,具有捕获局部频率信息的能力,但缺乏建模全局频率信息的能力.全局频率信息(如说话人的基音)可有效提高说话人验证任务的性能.同时,在视觉、语言等领域的研究表明全局和局部信息之间是相互补充的.因此,全局和局部频率信息的融合可提高说话人验证任务的性能.为了获取更鲁棒、更具辨别能力的说话人表征,提出了一种全局和局部频率信息耦合的说话人验证模型,利用频率多头注意力机制捕获频率带的全局信息.在VoxCeleb1-O、VoxCeleb1-E和VoxCeleb1-H这3个测试数据集下,实验结果显示提出的方法性能优于对比方法.同时,研究了话语长度对模型性能的影响,结果表明提出的融合模型在不同话语长度上仍然有效.
展开更多
关键词
说话人验证
说话人嵌入
信息融合
频率带交互
注意力机制
下载PDF
职称材料
用于拟人机器人的嵌入式语音交互系统研究
被引量:
7
2
作者
陈斌
郭大勇
施克仁
《机器人》
EI
CSCD
北大核心
2003年第5期452-455,共4页
本文介绍了一种用于拟人机器人的嵌入式语音交互系统 .系统采用高质量的语音采集模块及语音输出模块 ,以高性能数字信号处理器 (DSP)TMS32 0VC5 4 0 2为硬件核心 .HMM语音识别引擎以LPC倒谱及其差分分量作为语音特征表达 ,改进的Baum We...
本文介绍了一种用于拟人机器人的嵌入式语音交互系统 .系统采用高质量的语音采集模块及语音输出模块 ,以高性能数字信号处理器 (DSP)TMS32 0VC5 4 0 2为硬件核心 .HMM语音识别引擎以LPC倒谱及其差分分量作为语音特征表达 ,改进的Baum Welch重估算法完成了多观察值序列下的语音模板训练 .同时进行了语音特征不同表达形式对识别结果影响的对比实验 .系统外围控制程序完成识别结果提示以及与上位机的通讯 .系统在词汇量为 2 0 0的非特定人。
展开更多
关键词
拟人机器人
语音识别
非特定人
嵌入式系统
DSP
下载PDF
职称材料
题名
局部-全局频率信息耦合的说话人验证
1
作者
陈君玉
郭小英
梁新彦
郭倩
钱宇华
机构
山西大学大数据科学与产业研究院
山西省机器视觉与数据挖掘工程研究中心
出处
《江苏科技大学学报(自然科学版)》
CAS
北大核心
2023年第2期61-67,共7页
基金
国家重点研发计划项目(2021ZD0112400,2020AAA0106100)
国家自然科学基金资助项目(62136005,61603228)
+4 种基金
山西省重点研发计划项目(201903D421003)
山西省回国留学人员科研教研资助项目(HGKY2019001)
山西省自然科学基金青年项目(20210302124549,20210302124556)
山西省高等学校科技创新项目(2020L0036,2021L286,2019L0034)
山西省应用基础研究计划项目(201901D211171).
文摘
残差神经网络(ResNets)被广泛应用于说话人验证任务中,具有捕获局部频率信息的能力,但缺乏建模全局频率信息的能力.全局频率信息(如说话人的基音)可有效提高说话人验证任务的性能.同时,在视觉、语言等领域的研究表明全局和局部信息之间是相互补充的.因此,全局和局部频率信息的融合可提高说话人验证任务的性能.为了获取更鲁棒、更具辨别能力的说话人表征,提出了一种全局和局部频率信息耦合的说话人验证模型,利用频率多头注意力机制捕获频率带的全局信息.在VoxCeleb1-O、VoxCeleb1-E和VoxCeleb1-H这3个测试数据集下,实验结果显示提出的方法性能优于对比方法.同时,研究了话语长度对模型性能的影响,结果表明提出的融合模型在不同话语长度上仍然有效.
关键词
说话人验证
说话人嵌入
信息融合
频率带交互
注意力机制
Keywords
speaker
verification
speaker
embeddings
information
fusion
frequency
segment
interactions
attention
mechanism
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TN912.34 [自动化与计算机技术—控制科学与工程]
下载PDF
职称材料
题名
用于拟人机器人的嵌入式语音交互系统研究
被引量:
7
2
作者
陈斌
郭大勇
施克仁
机构
清华大学机械工程系无损检测实验室
出处
《机器人》
EI
CSCD
北大核心
2003年第5期452-455,共4页
基金
清华大学 985先进制造学科--拟人机器人重大项目
文摘
本文介绍了一种用于拟人机器人的嵌入式语音交互系统 .系统采用高质量的语音采集模块及语音输出模块 ,以高性能数字信号处理器 (DSP)TMS32 0VC5 4 0 2为硬件核心 .HMM语音识别引擎以LPC倒谱及其差分分量作为语音特征表达 ,改进的Baum Welch重估算法完成了多观察值序列下的语音模板训练 .同时进行了语音特征不同表达形式对识别结果影响的对比实验 .系统外围控制程序完成识别结果提示以及与上位机的通讯 .系统在词汇量为 2 0 0的非特定人。
关键词
拟人机器人
语音识别
非特定人
嵌入式系统
DSP
Keywords
humanoid
robot
speech
recognition
speaker
independent
embed
ded
system
DSP
分类号
TP24 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
局部-全局频率信息耦合的说话人验证
陈君玉
郭小英
梁新彦
郭倩
钱宇华
《江苏科技大学学报(自然科学版)》
CAS
北大核心
2023
0
下载PDF
职称材料
2
用于拟人机器人的嵌入式语音交互系统研究
陈斌
郭大勇
施克仁
《机器人》
EI
CSCD
北大核心
2003
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部