期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于声道频谱参数的语种识别
被引量:
11
1
作者
邵玉斌
刘晶
+2 位作者
龙华
杜庆治
李一民
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2021年第3期112-119,共8页
针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,...
针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,再基于信号频谱提取声道冲激响应频谱参数,然后融合Teager能量算子倒谱参数,最后通过高斯混合通用背景模型进行语种识别验证.不同信噪比条件下性能测试表明,所提方法相对于基于单一的梅尔频率倒谱系数特征、单一的伽玛通频率倒谱系数特征和基于对数梅尔尺度滤波器组能量特征,在低信噪比下提升约15 dB,显著提高了识别正确率.
展开更多
关键词
语种识别
声道
冲激响应
频谱
参数
低通滤波
重采样
Teager能量算子倒谱
参数
原文传递
基于听觉特性和发声特性的语种识别
2
作者
华英杰
朵琳
+1 位作者
刘晶
邵玉斌
《云南大学学报(自然科学版)》
CAS
CSCD
北大核心
2023年第4期807-814,共8页
针对现有的方法在低信噪比环境下语种识别性能不佳,提出了一种耳蜗滤波系数和声道冲激响应频谱参数相互融合的语种识别方法.该方法表征了人的耳蜗听觉特性和发声特性,首先提取模拟人耳听觉特性的耳蜗滤波系数,再融合表征人的发声特性的...
针对现有的方法在低信噪比环境下语种识别性能不佳,提出了一种耳蜗滤波系数和声道冲激响应频谱参数相互融合的语种识别方法.该方法表征了人的耳蜗听觉特性和发声特性,首先提取模拟人耳听觉特性的耳蜗滤波系数,再融合表征人的发声特性的声道冲激响应频谱参数,最后采用高斯混合通用背景模型对所提方法在语种识别上进行测试.实验结果表明,在4种信噪比环境下,该方法优于其他对比方法;相对于基于深度学习的对数Mel尺度滤波器能量特征,识别正确率提升了16.1%,与其他方法相比有较大程度的提升.
展开更多
关键词
语种识别
耳蜗滤波系数
声道
冲激响应
频谱
参数
高斯混合通用背景模型
下载PDF
职称材料
题名
基于声道频谱参数的语种识别
被引量:
11
1
作者
邵玉斌
刘晶
龙华
杜庆治
李一民
机构
昆明理工大学信息工程与自动化学院
出处
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2021年第3期112-119,共8页
基金
国家自然科学基金项目(61761025)。
文摘
针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,再基于信号频谱提取声道冲激响应频谱参数,然后融合Teager能量算子倒谱参数,最后通过高斯混合通用背景模型进行语种识别验证.不同信噪比条件下性能测试表明,所提方法相对于基于单一的梅尔频率倒谱系数特征、单一的伽玛通频率倒谱系数特征和基于对数梅尔尺度滤波器组能量特征,在低信噪比下提升约15 dB,显著提高了识别正确率.
关键词
语种识别
声道
冲激响应
频谱
参数
低通滤波
重采样
Teager能量算子倒谱
参数
Keywords
language identification
spectral parameters of channel impulse response
low-pass filtering
resampling
Teager energy operators cepstral coefficients
分类号
TN912.3 [电子电信—通信与信息系统]
原文传递
题名
基于听觉特性和发声特性的语种识别
2
作者
华英杰
朵琳
刘晶
邵玉斌
机构
昆明理工大学信息工程与自动化学院
出处
《云南大学学报(自然科学版)》
CAS
CSCD
北大核心
2023年第4期807-814,共8页
基金
国家自然科学基金(61962032)
云南省科技厅优秀青年项目(202001AW07000).
文摘
针对现有的方法在低信噪比环境下语种识别性能不佳,提出了一种耳蜗滤波系数和声道冲激响应频谱参数相互融合的语种识别方法.该方法表征了人的耳蜗听觉特性和发声特性,首先提取模拟人耳听觉特性的耳蜗滤波系数,再融合表征人的发声特性的声道冲激响应频谱参数,最后采用高斯混合通用背景模型对所提方法在语种识别上进行测试.实验结果表明,在4种信噪比环境下,该方法优于其他对比方法;相对于基于深度学习的对数Mel尺度滤波器能量特征,识别正确率提升了16.1%,与其他方法相比有较大程度的提升.
关键词
语种识别
耳蜗滤波系数
声道
冲激响应
频谱
参数
高斯混合通用背景模型
Keywords
language identification
cochlear filter coefficient
vocal tract impulse response spectral parameters
Gaussian mixture general background model
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于声道频谱参数的语种识别
邵玉斌
刘晶
龙华
杜庆治
李一民
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2021
11
原文传递
2
基于听觉特性和发声特性的语种识别
华英杰
朵琳
刘晶
邵玉斌
《云南大学学报(自然科学版)》
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部