期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于自适应心理声学模型的智能语音识别系统
被引量:
2
1
作者
熊笑颜
陈栩
+1 位作者
黄灿英
陈艳
《沈阳工业大学学报》
EI
CAS
北大核心
2017年第6期675-679,共5页
针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和...
针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和多训练条件下进行试验.结果表明,所提出的特征提取方法可以显著提高词识别率,优于梅尔频率倒谱系数(MFCC)、前向掩蔽(FM)、侧向抑制(LI)和倒谱平均值及方差归一化(CMVN)算法,能够有效地提高智能语音识别系统的性能.
展开更多
关键词
梅尔频率倒谱系数
耳声发射
自适应
心理声学滤波器
自动语音识别
AURORA2数据库
前向掩蔽
侧向抑制
下载PDF
职称材料
CELP宽带语音编码中感知加权滤波器的新算法
被引量:
1
2
作者
胡锴亮
金文光
杨雯
《浙江大学学报(理学版)》
CAS
CSCD
北大核心
2009年第1期41-46,共6页
心理声学模型已经成功地应用于音频编码技术中,将心理声学模型应用到CELP语音编码技术中,构造新的感知加权滤波器,可以有效地提高合成语音的质量,但如何减少其算法的复杂度是CELP算法的一个关键.提出了LSP系数插值和滤波器系数插值两种...
心理声学模型已经成功地应用于音频编码技术中,将心理声学模型应用到CELP语音编码技术中,构造新的感知加权滤波器,可以有效地提高合成语音的质量,但如何减少其算法的复杂度是CELP算法的一个关键.提出了LSP系数插值和滤波器系数插值两种新方法,以替代子帧中的心理声学模型掩蔽曲线的计算和转化,有效地减少其算法的复杂度.实验结果表明:在语音质量基本一致的情况下,LSP系数插值和滤波器系数插值两种算法的平均编码时间与原来相比分别减少18%和53%.该算法具有一般性,可以推广到其他CELP编码器的心理声学模型应用中.
展开更多
关键词
心理声学模型
感知加权滤波器
线谱对系数
预测系数
下载PDF
职称材料
MPEG Audio I Layer Ⅲ的几个问题
3
作者
亓中瑞
高振明
《山东电子》
2003年第4期40-42,共3页
本文主要介绍了MPEGAudioILayerIII的一些基本原理 ,包括为什么要用MP3格式进行声音文件的传输、音频文件可以被压缩的原因。
关键词
MPEG-Audio-I-LayerⅢ的几个问题
MP3格式
声音文件
心理声学模型
滤波器组
下载PDF
职称材料
题名
基于自适应心理声学模型的智能语音识别系统
被引量:
2
1
作者
熊笑颜
陈栩
黄灿英
陈艳
机构
南昌大学科学技术学院
出处
《沈阳工业大学学报》
EI
CAS
北大核心
2017年第6期675-679,共5页
基金
江西省教育厅科学技术研究项目(GJJ151504
GJJ151505)
+3 种基金
江西省教育改革课题资助项目(JXJG-14-28-3
JXJG-14-28-1
JXJG-14-28-6
JXJG-14-28-8)
文摘
针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和多训练条件下进行试验.结果表明,所提出的特征提取方法可以显著提高词识别率,优于梅尔频率倒谱系数(MFCC)、前向掩蔽(FM)、侧向抑制(LI)和倒谱平均值及方差归一化(CMVN)算法,能够有效地提高智能语音识别系统的性能.
关键词
梅尔频率倒谱系数
耳声发射
自适应
心理声学滤波器
自动语音识别
AURORA2数据库
前向掩蔽
侧向抑制
Keywords
Mel-frequency
cepstral
coefficient(MFCC)
otoacoustic
emission(OAE)
self-adaption
psychoacoustic
filter
automatic
speech
recognition(ASR)
AURORA2
database
forward
masking(FM)
lateral
inhibition(LI)
分类号
TP511 [自动化与计算机技术]
下载PDF
职称材料
题名
CELP宽带语音编码中感知加权滤波器的新算法
被引量:
1
2
作者
胡锴亮
金文光
杨雯
机构
浙江大学信息与电子工程学系
出处
《浙江大学学报(理学版)》
CAS
CSCD
北大核心
2009年第1期41-46,共6页
文摘
心理声学模型已经成功地应用于音频编码技术中,将心理声学模型应用到CELP语音编码技术中,构造新的感知加权滤波器,可以有效地提高合成语音的质量,但如何减少其算法的复杂度是CELP算法的一个关键.提出了LSP系数插值和滤波器系数插值两种新方法,以替代子帧中的心理声学模型掩蔽曲线的计算和转化,有效地减少其算法的复杂度.实验结果表明:在语音质量基本一致的情况下,LSP系数插值和滤波器系数插值两种算法的平均编码时间与原来相比分别减少18%和53%.该算法具有一般性,可以推广到其他CELP编码器的心理声学模型应用中.
关键词
心理声学模型
感知加权滤波器
线谱对系数
预测系数
Keywords
psychoacoustic
model
perceptual
weighting
filter
LSP
LPC
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
MPEG Audio I Layer Ⅲ的几个问题
3
作者
亓中瑞
高振明
机构
山东大学信息学院
出处
《山东电子》
2003年第4期40-42,共3页
文摘
本文主要介绍了MPEGAudioILayerIII的一些基本原理 ,包括为什么要用MP3格式进行声音文件的传输、音频文件可以被压缩的原因。
关键词
MPEG-Audio-I-LayerⅢ的几个问题
MP3格式
声音文件
心理声学模型
滤波器组
Keywords
MPEG
Audio
I
Layer
Ⅲ
psychoacoustic
Model
filter
Bank
分类号
TN912.3 [电子电信—通信与信息系统]
TN919.81 [电子电信—信息与通信工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于自适应心理声学模型的智能语音识别系统
熊笑颜
陈栩
黄灿英
陈艳
《沈阳工业大学学报》
EI
CAS
北大核心
2017
2
下载PDF
职称材料
2
CELP宽带语音编码中感知加权滤波器的新算法
胡锴亮
金文光
杨雯
《浙江大学学报(理学版)》
CAS
CSCD
北大核心
2009
1
下载PDF
职称材料
3
MPEG Audio I Layer Ⅲ的几个问题
亓中瑞
高振明
《山东电子》
2003
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部