期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于能量和浊音特性的语音端点检测 被引量:5
1
作者 国雁萌 盛任农 牟英良 《计算机工程与应用》 CSCD 北大核心 2006年第26期43-45,126,共4页
论文提出一种适用于实际噪声环境的语音端点检测算法,并将其用于语音识别系统中。首先通过跟踪平稳噪声能量,检测能量变化非平稳的信号;然后在这段信号中根据浊音特性搜索并跟踪谐波,确定浊音的位置;最后结合能量和浊音信息检测语音的... 论文提出一种适用于实际噪声环境的语音端点检测算法,并将其用于语音识别系统中。首先通过跟踪平稳噪声能量,检测能量变化非平稳的信号;然后在这段信号中根据浊音特性搜索并跟踪谐波,确定浊音的位置;最后结合能量和浊音信息检测语音的精确起止点。实验证明,该算法能在多种环境噪声中保持稳定可靠的性能。 展开更多
关键词 端点检测 语音识别 能量 浊音 基音 谐波
下载PDF
基于回归分析的语音识别快速自适应算法 被引量:4
2
作者 吕萍 颜永红 《声学学报》 EI CSCD 北大核心 2005年第3期222-228,共7页
从回归分析的角度推导出最大似然线性回归算法的等价算法--最小二乘线性回归算法,以及相应的多元线性回归模型。该模型中回归因子间存在着多重共线性,它导致了算法在自适应数据很少时失效。为减轻多重共线性的影响,提出改进算法:伪自适... 从回归分析的角度推导出最大似然线性回归算法的等价算法--最小二乘线性回归算法,以及相应的多元线性回归模型。该模型中回归因子间存在着多重共线性,它导致了算法在自适应数据很少时失效。为减轻多重共线性的影响,提出改进算法:伪自适应数据算法。实验表明,当仅有1s-3s自适应数据时,新算法使得系统误识率相对下降2%-6%,随着自适应数据增多,其性能与最大似然线性回归(或最小二乘线性同归)算法趋于一致。 展开更多
关键词 最小二乘线性回归算法 多重共线性 伪自适应数据算法 语音识别系统
下载PDF
广播新闻语料识别中的自动分段和分类算法 被引量:2
3
作者 吕萍 颜永红 《电子与信息学报》 EI CSCD 北大核心 2006年第12期2292-2295,共4页
该介绍了中文广播新闻语料识别任务中的自动分段和自动分类算法。提出了3阶段自动分段系统。该方法通过粗分段、精细分段和平滑3个阶段,将音频流分割为易于识别的音频段。在精细分段阶段,文中提出两种算法:动态噪声跟踪分段算法和基于... 该介绍了中文广播新闻语料识别任务中的自动分段和自动分类算法。提出了3阶段自动分段系统。该方法通过粗分段、精细分段和平滑3个阶段,将音频流分割为易于识别的音频段。在精细分段阶段,文中提出两种算法:动态噪声跟踪分段算法和基于单音素解码的分段算法。仿效说话人鉴别中的方法,文中提出了基于混合高斯模型的分类算法。该算法较好地解决了音频段的多类判决问题。在“新闻联播”测试数据中的实验结果表明,该文提出的自动分段和分类算法性能与手工分段分类性能几乎相当。 展开更多
关键词 语音识别 自动分段 自动分类
下载PDF
利用语句结构信息的机器翻译自动评测初探
4
作者 丁泽亚 张全 +2 位作者 缪建明 池毓焕 臧翰芬 《微计算机应用》 2010年第4期59-62,共4页
机器翻译评测对机器翻译有着极其重要的意义,它对翻译系统性能的提高做出了很大的贡献,同时促进了机器翻译的发展。本文在HNC机器翻译策略的基础上,对翻译语料的句类转换和句式转换做了初步的研究,并利用句类转换和句式转换的理论,建立... 机器翻译评测对机器翻译有着极其重要的意义,它对翻译系统性能的提高做出了很大的贡献,同时促进了机器翻译的发展。本文在HNC机器翻译策略的基础上,对翻译语料的句类转换和句式转换做了初步的研究,并利用句类转换和句式转换的理论,建立了基于句类信息的自动评测的打分机制。 展开更多
关键词 机器翻译自动评测 句类转换 句式转换
下载PDF
中英双语混合语音识别研究
5
作者 张晴晴 潘接林 颜永红 《重庆邮电大学学报(自然科学版)》 2008年第4期391-396,共6页
介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题:①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及... 介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题:①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法(TCM),并将该方法与基于声学似然度准则的聚类方法进行了比较。实验结果表明:利用TCM进行音素聚类的识别性能优于基于声学似然度音素聚类的性能,最终得到的中英双语识别系统在纯英文测试集上的短语错误率(PER)相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降13.78%;同时在纯中文测试集上保持了基线单中文识别系统的性能。 展开更多
关键词 双语识别 聚类算法 自适应
下载PDF
基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究 被引量:16
6
作者 董滨 赵庆卫 颜永红 《声学学报》 EI CSCD 北大核心 2007年第2期122-128,共7页
提出了一种以元音的共振峰模式为特征基于支持向量机算法的分类评估方法,用以对汉语普通话中的韵母发音水平进行客观测试。此算法为每个韵母分别训练全分类模型、子分类模型和评估模型,在两级分类的基础上对发音水平进行测试打分。实验... 提出了一种以元音的共振峰模式为特征基于支持向量机算法的分类评估方法,用以对汉语普通话中的韵母发音水平进行客观测试。此算法为每个韵母分别训练全分类模型、子分类模型和评估模型,在两级分类的基础上对发音水平进行测试打分。实验结果表明,全分类模型可以达到90%以上的分类正确率,客观测试与专家主观评估的相似度达到82%,在性能上超过了传统的以倒谱系数为特征的隐含马尔科夫模型方法。 展开更多
关键词 客观测试方法 汉语普通话 共振峰 发音 韵母 支持向量机算法 分类模型
下载PDF
窄带的自同步音频水印算法 被引量:11
7
作者 雷赟 刘建 +1 位作者 严波 颜永红 《计算机学报》 EI CSCD 北大核心 2008年第7期1283-1290,共8页
提出了一种适应于短波窄带信道的自同步音频水印算法.该算法具有如下优点:(1)在隐藏水印信息的同时,嵌入同步信号,使得水印具有时钟自同步和数据自同步的能力.(2)水印信号基于窄带信道的传输,适用于短波广播.(3)水印信号能够抗拒短波传... 提出了一种适应于短波窄带信道的自同步音频水印算法.该算法具有如下优点:(1)在隐藏水印信息的同时,嵌入同步信号,使得水印具有时钟自同步和数据自同步的能力.(2)水印信号基于窄带信道的传输,适用于短波广播.(3)水印信号能够抗拒短波传输中的各种干扰.实验表明:该算法能够实际地应用于短波节目的水印嵌入,对于短波传输中的各种干扰都有较好的鲁棒性. 展开更多
关键词 数字水印 音频水印 自同步 短波 窄带
下载PDF
基于发音特征的汉语普通话语音声学建模 被引量:14
8
作者 张晴晴 潘接林 颜永红 《声学学报》 EI CSCD 北大核心 2010年第2期254-260,共7页
将表征汉语普通话语音特点的发音特征引入汉语普通话语音识别的声学建模中,根据普通话发音特点,确定了用于区别普通话元音、辅音以及声调信息的9种发音特征,并以此为目标值训练神经网络得到语音信号属于各类发音特征的后验概率,将此概... 将表征汉语普通话语音特点的发音特征引入汉语普通话语音识别的声学建模中,根据普通话发音特点,确定了用于区别普通话元音、辅音以及声调信息的9种发音特征,并以此为目标值训练神经网络得到语音信号属于各类发音特征的后验概率,将此概率作为语音识别的输入特征建立声学模型。在汉语普通话非特定人大词表自然口语对话识别系统中进行了实验验证,并与基于频谱特征的声学模型进行了比较,在相同解码速度下,由此方法建立的声学模型汉字错误率相对下降6.8%;将发音特征和频谱特征进行了融合实验,融合以后的识别系统相对基于频谱特征系统的汉字错误率相对下降10.1%。上述结果表明,基于发音特征的声学模型更加有效的实现了对语音特性的表征,通过利用发音特征和频谱特征的互补性,能够进一步实现对语音识别性能的提高。 展开更多
关键词 汉语普通话 语音识别 输入特征 声学建模 发音 声学模型 频谱特征 后验概率
下载PDF
汉语发音质量评估的实验研究 被引量:12
9
作者 葛凤培 潘复平 +1 位作者 董滨 颜永红 《声学学报》 EI CSCD 北大核心 2010年第2期261-266,共6页
研究了发音评估系统中通用的置信度测度——后验概率算法,针对它存在的不足,提出了两种改进方案。首先,为了降低计算复杂度,传统算法采用了求最大值算法代替求和算法,在被测发音偏离目标音素集的情况下,这会严重降低后验概率的计算精度... 研究了发音评估系统中通用的置信度测度——后验概率算法,针对它存在的不足,提出了两种改进方案。首先,为了降低计算复杂度,传统算法采用了求最大值算法代替求和算法,在被测发音偏离目标音素集的情况下,这会严重降低后验概率的计算精度,本文提出基于扩展的音素混淆网络的后验概率算法。其次,为使置信度能评估不同语音段长的发音质量优劣,传统算法采用了后验概率的段长规整策略,研究分析发现声学似然值与时间的关系更为紧密,所以本文提出了基于声学似然值的时间规整方案。试验结果表明:与传统算法相比,采用改进的置信度算法能使平均打分错误率相对降低35%左右,有效地改善了计算机辅助语言学习系统的性能。 展开更多
关键词 质量评估 发音 概率算法 实验 汉语 传统算法 语言学习系统 后验概率
下载PDF
一种基于滑动窗口的语音端点检测算法 被引量:4
10
作者 余洪涌 赵庆卫 颜永红 《微计算机应用》 2006年第6期641-645,共5页
提出了一种基于滑动窗口的综合语音端点检测方法。从提高系统鲁棒性角度出发,利用各种综合的算法思想方法提高端点检测的准确性,鲁棒性和提高语音识别系统的总体识别率。利用频域能量、回声消除、DTMF滤除、利用信噪比确定多种阈值用于... 提出了一种基于滑动窗口的综合语音端点检测方法。从提高系统鲁棒性角度出发,利用各种综合的算法思想方法提高端点检测的准确性,鲁棒性和提高语音识别系统的总体识别率。利用频域能量、回声消除、DTMF滤除、利用信噪比确定多种阈值用于判定、利用语音波形特点进行粗调和精调等。试验表明该方法在语音端点检测的错误率和端点误差方面都显著减少了,系统鲁棒性得到明显提高。 展开更多
关键词 语音识别 语音端点检测 滑动窗口 回声消除
下载PDF
基于频率调制信息的人工耳蜗语音处理算法研究 被引量:4
11
作者 杨琳 张建平 +1 位作者 王迪 颜永红 《声学学报》 EI CSCD 北大核心 2009年第2期151-157,共7页
在传统人工耳蜗连续交叠采样(Continuous Interleaved Sampler,CIS)算法的基础上,提出一种基于精细结构(频率调制信息)的人工耳蜗语音处理算法,在不引入过高频率成分、保证工艺可实现性的前提下,使语音识别率大幅提高。听觉仿真实验的... 在传统人工耳蜗连续交叠采样(Continuous Interleaved Sampler,CIS)算法的基础上,提出一种基于精细结构(频率调制信息)的人工耳蜗语音处理算法,在不引入过高频率成分、保证工艺可实现性的前提下,使语音识别率大幅提高。听觉仿真实验的结果表明,与传统的基于时域包络的CIS算法相比,基于精细结构的CIS算法对于元音可懂度的改进可以达到28%;声调的识别率在各种噪声条件下提高20%以上;在一般噪声环境下,辅音和句子的可懂度也分别获得了22.9%和28.3%的改进。 展开更多
关键词 人工耳蜗 频率成分 语音处理 调制信息 算法 语音识别率 精细结构 噪声环境
下载PDF
汉语普通话易混淆音素的识别 被引量:4
12
作者 李晨冲 董滨 +2 位作者 潘复平 曾兴雯 颜永红 《计算机工程》 CAS CSCD 北大核心 2009年第23期201-203,共3页
针对汉语普通话语音识别中易混淆音素的声学特征,把小波包分解理论应用在感觉加权线性预测(PLP)特征中,提出一种新的特征参数提取算法,可以更精确地描述易混淆音素的频谱特征。使用高斯混合模型对新的声学特征进行分类,从而达到区分的... 针对汉语普通话语音识别中易混淆音素的声学特征,把小波包分解理论应用在感觉加权线性预测(PLP)特征中,提出一种新的特征参数提取算法,可以更精确地描述易混淆音素的频谱特征。使用高斯混合模型对新的声学特征进行分类,从而达到区分的目的。实验结果证明,新的特征参数识别结果优于使用传统PLP特征参数的识别结果,识别错误率下降30%以上。 展开更多
关键词 小波包分解 感觉加权线性预测 语音识别
下载PDF
一种任务域无关的语音关键词检测系统 被引量:2
13
作者 韩疆 刘晓星 +1 位作者 颜永红 张鹏远 《通信学报》 EI CSCD 北大核心 2006年第2期137-141,共5页
提出了面向语音关键词检测的多尺度声学模型建模框架,基于判决树的自动音素聚类生成了大尺度音素集,利用HMM声学模型训练技术生成了大尺度音素声学上下文相关的背景模型,提高了废料语音的建模精度,还给出了此框架下共享HMM状态的高效搜... 提出了面向语音关键词检测的多尺度声学模型建模框架,基于判决树的自动音素聚类生成了大尺度音素集,利用HMM声学模型训练技术生成了大尺度音素声学上下文相关的背景模型,提高了废料语音的建模精度,还给出了此框架下共享HMM状态的高效搜索空间构造方法,关键词识别准确率平均提高了绝对6.9%;提出了近邻声学上下文准则以及候选关键词在多尺度声学模型上的似然比计算方法并采用FLDA融合,显著提高了声学置信度计算的有效性,系统等错率绝对下降了3.0%。 展开更多
关键词 声学置信度 多尺度声学建模 搜索空间
下载PDF
关键词检测系统中基于音素网格的置信度计算 被引量:3
14
作者 张鹏远 韩疆 颜永红 《电子与信息学报》 EI CSCD 北大核心 2007年第9期2063-2066,共4页
该文提出了一种基于音素网格的置信度计算方法。与传统的基于整个声学模型的置信度不同的是,这种方法在解码器生成的音素网格上计算关键词的置信度,从而具有更好的拒识能力。另外,针对两种置信度取值范围的不同,该文采用权重因子的方法... 该文提出了一种基于音素网格的置信度计算方法。与传统的基于整个声学模型的置信度不同的是,这种方法在解码器生成的音素网格上计算关键词的置信度,从而具有更好的拒识能力。另外,针对两种置信度取值范围的不同,该文采用权重因子的方法综合利用两种置信度,取得了较好的效果。在自然对话的电话数据测试中,与传统的置信度计算方式相比,混和置信度的FOM(Figure Of Merit)值相对提高了17.0%。 展开更多
关键词 语音识别 关键词检测 置信度 后验概率 网格
下载PDF
基于音色单元分布的音乐结构分析 被引量:3
15
作者 李相莲 李明 +1 位作者 刘若伦 颜永红 《声学学报》 EI CSCD 北大核心 2010年第2期276-281,共6页
音乐的结构是音乐作品表达作者思想的一种重要形式,也是听众理解音乐作品内涵的有效途径。本文研究了基于音乐特征的音色单元建模方法,研究了在Fisher准则下,根据局部范围音色单元的分布,采用非监督聚类方法分析音乐的结构。实验结果证... 音乐的结构是音乐作品表达作者思想的一种重要形式,也是听众理解音乐作品内涵的有效途径。本文研究了基于音乐特征的音色单元建模方法,研究了在Fisher准则下,根据局部范围音色单元的分布,采用非监督聚类方法分析音乐的结构。实验结果证明了基于离散余弦变换的音色特征,用音色单元分布聚类算法进行音乐结构分析的有效性。 展开更多
关键词 音乐作品 结构分析 音色 单元 FISHER准则 离散余弦变换 建模方法 聚类方法
下载PDF
基于人耳听觉模型的自动嗓音评估方法 被引量:2
16
作者 王迪 付强 +3 位作者 杨琳 于萍 颜永红 冯稷 《物理学报》 SCIE EI CAS CSCD 北大核心 2008年第7期4244-4250,共7页
在嗓音评估系统的长元音谐噪比分析中,针对传统方法在普通傅里叶变换域上进行谐波成分计算并且需要对样本进行人工选择切分的情况,提出了一种新谐噪比计算方法,能够自动切分出长元音中稳定部分,并采用了更贴近人耳听觉模型的时频分析办... 在嗓音评估系统的长元音谐噪比分析中,针对传统方法在普通傅里叶变换域上进行谐波成分计算并且需要对样本进行人工选择切分的情况,提出了一种新谐噪比计算方法,能够自动切分出长元音中稳定部分,并采用了更贴近人耳听觉模型的时频分析办法,使对长元音的分析能够更稳定更贴近人耳主观听觉.同时由于没有人工干预,使得评估标准更加统一,结果更加客观. 展开更多
关键词 嗓音评估 听觉模型 长元音分析 谐噪比计算
原文传递
用于语音识别置信度的发音特征各维度分析和子集优化 被引量:2
17
作者 孙艳庆 张晴晴 +2 位作者 周瑜 赵庆卫 颜永红 《声学学报》 EI CSCD 北大核心 2011年第3期339-348,共10页
提出了基于发音特征单个维度的置信度算法,并基于此对发音特征的各个维度展开分析。分析不仅验证了融合的必要性,同时也展示了发音特征各维度之间以及和隐马尔可夫模型之间的大量冗余。为了去除冗余,提出了用子集选择的方法进行优化。... 提出了基于发音特征单个维度的置信度算法,并基于此对发音特征的各个维度展开分析。分析不仅验证了融合的必要性,同时也展示了发音特征各维度之间以及和隐马尔可夫模型之间的大量冗余。为了去除冗余,提出了用子集选择的方法进行优化。对比所有都用的情况,基于发音特征紧凑子集的语音识别置信度估计,在等错率上取得了12.7%的相对下降。把经过优化后的基于发音特征的语音识别置信度估计和基于隐马尔可夫模型的语音识别置信度进行融合,在保持集内识别率不损失的前提下,显著提高了语法外输入测试的拒识性能:在相同参数下,在开发集和测试集上分别取得了34%和35.3%的显著改善。 展开更多
关键词 置信度估计 语音识别 特征 发音 维度 优化 子集 隐马尔可夫模型
下载PDF
语言声学进展及其应用
18
作者 颜永红 《应用声学》 CSCD 北大核心 2009年第2期81-89,共9页
本文对语言声学研究的最新进展进行综述。首先介绍了人类的言语的产生和感知以及声学分析方面的近期发展,接着重点阐述了计算机处理人类语音(包括语音识别和合成,发音评估以及演唱评价)的最新研究、成果。同时提及了这些研究成果的相关... 本文对语言声学研究的最新进展进行综述。首先介绍了人类的言语的产生和感知以及声学分析方面的近期发展,接着重点阐述了计算机处理人类语音(包括语音识别和合成,发音评估以及演唱评价)的最新研究、成果。同时提及了这些研究成果的相关应用。最后是总结与展望。 展开更多
关键词 语言声学 言语产生 言语感知 语音识别 语音合成 发音评估 演唱评价
下载PDF
语音导航系统中的一种模糊检索算法 被引量:1
19
作者 孙艳庆 赵庆卫 颜永红 《微计算机应用》 2009年第12期38-45,共8页
基于车载的语音导航系统,尤其是针对大地名库中地名识别的任务需求。用LVCSR取代了较流行的基于语法的语音识别系统,以增强系统灵活性和处理能力。用一套模糊检索算法作为系统的后处理,提高地名识别的整句正确率。在普通的数万量级的地... 基于车载的语音导航系统,尤其是针对大地名库中地名识别的任务需求。用LVCSR取代了较流行的基于语法的语音识别系统,以增强系统灵活性和处理能力。用一套模糊检索算法作为系统的后处理,提高地名识别的整句正确率。在普通的数万量级的地名数据库中可以达到90%的地名识别正确率;即使增加到百万数量级,识别率也能保持在70%以上。目前支持中英文系统。 展开更多
关键词 语音地名导航 LVCSR 模糊检索
下载PDF
嵌入式语音识别中一种高效的图搜索算法
20
作者 黎塔 蔡尚 +2 位作者 赵庆卫 潘接林 颜永红 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第S1期215-218,共4页
为了满足超大词表语法的识别任务在嵌入式语音识别系统上的应用,提出了一种高效的双层图搜索算法.该算法通过分离声学层和词法层来构建2层图搜索空间,其中声学层记录声学模型相关信息,词法层记录词表语法信息.利用这样简洁的搜索空间可... 为了满足超大词表语法的识别任务在嵌入式语音识别系统上的应用,提出了一种高效的双层图搜索算法.该算法通过分离声学层和词法层来构建2层图搜索空间,其中声学层记录声学模型相关信息,词法层记录词表语法信息.利用这样简洁的搜索空间可以使语音识别的解码过程更加紧凑有效.在对比实验中,传统的基于前缀合并的状态树搜索算法的大词表嵌入式单词拼读系统作为基线系统.实验结果表明,与基线系统相比,所提出的双层图搜索算法在系统解码速度相对提高10%的情况下,系统的动态内存占用仅为基线的8%.通过使用所提出的双层图搜索算法,大大提高了大词表嵌入式单词拼读系统的效率,使其更适用于大多数嵌入式平台. 展开更多
关键词 嵌入式语音识别 双层图搜索 单词拼读系统
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部