期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
普通话语音识别中的基本音素分析 被引量:9
1
作者 黄中伟 杨磊 +1 位作者 徐明 冯杉杉 《深圳大学学报(理工版)》 EI CAS 北大核心 2006年第4期356-357,共2页
分析普通话发音的基本音素,选取8个元音音素和22个辅音音素作为发音构成的基础,列出了由音素构成汉语拼音声母和韵母的方法,从而为形成从音素到拼音的两步式识别法奠定了基础.
关键词 语音识别 语言学 特殊教育 普通话
下载PDF
结合高斯混合模型和VOT特征的音素发音错误检测 被引量:3
2
作者 刘明辉 黄中伟 《科学技术与工程》 北大核心 2013年第7期1789-1793,共5页
结合高斯混合模型(GMM)和嗓音起始时间(VOT)特征的普通话音素发音错误检测,提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测,并直接对大部分音素的发音质量直接... 结合高斯混合模型(GMM)和嗓音起始时间(VOT)特征的普通话音素发音错误检测,提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测,并直接对大部分音素的发音质量直接进行错误检测。对于少数通过MFCC参数和GMM难于检测区分的辅音音素,则通过反映VOT信息的音源特征参数进行区分。实验表明,该方法在训练数据有限的情况下取得了较好的性能,非常适合用于聋人语言康复的计算机辅助训练。 展开更多
关键词 语音识别 发音错误检测 高斯混合模型 嗓音起始时间
下载PDF
便于语音识别的汉语音素发音口形定型化处理 被引量:3
3
作者 黄中伟 刘明辉 +2 位作者 徐明 冯杉杉 高建伟 《深圳大学学报(理工版)》 EI CAS 北大核心 2007年第4期404-405,共2页
分析汉语普通话发音的29个基本音素,对m,n,l等3个音素的发音进行改造,形成了由16个定口型音和13个动口型音组成的音素体系,有助于减轻非母语系者学习中文及智障人士语音识别的学习负担.
关键词 语音识别 语言学 特殊教育 普通话
下载PDF
普通话发音训练多级音素模板综合评价方法
4
作者 徐明 黄中伟 杨磊 《计算机工程与应用》 CSCD 北大核心 2007年第28期237-239,共3页
提出了一种应用于普通话声韵母发音评价的多级音素模板综合评分法,该方法在单模板匹配的基础上,通过寻找汉语音素发音过程中的浊化、摩擦、爆破等特征,形成多个子模式,进行多模式匹配,最后给出加权评分。实验结果表明多级音素模板综合... 提出了一种应用于普通话声韵母发音评价的多级音素模板综合评分法,该方法在单模板匹配的基础上,通过寻找汉语音素发音过程中的浊化、摩擦、爆破等特征,形成多个子模式,进行多模式匹配,最后给出加权评分。实验结果表明多级音素模板综合评分法有效地改善了汉语发音中几组相似音之间的区分度。也介绍了MFCC等语音特征提取、DTW模板匹配算法、基于聚类的模板训练以及综合加权评价机制的实现方法。 展开更多
关键词 语音评价 模式匹配 综合评分
下载PDF
用于SVM话者模型训练的冒认话者选取 被引量:1
5
作者 刘明辉 黄中伟 +1 位作者 戴蓓蒨 熊继平 《计算机工程》 CAS CSCD 北大核心 2009年第16期4-6,共3页
在基于支持向量机(SVM)的文本无关的说话人确认中,为提高SVM话者模型的训练效率和区分性能,提出2种基于高斯混合模型(GMM)的冒认话者选取方法——通过GMM概率评分,为每个目标说话人选取最接近的话者作为冒认话者用于SVM话者模型的训练,... 在基于支持向量机(SVM)的文本无关的说话人确认中,为提高SVM话者模型的训练效率和区分性能,提出2种基于高斯混合模型(GMM)的冒认话者选取方法——通过GMM概率评分,为每个目标说话人选取最接近的话者作为冒认话者用于SVM话者模型的训练,不仅提高模型的训练效率,而且提高SVM模型的区分性,有效地改进系统性能。在NIST’04 1side-1side数据库上的实验表明该方法的有效性。 展开更多
关键词 说话人确认 支持向量机 冒认话者选取 高斯混合模型
下载PDF
基于分层增长语音活动检测的鲁棒性说话人识别
6
作者 解焱陆 张劲松 +1 位作者 刘明辉 黄中伟 《深圳大学学报(理工版)》 EI CAS 北大核心 2012年第4期328-334,共7页
基于欧洲电信标准化协会颁布的分布式语音识别和前端标准(ETSI-DSR-AFE).针对分布式说话人识别噪声鲁棒性较差的问题,提出一种新的前端处理方法.该方法以似然距离为测度,对语音进行无监督聚类,为减少计算量,采用分层增长(level-building... 基于欧洲电信标准化协会颁布的分布式语音识别和前端标准(ETSI-DSR-AFE).针对分布式说话人识别噪声鲁棒性较差的问题,提出一种新的前端处理方法.该方法以似然距离为测度,对语音进行无监督聚类,为减少计算量,采用分层增长(level-building)方法进行逐层分割,从而准确找出语音和静音的边界点.实验结果表明,用该方法改进ETSI-DSR-AFE标准后,信噪比在大于0 dB时,说话人辨认系统识别率相对改进了18.9%,相对原有的Mel频率倒谱系数(Mel-frequenly Ceptral coefficients,MFCC)系统识别率改进了60.7%. 展开更多
关键词 语音信号处理 说话人识别 分布式语音识别 分层增长 语音活动检测 似然距离
下载PDF
自适应GMM聚类的SVM话者确认
7
作者 刘明辉 戴蓓倩 黄中伟 《小型微型计算机系统》 CSCD 北大核心 2011年第1期173-176,共4页
支持向量机作为说话人建模方法用于与文本无关的话者确认研究时,如何提取适合SVM训练和测试的特征参数直接影响话者确认系统的性能和效率.根据高斯混合模型(GMM)聚类能力强的特点,提出一种基于自适应GMM聚类的说话人特征参数提取方法,... 支持向量机作为说话人建模方法用于与文本无关的话者确认研究时,如何提取适合SVM训练和测试的特征参数直接影响话者确认系统的性能和效率.根据高斯混合模型(GMM)聚类能力强的特点,提出一种基于自适应GMM聚类的说话人特征参数提取方法,通过自适应的GMM聚类将大样本、混叠严重的M FCC特征参数聚为小样本的、代表说话人个性特征的特征参数,并用于与文本无关的SVM话者确认.在N IST0′4 1side-1side数据库上的实验表明了该方法的有效性. 展开更多
关键词 话者确认 自适应高斯混合模型 支持向量机 文本无关
下载PDF
用于说话人辨识的评分规整
8
作者 刘明辉 黄中伟 熊继平 《计算机工程与应用》 CSCD 北大核心 2010年第12期133-135,共3页
在文本无关的说话人辨识中,为了提高系统在电话语音条件下的鲁棒性,提出了将说话人确认中常用的评分规整手段用于说话人辨识中,即对测试语音通过不同话者模型的评分分别进行评分规整,为测试语音选取最接近的话者模型作为系统识别输出,... 在文本无关的说话人辨识中,为了提高系统在电话语音条件下的鲁棒性,提出了将说话人确认中常用的评分规整手段用于说话人辨识中,即对测试语音通过不同话者模型的评分分别进行评分规整,为测试语音选取最接近的话者模型作为系统识别输出,有效地提高了系统性能。在NIST’031spk数据库上的说话人辨识实验表明了评分规整技术对说话人辨识的有效性。 展开更多
关键词 评分规整 说话人辨识 高斯混合模型 统一背景模型最大后验概率估计(UBM-MAP)
下载PDF
计算机辅助聋人语言康复的实践探讨 被引量:1
9
作者 黄中伟 刘明辉 +1 位作者 孙宏元 徐明 《中国科技信息》 2013年第13期126-126,共1页
由于听力残缺所造成的语音发音障碍,使得部分人群无法通过对话的方式与他人交流。对发音器官健全的听力语言残疾人,可以借助教师和计算机的帮助,学习、提高自己的语言理解能力和发音能力。本文针对人工教育成本高的缺点,进行了计算机辅... 由于听力残缺所造成的语音发音障碍,使得部分人群无法通过对话的方式与他人交流。对发音器官健全的听力语言残疾人,可以借助教师和计算机的帮助,学习、提高自己的语言理解能力和发音能力。本文针对人工教育成本高的缺点,进行了计算机辅助聋人语言康复的软件系统的开发,并结合具体教学事例进行了应用实践。 展开更多
关键词 语言康复 聋人 计算机辅助教学
下载PDF
针对聋人语言康复的基本音教学法 被引量:1
10
作者 黄中伟 刘明辉 +1 位作者 周延蕾 苏国标 《中国科技信息》 2012年第8期224-224,共1页
由于听力残缺所造成的语音发音障碍,使得部分人群无法用讲话的方式表达自己。对发音器官健全的听力语言残疾人,可以借助教师和计算机的帮助,先学会少数基本音的发音,再学会复合音和单字、单词的发音。本文提出了以基本音为基础的教学法... 由于听力残缺所造成的语音发音障碍,使得部分人群无法用讲话的方式表达自己。对发音器官健全的听力语言残疾人,可以借助教师和计算机的帮助,先学会少数基本音的发音,再学会复合音和单字、单词的发音。本文提出了以基本音为基础的教学法,解释了选取汉字基本音的方案和相应计算机辅助软件系统的制作与使用原理,并结合具体教学事例分析了新方法的效果。 展开更多
关键词 语言康复 聋人 基本音
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部