期刊文献+
共找到117篇文章
< 1 2 6 >
每页显示 20 50 100
两级决策的开集说话人辨认方法 被引量:12
1
作者 何致远 胡起秀 徐光祐 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第4期516-520,共5页
为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ... 为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。 展开更多
关键词 说话人识别 说话人辨认 语音切分 隐MARKOV模型 两级决策 语音识别
原文传递
基于语音识别的汉语发音自动评分系统的设计与实现 被引量:12
2
作者 吕军 曹效英 《计算机工程与设计》 CSCD 北大核心 2007年第5期1232-1235,共4页
语音识别技术的发展使得人与计算机的交互成为可能,针对目前对外汉语中发音教学的不足,在结合了语音识别的相关原理,提出了在对外汉语教学领域中汉语自动发音水平评价系统的设计,详细地描述了系统的结构、功能及流程。介绍了系统实现中... 语音识别技术的发展使得人与计算机的交互成为可能,针对目前对外汉语中发音教学的不足,在结合了语音识别的相关原理,提出了在对外汉语教学领域中汉语自动发音水平评价系统的设计,详细地描述了系统的结构、功能及流程。介绍了系统实现中的关键技术和步骤:动态时间弯折算法、语料库的建立、声韵分割技术以及评价分级标准。通过小范围的试验,表明该系统对留学生汉语发音水平的测试有一定的参考价值。 展开更多
关键词 语音识别 对外汉语 自动评分 动态时间弯折 音素分割
下载PDF
汉语语音音素分割的一种新方法 被引量:10
3
作者 王宁 万旺根 余小清 《上海大学学报(自然科学版)》 CAS CSCD 2002年第2期116-118,共3页
音素分割在大词汇量连续语音识别的过程中起着重要的作用 .该文提出了一种简单实用的音素分割方法 ,比较好地解决了这个问题 ,并在大词汇量汉语语音识别中得到了应用 。
关键词 汉语语音 音素分割 大词汇量 语音识别 清音 浊音 音素长度 拆分
下载PDF
基于分形维数实现语音分割和增强 被引量:8
4
作者 陈亮 张雄伟 《北京邮电大学学报》 EI CAS CSCD 北大核心 2003年第z1期112-114,125,共4页
在研究语音分形维数基础上,提出语音音素分割和模糊控制语音增强的新方法。
关键词 混沌 分形维数 语音分割 语音增强
下载PDF
语音识别中基于语谱图的语音音素分割方法 被引量:7
5
作者 潘凌云 孙达传 吴美朝 《杭州大学学报(自然科学版)》 CSCD 1995年第1期42-46,共5页
语谱图在语音分析方面有着广泛的应用.音素的自动分割是语音识别过程中的一个基本阶段,它将把语音句子按音素特征进行分割.本文提出了一个音素自动分割的方法;使用了两个表示语谱图密度变化的形变函数,以及自适应阈值技术来定位每个音... 语谱图在语音分析方面有着广泛的应用.音素的自动分割是语音识别过程中的一个基本阶段,它将把语音句子按音素特征进行分割.本文提出了一个音素自动分割的方法;使用了两个表示语谱图密度变化的形变函数,以及自适应阈值技术来定位每个音素段的边缘.这个方法在计算机上具体实现后.我们对取于一个语谱图数据库的一组实验数据,用本文所介绍的自动分割方法划分音素,将所得结果与由一语音学家分割的结果进行比较,得到的识别率高于93%.这个方法作为语音识别系统的一部分,已经在一个语音分析系统中使用. 展开更多
关键词 语谱图 语音音素 语音识别 自动分割
下载PDF
语音分割与端点检测研究综述 被引量:9
6
作者 杨健 李振鹏 苏鹏 《计算机应用》 CSCD 北大核心 2020年第1期1-7,共7页
语音分割是语音识别和语音合成中必不可少的基础性工作,其质量对后续系统的影响巨大。使用手工分割和标注虽然精度高,但费时费力,同时需要熟练的领域专家来完成,自动语音分割因此成为语音处理的研究热点。首先针对自动语音分割目前的研... 语音分割是语音识别和语音合成中必不可少的基础性工作,其质量对后续系统的影响巨大。使用手工分割和标注虽然精度高,但费时费力,同时需要熟练的领域专家来完成,自动语音分割因此成为语音处理的研究热点。首先针对自动语音分割目前的研究进展,介绍了语音分割的不同分类方法;然后分别介绍了基于对齐的方法和基于边界检测的方法,并详细介绍了可以应用在上述两种框架下的神经网络语音分割方法;接着介绍了基于生物激励信号以及博弈论等方法的新型语音分割技术,并给出了领域内广泛使用的性能评估度量,并对这些评估指标进行比较和分析;最后总结并提出语音分割研究未来发展的重要方向。 展开更多
关键词 语音分割 端点检测 语音合成 信号特征 人工神经网络
下载PDF
汉语自然话语韵律组块的优选论分析 被引量:6
7
作者 王茂林 《暨南学报(哲学社会科学版)》 CSSCI 北大核心 2005年第4期85-87,共3页
韵律是影响语音合成自然度的一个重要因素,韵律结构的预测是一个韵律组块过程。使用自然话语材料,依靠听感,对语料进行了韵律切分。通过对切分结果的考察,可以发现,韵律组块受词性及节奏等多方面因素的制约,现代音系学理论优选论可以对... 韵律是影响语音合成自然度的一个重要因素,韵律结构的预测是一个韵律组块过程。使用自然话语材料,依靠听感,对语料进行了韵律切分。通过对切分结果的考察,可以发现,韵律组块受词性及节奏等多方面因素的制约,现代音系学理论优选论可以对韵律组块问题作出解释。 展开更多
关键词 自然话语 韵律切分 韵律组块 优选论
下载PDF
阈值自适应语音自动分割系统模型 被引量:9
8
作者 张俊星 石立新 王都生 《计算机工程与设计》 CSCD 北大核心 2010年第8期1886-1888,F0003,共4页
针对有声出版物语音分割系统,提出了一种阈值自适应加相似度判决的系统分割模型,基于脚本中的先验知识提出了能量阈值自适应分割算法。对于传统的端点检测算法无法排除的干扰,为提高系统的抗干扰能力以增强其适用性,提出了基于语音单元... 针对有声出版物语音分割系统,提出了一种阈值自适应加相似度判决的系统分割模型,基于脚本中的先验知识提出了能量阈值自适应分割算法。对于传统的端点检测算法无法排除的干扰,为提高系统的抗干扰能力以增强其适用性,提出了基于语音单元相似性进行分析判决的新方法。测试结果表明,无干扰时,系统分割的正确率100%,每个语音文件包含两个人为干扰信号时,系统分割正确率98.8%,能够满足有声出版物语音自动分割的需要。 展开更多
关键词 有声出版物 语音分割 阈值调整 自适应算法 相似性分析
下载PDF
多重分形维数在语音分割和语音识别中的应用 被引量:4
9
作者 董远 胡光锐 《上海交通大学学报》 EI CAS CSCD 北大核心 1999年第11期1406-1408,共3页
语音气流中具有混沌特征,而分形可以定量地分析混沌现象,故分形可作为分析语音信号的数学工具.由于传统的Hausdorff-Besicovitch 维数没有考虑关于集合中点的分布信息,本文引入多重分形维数来克服上述缺点.... 语音气流中具有混沌特征,而分形可以定量地分析混沌现象,故分形可作为分析语音信号的数学工具.由于传统的Hausdorff-Besicovitch 维数没有考虑关于集合中点的分布信息,本文引入多重分形维数来克服上述缺点.实验表明,多重分形维数语音分割方法明显好于单一Hausdorff-Besicovitch 展开更多
关键词 分形 多重分形 语音分割 语音识别 维数
下载PDF
汉语连续语音中声调识别的特殊性研究 被引量:2
10
作者 钟金宏 杨善林 蒋俊杰 《小型微型计算机系统》 CSCD 北大核心 2002年第4期470-473,共4页
大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若... 大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若干结论 。 展开更多
关键词 声调识别 基音检测 语音分割 声调模式 汉语连续语音 特殊性 语音识别
下载PDF
说话人识别中语音切分算法的研究 被引量:4
11
作者 何致远 胡起秀 徐光 《计算机工程与应用》 CSCD 北大核心 2003年第6期55-58,共4页
论文针对说话人识别中语音能量变化和噪声对提取有效语音数据的影响,在传统时域语音切分算法犤1,3犦的基础上,提出了三种孤立词的精确切分算法和一种连续语音的非精确切分算法。实验表明,新算法较好地克服了语音能量变化对切分的影响,... 论文针对说话人识别中语音能量变化和噪声对提取有效语音数据的影响,在传统时域语音切分算法犤1,3犦的基础上,提出了三种孤立词的精确切分算法和一种连续语音的非精确切分算法。实验表明,新算法较好地克服了语音能量变化对切分的影响,在原始语音具有较高信噪比(≥10dB)的情况下,能够切除某些短时噪声和白噪声犤2犦。 展开更多
关键词 说话人识别 语音切分算法 语音识别 孤立词切分算法 帧参数规一化
下载PDF
仿真手语翻译系统开发 被引量:6
12
作者 杨淑莹 田迪 +1 位作者 郭杨杨 赵敏 《计算机仿真》 北大核心 2022年第2期278-282,418,共6页
为便利听障人士的正常社会生活,提高其社会融入度,设计开发了基于B/S模式的仿真手语翻译系统。此系统包含语音识别模块、文本分词模块和虚拟人控制模块。采集到的语音经过Mel尺度的小波包分解提取语音声学特征,并进行快速语音识别得到... 为便利听障人士的正常社会生活,提高其社会融入度,设计开发了基于B/S模式的仿真手语翻译系统。此系统包含语音识别模块、文本分词模块和虚拟人控制模块。采集到的语音经过Mel尺度的小波包分解提取语音声学特征,并进行快速语音识别得到对应文本,使用jieba完成对应的文本分词;同时创建仿真虚拟人模型并为其添加关键帧手语动作,使用Three.js实现Web端仿真手语动作渲染,最终实现语音到仿真手语的翻译过程。此系统操作方便、实用性强,具有很好的应用前景。 展开更多
关键词 手语翻译 语音识别 虚拟仿真 中文分词
下载PDF
电话语音的多说话人分割聚类研究 被引量:6
13
作者 张薇 刘加 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第4期574-577,共4页
为了提高电话多人语音中提取的单人语音纯度,即多说话人分割聚类处理的性能,该文在传统的分步分割聚类算法机制上增加了重分割处理,提出逐级算法增强处理机制:在分割部分,该文提出了一种基于Bayesian信息准则的分割算法,融合基于不同距... 为了提高电话多人语音中提取的单人语音纯度,即多说话人分割聚类处理的性能,该文在传统的分步分割聚类算法机制上增加了重分割处理,提出逐级算法增强处理机制:在分割部分,该文提出了一种基于Bayesian信息准则的分割算法,融合基于不同距离测度检测得出的分割点提高了分割点检测率;在聚类部分提出了基于BIC和交叉似然比准则(CLR)的分层聚类算法;在重分割部分引入和改进了进化隐Markov模型算法精化分割结果。该文在美国国家标准技术局(NIST)1998年度多说话人识别数据库上进行实验,聚类后性能"类纯度"比传统算法提高了10%。 展开更多
关键词 语音信号处理 电话语音 分割聚类 交叉似然比 进化隐Markov模型
原文传递
基于线性预测能量谱系数的自然语音和耳语音的分类研究 被引量:1
14
作者 姚真真 胡金瑶 艾斯卡尔·艾木都拉 《现代电子技术》 2023年第2期85-90,共6页
在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能。基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取... 在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能。基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取到更多的语音信息,并将其用于耳语音分类。此外,还特别设计4种不同的滤波器组,并将提取到的特征应用于7个分类器上。实验结果表明,密集的均匀三角滤波器组更加适合提取该特征,在7种传统分类器上均有较好的分类效果,其中SVM分类效果最好。最后,对比LPESC与传统特征(39维的LFCC和MFCC)在7种分类器上的分类效果,验证新特征的有效性。实验还发现,女生的耳语音有更好的分类效果。 展开更多
关键词 语音分类 语音识别 耳语音 线性预测能量谱系数 特征提取 频谱图切分 结果分析 效果验证
下载PDF
一个面向言语工程的兰州方言语料库 被引量:6
15
作者 杨鸿武 梁青青 +2 位作者 郭威彤 李锦珑 陈龙 《西北师范大学学报(自然科学版)》 CAS 北大核心 2009年第6期54-59,共6页
建立了一个兰州方言语料库.利用《方言调查字表》设计了兰州方言的文本语料,包括1 280个单字,2 000个双字词,18个负载句和1 000句语句,录制了4位发音人的兰州方言和普通话平行的语音语料,并标注了音节边界、峰值点、声韵母和声调信息;... 建立了一个兰州方言语料库.利用《方言调查字表》设计了兰州方言的文本语料,包括1 280个单字,2 000个双字词,18个负载句和1 000句语句,录制了4位发音人的兰州方言和普通话平行的语音语料,并标注了音节边界、峰值点、声韵母和声调信息;对于语句,根据词法信息和语法信息,利用TBL算法标注了韵律边界.语料库可用于兰州方言的实验语音学研究以及兰州方言的韵律建模、语音合成、语音转换的研究. 展开更多
关键词 兰州方言 语料库 语音切分 峰值点标注
下载PDF
基于计算听觉场景分析的混合语音信号分离算法研究 被引量:6
16
作者 屈俊玲 李鸿燕 《计算机应用研究》 CSCD 北大核心 2014年第12期3822-3824,共3页
人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离。针对单通道浊语音分离的问题,提出了一种以基音为线索的浊... 人耳听觉系统能够在强噪声的环境下区分出自己感兴趣的语音,基于计算听觉场景分析(CASA)的基本原理,其重点和难点是找到合适的声音分离线索,完成目标语音信号和噪声信号的分离。针对单通道浊语音分离的问题,提出了一种以基音为线索的浊语音信号分离算法。在白噪声、鸡尾酒会噪声等六种噪声干扰条件下,通过仿真实验结果表明,相比于传统的谱减法,语音分离算法的输出信噪比平均提高了7.47 d B,并有效抑制了干扰噪声,改善了分离效果。 展开更多
关键词 语音分离 计算听觉场景分析 基音 分段 听觉流
下载PDF
一种基于段间距离测度的语音自动分割方法 被引量:6
17
作者 张江安 杨洪柏 +1 位作者 林良明 颜国正 《上海交通大学学报》 EI CAS CSCD 北大核心 2001年第9期1362-1365,共4页
根据连续语音中不同类语音段之间内在的相异性 ,提出了段间距离的概念 ,并基于特征矢量距离给出了段间距离的一种测度 .在此基础上 ,提出一种新的语音自动分割方法 ,它根据语音段间距离曲线的峰值点对语音音素进行分割 ,而不需要关于语... 根据连续语音中不同类语音段之间内在的相异性 ,提出了段间距离的概念 ,并基于特征矢量距离给出了段间距离的一种测度 .在此基础上 ,提出一种新的语音自动分割方法 ,它根据语音段间距离曲线的峰值点对语音音素进行分割 ,而不需要关于语音单元的先验知识或参考模型 .在该方法中 ,语音特征矢量按帧计算 .通过采用适当的帧重迭度 ,可以使语音分割具有较高的时间分辨率 .实验结果表明 。 展开更多
关键词 语音分割 音素 段间距离测度 先验分割 后验分割 时间分辨率 自动分割
下载PDF
基于卷积神经网络的实时语音分割优化研究
18
作者 杨波 《电声技术》 2024年第5期46-48,共3页
为进一步提高实时语音分割的性能,分析基于卷积神经网络(Convolutional Neural Networks,CNN)的实时语音分割优化方法。首先,介绍CNN的基本结构和在语音分割中的数学原理。其次,引入修剪技术,根据权重的重要性分数决定保留或删除权重。... 为进一步提高实时语音分割的性能,分析基于卷积神经网络(Convolutional Neural Networks,CNN)的实时语音分割优化方法。首先,介绍CNN的基本结构和在语音分割中的数学原理。其次,引入修剪技术,根据权重的重要性分数决定保留或删除权重。实验结果表明,该方法的准确率、召回率、F1值及用时均优于传统CNN。 展开更多
关键词 卷积神经网络(CNN) 语音分割 实时性 修剪技术
下载PDF
基于短时分形维数的汉语语音自动分段技术研究 被引量:3
19
作者 陈国 胡修林 +1 位作者 张蕴玉 朱耀庭 《通信学报》 EI CSCD 北大核心 2000年第10期6-13,共8页
本文根据汉语语音的构成特点 ,提出了一种新的基于短时分形维数的汉语语音自动分段方法。该方法首先用等差尺度网格维数替代传统盒维数计算方法来快速计算语音信号的分形维数 ,然后在统计、分析汉语男女声 2 1种声母和 3 8种韵母语音信... 本文根据汉语语音的构成特点 ,提出了一种新的基于短时分形维数的汉语语音自动分段方法。该方法首先用等差尺度网格维数替代传统盒维数计算方法来快速计算语音信号的分形维数 ,然后在统计、分析汉语男女声 2 1种声母和 3 8种韵母语音信号的分形特性基础上 ,利用中心偏离限定算法来实现汉语语音信号的自动分段。仿真实验表明 ,该方法不但能正确实现不同语速条件下的语音自动分段 ,而且具有噪声鲁棒性 ,是一种有效的汉语语音自动分段技术。 展开更多
关键词 汉语语音 自动分段 分形维数 语音信号处理
下载PDF
单通道的语音盲去混响 被引量:6
20
作者 沈希忠 孟光 《上海交通大学学报》 EI CAS CSCD 北大核心 2010年第2期229-233,共5页
针对单通道的语音盲去混响研究中存在的问题,提出了一种盲去混响的方法.首先对语音信号进行可变长度的分段,然后采用复倒谱技术,对房间声学冲激响应进行预估计,得到去混响的初始解,并以此作为盲解卷积算法的初始解进一步去混响.仿真和... 针对单通道的语音盲去混响研究中存在的问题,提出了一种盲去混响的方法.首先对语音信号进行可变长度的分段,然后采用复倒谱技术,对房间声学冲激响应进行预估计,得到去混响的初始解,并以此作为盲解卷积算法的初始解进一步去混响.仿真和实验表明,该方法具有很好的去混响效果. 展开更多
关键词 去混响 复倒谱 盲解卷积 语音 分段
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部