期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
普通话语音的环境音变与双音子和三音子结构 被引量:11
1
作者 曹剑芬 《语言文字应用》 CSSCI 1996年第2期58-63,共6页
自然语音处理进入连续话语阶段以来,无论是合成方面还是识别方面,一个迫切需要解决的关键问题就是如何对付自然语音的多变性。这个问题既涉及对于语音变化本质的认识,又涉及合适的处理单元的选择。扼要介绍普通话语音的环境变异以及... 自然语音处理进入连续话语阶段以来,无论是合成方面还是识别方面,一个迫切需要解决的关键问题就是如何对付自然语音的多变性。这个问题既涉及对于语音变化本质的认识,又涉及合适的处理单元的选择。扼要介绍普通话语音的环境变异以及表达和描写这种动态变化特性的双音子和三音子结构。 展开更多
关键词 普通话语 位变体 协同发 处理 环境 一个 环境变异 变化
下载PDF
基于深度神经网络的维吾尔语语音识别 被引量:13
2
作者 其米克.巴特西 黄浩 王羡慧 《计算机工程与设计》 北大核心 2015年第8期2239-2244,共6页
目前的语音识别主要采用隐马尔可夫模型去实现,考虑三音子后,模型参数巨增,在训练数据有限的状态下,模型参数得不到很好的训练,影响语音识别率。为提高语音识别率,提出基于深度神经网络的语音识别方法。以kaldi为测试平台,对一个含有4... 目前的语音识别主要采用隐马尔可夫模型去实现,考虑三音子后,模型参数巨增,在训练数据有限的状态下,模型参数得不到很好的训练,影响语音识别率。为提高语音识别率,提出基于深度神经网络的语音识别方法。以kaldi为测试平台,对一个含有4隐层的神经网络进行训练,利用该模型进行维吾尔语语音识别。实验结果表明,相比基本单音子隐马尔科夫模型和考虑三音子后的隐马尔科夫模型,深度神经网络模型使维吾尔语语音识别错误率分别降低了31.09%和8.68%,且现存一切模型优化算法在此模型中依然有效。 展开更多
关键词 识别 模型 深度神经网络 隐马尔可夫
下载PDF
汉语语音合成语料库的研究与建立 被引量:6
3
作者 蔡莲红 赵世霞 《语言文字应用》 CSSCI 北大核心 1999年第3期97-102,共6页
本文介绍了一个语音合成语料库。语料的设计考虑了音段和韵律,语料库中包含汉语的音节、词语、独白语句和情景对话语篇。语音的录制在卦限录音室中进行。语料库中还包括了科学的语料管理系统,它具有查询、浏览和更新等功能。
关键词 语料库 汉语语合成 管理系统 韵律结构 语料库 韵律短语 系统设计 波形
下载PDF
藏语连续语音语料库设计与实现 被引量:10
4
作者 李永宏 于洪志 孔江平 《计算机工程与应用》 CSCD 北大核心 2010年第13期233-235,248,共4页
以藏语夏河话为研究对象,建立了基于三音子的藏语连续语音语料库。首先收集了10万句藏语文本语料库,并根据夏河话的实际发音,进行了国际音标转写;然后总结了夏河话的三音子音联结构形式,并用藏语文本处理平台对其组合类型和在原始文本... 以藏语夏河话为研究对象,建立了基于三音子的藏语连续语音语料库。首先收集了10万句藏语文本语料库,并根据夏河话的实际发音,进行了国际音标转写;然后总结了夏河话的三音子音联结构形式,并用藏语文本处理平台对其组合类型和在原始文本语料库中的频度进行了详细的统计分析;最后在语音库的语料设计中综合考虑了三音子以及类三音子的覆盖率和稀疏度,设计并完成了语料抽取算法,实现了语料自动选取。 展开更多
关键词 藏语 Greed算法
下载PDF
普通话双音子和三音子结构系统代表语料集 被引量:7
5
作者 曹剑芬 《语言文字应用》 CSSCI 北大核心 1997年第1期62-70,共9页
本语料集是为普通话双音子和三音子结构系统设计的语音样本集,它覆盖了普通话里所有可能出现的音节内和音节间双、三音子的语音环境。因此,它本质上是个汇总这个语言里因协同发音而产生的环境音变现象的知识库,既可作为语音研究领域... 本语料集是为普通话双音子和三音子结构系统设计的语音样本集,它覆盖了普通话里所有可能出现的音节内和音节间双、三音子的语音环境。因此,它本质上是个汇总这个语言里因协同发音而产生的环境音变现象的知识库,既可作为语音研究领域探索协同发音及音变现象的基本语料。 展开更多
关键词 普通话语 结构系统设计 代表语 结构 语料库 识别 环境
下载PDF
基于三音子模型的柯尔克孜最优语料选取算法
6
作者 买买提阿依甫 帕丽旦·木合塔尔 郭文强 《计算机仿真》 2024年第8期296-302,共7页
选择具有丰富语音现象的语料库是提高语音识别性能的关键。为了构建柯尔克孜语语音识别文本语料库,首先利用预处理技术去除文本中的噪声信息并用文本转换算法将柯尔克孜文转换为拉丁文形式。其次,根据柯尔克孜语的音节结构和规则,提出... 选择具有丰富语音现象的语料库是提高语音识别性能的关键。为了构建柯尔克孜语语音识别文本语料库,首先利用预处理技术去除文本中的噪声信息并用文本转换算法将柯尔克孜文转换为拉丁文形式。其次,根据柯尔克孜语的音节结构和规则,提出了启发函数和两种最优自动选择句子的算法。最后,为了验证算法的有效性,将两组包含不同数量的句子集作为实验语料,采用两种算法生成最优句子集,并对两种算法生成的语料库进行了统计,实验结果表明,利用算法2挑选出来的文本包含的三音子覆盖率达到了78.70%,能够满足语音识别系统的需要,验证了提出的算法的有效性。 展开更多
关键词 识别 语料库 柯尔克孜语
下载PDF
基于综合因素的汉语连续语音库语料自动选取 被引量:3
7
作者 康恒 刘文举 《中文信息学报》 CSCD 北大核心 2003年第4期27-32,共6页
大词汇量连续语音识别系统的性能很大程度上取决于语音库的质量 ,而语音库设计的中心环节就是语料选取。但是传统语料选取方法往往考虑因素单一 ,不利于语音识别系统有效利用语言信息。本语音库的语料选取方法综合考虑了多种因素 :三音... 大词汇量连续语音识别系统的性能很大程度上取决于语音库的质量 ,而语音库设计的中心环节就是语料选取。但是传统语料选取方法往往考虑因素单一 ,不利于语音识别系统有效利用语言信息。本语音库的语料选取方法综合考虑了多种因素 :三音子覆盖率、三音子覆盖效率、三音子稀疏度、常用词分布等 ,并完全实现程序自动选取 ,充分利用了原始语料 ,使选取结果的信息量更加丰富。程序自动选取结果可以覆盖94 1%的三音子 ,75 4 %的最常用词 ,覆盖效率和稀疏度也比传统方法有了较大改善。 展开更多
关键词 识别系统 语料选取 程序自动选取 覆盖效率 稀疏度 综合因素 高频词
下载PDF
基于语音学分类的汉语三音子识别单元的算法 被引量:4
8
作者 李春 王作英 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第1期16-19,共4页
为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系... 为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法。实验表明:基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28%。 展开更多
关键词 识别单元 汉语连续语识别 学分类 训练算法 识别算法 节结构
原文传递
汉语连续语音识别中的分级聚类算法的研究和应用 被引量:2
9
作者 徐向华 朱杰 郭强 《信号处理》 CSCD 2004年第5期497-500,共4页
针对汉语语音单音节结构的特点,考虑音节间协同发音的现象,本文提出了一种对三音子模型进行分级聚类的方法。与传统的基于决策树的状态聚类算法相比,该方法通过对稀少三音子模型聚类,更充分地利用训练数据,减少稀少三音子对状态聚类的影... 针对汉语语音单音节结构的特点,考虑音节间协同发音的现象,本文提出了一种对三音子模型进行分级聚类的方法。与传统的基于决策树的状态聚类算法相比,该方法通过对稀少三音子模型聚类,更充分地利用训练数据,减少稀少三音子对状态聚类的影响,从而提高声学模型的鲁棒性。实验结果表明:大词汇量连续语音识别器采用这种分级聚类方法,不仅可以大大减少模型及其参数的数量,还可使系统识别率有所提高,其中误识率相对于传统的决策树状态聚类系统降低了4.93%。 展开更多
关键词 状态聚类 决策树 训练数据 聚类算法 鲁棒性 聚类方法 汉语连续语识别 协同发 误识率
下载PDF
藏语安多方言的音联结构及统计分析 被引量:2
10
作者 杨阳蕊 李永宏 于洪志 《西北民族大学学报(自然科学版)》 2008年第2期11-16,共6页
根据藏语安多方言夏河话发音,总结夏河话的音节、半音节、音子、双音子、三音子等音联结构形式,并对他们的组合类型和频度进行详细的统计分析.其研究不仅为探索协同发音提供了基本数据,也为连续语音库的设计提供参考.
关键词 协同发
下载PDF
连续话语语音特性及其信息处理 被引量:3
11
作者 曹剑芬 《语言文字应用》 CSSCI 北大核心 1998年第1期100-103,共4页
本文简要讨论自然话语里的语音动态变化特性以及相关的语音学知识和理论在计算机语音信息处理方面的应用问题
关键词 语料库 连续话语 特性 汉语普通话 处理 计算机 协同发 识别 信息处理
下载PDF
利用上下文和基频提高汉语连续数字串识别性能
12
作者 程雪林 吴开政 李宗葛 《计算机工程与应用》 CSCD 北大核心 2003年第23期84-86,共3页
该文介绍了如何利用三音子模型和基频信息来提高汉语连续数字串的识别性能。三音子模型考虑了前后语音协同发音的影响,将上下文考虑到模型中去,可以更好地描述连续语音;各个音节的基频是随时间而变化的,其不同轨迹构成了声调,利用基频... 该文介绍了如何利用三音子模型和基频信息来提高汉语连续数字串的识别性能。三音子模型考虑了前后语音协同发音的影响,将上下文考虑到模型中去,可以更好地描述连续语音;各个音节的基频是随时间而变化的,其不同轨迹构成了声调,利用基频信息进一步提高了对汉语连续数字串的识别率。 展开更多
关键词 隐含马尔可夫模型 连续数字串 基频 识别 汉语
下载PDF
汉语连续数字串识别的改进
13
作者 程雪林 吴开政 李宗葛 《计算机工程》 CAS CSCD 北大核心 2003年第12期93-95,共3页
介绍了利用三音子模型和基频信息提高汉语连续数字串的识别率。在汉语连续数字串识别中“8”和“2” 是容易混淆的数字,而“9”和“6”在识别时会在末尾插入一个“5”而变成“95”和“65”。三音子模型将不同上下文的同一个数字区分开... 介绍了利用三音子模型和基频信息提高汉语连续数字串的识别率。在汉语连续数字串识别中“8”和“2” 是容易混淆的数字,而“9”和“6”在识别时会在末尾插入一个“5”而变成“95”和“65”。三音子模型将不同上下文的同一个数字区分开来,明显提高了识别率。基频反映了声调的变化,将它们作为后处理进一步降低了错误率。 展开更多
关键词 汉语连续数字串 基频 NBest
下载PDF
语音识别系统中上下文相关声学模型建模优化 被引量:2
14
作者 彭荻 刘刚 郭军 《北京邮电大学学报》 EI CAS CSCD 北大核心 2006年第z2期188-191,共4页
在实验中发现,某些带调三音子的训练数据稀疏会引起识别错误率的上升,为了在一定程度上减少这种影响,提出了使用其无调三音子的模型参数对有调三音子进行初始化.此外还调整了决策树状态捆绑的停止门限,并且采用了混合度分量的自适应增... 在实验中发现,某些带调三音子的训练数据稀疏会引起识别错误率的上升,为了在一定程度上减少这种影响,提出了使用其无调三音子的模型参数对有调三音子进行初始化.此外还调整了决策树状态捆绑的停止门限,并且采用了混合度分量的自适应增长训练.在863语音库上的实验结果表明,所有这些获得了一定的音子识别性能提高,同时也一定程度上压缩了声学模型大小. 展开更多
关键词 声学模型 识别
下载PDF
关于维吾尔语口语语料的三音子选取方法研究 被引量:1
15
作者 徐宝龙 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《中文信息学报》 CSCD 北大核心 2015年第2期118-124,共7页
在大词汇量连续语音识别应用中,优质的语音训练语料是所有识别工作的基础和前提,能否挑选出覆盖更多语音现象的语料是提高语音识别性能的关键。该文在多种维吾尔文口语化传播平台中采集了大量口语句子语料,并考虑协同发音的影响和常用... 在大词汇量连续语音识别应用中,优质的语音训练语料是所有识别工作的基础和前提,能否挑选出覆盖更多语音现象的语料是提高语音识别性能的关键。该文在多种维吾尔文口语化传播平台中采集了大量口语句子语料,并考虑协同发音的影响和常用词的适用性,根据评估函数对语料筛选。经过筛选后的语料包含的三音子更加均衡和高效,囊括的语音现象更加全面,为训练准确而牢靠的语音模型打下了稳固的根基。 展开更多
关键词 维吾尔语 识别 语料库
下载PDF
基于DDBHMM的维吾尔语音声学识别
16
作者 王飞飞 吾守尔.斯拉木 那斯尔江.吐尔逊 《计算机工程》 CAS CSCD 北大核心 2011年第2期197-199,共3页
在维吾尔语连续语音识别试验的声学层建模基础上,引用DDBHMM模型将上下文相关的三音子作为基本识别单元,并提出一种状态绑定的思想,对状态进行优化。为得到更充分的训练模型,提高识别效率,对语料库进行扩充,在多组对比试验的基础上,分... 在维吾尔语连续语音识别试验的声学层建模基础上,引用DDBHMM模型将上下文相关的三音子作为基本识别单元,并提出一种状态绑定的思想,对状态进行优化。为得到更充分的训练模型,提高识别效率,对语料库进行扩充,在多组对比试验的基础上,分析扩充前后对声学层识别速度、准确率等各个方面的影响。 展开更多
关键词 语料库 维吾尔语 DDBHMM模型理论
下载PDF
连续语音的三音子DDBHMM识别方法
17
作者 游展 肖熙 王作英 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第4期506-509,共4页
针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS... 针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。 展开更多
关键词 识别 段长 DDBHMM
原文传递
基于视频三音子的汉语双模态语料库的建立 被引量:6
18
作者 赵晖 林成龙 唐朝京 《中文信息学报》 CSCD 北大核心 2009年第5期98-103,共6页
为实现可视语音合成和双模态语音识别,需要建立符合条件的双模态语料库。该文提出了一种汉语双模态语料库的建立方法。根据视频中唇部发音特征,对已有的三音子模型聚类,形成视频三音子。在视频三音子的基础上,利用评估函数对原始语料中... 为实现可视语音合成和双模态语音识别,需要建立符合条件的双模态语料库。该文提出了一种汉语双模态语料库的建立方法。根据视频中唇部发音特征,对已有的三音子模型聚类,形成视频三音子。在视频三音子的基础上,利用评估函数对原始语料中的句子打分,并实现语料的自动选取。与其他双模态语料库相比,该文所建立的语料库在覆盖率、覆盖效率和高频词分布律有了较大改进,能够更加真实反映汉语中的双模态语言现象。 展开更多
关键词 计算机应用 中文信息处理 可视语合成 双模态语料 视频 评估函数
下载PDF
基于视频三音子的双模态语料自动选取算法 被引量:2
19
作者 赵晖 林成龙 唐朝京 《计算机工程》 CAS CSCD 北大核心 2009年第17期1-3,共3页
为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。根据视频中唇部发音特征,对已有的三音子模型归类,形成视频三音子,在其基础上从原始语料中自动选取语料,利用评估函数对原始语料中的句子打分。与其他双模... 为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。根据视频中唇部发音特征,对已有的三音子模型归类,形成视频三音子,在其基础上从原始语料中自动选取语料,利用评估函数对原始语料中的句子打分。与其他双模态语料库相比,该语料库在覆盖率等指标上有较大改进,为实现具有真实感的可视语音合成奠定基础。 展开更多
关键词 可视语合成 双模态语料 视频 评估函数
下载PDF
汉语古吟诵“依字率”计量研究
20
作者 孔江平 《语言学论丛》 2021年第2期252-271,共20页
“依字行腔”是中华传统有声文化形式上的精髓,因为中国大部分的语言使用基频构建不同的声调系统来区别语言意义,而有声文化也同时使用基频作为音乐旋律的物理和感知基础。在语盲和音乐长期的演化和形成过程中,人的认知能力构建了“依... “依字行腔”是中华传统有声文化形式上的精髓,因为中国大部分的语言使用基频构建不同的声调系统来区别语言意义,而有声文化也同时使用基频作为音乐旋律的物理和感知基础。在语盲和音乐长期的演化和形成过程中,人的认知能力构建了“依字行腔”这种涵盖语言认知系统和音乐认知系统的形式。本文提出了基于单音子字调和三音子字调的语言与吟诵的相关算法,并在此基础上提出了“依字率”的计算方法.用于“依字行腔”中对于字调感知正确率的实证定量描写。 展开更多
关键词 依字行腔 字调 字调 相关计算 依字率
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部