期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于HMM的缅甸语语音合成系统设计与实现 被引量:9
1
作者 刘梦媛 杨鉴 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第1期19-27,共9页
由于电子化语言资源较为匮乏,缅甸语语音合成的研究相对滞后.针对该问题,以开发缅甸语语音合成应用系统为目的,设计并实现了一个基于HMM的语音合成系统.首先,为了使计算机按输入文本合成出正确的读音,提出并设计了缅甸语的注音方案,其... 由于电子化语言资源较为匮乏,缅甸语语音合成的研究相对滞后.针对该问题,以开发缅甸语语音合成应用系统为目的,设计并实现了一个基于HMM的语音合成系统.首先,为了使计算机按输入文本合成出正确的读音,提出并设计了缅甸语的注音方案,其中重点解决了缅甸语中的变音和变调问题;然后,根据缅甸语的语音特点选取声母及带声调的韵母作为合成基元,并按此设计上下文属性和问题集;最后,基于HTS平台,完整实现了音子自动切分、HMM声学模型训练及语音合成.实验结果表明,该缅甸语语音合成系统具有可行性,可作为后续研究的基线系统. 展开更多
关键词 缅甸语 语音合成 文本注音 音子自动切分 声学模型
下载PDF
Improved Grapheme-to-Phoneme Conversion for Mandarin TTS 被引量:1
2
作者 易立夫 李健 +1 位作者 郝杰 熊子瑜 《Tsinghua Science and Technology》 SCIE EI CAS 2009年第5期606-611,共6页
Several methods were developed to improve grapheme-to-phoneme (G2P) conversion models for Chinese text-to-speech (TTS) systems. The critical problem of data sparsity was handled by combining approaches. First, a t... Several methods were developed to improve grapheme-to-phoneme (G2P) conversion models for Chinese text-to-speech (TTS) systems. The critical problem of data sparsity was handled by combining approaches. First, a text-selection method was designed to cover as many G2P text corpus contexts as possible. Then, various data-driven modeling methods were used with comparisons to select the best method for each polyphonic word. Finally, independent models were used for some neutral tone words in addition to the normal G2P models to achieve more compact and flexible G2P models. Tests show that these methods reduce the relative errors by 50% for both normal polyphonic words and Chinese neutral tones. 展开更多
关键词 grapheme-to-phoneme conversion text design Chinese neutral tone speech synthesis
原文传递
面向方言语音合成的文本分析研究 被引量:3
3
作者 郭威彤 杨鸿武 +2 位作者 宋继华 顾香 甘振业 《计算机工程》 CAS CSCD 北大核心 2015年第9期184-189,共6页
为实现方言的统计参数语音合成,提出一种从文字到方言读音的文本分析方法。通过对比普通话和方言在声韵母方面的发音异同,设计方言的语音评估方法音标字母(SAMPA),用来标注方言声韵母的读音,得到从普通话读音到方言读音的转换规则。对... 为实现方言的统计参数语音合成,提出一种从文字到方言读音的文本分析方法。通过对比普通话和方言在声韵母方面的发音异同,设计方言的语音评估方法音标字母(SAMPA),用来标注方言声韵母的读音,得到从普通话读音到方言读音的转换规则。对输入的汉语文本进行分析,获得语法词、声母、韵母信息,使用基于转换的错误驱动学习算法获得语句的韵律词和韵律短语边界,利用普通话读音到方言读音的转换规则,获得方言发音的SAMPA音标,从而将输入的文本转换为统计参数语音合成所需的上下文相关标注。测试结果表明,该方法能较为准确地生成上下文相关标注。 展开更多
关键词 文本分析 字音转换 语音评估方法音标字母 语音合成 语法分析
下载PDF
利用SAMPA实现藏语的字音转换 被引量:3
4
作者 刘博 杨鸿武 +1 位作者 甘振业 郭威彤 《计算机工程与应用》 CSCD 北大核心 2011年第35期117-121,共5页
机读音标SAMPA(Speech Assessment Methods Phonetic Alphabet)即计算机可读的音标,用计算机可读的ASCII字符表示语言的发音。提出了一种藏语的SAMPA标注的设计方案SAMPA-T(Tibetan),以藏语拉萨话为例列出了它们的辅音和元音对应的国际... 机读音标SAMPA(Speech Assessment Methods Phonetic Alphabet)即计算机可读的音标,用计算机可读的ASCII字符表示语言的发音。提出了一种藏语的SAMPA标注的设计方案SAMPA-T(Tibetan),以藏语拉萨话为例列出了它们的辅音和元音对应的国际音标与SAMPA-T标注,并实现了面向SAMPA-T的藏语字音转换,可应用于藏语语音合成等藏语语音信息处理中。 展开更多
关键词 藏语机读音标 机读音标(SAMPA) 字音转换
下载PDF
基于神经网络的汉字多音字标音处理方法
5
作者 高健 《番禺职业技术学院学报》 2004年第2期42-45,58,共5页
提出基于神经网络的多音字标音处理方法。该方法具有结构简单、易实现和对汉语知识依赖性不强的特点,而且通过开集测试和闭集测试,证明神经网络解决多音字标音处理具有较高的正确率。
关键词 语音合成 文本分析 多音字标音处理
下载PDF
德语语音合成中的字音转换研究 被引量:1
6
作者 王永生 《计算机工程与应用》 CSCD 北大核心 2009年第35期132-134,共3页
字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字... 字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。 展开更多
关键词 德语语音合成 字音转换 有限状态转录机
下载PDF
字音转换策略介绍及性能代价评估
7
作者 王洁 宋柔 《计算机工程与应用》 CSCD 北大核心 2007年第16期26-29,共4页
许多面向应用的方法研究主要关注的是该方法的技术的性能,而相应的软件开发则要顾及整个系统的性能代价比,即不但要考虑到技术的性能,还要考虑到系统开发过程中的人力投入以及系统实现运行时的存储占用等方面的因素。这就对学术研究提... 许多面向应用的方法研究主要关注的是该方法的技术的性能,而相应的软件开发则要顾及整个系统的性能代价比,即不但要考虑到技术的性能,还要考虑到系统开发过程中的人力投入以及系统实现运行时的存储占用等方面的因素。这就对学术研究提出了另外一个要求,即对方法的实现做出性能代价的评估。探讨了字音转换技术,采用高频默认方法和语境约束方法,给出在不同分词词表背景下的准确率、存储空间占用及人力消耗等统计数据,从而为标音软件的开发提供一定的参考。 展开更多
关键词 字音转换 准确率 性能 代价
下载PDF
面向汉语统计参数语音合成的标注生成方法 被引量:1
8
作者 郝东亮 杨鸿武 +3 位作者 张策 张帅 郭立钊 杨静波 《计算机工程与应用》 CSCD 北大核心 2016年第19期146-153,共8页
针对汉语统计参数语音合成中的上下文相关标注生成,设计了声韵母层、音节层、词层、韵律词层、韵律短语层和语句层6层上下文相关的标注格式。对输入的中文语句进行文本规范并利用语法分析获得语句的结构和分词信息;通过字音转换获得每... 针对汉语统计参数语音合成中的上下文相关标注生成,设计了声韵母层、音节层、词层、韵律词层、韵律短语层和语句层6层上下文相关的标注格式。对输入的中文语句进行文本规范并利用语法分析获得语句的结构和分词信息;通过字音转换获得每个汉字的声韵母及声调;利用TBL(Transformation-Based error driven Learning)算法预测输入文本的韵律词边界和韵律短语边界。在此基础上,获得输入文本中每个汉字的声韵母信息及其上下文结构信息,从而产生统计参数语音合成所需的上下文相关标注。设计了一个以声韵母为合成基元的普通话的基于隐Markov模型(HMM)的统计参数语音合成系统,通过主、客观实验评测了不同标注信息对合成语音音质的影响,结果表明,上下文相关的标注信息越丰富,合成语音的音质越好。 展开更多
关键词 文本分析 语音合成 上下文相关标注 韵律预测 字音转换
下载PDF
德语字素音素转换学习语料库的自动生成算法
9
作者 王永生 《计算机应用》 CSCD 北大核心 2008年第B06期7-9,共3页
提出了一种基于迭代的有限状态转录机的字素音素转换学习语料库的自动生成算法,针对一个德语单词及其音标进行基于形态规则和语音规则的迭代,最终将字素和音素完全一一对应起来。经过抽样测试,算法的正确率可以达到98.6%。
关键词 语音合成 字素音素转换 语料库 有限状态转录机
下载PDF
基于循环神经网络的西班牙语词汇发音预测模型研究
10
作者 赵皎谷 马延周 黄晓辉 《计算机科学与应用》 2020年第10期1714-1727,共14页
依据西班牙语词汇和音素的特征以及词汇标音过程的特点,将西班牙语词汇标音过程建模为序列标注任务,提出基于字符嵌入 + 循环神经网络 + 连接时序分类的端到端词汇标音模型。首先利用word2vec框架在自建的西班牙语词库上训练字符嵌入向... 依据西班牙语词汇和音素的特征以及词汇标音过程的特点,将西班牙语词汇标音过程建模为序列标注任务,提出基于字符嵌入 + 循环神经网络 + 连接时序分类的端到端词汇标音模型。首先利用word2vec框架在自建的西班牙语词库上训练字符嵌入向量,从而形成西班牙语字符的分布式向量编码表示;之后基于循环神经网络和连接时序分类算法构建了西班牙语词汇标音模型,并在自建的发音词典语料上进行了训练与测试。试验结果显示,基于字符嵌入 + 循环神经网络 + 连接时序分类的词汇标音模型可以获得较其他统计模型或是神经网络模型更高的标音准确率,同时较传统标音模型有更简单的标注流程,对数据集的要求也要低得多,可有效实现端到端的西班牙语词汇标音任务。 展开更多
关键词 西班牙语 发音词典 字音转换 循环神经网络
下载PDF
蒙古文字母到音素转换方法的研究 被引量:4
11
作者 飞龙 高光来 闫学亮 《计算机应用研究》 CSCD 北大核心 2013年第6期1696-1700,共5页
针对蒙古文字母到音素的转换(grapheme to phoneme conversion,G2P)问题,提出了基于规则的蒙古文G2P转换方法和基于联合序列模型的蒙古文G2P转换方法。实验结果表明,利用联合序列模型的蒙古文G2P转换方法要明显好于基于规则的蒙古文G2P... 针对蒙古文字母到音素的转换(grapheme to phoneme conversion,G2P)问题,提出了基于规则的蒙古文G2P转换方法和基于联合序列模型的蒙古文G2P转换方法。实验结果表明,利用联合序列模型的蒙古文G2P转换方法要明显好于基于规则的蒙古文G2P转换方法。并且建立的基于联合序列模型的蒙古文G2P转换系统的词误识率为16.32%,音素误识率仅为3.37%,能达到实用要求。 展开更多
关键词 蒙古文 字母到音素的转换 联合序列模型 联合多元 联合分割
下载PDF
单词自动注音方法的研究 被引量:2
12
作者 李鹏 徐波 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第S1期735-740,共6页
在字母语言的文本到语音(text to speech,TTS)系统和自动语音识别(automatic speech recognition,ASR)系统的实际应用中,由于新词的出现和大量专有名词收集、存储的困难,经常会遇到发音词典中不存在的单词,需要自动对这些单词注音。该... 在字母语言的文本到语音(text to speech,TTS)系统和自动语音识别(automatic speech recognition,ASR)系统的实际应用中,由于新词的出现和大量专有名词收集、存储的困难,经常会遇到发音词典中不存在的单词,需要自动对这些单词注音。该文对各类自动注音方法做了回顾,对自动注音系统中若干关键问题做了简单的介绍。在此基础上,该文给出了一个自动注音系统的实现,对其中若干技术细节对性能的影响做了分析,最后给出了本系统与基于手写规则的方法的对比实验,结果表明前者的单词转换正确率达63%以上,显著优于后者。 展开更多
关键词 信息处理 语音处理 字素音素转换
原文传递
基于决策树的德语字素音素转换算法 被引量:1
13
作者 王永生 李立贵 《计算机应用与软件》 北大核心 2019年第1期211-215,共5页
字素音素转换是德语自然语言处理中的难点之一。提出一种基于决策树的字素音素转换的监督学习算法。在一个字素音素平行语料库的基础上,通过决策树进行字素音素转换的监督学习,生成字素音素转换规则。经交叉测试,平均转换正确率可达98. ... 字素音素转换是德语自然语言处理中的难点之一。提出一种基于决策树的字素音素转换的监督学习算法。在一个字素音素平行语料库的基础上,通过决策树进行字素音素转换的监督学习,生成字素音素转换规则。经交叉测试,平均转换正确率可达98. 03%。 展开更多
关键词 德语字素音素转换 自然语言处理 决策树
下载PDF
解决多音字字-音转换的一种统计学习方法 被引量:10
14
作者 张子荣 初敏 《中文信息学报》 CSCD 北大核心 2002年第3期39-45,共7页
字 -音转换是语音合成系统中的一个重要模块 ,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题。本文通过对大量标注有正确拼音的语料的统计 ,指出着重解决 4 1个重点多音字和 2 2个重点多音词就可基本解决... 字 -音转换是语音合成系统中的一个重要模块 ,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题。本文通过对大量标注有正确拼音的语料的统计 ,指出着重解决 4 1个重点多音字和 2 2个重点多音词就可基本解决字 -音转换的问题。本文采用基于扩展的随机复杂度的随机决策列表方法自动提取多音字 (词 )的读音规则 ,将字 -音转换的错误率由 8 8‰降低到 4 4‰。规则的训练和测试的材料的标注是一个耗费人力和时间的工作 ,而训练材料的数量和质量又直接影响最终的结果。本文提出一种半自动的语料标注流程 。 展开更多
关键词 统计学习方法 随机决策列表 字-音转换 多音字 多音词 语言合成系统 语音规则
下载PDF
面向字音转换的有条件维数扩展算法 被引量:2
15
作者 赵坤 梁维谦 刘润生 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第10期1629-1631,共3页
为克服ID3算法应用于字音转换时,运算速度慢、易受数据稀疏问题影响的缺点,提出了一种面向字音转换的新决策树算法"有条件维数扩展算法"(conditional mixincrementing algorithm,CMI)。在ID3的基础上,CMI使用先验发音学知识... 为克服ID3算法应用于字音转换时,运算速度慢、易受数据稀疏问题影响的缺点,提出了一种面向字音转换的新决策树算法"有条件维数扩展算法"(conditional mixincrementing algorithm,CMI)。在ID3的基础上,CMI使用先验发音学知识指导下的互信息量方法选择决策属性,并引入2个参量,最小可信度与最大支持数,控制叶子节点。实验结果表明,CMI简化了运算过程,降低了稀疏数据对所生成决策树预测性能的影响。相同实验条件下,CMI在运算速度上比ID3提高了3.3倍,在决策树的预测正确率上提高了11.6%。 展开更多
关键词 决策树 字音转换 ID3算法 CMI算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部