期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
Improved Grapheme-to-Phoneme Conversion for Mandarin TTS 被引量:1
1
作者 易立夫 李健 +1 位作者 郝杰 熊子瑜 《Tsinghua Science and Technology》 SCIE EI CAS 2009年第5期606-611,共6页
Several methods were developed to improve grapheme-to-phoneme (G2P) conversion models for Chinese text-to-speech (TTS) systems. The critical problem of data sparsity was handled by combining approaches. First, a t... Several methods were developed to improve grapheme-to-phoneme (G2P) conversion models for Chinese text-to-speech (TTS) systems. The critical problem of data sparsity was handled by combining approaches. First, a text-selection method was designed to cover as many G2P text corpus contexts as possible. Then, various data-driven modeling methods were used with comparisons to select the best method for each polyphonic word. Finally, independent models were used for some neutral tone words in addition to the normal G2P models to achieve more compact and flexible G2P models. Tests show that these methods reduce the relative errors by 50% for both normal polyphonic words and Chinese neutral tones. 展开更多
关键词 grapheme-to-phoneme conversion text design Chinese neutral tone speech synthesis
原文传递
用决策树指导TBL进行多音字消歧 被引量:2
2
作者 刘方舟 周游 《计算机工程与应用》 CSCD 北大核心 2011年第12期137-140,共4页
多音字消歧是普通话语音合成系统中字音转换模块的核心问题。选择了常见易错的33个多音字和24个多音词作为研究对象,构建了一个平均每个多音字(词)5000句的语料库,并且提出了一种结合决策树和基于转换的错误驱动的学习(Transformation-B... 多音字消歧是普通话语音合成系统中字音转换模块的核心问题。选择了常见易错的33个多音字和24个多音词作为研究对象,构建了一个平均每个多音字(词)5000句的语料库,并且提出了一种结合决策树和基于转换的错误驱动的学习(Transformation-Basederror-driven Learning,TBL)的混合算法。该方法根据决策树的指导,自动生成TBL算法的模板,避免了手工总结模板这一费时费力的过程。实验结果表明,该方法生成的模板与手工模板性能相当,其平均准确率达90.36%,明显优于决策树。 展开更多
关键词 多音字消歧 字音转换 决策树 基于转换的错误驱动的学习(TBL)
下载PDF
知识与数据驱动相融合的朝鲜语自动标音方法研究
3
作者 曹德智 吴立成 赵悦 《数据与计算发展前沿》 CSCD 2023年第5期164-173,共10页
【应用背景】在朝鲜语语音信息处理的资源建设中,自动标音技术即字音转换技术起着至关重要的作用。目前学界对于字音转换技术的方法主要有基于知识和基于数据两种。【目的】为解决以往仅基于知识驱动的方法难以适应大量数据信息的实际情... 【应用背景】在朝鲜语语音信息处理的资源建设中,自动标音技术即字音转换技术起着至关重要的作用。目前学界对于字音转换技术的方法主要有基于知识和基于数据两种。【目的】为解决以往仅基于知识驱动的方法难以适应大量数据信息的实际情况,导致模型复杂、计算困难等问题;以及仅基于数据驱动的方法依赖高质量数据又难以合理确定输入变量,需要模型特征充足且选取精准等问题。【方法】本文提出了一种知识与数据驱动相融合的朝鲜语自动标音方法。首先根据朝鲜语语音变异规律为基础提取精准的特征属性,获得高质量数据;然后结合数据驱动模型能够较好拟合输入与输出变量之间映射关系的优点,训练学习模型,实现对朝鲜语的自动标音。【结果】通过本文方法,最终标音结果能够兼顾朝鲜语连续语流中音节弱化、脱落、增音、异化等音变现象,并能够准确地获得字素相对应的音素。经交叉测试,该方法使预测模型性能提高,平均正确字音转换率可达94.63%。【结论】利用本文提出的朝鲜语自动标音方法能够有效建立准确的朝鲜语发音字典,有望为朝鲜语语音识别与语音合成等系统提供技术支持。 展开更多
关键词 知识驱动 数据驱动 朝鲜语 语流音变 字音转换
下载PDF
基于音素混淆模型的集外词查询项扩展方法 被引量:1
4
作者 陆梨花 张连海 《信息工程大学学报》 2014年第4期459-465,共7页
为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weighted finite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题。首先由G2P(graphe... 为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weighted finite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题。首先由G2P(grapheme-to-phoneme)模型生成查询项的发音序列,然后利用音素混淆模型将发音序列扩展成N-best发音,以补偿识别错误造成Lattice建立的索引与查询项发音序列之间音素表示差异带来的影响,从而有效降低漏警率。实验结果表明,加入音素混淆模型之后,系统集外词检索性能有明显提升。 展开更多
关键词 集外词查询项扩展 音素混淆模型 加权有限状态转换器 语音查询项检索
下载PDF
基于HMM的缅甸语语音合成系统设计与实现 被引量:9
5
作者 刘梦媛 杨鉴 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第1期19-27,共9页
由于电子化语言资源较为匮乏,缅甸语语音合成的研究相对滞后.针对该问题,以开发缅甸语语音合成应用系统为目的,设计并实现了一个基于HMM的语音合成系统.首先,为了使计算机按输入文本合成出正确的读音,提出并设计了缅甸语的注音方案,其... 由于电子化语言资源较为匮乏,缅甸语语音合成的研究相对滞后.针对该问题,以开发缅甸语语音合成应用系统为目的,设计并实现了一个基于HMM的语音合成系统.首先,为了使计算机按输入文本合成出正确的读音,提出并设计了缅甸语的注音方案,其中重点解决了缅甸语中的变音和变调问题;然后,根据缅甸语的语音特点选取声母及带声调的韵母作为合成基元,并按此设计上下文属性和问题集;最后,基于HTS平台,完整实现了音子自动切分、HMM声学模型训练及语音合成.实验结果表明,该缅甸语语音合成系统具有可行性,可作为后续研究的基线系统. 展开更多
关键词 缅甸语 语音合成 文本注音 音子自动切分 声学模型
下载PDF
基于预训练模型的多音字消歧方法
6
作者 高贝贝 张仰森 《计算机科学》 CSCD 北大核心 2024年第11期273-279,共7页
字音转换是中文语音合成系统(Text-To-Speech,TTS)的重要组成部分,其核心问题是多音字消歧,即在若干候选读音中为多音字选择一个正确的发音。现有的方法通常无法充分理解多音字所在词语的语义,且多音字数据集存在分布不均衡的问题。针... 字音转换是中文语音合成系统(Text-To-Speech,TTS)的重要组成部分,其核心问题是多音字消歧,即在若干候选读音中为多音字选择一个正确的发音。现有的方法通常无法充分理解多音字所在词语的语义,且多音字数据集存在分布不均衡的问题。针对以上问题,提出了一种基于预训练模型RoBERTa的多音字消歧方法CLTRoBERTa(Cross-lingual Translation RoBERTa)。首先联合跨语言互译模块获得多音字所在词语的另一种语言翻译,并将其作为额外特征输入模型以提升对词语的语义理解,然后使用判别微调中的层级学习率优化策略来适应神经网络不同层之间的学习特性,最后结合样本权重模块以解决多音字数据集的分布不均衡问题。CTLRoBERTa平衡了数据集的不均衡分布带来的性能差异,并且在CPP(Chinese Polyphone with Pinyin)基准数据集上取得了99.08%的正确率,性能优于其他基线模型。 展开更多
关键词 多音字消歧 预训练模型 字音转换 跨语言互译 层级学习率 样本权重
下载PDF
蒙古文字母到音素转换方法的研究 被引量:4
7
作者 飞龙 高光来 闫学亮 《计算机应用研究》 CSCD 北大核心 2013年第6期1696-1700,共5页
针对蒙古文字母到音素的转换(grapheme to phoneme conversion,G2P)问题,提出了基于规则的蒙古文G2P转换方法和基于联合序列模型的蒙古文G2P转换方法。实验结果表明,利用联合序列模型的蒙古文G2P转换方法要明显好于基于规则的蒙古文G2P... 针对蒙古文字母到音素的转换(grapheme to phoneme conversion,G2P)问题,提出了基于规则的蒙古文G2P转换方法和基于联合序列模型的蒙古文G2P转换方法。实验结果表明,利用联合序列模型的蒙古文G2P转换方法要明显好于基于规则的蒙古文G2P转换方法。并且建立的基于联合序列模型的蒙古文G2P转换系统的词误识率为16.32%,音素误识率仅为3.37%,能达到实用要求。 展开更多
关键词 蒙古文 字母到音素的转换 联合序列模型 联合多元 联合分割
下载PDF
利用SAMPA实现藏语的字音转换 被引量:3
8
作者 刘博 杨鸿武 +1 位作者 甘振业 郭威彤 《计算机工程与应用》 CSCD 北大核心 2011年第35期117-121,共5页
机读音标SAMPA(Speech Assessment Methods Phonetic Alphabet)即计算机可读的音标,用计算机可读的ASCII字符表示语言的发音。提出了一种藏语的SAMPA标注的设计方案SAMPA-T(Tibetan),以藏语拉萨话为例列出了它们的辅音和元音对应的国际... 机读音标SAMPA(Speech Assessment Methods Phonetic Alphabet)即计算机可读的音标,用计算机可读的ASCII字符表示语言的发音。提出了一种藏语的SAMPA标注的设计方案SAMPA-T(Tibetan),以藏语拉萨话为例列出了它们的辅音和元音对应的国际音标与SAMPA-T标注,并实现了面向SAMPA-T的藏语字音转换,可应用于藏语语音合成等藏语语音信息处理中。 展开更多
关键词 藏语机读音标 机读音标(SAMPA) 字音转换
下载PDF
面向方言语音合成的文本分析研究 被引量:3
9
作者 郭威彤 杨鸿武 +2 位作者 宋继华 顾香 甘振业 《计算机工程》 CAS CSCD 北大核心 2015年第9期184-189,共6页
为实现方言的统计参数语音合成,提出一种从文字到方言读音的文本分析方法。通过对比普通话和方言在声韵母方面的发音异同,设计方言的语音评估方法音标字母(SAMPA),用来标注方言声韵母的读音,得到从普通话读音到方言读音的转换规则。对... 为实现方言的统计参数语音合成,提出一种从文字到方言读音的文本分析方法。通过对比普通话和方言在声韵母方面的发音异同,设计方言的语音评估方法音标字母(SAMPA),用来标注方言声韵母的读音,得到从普通话读音到方言读音的转换规则。对输入的汉语文本进行分析,获得语法词、声母、韵母信息,使用基于转换的错误驱动学习算法获得语句的韵律词和韵律短语边界,利用普通话读音到方言读音的转换规则,获得方言发音的SAMPA音标,从而将输入的文本转换为统计参数语音合成所需的上下文相关标注。测试结果表明,该方法能较为准确地生成上下文相关标注。 展开更多
关键词 文本分析 字音转换 语音评估方法音标字母 语音合成 语法分析
下载PDF
单词自动注音方法的研究 被引量:2
10
作者 李鹏 徐波 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第S1期735-740,共6页
在字母语言的文本到语音(text to speech,TTS)系统和自动语音识别(automatic speech recognition,ASR)系统的实际应用中,由于新词的出现和大量专有名词收集、存储的困难,经常会遇到发音词典中不存在的单词,需要自动对这些单词注音。该... 在字母语言的文本到语音(text to speech,TTS)系统和自动语音识别(automatic speech recognition,ASR)系统的实际应用中,由于新词的出现和大量专有名词收集、存储的困难,经常会遇到发音词典中不存在的单词,需要自动对这些单词注音。该文对各类自动注音方法做了回顾,对自动注音系统中若干关键问题做了简单的介绍。在此基础上,该文给出了一个自动注音系统的实现,对其中若干技术细节对性能的影响做了分析,最后给出了本系统与基于手写规则的方法的对比实验,结果表明前者的单词转换正确率达63%以上,显著优于后者。 展开更多
关键词 信息处理 语音处理 字素音素转换
原文传递
基于神经网络的汉字多音字标音处理方法
11
作者 高健 《番禺职业技术学院学报》 2004年第2期42-45,58,共5页
提出基于神经网络的多音字标音处理方法。该方法具有结构简单、易实现和对汉语知识依赖性不强的特点,而且通过开集测试和闭集测试,证明神经网络解决多音字标音处理具有较高的正确率。
关键词 语音合成 文本分析 多音字标音处理
下载PDF
德语语音合成中的字音转换研究 被引量:1
12
作者 王永生 《计算机工程与应用》 CSCD 北大核心 2009年第35期132-134,共3页
字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字... 字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。 展开更多
关键词 德语语音合成 字音转换 有限状态转录机
下载PDF
字音转换策略介绍及性能代价评估
13
作者 王洁 宋柔 《计算机工程与应用》 CSCD 北大核心 2007年第16期26-29,共4页
许多面向应用的方法研究主要关注的是该方法的技术的性能,而相应的软件开发则要顾及整个系统的性能代价比,即不但要考虑到技术的性能,还要考虑到系统开发过程中的人力投入以及系统实现运行时的存储占用等方面的因素。这就对学术研究提... 许多面向应用的方法研究主要关注的是该方法的技术的性能,而相应的软件开发则要顾及整个系统的性能代价比,即不但要考虑到技术的性能,还要考虑到系统开发过程中的人力投入以及系统实现运行时的存储占用等方面的因素。这就对学术研究提出了另外一个要求,即对方法的实现做出性能代价的评估。探讨了字音转换技术,采用高频默认方法和语境约束方法,给出在不同分词词表背景下的准确率、存储空间占用及人力消耗等统计数据,从而为标音软件的开发提供一定的参考。 展开更多
关键词 字音转换 准确率 性能 代价
下载PDF
面向汉语统计参数语音合成的标注生成方法 被引量:1
14
作者 郝东亮 杨鸿武 +3 位作者 张策 张帅 郭立钊 杨静波 《计算机工程与应用》 CSCD 北大核心 2016年第19期146-153,共8页
针对汉语统计参数语音合成中的上下文相关标注生成,设计了声韵母层、音节层、词层、韵律词层、韵律短语层和语句层6层上下文相关的标注格式。对输入的中文语句进行文本规范并利用语法分析获得语句的结构和分词信息;通过字音转换获得每... 针对汉语统计参数语音合成中的上下文相关标注生成,设计了声韵母层、音节层、词层、韵律词层、韵律短语层和语句层6层上下文相关的标注格式。对输入的中文语句进行文本规范并利用语法分析获得语句的结构和分词信息;通过字音转换获得每个汉字的声韵母及声调;利用TBL(Transformation-Based error driven Learning)算法预测输入文本的韵律词边界和韵律短语边界。在此基础上,获得输入文本中每个汉字的声韵母信息及其上下文结构信息,从而产生统计参数语音合成所需的上下文相关标注。设计了一个以声韵母为合成基元的普通话的基于隐Markov模型(HMM)的统计参数语音合成系统,通过主、客观实验评测了不同标注信息对合成语音音质的影响,结果表明,上下文相关的标注信息越丰富,合成语音的音质越好。 展开更多
关键词 文本分析 语音合成 上下文相关标注 韵律预测 字音转换
下载PDF
基于决策树的德语字素音素转换算法 被引量:1
15
作者 王永生 李立贵 《计算机应用与软件》 北大核心 2019年第1期211-215,共5页
字素音素转换是德语自然语言处理中的难点之一。提出一种基于决策树的字素音素转换的监督学习算法。在一个字素音素平行语料库的基础上,通过决策树进行字素音素转换的监督学习,生成字素音素转换规则。经交叉测试,平均转换正确率可达98. ... 字素音素转换是德语自然语言处理中的难点之一。提出一种基于决策树的字素音素转换的监督学习算法。在一个字素音素平行语料库的基础上,通过决策树进行字素音素转换的监督学习,生成字素音素转换规则。经交叉测试,平均转换正确率可达98. 03%。 展开更多
关键词 德语字素音素转换 自然语言处理 决策树
下载PDF
德语字素音素转换学习语料库的自动生成算法
16
作者 王永生 《计算机应用》 CSCD 北大核心 2008年第B06期7-9,共3页
提出了一种基于迭代的有限状态转录机的字素音素转换学习语料库的自动生成算法,针对一个德语单词及其音标进行基于形态规则和语音规则的迭代,最终将字素和音素完全一一对应起来。经过抽样测试,算法的正确率可以达到98.6%。
关键词 语音合成 字素音素转换 语料库 有限状态转录机
下载PDF
基于循环神经网络的西班牙语词汇发音预测模型研究
17
作者 赵皎谷 马延周 黄晓辉 《计算机科学与应用》 2020年第10期1714-1727,共14页
依据西班牙语词汇和音素的特征以及词汇标音过程的特点,将西班牙语词汇标音过程建模为序列标注任务,提出基于字符嵌入 + 循环神经网络 + 连接时序分类的端到端词汇标音模型。首先利用word2vec框架在自建的西班牙语词库上训练字符嵌入向... 依据西班牙语词汇和音素的特征以及词汇标音过程的特点,将西班牙语词汇标音过程建模为序列标注任务,提出基于字符嵌入 + 循环神经网络 + 连接时序分类的端到端词汇标音模型。首先利用word2vec框架在自建的西班牙语词库上训练字符嵌入向量,从而形成西班牙语字符的分布式向量编码表示;之后基于循环神经网络和连接时序分类算法构建了西班牙语词汇标音模型,并在自建的发音词典语料上进行了训练与测试。试验结果显示,基于字符嵌入 + 循环神经网络 + 连接时序分类的词汇标音模型可以获得较其他统计模型或是神经网络模型更高的标音准确率,同时较传统标音模型有更简单的标注流程,对数据集的要求也要低得多,可有效实现端到端的西班牙语词汇标音任务。 展开更多
关键词 西班牙语 发音词典 字音转换 循环神经网络
下载PDF
字素-音素与词体-尾音对中国人英语语音加工的影响
18
作者 肖晓云 冯聪 高定国 《心理科学》 CSSCI CSCD 北大核心 2009年第3期531-534,539,共5页
研究采用命名任务,探讨了字素-音素对应规则与词体-尾音对应规则在英语假词和中高频真词读音中的作用。结果发现,中国被试同时采用字素-音素对应规则与词体-尾音对应规则命名假词和中高频真词,但是字素-音素对应规则对假词命名更重要。
关键词 字素-音素对应规则 词体-尾音对应规则 英语 中国人
下载PDF
解决多音字字-音转换的一种统计学习方法 被引量:10
19
作者 张子荣 初敏 《中文信息学报》 CSCD 北大核心 2002年第3期39-45,共7页
字 -音转换是语音合成系统中的一个重要模块 ,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题。本文通过对大量标注有正确拼音的语料的统计 ,指出着重解决 4 1个重点多音字和 2 2个重点多音词就可基本解决... 字 -音转换是语音合成系统中的一个重要模块 ,其中多音词和以单字词形式存在的多音字读音的确定一直是个没有很好解决的问题。本文通过对大量标注有正确拼音的语料的统计 ,指出着重解决 4 1个重点多音字和 2 2个重点多音词就可基本解决字 -音转换的问题。本文采用基于扩展的随机复杂度的随机决策列表方法自动提取多音字 (词 )的读音规则 ,将字 -音转换的错误率由 8 8‰降低到 4 4‰。规则的训练和测试的材料的标注是一个耗费人力和时间的工作 ,而训练材料的数量和质量又直接影响最终的结果。本文提出一种半自动的语料标注流程 。 展开更多
关键词 统计学习方法 随机决策列表 字-音转换 多音字 多音词 语言合成系统 语音规则
下载PDF
儿童听写困难研究综述 被引量:3
20
作者 信忠义 朱金卫 《陕西学前师范学院学报》 2013年第3期116-120,共5页
听写困难是儿童学习障碍的一种,是指在没有阅读障碍病史的情况下儿童特定拼写技能明显落后的现象。已有研究发现,听写困难儿童在字形表征、形音联结强度、语音表征、语义表征与听写正常儿童存在着显著差异,未来研究应注重对听写困难纵... 听写困难是儿童学习障碍的一种,是指在没有阅读障碍病史的情况下儿童特定拼写技能明显落后的现象。已有研究发现,听写困难儿童在字形表征、形音联结强度、语音表征、语义表征与听写正常儿童存在着显著差异,未来研究应注重对听写困难纵向发展的研究、制定听写技能的发展常模、探明听写过程中各环节的转换机制和神经生理基础及影响听写活动的相关因素。 展开更多
关键词 听写困难 语音线索 字形表征 字义表征 形音联结
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部