期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于K-L散度的最大后验弧主导的混淆网络生成算法 被引量:4
1
作者 王欢良 韩纪庆 +1 位作者 郑铁然 李海峰 《电子与信息学报》 EI CSCD 北大核心 2008年第5期1109-1112,共4页
为快速生成高质量混淆网络,该文提出一种最大后验弧主导的快速生成算法。它只需遍历一遍Lattice,具有线性时间复杂度。采用K-L散度(Kullback-Leibler Divergence,KLD)来度量弧标号之间的发音相似性,改善了混淆网络生成中弧对齐的准确性... 为快速生成高质量混淆网络,该文提出一种最大后验弧主导的快速生成算法。它只需遍历一遍Lattice,具有线性时间复杂度。采用K-L散度(Kullback-Leibler Divergence,KLD)来度量弧标号之间的发音相似性,改善了混淆网络生成中弧对齐的准确性。实验结果显示,所提算法在生成速度上和Xue的快速算法是可比的,而生成质量更好。通过采用KLD作为弧标号相似性测度,生成混淆网络的质量得到了进一步提高。 展开更多
关键词 语音识别 混淆网络 LATTICE 混淆网络生成 K—L散度
下载PDF
An iterative approach to Bayes risk decoding and system combination 被引量:1
2
作者 Hai-hua XU Jie ZHU 《Journal of Zhejiang University-Science C(Computers and Electronics)》 SCIE EI 2011年第3期204-212,共9页
We describe a novel approach to Bayes risk(BR) decoding for speech recognition,in which we attempt to find the hypothesis that minimizes an estimate of the BR with regard to the minimum word error(MWE) metric.To achie... We describe a novel approach to Bayes risk(BR) decoding for speech recognition,in which we attempt to find the hypothesis that minimizes an estimate of the BR with regard to the minimum word error(MWE) metric.To achieve this,we propose improved forward and backward algorithms on the lattices and the whole procedure is optimized recursively.The remarkable characteristics of the proposed approach are that the optimization procedure is expectation-maximization(EM) like and the formation of the updated result is similar to that obtained with the confusion network(CN) decoding method.Experimental results indicated that the proposed method leads to an error reduction for both lattice rescoring and lattice-based system combinations,compared with CN decoding,confusion network combination(CNC),and ROVER methods. 展开更多
关键词 Bayes risk(BR) confusion network Speech recognition Lattice rescoring System combination
原文传递
基于加权有限状态转换器的语音查询项检索技术 被引量:2
3
作者 陆梨花 张连海 陈琦 《数据采集与处理》 CSCD 北大核心 2015年第2期390-398,共9页
为了提高语音查询项检索效率,提出了一种在加权有限状态转换器(Weighted finite-state transducer,WFST)框架下以混淆网络代替词格建立索引的技术。在索引建立阶段,首先将词格转化为混淆网络并用自动机形式表示,然后利用自动机构建基于... 为了提高语音查询项检索效率,提出了一种在加权有限状态转换器(Weighted finite-state transducer,WFST)框架下以混淆网络代替词格建立索引的技术。在索引建立阶段,首先将词格转化为混淆网络并用自动机形式表示,然后利用自动机构建基于时间的因子转换器,最后将所有因子转换器进行联合及优化得到索引。在查询阶段,将查询项转化为自动机形式后与索引进行合成运算得到表示查询结果的自动机。实验结果表明,在保证系统检测正确率的前提下,与直接以词格建立的WFST索引相比,以混淆网络建立的WFST索引尺寸更小,检索速度更快,因而系统性能更好。 展开更多
关键词 加权有限状态转换器 语音查询项检索 混淆网络 因子转换器
下载PDF
基于分割识别的蒙古语语音关键词检测方法的研究 被引量:2
4
作者 飞龙 高光来 +1 位作者 闫学亮 王炜华 《计算机科学》 CSCD 北大核心 2013年第9期208-211,共4页
蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词。同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降。为了解决LVCSR系统... 蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词。同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降。为了解决LVCSR系统中大多数蒙古文单词的识别问题和蒙古语语音关键词检测系统中大量集外词的检测问题,结合蒙古文的构词特点,提出了基于分割识别的蒙古语LVCSR方法,并建立了对应的声学模型和语言模型。最后,将此方法应用到了蒙古语语音关键词检测系统中并在蒙古语语音语料上进行了测试。实验结果表明,基于分割识别的蒙古语LVCSR方法能解决大部分蒙古文单词的识别问题,并将蒙古语语音关键词检测系统的大量集外词转化成了集内词,大幅度提高了检测系统的查准率和召回率。 展开更多
关键词 蒙古语 词干 结尾后缀 关键词检测 集外词 混淆网络
下载PDF
基于词干的蒙古语语音关键词检测方法的研究 被引量:2
5
作者 飞龙 高光来 王宏伟 《中文信息学报》 CSCD 北大核心 2016年第1期124-128,共5页
为了提高蒙古语语音关键词检测任务中的集内词检测性能,该文结合蒙古文的构词特点提出了基于词干进行检测的蒙古语语音关键词检测方法。首先,该文采用基于分割识别的蒙古语语音识别系统将语音解码成了网格文本,并对网格文本进行了混淆... 为了提高蒙古语语音关键词检测任务中的集内词检测性能,该文结合蒙古文的构词特点提出了基于词干进行检测的蒙古语语音关键词检测方法。首先,该文采用基于分割识别的蒙古语语音识别系统将语音解码成了网格文本,并对网格文本进行了混淆网络的转换;其次,采用关键词的词干部分对混淆网络文本进行了关键词的检测。实验结果表明,基于词干进行检测的蒙古语语音关键词检测方法明显优于基于词混淆网络的蒙古语关键词检测方法,并有效提高了系统的召回率和精确率。 展开更多
关键词 蒙古语 词干 混淆网络 置信度
下载PDF
汉语大词汇量连续语音识别中混淆网络算法的研究
6
作者 吴斌 刘刚 郭军 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2007年第S1期187-190,共4页
在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结果,可以采用最小贝叶斯风险解码策略,通过将识别输出的word lattice转换成为混淆网络以得到最小字错误率... 在汉语大词汇量连续语音识别中,以往基于最大后验概率准则解码得到的识别结果具有最小的句子错误率,为了得到字错误率最小的识别结果,可以采用最小贝叶斯风险解码策略,通过将识别输出的word lattice转换成为混淆网络以得到最小字错误率的识别结果。在以往混淆网络算法的基础上,根据汉语语言的特点,提出一种改进的构造混淆网络的算法。基于863测试语音库进行的实验表明,与最大后验概率识别结果和以前的两种混淆网络算法的识别结果相比,改进的混淆网络算法有效地降低汉语大词汇量连续语音识别结果的字错误率。 展开更多
关键词 最小贝叶斯风险 Levenshtein距离 混淆网络 字错误率 语音识别
下载PDF
结合关键词混淆网络的关键词检出系统 被引量:1
7
作者 张磊 陈晶 +1 位作者 项学智 贾梅梅 《智能系统学报》 2010年第5期432-435,共4页
为了高效地从大词汇量连续语音识别(LVCSR)的多候选中得到关键词结果,保证最小词错误率,提出了将混淆网络的思想应用到关键词检出系统中.在传统混淆网络生成方法基础上,提出一种改进的更加适合于关键词检出的关键词混淆网络作为关键词... 为了高效地从大词汇量连续语音识别(LVCSR)的多候选中得到关键词结果,保证最小词错误率,提出了将混淆网络的思想应用到关键词检出系统中.在传统混淆网络生成方法基础上,提出一种改进的更加适合于关键词检出的关键词混淆网络作为关键词检出的中间结构,该方法只对所有关键词竞争候选生成带有得分标记的关键词混淆网络,突出候选之间竞争关系,并根据得分标记确定关键词.与传统的N-best作为中间结构的关键词检出系统比较,基于混淆网络的关键词检出系统的召回率为87.11%,提高了21.65%.实验表明,在提高召回率的同时,所提方法具有关键词直接定位的特点,因此具有较低的时间开销. 展开更多
关键词 关键词检出 混淆网络 语音识别
下载PDF
基于词与短语的多机器翻译系统融合方法研究 被引量:1
8
作者 何彦青 张均胜 王惠临 《情报学报》 CSSCI 北大核心 2011年第12期1268-1273,共6页
多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题。常用的多机器翻译系统融合技术可以分为句子级、短语级和词级融合。在对不同级别的系统融... 多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题。常用的多机器翻译系统融合技术可以分为句子级、短语级和词级融合。在对不同级别的系统融合技术进行分析的基础上,本文提出基于词和短语的多机器翻译系统融合方法。首先,采用词级的系统融合技术构建混淆网络,将混淆网络转化为短语表。然后,基于该短语表利用短语级的系统融合技术中的再解码方法进行混淆网络解码生成融合结果。该方法既保证了融合系统所构建的混淆网络的最大可能性,又可以利用更多的特征进行混淆网络解码。我们将基于词和短语的多机器翻译系统融合方法在两个测试集上分别实验并进行比较,获得了较为满意的翻译效果。 展开更多
关键词 机器翻译 系统融合 混淆网络
下载PDF
基于Lattice分段的高质量混淆网络快速生成方法
9
作者 王欢良 韩纪庆 《高技术通讯》 EI CAS CSCD 北大核心 2010年第5期473-480,共8页
针对现有混淆网络生成方法难以兼顾速度和质量的问题,研究了基于横断一致性的Lattice分段方法和基于最大置信度的Lattice分段方法,研究了用这两种Lattice分段方法来减少对混淆网络质量的影响。提出了一种基于Lattice分段的高质量混淆网... 针对现有混淆网络生成方法难以兼顾速度和质量的问题,研究了基于横断一致性的Lattice分段方法和基于最大置信度的Lattice分段方法,研究了用这两种Lattice分段方法来减少对混淆网络质量的影响。提出了一种基于Lattice分段的高质量混淆网络快速生成方法。该方法把原始大规模Lattice分割成小尺寸的Lattice,分别生成混淆网络,从而可减小计算规模,提高网络生成速度。同时通过分段数目来调节速度和质量之间的平衡。实验结果显示,与词聚类算法相比,所提方法显著提高了混淆网络的生成速度,而对混淆网络质量影响很小。从解码性能看,在相同速度下所提方法获得了比采用剪枝的词聚类算法更低的错误率。 展开更多
关键词 混淆网络(CN) LATTICE 多候选 语音识别
下载PDF
基于音素混淆网络的蒙古语语音关键词检测方法的研究
10
作者 飞龙 高光来 鲍玉来 《中文信息学报》 CSCD 北大核心 2015年第1期178-182,共5页
蒙古语语音识别系统的词表很难覆盖所有的蒙古文单词,并且随着社会的发展,蒙古文的新词和外来词也越来越多。为了解决蒙古语语音关键词检测系统中的集外词检测问题,该文提出了基于音素混淆网络的蒙古语语音关键词检测方法,并采用音素混... 蒙古语语音识别系统的词表很难覆盖所有的蒙古文单词,并且随着社会的发展,蒙古文的新词和外来词也越来越多。为了解决蒙古语语音关键词检测系统中的集外词检测问题,该文提出了基于音素混淆网络的蒙古语语音关键词检测方法,并采用音素混淆矩阵改进了关键词的置信度计算方法。实验结果表明,基于音素混淆网络的蒙古语语音关键词检测方法可以较好地解决集外词的检测问题。蒙古语语音关键词检测系统采用改进的置信度计算方法后精确率提高了6%,召回率提高了2.69%,性能得到明显的提升。 展开更多
关键词 蒙古语 关键词检测 集外词 混淆网络 音素混淆矩阵
下载PDF
一种汉字混淆网络算法
11
作者 吴斌 孙成立 +1 位作者 刘刚 郭军 《数据采集与处理》 CSCD 北大核心 2008年第4期404-409,共6页
在普通话大词汇量连续语音识别中,使用最大后验概率决策规则解码得到的是具有最小句子错误率的识别结果,但是本文通常使用字错误率作为识别结果的评测标准。为了使识别结果具有最小字错误率,在充分考虑汉语语言特点的基础上,提出了一种... 在普通话大词汇量连续语音识别中,使用最大后验概率决策规则解码得到的是具有最小句子错误率的识别结果,但是本文通常使用字错误率作为识别结果的评测标准。为了使识别结果具有最小字错误率,在充分考虑汉语语言特点的基础上,提出了一种汉字混淆网络算法。这种算法能够有效地将普通话大词汇量连续语音识别系统输出的词格转换成为汉字混淆网络。详细讨论了最小贝叶斯风险决策规则理论及使用汉字混淆网络进行的解码过程。基于2005 HTRDP(863)评测数据集进行的实验结果表明,这种使用汉语字混淆网络的方法有效地降低了普通话大词汇量连续语音识别结果的字错误率。 展开更多
关键词 语音识别 字错误率 最小贝叶斯风险决策规则 混淆网络
下载PDF
汉语音节混淆网络的生成与重打分算法研究
12
作者 尹明明 李弼程 +1 位作者 屈丹 牛铜 《小型微型计算机系统》 CSCD 北大核心 2012年第6期1385-1388,共4页
针对目前混淆网络生成算法速度与精度不能兼顾的不足,提出一种新的汉语音节混淆网络生成的方法.本算法采用类似轴对齐算法,对音节网格每次提取一条局部路径与参考路径对齐,根据每次对齐路径与参考路径长度不同,采用不同的策略生成混淆网... 针对目前混淆网络生成算法速度与精度不能兼顾的不足,提出一种新的汉语音节混淆网络生成的方法.本算法采用类似轴对齐算法,对音节网格每次提取一条局部路径与参考路径对齐,根据每次对齐路径与参考路径长度不同,采用不同的策略生成混淆网络,并在生成混淆网络之后对其应用一种新的解码框架进行重打分.实验表明,该算法生成的混淆网络精度较高,时间复杂度优于轴对齐算法,且重打分后的识别率有显著提高. 展开更多
关键词 混淆网络 音节网格 语音识别 最小词错误解码 重打分
下载PDF
触发式语言模型下的混淆网络解码方法
13
作者 杨春风 王欢良 《计算机工程与应用》 CSCD 北大核心 2011年第10期127-130,共4页
将触发式语言模型应用于混淆网络解码过程来提高汉字识别率。为了利用词间的长距离依赖信息,提出了基于词义类对触发式语言模型的混淆网络解码方法。实验结果显示,该方法可以使汉字错误率相对下降7.9%。
关键词 语音识别 触发式语言模型 混淆网络
下载PDF
混淆网络在音频文档检索系统中的应用研究
14
作者 孙成立 《计算机工程与应用》 CSCD 北大核心 2010年第28期138-140,145,共4页
给出了一个基于音节混淆网络的语音文档内容检索系统,提出了一种基于两阶段解码的查询自动扩展方法,首先通过Viterbi解码算法在混淆音节网格上计算混淆音节的似然得分,然后利用A*解码算法从音节格上产生易混淆的扩展项,扩展项由其置信... 给出了一个基于音节混淆网络的语音文档内容检索系统,提出了一种基于两阶段解码的查询自动扩展方法,首先通过Viterbi解码算法在混淆音节网格上计算混淆音节的似然得分,然后利用A*解码算法从音节格上产生易混淆的扩展项,扩展项由其置信得分与阈值的比较自动产生。实验结果显示该方法能够有效提高系统的检出率。 展开更多
关键词 关键词识别 混淆网络 查询扩展 音节相似度
下载PDF
机器翻译系统融合技术综述 被引量:16
15
作者 李茂西 宗成庆 《中文信息学报》 CSCD 北大核心 2010年第4期74-84,118,共12页
该文对机器翻译研究中的系统融合方法进行了全面综述和分析。根据在多系统输出结果的基础上进行融合的层次差异,我们将系统融合方法分为三类:句子级系统融合、短语级系统融合和词汇级系统融合。然后,针对这三种融合方法,该文分别介绍了... 该文对机器翻译研究中的系统融合方法进行了全面综述和分析。根据在多系统输出结果的基础上进行融合的层次差异,我们将系统融合方法分为三类:句子级系统融合、短语级系统融合和词汇级系统融合。然后,针对这三种融合方法,该文分别介绍了它们各自具有代表性的研究工作,包括实现方法、置信度估计和解码算法等,并着重阐述了近年来使用广泛的词汇级系统融合方法中用于构造混淆网络的词对齐技术。最后,该文对这三类系统融合方法进行了比较、总结和展望。 展开更多
关键词 人工智能 机器翻译 系统融合 最小贝叶斯风险解码 混淆网络解码 词对齐
下载PDF
基于WordNet词义消歧的系统融合 被引量:12
16
作者 刘宇鹏 李生 赵铁军 《自动化学报》 EI CSCD 北大核心 2010年第11期1575-1580,共6页
最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了... 最近混淆网络在融合多个机器翻译结果中展示很好的性能.然而为了克服在不同的翻译系统中不同的词序,假设对齐在混淆网络的构建上仍然是一个重要的问题.但以往的对齐方法都没有考虑到语义信息.本文为了更好地改进系统融合的性能,提出了用词义消歧(Word sense disambiguation,WSD)来指导混淆网络中的对齐.同时骨架翻译的选择也是通过计算句子间的相似度来获得的,句子的相似性计算使用了二分图的最大匹配算法.为了使得基于WordNet词义消歧方法融入到系统中,本文将翻译错误率(Translation error rate,TER)算法进行了改进,实验结果显示本方法的性能好于经典的TER算法的性能. 展开更多
关键词 系统融合 翻译错误率 词义消歧 混淆网络
下载PDF
基于混淆网络解码的机器翻译多系统融合 被引量:3
17
作者 杜金华 魏玮 徐波 《中文信息学报》 CSCD 北大核心 2008年第4期48-54,共7页
在对当前几种较流行的统计机器翻译多系统融合方法分析的基础上,提出了一种改进的多系统融合框架,该框架集成了最小贝叶斯风险解码和多特征混淆网络解码两种技术。融合过程如下:(1)从多个翻译系统输出的-best结果中,利用最小贝叶斯风险... 在对当前几种较流行的统计机器翻译多系统融合方法分析的基础上,提出了一种改进的多系统融合框架,该框架集成了最小贝叶斯风险解码和多特征混淆网络解码两种技术。融合过程如下:(1)从多个翻译系统输出的-best结果中,利用最小贝叶斯风险解码器选择一个风险最小的假设作为对齐参考;(2)将其余的-best假设结果与该参考对齐,从而构建混淆网络。多特征混淆网络基于对数线性模型,引入了更多有效的知识源参与最优路径选择,融合后的BLEU得分比融合前最好的单系统BLEU得分提高了2.19%。在对齐方法上,我们提出了一种改进的翻译错误率(Translation Error Rate,TER)准则——GIZA-TER准则,该准则可以对CN网络进行更有效的短语调序。实验中的显著性检验证明了本文方法的有效性。 展开更多
关键词 人工智能 机器翻译 多系统融合 最小贝叶斯风险解码 多特征混淆网络 GIZA—TER
下载PDF
维吾尔语语音检索技术研究 被引量:3
18
作者 张力文 努尔麦麦提.尤鲁瓦斯 吾守尔.斯拉木 《中文信息学报》 CSCD 北大核心 2014年第5期182-186,197,共6页
随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义。目前研究人员对针对英语和汉语的语音检索技术进行了深入的研究,而针对维吾尔语的语音检索技术还处于起步阶段。该文对维吾尔语... 随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义。目前研究人员对针对英语和汉语的语音检索技术进行了深入的研究,而针对维吾尔语的语音检索技术还处于起步阶段。该文对维吾尔语语音关键词检索技术进行了研究并采用了大词汇量连续语音识别、利用聚类算法将多候选词图转换为混淆网络、倒排索引、置信度以及相关度的计算等技术和方法,对维吾尔语语音检索系统进行了研究与搭建。最后在测试集上对该系统进行测试,测试结果显示,在语音识别正确率为82.1%的情况下,检索系统的召回率分别达到97.0%和79.1%时,虚警率分别为13.5%和8.5%。 展开更多
关键词 维吾尔语 语音检索 语音识别 词图 混淆网络 倒排索引
下载PDF
Investigation of Improved Approaches to Bayes Risk Decoding
19
作者 徐海华 朱杰 《Journal of Shanghai Jiaotong university(Science)》 EI 2011年第5期524-529,共6页
Bayes risk (BR) decoding methods have been widely investigated in the speech recognition area due to its flexibility and complexity compared with the maximum a posteriori (MAP) method regarding to minimum word error (... Bayes risk (BR) decoding methods have been widely investigated in the speech recognition area due to its flexibility and complexity compared with the maximum a posteriori (MAP) method regarding to minimum word error (MWE) optimization. This paper investigates two improved approaches to the BR decoding, aiming at minimizing word error. The novelty of the proposed methods is shown in the explicit optimization of the objective function, the value of which is calculated by an improved forward algorithm on the lattice. However, the result of the first method is obtained by an expectation maximization (EM) like iteration, while the result of the second one is achieved by traversing the confusion network (CN), both of which lead to an optimized objective function value with distinct approaches. Experimental results indicate that the proposed methods result in an error reduction for lattice rescoring, compared with the traditional CN method for lattice rescoring. 展开更多
关键词 Bayes risk (BR) confusion network (CN) speech recognition lattice rescoring
原文传递
多策略的增量TER指导系统融合
20
作者 刘宇鹏 李生 赵铁军 《高技术通讯》 CAS CSCD 北大核心 2011年第10期1042-1047,共6页
针对词一级的混淆网络(CN)构建的对齐方法和骨架翻译选择的问题进行了研究。将增量的对齐方法引入到原有的翻译错误率(TER)对齐框架中,并对加入候选翻译的顺序进行了不同的尝试;同时选用两种最小贝叶斯风险(MBR)策略来选择骨架... 针对词一级的混淆网络(CN)构建的对齐方法和骨架翻译选择的问题进行了研究。将增量的对齐方法引入到原有的翻译错误率(TER)对齐框架中,并对加入候选翻译的顺序进行了不同的尝试;同时选用两种最小贝叶斯风险(MBR)策略来选择骨架翻译;为了改进TER中同义词的对齐,进行了同义词匹配。在实验中,把候选翻译的顺序、选择骨架翻译方法、是否引入同义词这三种策略进行了组合。匹配数据显示,可以确定一种组合策略来最大地提高系统融合性能。 展开更多
关键词 系统融合 最小贝叶斯风险(MBR) 翻译错误率(TER) 增量对齐 混淆网络(CN)
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部