期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于wav2vec预训练的样例关键词识别 被引量:5
1
作者 李昭奇 黎塔 《计算机科学》 CSCD 北大核心 2022年第1期59-64,共6页
样例关键词识别是将语音关键词片段与语音流中的片段匹配的任务。在低资源或零资源的情况下,样例关键词识别通常采用基于动态时间规正的方法。近年来,神经网络声学词嵌入已成为一种常用的样例关键词识别方法,但神经网络的方法受限于标... 样例关键词识别是将语音关键词片段与语音流中的片段匹配的任务。在低资源或零资源的情况下,样例关键词识别通常采用基于动态时间规正的方法。近年来,神经网络声学词嵌入已成为一种常用的样例关键词识别方法,但神经网络的方法受限于标注数据数量。使用wav2vec预训练可以减少神经网络对数据量的依赖,提升系统的性能。使用wav2vec模型提取的预训练特征直接替换梅尔频率倒谱系数特征后,在SwitchBoard语料库中提取的数据集上使双向长短时记忆网络的神经网络声学词嵌入系统的平均准确率提高了11.1%,等精度召回值提高了10.0%。将wav2vec特征与梅尔频率倒谱系数特征相融合以提取嵌入向量的方法进一步提高了系统的性能,与仅使用wav2vec的方法相比,融合方法的平均准确率提高了5.3%,等精度召回值提高了2.5%。 展开更多
关键词 声学词嵌入 孤立词识别 wav2vec预训练 样例查询 语音片段查询
下载PDF
基于多尺度距离矩阵的语音关键词检测与细粒度定位方法
2
作者 李祥瑞 毛启容 《计算机应用研究》 CSCD 北大核心 2024年第11期3370-3375,共6页
针对现有语音关键词检测方法定位精度低的问题,提出了一种基于多尺度距离矩阵的语音关键词检测与细粒度定位方法(spoken term detection and fine-grained localization method based on multi-scale distance matrices,MF-STD)。该方... 针对现有语音关键词检测方法定位精度低的问题,提出了一种基于多尺度距离矩阵的语音关键词检测与细粒度定位方法(spoken term detection and fine-grained localization method based on multi-scale distance matrices,MF-STD)。该方法首先利用残差卷积网络提取特征并构建距离矩阵以建模输入之间的相关性;其次通过多尺度分割和解耦头学习不同尺度下的定位信息;最后根据多尺度加权定位损失、置信度损失和分类损失优化模型,实现对关键词存在性和时域边界的细粒度预测。在LibriSpeech数据集上的实验结果表明,MF-STD在集内词的检测中,精准率和交并比分别达到97.1%和88.6%;在集外词的检测中,精准率和交并比分别达到96.7%和88.2%。与现有的语音关键词检测与定位方法相比,MF-STD的检测准确率和定位精度显著提升,充分证明该方法的先进性,也证明了多尺度特征建模与细粒度定位约束在语音关键词检测任务中的有效性。 展开更多
关键词 语音关键词检测 语音细粒度定位 多尺度检测 残差卷积网络
下载PDF
Term-Dependent Confidence Normalisation for Out-of-Vocabulary Spoken Term Detection 被引量:2
3
作者 Javier Tejedo Simon King Joe Frankel 《Journal of Computer Science & Technology》 SCIE EI CSCD 2012年第2期358-375,共18页
An important component of a spoken term detection (STD) system involves estimating confidence measures of hypothesised detections.A potential problem of the widely used lattice-based confidence estimation,however,is... An important component of a spoken term detection (STD) system involves estimating confidence measures of hypothesised detections.A potential problem of the widely used lattice-based confidence estimation,however,is that the confidence scores are treated uniformly for all search terms,regardless of how much they may differ in terms of phonetic or linguistic properties.This problem is particularly evident for out-of-vocabulary (OOV) terms which tend to exhibit high intra-term diversity.To address the impact of term diversity on confidence measures,we propose in this work a term-dependent normalisation technique which compensates for term diversity in confidence estimation.We first derive an evaluation-metric-oriented normalisation that optimises the evaluation metric by compensating for the diverse occurrence rates among terms,and then propose a linear bias compensation and a discriminative compensation to deal with the bias problem that is inherent in lattice-based confidence measurement and from which the Term Specific Threshold (TST) approach suffers.We tested the proposed technique on speech data from the multi-party meeting domain with two state-ofthe-art STD systems based on phonemes and words respectively.The experimental results demonstrate that the confidence normalisation approach leads to a significant performance improvement in STD,particularly for OOV terms with phonemebased systems. 展开更多
关键词 confidence estimation discriminative model spoken term detection speech recognition
原文传递
低资源语言的无监督语音关键词检测技术综述 被引量:3
4
作者 杨鹏 谢磊 张艳宁 《中国图象图形学报》 CSCD 北大核心 2015年第2期211-218,共8页
目的低资源(low-resource)语言的无监督的关键词检测技术近年来引起了广泛的研究兴趣。低资源语言由于缺乏足够的标注数据及相关的专家知识,使得传统的基于大词汇量语音识别系统的关键词检测技术无法使用。近年来,研究者试图寻找一种无... 目的低资源(low-resource)语言的无监督的关键词检测技术近年来引起了广泛的研究兴趣。低资源语言由于缺乏足够的标注数据及相关的专家知识,使得传统的基于大词汇量语音识别系统的关键词检测技术无法使用。近年来,研究者试图寻找一种无监督的技术来完成针对低资源语言的语音关键词检测。方法首先阐述了该技术目前面临的问题与挑战,然后介绍了该技术使用的主流的基于动态时间规整的算法框架,并从特征表示、模板匹配方法、效率提升等几个重要方面介绍了近几年来主要的研究成果,最后介绍了该任务常用的系统评价标准及目前所能达到的水平,讨论了未来可能的研究方向。结果该任务的研究目前取得了很多成果,但仍处于实验室阶段,多系统融合策略导致系统庞大,而且目前还没有好的进行索引的方法,导致检测时间过长,对于低资源语音的关键词检测技术,还有很多研究工作要做。结论期望通过对目前低资源语言的无监督的关键词检测技术做出一个全面的综述,从而给研究者的工作带来便利。 展开更多
关键词 语音关键词检测 低资源 动态时间规整
原文传递
基于音素后验概率的样例语音关键词检测方法 被引量:3
5
作者 张卫强 宋贝利 +1 位作者 蔡猛 刘加 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第9期757-760,共4页
低资源条件下的语音关键词检测是一个具有挑战性的问题,因为传统的基于大词汇量连续语音识别(LVCSR)的语音关键词检测方法不再适用.针对此问题提出了一种基于深度神经网络(DNN)输出层后验概率特征和改进的动态时间规整(DTW)算法的语音... 低资源条件下的语音关键词检测是一个具有挑战性的问题,因为传统的基于大词汇量连续语音识别(LVCSR)的语音关键词检测方法不再适用.针对此问题提出了一种基于深度神经网络(DNN)输出层后验概率特征和改进的动态时间规整(DTW)算法的语音关键词检测方法.采用无监督高斯混合模型(GMM)和中、英文DNN音素模型得出的输入特征构建互补的子系统,并在SWS2013多语种数据集上进行实验.结果表明:相对于基线系统,分数层面的多语种、多系统融合能够有效地提升语音关键词检测系统的性能. 展开更多
关键词 样例查询 语音关键词检测 DNN输出层特征 动态时间规整
下载PDF
面向海量数据的语音敏感信息检测系统 被引量:2
6
作者 李伟 吴及 吕萍 《信息工程大学学报》 2010年第5期544-548,共5页
为了解决海量数据条件下敏感语音信息检测的问题,设计并实现了一个面向内容的语音检索系统。该系统采用先进的语音识别、语音搜索技术,可以快速、准确地在海量数据中搜索需要的敏感词汇。系统可以作为海量音频条件下信息监测、控制的重... 为了解决海量数据条件下敏感语音信息检测的问题,设计并实现了一个面向内容的语音检索系统。该系统采用先进的语音识别、语音搜索技术,可以快速、准确地在海量数据中搜索需要的敏感词汇。系统可以作为海量音频条件下信息监测、控制的重要辅助手段。实验证明,系统具有灵活的配制能力与较高的搜索性能。 展开更多
关键词 语音搜索 语音识别 关键词检测
下载PDF
基于加权有限状态转换器的语音查询项检索技术 被引量:2
7
作者 陆梨花 张连海 陈琦 《数据采集与处理》 CSCD 北大核心 2015年第2期390-398,共9页
为了提高语音查询项检索效率,提出了一种在加权有限状态转换器(Weighted finite-state transducer,WFST)框架下以混淆网络代替词格建立索引的技术。在索引建立阶段,首先将词格转化为混淆网络并用自动机形式表示,然后利用自动机构建基于... 为了提高语音查询项检索效率,提出了一种在加权有限状态转换器(Weighted finite-state transducer,WFST)框架下以混淆网络代替词格建立索引的技术。在索引建立阶段,首先将词格转化为混淆网络并用自动机形式表示,然后利用自动机构建基于时间的因子转换器,最后将所有因子转换器进行联合及优化得到索引。在查询阶段,将查询项转化为自动机形式后与索引进行合成运算得到表示查询结果的自动机。实验结果表明,在保证系统检测正确率的前提下,与直接以词格建立的WFST索引相比,以混淆网络建立的WFST索引尺寸更小,检索速度更快,因而系统性能更好。 展开更多
关键词 加权有限状态转换器 语音查询项检索 混淆网络 因子转换器
下载PDF
基于分割识别的蒙古语语音关键词检测方法的研究 被引量:2
8
作者 飞龙 高光来 +1 位作者 闫学亮 王炜华 《计算机科学》 CSCD 北大核心 2013年第9期208-211,共4页
蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词。同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降。为了解决LVCSR系统... 蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词。同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降。为了解决LVCSR系统中大多数蒙古文单词的识别问题和蒙古语语音关键词检测系统中大量集外词的检测问题,结合蒙古文的构词特点,提出了基于分割识别的蒙古语LVCSR方法,并建立了对应的声学模型和语言模型。最后,将此方法应用到了蒙古语语音关键词检测系统中并在蒙古语语音语料上进行了测试。实验结果表明,基于分割识别的蒙古语LVCSR方法能解决大部分蒙古文单词的识别问题,并将蒙古语语音关键词检测系统的大量集外词转化成了集内词,大幅度提高了检测系统的查准率和召回率。 展开更多
关键词 蒙古语 词干 结尾后缀 关键词检测 集外词 混淆网络
下载PDF
基于特征空间轨迹信息的语音关键词检测方法 被引量:1
9
作者 田颖慧 贺前华 +2 位作者 郑若伟 危卓 李艳雄 《电子学报》 EI CAS CSCD 北大核心 2023年第10期2915-2924,共10页
当前语音关键词检测的主流技术为深度学习,需要大规模标注样本进行训练,难以应用于更普遍的低资源场景.本文提出一种基于音频特征空间轨迹信息的低资源语音关键词检测方法,该方法基于“词是由更小语言单元(音节、音素)的结构化组成,以... 当前语音关键词检测的主流技术为深度学习,需要大规模标注样本进行训练,难以应用于更普遍的低资源场景.本文提出一种基于音频特征空间轨迹信息的低资源语音关键词检测方法,该方法基于“词是由更小语言单元(音节、音素)的结构化组成,以及语言单元声学特征具有稳定性(统计意义)”的事实,结合物理几何空间定位的原理,构建语音关键词的特征空间表达、时序信息表达和局部区分信息知识.语音关键词检测时,依据语音段的特征空间轨迹信息分层次进行判决,实现了模式信息与统计信息的综合应用.其中语音特征空间是利用丰富的无标注语音样本构建音频特征空间的标识子表达,而语音关键词的特征空间轨迹信息利用少量关键词语音样本构建.多个实验结果表明,本文算法在低资源时(100个样本以下),相比HMM和CRNN有显著优势,10个训练样本时,相比HMM,FRR绝对下降了20.5%,FAR绝对下降了8.7 FP/h;而在训练样本量较充分(300个样本及以上)时,与CRNN有大致相当的性能. 展开更多
关键词 语音关键词检测 音频特征空间 特征空间轨迹信息 低资源
下载PDF
基于非均匀MCE准则的DNN关键词检测系统中声学模型的训练 被引量:1
10
作者 王朝松 韩纪庆 郑铁然 《智能计算机与应用》 2015年第5期15-17,21,共4页
关键词检测是从连续语音流中检测预先定义的给定词的技术,是语音识别领域的一个重要应用。目前的关键词检测研究中,主流的方法是基于连续语音识别器的先识别后检测的两阶段方法,语音识别器的准确率对关键词检测有很大影响。本文首先在... 关键词检测是从连续语音流中检测预先定义的给定词的技术,是语音识别领域的一个重要应用。目前的关键词检测研究中,主流的方法是基于连续语音识别器的先识别后检测的两阶段方法,语音识别器的准确率对关键词检测有很大影响。本文首先在识别阶段引入深度学习技术来改善关键词检测算法的性能。进而针对识别阶段和检测阶段缺乏紧密联系,耦合度不够的问题,研究了侧重关键词的深度神经网络声学建模技术,利用非均匀的最小分类错误准则来调整深度神经网络声学建模中的参数,并利用Ada Boost算法来动态调整声学建模中的关键词权重。结果表明,利用非均匀最小分类错误准则来调整深度神经网络参数进行优化的声学模型,可以提高关键词检测的性能。 展开更多
关键词 深度学习 关键词检测 ADA BOOST 最小分类错误
下载PDF
基于音素混淆模型的集外词查询项扩展方法 被引量:1
11
作者 陆梨花 张连海 《信息工程大学学报》 2014年第4期459-465,共7页
为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weighted finite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题。首先由G2P(graphe... 为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weighted finite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题。首先由G2P(grapheme-to-phoneme)模型生成查询项的发音序列,然后利用音素混淆模型将发音序列扩展成N-best发音,以补偿识别错误造成Lattice建立的索引与查询项发音序列之间音素表示差异带来的影响,从而有效降低漏警率。实验结果表明,加入音素混淆模型之后,系统集外词检索性能有明显提升。 展开更多
关键词 集外词查询项扩展 音素混淆模型 加权有限状态转换器 语音查询项检索
下载PDF
语音关键词检测中置信测度方法研究综述
12
作者 李海洋 韩纪庆 +1 位作者 郑贵滨 郑铁然 《智能计算机与应用》 2014年第2期10-15,共6页
语音关键词检测是指在语音文档中寻找并定位特定的词的技术,输入所需查询的关键词通常是以文本的形式给出。作为语音文档分析等技术的核心部分,语音关键词检测始终是语音处理领域研究的热点。置信测度计算是关键词检测技术的重要组成部... 语音关键词检测是指在语音文档中寻找并定位特定的词的技术,输入所需查询的关键词通常是以文本的形式给出。作为语音文档分析等技术的核心部分,语音关键词检测始终是语音处理领域研究的热点。置信测度计算是关键词检测技术的重要组成部分,对确认正确检出的关键词及拒绝误识都起到决定性作用,置信测度的优劣对检测系统性能有着直接的影响。介绍并总结了语音关键词检测中测置信测度方法的研究工作,提供了详尽的参考文献。 展开更多
关键词 检测 置信测度 词表外词
下载PDF
一种基于改进得分分布的查询项特定阈值方法
13
作者 陆梨花 张连海 《模式识别与人工智能》 EI CSCD 北大核心 2015年第5期437-442,共6页
为提高语音查询项检索系统的准确率,提出一种基于改进得分分布的查询项特定阈值方法.在系统判决阶段,根据每个查询项的后验得分分布设定不同阈值.后验得分分布用指数混合模型描述,通过无监督的最大期望(EM)算法估计模型参数,最后根据贝... 为提高语音查询项检索系统的准确率,提出一种基于改进得分分布的查询项特定阈值方法.在系统判决阶段,根据每个查询项的后验得分分布设定不同阈值.后验得分分布用指数混合模型描述,通过无监督的最大期望(EM)算法估计模型参数,最后根据贝叶斯最小风险准则计算阈值.针对EM算法对初始值较为敏感的问题,初始化时采用K-means聚类算法代替随机初始化方法,首先将候选结果得分分为两类,然后计算每类的先验分布并用最大似然法估计模型参数的初始值.实验结果表明该阈值方法有更好的检索性能. 展开更多
关键词 得分分布 查询项特定阈值 K-MEANS聚类 语音查询项检索
下载PDF
基于音素混淆网络的蒙古语语音关键词检测方法的研究
14
作者 飞龙 高光来 鲍玉来 《中文信息学报》 CSCD 北大核心 2015年第1期178-182,共5页
蒙古语语音识别系统的词表很难覆盖所有的蒙古文单词,并且随着社会的发展,蒙古文的新词和外来词也越来越多。为了解决蒙古语语音关键词检测系统中的集外词检测问题,该文提出了基于音素混淆网络的蒙古语语音关键词检测方法,并采用音素混... 蒙古语语音识别系统的词表很难覆盖所有的蒙古文单词,并且随着社会的发展,蒙古文的新词和外来词也越来越多。为了解决蒙古语语音关键词检测系统中的集外词检测问题,该文提出了基于音素混淆网络的蒙古语语音关键词检测方法,并采用音素混淆矩阵改进了关键词的置信度计算方法。实验结果表明,基于音素混淆网络的蒙古语语音关键词检测方法可以较好地解决集外词的检测问题。蒙古语语音关键词检测系统采用改进的置信度计算方法后精确率提高了6%,召回率提高了2.69%,性能得到明显的提升。 展开更多
关键词 蒙古语 关键词检测 集外词 混淆网络 音素混淆矩阵
下载PDF
多流信息融合的集外词检索
15
作者 熊世富 郭武 《数据采集与处理》 CSCD 北大核心 2014年第2期274-279,共6页
针对关键词中的集外词检索任务,提出采用音素、音节、词片三种子词单元进行多流信息的联合检索算法,其中对基于音素的语音检索(Spoken term detection,STD)系统使用基于n元语言模型-加权有限状态机的完全匹配检索降低漏警,对基于音节、... 针对关键词中的集外词检索任务,提出采用音素、音节、词片三种子词单元进行多流信息的联合检索算法,其中对基于音素的语音检索(Spoken term detection,STD)系统使用基于n元语言模型-加权有限状态机的完全匹配检索降低漏警,对基于音节、词片的STD系统使用模糊匹配检索降低虚警,最后采用线性逻辑回归(Linear logistic regression,LLR)的算法将三个子系统的结果进行融合。在NIST STD 2006语音检索评测的英语电话会话语音测试集上的实验结果表明,相对于最好的单流系统,多流信息融合获得了12%的实际词项权重值(Actual term weighted value,ATWV)相对提升。 展开更多
关键词 语音检索 集外词 加权有限状态机
下载PDF
汉语语言集外词检索算法的改进研究
16
作者 王旭阳 张鹏远 +1 位作者 潘接林 颜永红 《网络新媒体技术》 2014年第4期30-32,共3页
针对汉语语音关键词检索任务中的集外词检索提出了一种基于局部声学信息的改进算法。在汉语语音识别和语音关键词检索任务中,由于集外词可以由词典内部的字词组合而成,因而通常认为不存在类似英文等语言中的集外词检索的问题。然而,由... 针对汉语语音关键词检索任务中的集外词检索提出了一种基于局部声学信息的改进算法。在汉语语音识别和语音关键词检索任务中,由于集外词可以由词典内部的字词组合而成,因而通常认为不存在类似英文等语言中的集外词检索的问题。然而,由于数据稀疏问题,集外词在语言模型上建模不够充分,导致解码过程中难以存留下包含集外词的路径。本文根据深度神经网络在声学模型上建模的准确性,提出了在解码过程中利用令牌保存的局部声学信息以保留那些局部声学概率高而即将被剪枝掉的令牌,从而在词图中保留下来包含集外词的路径,提高集外词检索的召回率;然后再利用关键词置信度重估技术提高集外词检索的精度。实验表明,利用解码过程中的局部声学信息可以提高集外词检索的性能,召回率相对于基线系统有10%的绝对提高;在高精度区,使用置信度重估后本文提出的方法同样取得显著提高。 展开更多
关键词 检索 集外词 令牌传递 置信度重估
下载PDF
语音查询项检索中的两阶段得分规整方法
17
作者 李鹏 屈丹 《模式识别与人工智能》 EI CSCD 北大核心 2016年第3期216-222,共7页
得分规整为语音查询项检索系统中的必要过程,文中提出两阶段得分规整方法.先引入rank-p和relativeto-max这2个特征至区分性得分规整方法中,使正确候选结果和错误候选结果的置信度得分区分性更大,更易进行关键词确认.再应用基于优化查询... 得分规整为语音查询项检索系统中的必要过程,文中提出两阶段得分规整方法.先引入rank-p和relativeto-max这2个特征至区分性得分规整方法中,使正确候选结果和错误候选结果的置信度得分区分性更大,更易进行关键词确认.再应用基于优化查询项权重代价指标的得分规整方法得到最优的语音查询项检索性能.实验表明,文中方法同时利用区分性和基于优化查询项权重代价指标得分规整方法的优点,相比最佳单一得分规整方法性能更优. 展开更多
关键词 语音查询项检索 得分规整 区分性模型 置信度得分
下载PDF
汉语语音检索的集外词问题与两阶段检索方法 被引量:8
18
作者 孟莎 刘加 《中文信息学报》 CSCD 北大核心 2009年第6期91-97,共7页
该文针对大规模汉语语音检索任务提出汉语语音检索中的集外词问题和针对集外查询词的两阶段检索方法。汉语语音识别和检索中,集外词可以以词表词序列的形式被识别和检索到,因此被认为不存在集外词问题;该文发现集外查询词性能远远低于... 该文针对大规模汉语语音检索任务提出汉语语音检索中的集外词问题和针对集外查询词的两阶段检索方法。汉语语音识别和检索中,集外词可以以词表词序列的形式被识别和检索到,因此被认为不存在集外词问题;该文发现集外查询词性能远远低于集内查询词,将此问题定义为汉语语音检索任务的集外词问题,并提出两阶段的检索方法,第一阶段通过模糊音素匹配的方法提高查全率,第二阶段通过词格修正的方法提高查准率。实验表明,两阶段的检索方法极大的提高了典型集外查询词的检索性能,FOM指标相对基线系统提高了24.1%。 展开更多
关键词 计算机应用 中文信息处理 汉语语音检索 集外词 词格 大词汇量连续语音识别
下载PDF
基于动态时间规整的语音样例快速检索算法 被引量:7
19
作者 张连海 冯志远 +1 位作者 陈琦 李勃昊 《计算机应用研究》 CSCD 北大核心 2014年第6期1688-1692,共5页
为了提高基于DTW算法的语音检索系统的速度,提出了一种基于分段累积近似下界估计的动态时间规整算法,实现语音样例快速检索。该方法首先提取查询样例和测试集的音素后验概率作为特征参数,然后计算语音样例和测试集中所有候选分段实际动... 为了提高基于DTW算法的语音检索系统的速度,提出了一种基于分段累积近似下界估计的动态时间规整算法,实现语音样例快速检索。该方法首先提取查询样例和测试集的音素后验概率作为特征参数,然后计算语音样例和测试集中所有候选分段实际动态规整得分的分段累积近似下界估计,最后采用K-最近邻算法与动态时间规整算法搜索与语音样例相似度最高的区域。实验结果表明,此算法的检索速度比直接运用DTW算法快6.32倍,而对其检索精度无任何影响。 展开更多
关键词 语音样例检索 音素后验概率 分段累积近似下界估计 动态时间规整 内积距离
下载PDF
基于分段动态时间规整的语音样例快速检索 被引量:5
20
作者 冯志远 张连海 《数据采集与处理》 CSCD 北大核心 2014年第2期265-273,共9页
提出了一种融合下界估计和分段动态时间规整的语音样例快速检索方法。该方法针对缺乏合适的训练数据等语音资源较为有限的语言进行快速检索所设计。此方法首先提取查询样例和测试集的音素后验概率;然后,根据限制条件在测试语句中选定候... 提出了一种融合下界估计和分段动态时间规整的语音样例快速检索方法。该方法针对缺乏合适的训练数据等语音资源较为有限的语言进行快速检索所设计。此方法首先提取查询样例和测试集的音素后验概率;然后,根据限制条件在测试语句中选定候选分段,并计算查询样例和每个候选分段之间实际动态时间规整得分的下界估计,再运用K最近邻搜索算法搜索与查询样例相似度最高的分段;最后,使用虚拟相关反馈技术对检索结果进行修正。实验结果表明:尽管此方法的检索精度略低于直接运用动态时间规整进行检索的检索精度,但其检索速度优于后者,且检索结果经过虚拟相关反馈技术修正后,其检索精度也得到有效提升。 展开更多
关键词 语音样例检索 音素后验概率 分段动态时间规整 下界估计 虚拟相关反馈
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部