期刊文献+
共找到60篇文章
< 1 2 3 >
每页显示 20 50 100
基于离散HMM的非特定人关键词提取语音识别系统 被引量:5
1
作者 汪鹏 刘加 刘润生 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2003年第3期347-351,共5页
设计了一个基于离散隐含马尔可夫整词模型的非特定人汉语小词表关键词提取语音识别系统,提出一种基于对前向、后向搜索得到的关键词假设做二次识别的置信度策略.将该置信度用于关键词提取系统的说话验证,得到了良好效果.
关键词 语音识别 关键词提取 离散隐含马尔可夫模型 置信度 离散HMM
下载PDF
一种高效的语音关键词检索系统 被引量:9
2
作者 罗骏 欧智坚 《通信学报》 EI CSCD 北大核心 2006年第2期113-118,共6页
针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖... 针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖率的拼音图,在这一过程中通过若干次的无监督最大似然线性回归自适应算法渐次提高拼音图的质量。检索阶段响应用户的频繁查询,只需在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选。实验表明:系统具有较高的召回率和正确率,且检索阶段仅需0.01倍实时,可以满足快速检索的需要。 展开更多
关键词 信息检索 关键词检索 拼音图 置信度
下载PDF
面向自定义语音唤醒的关键词相关的单通道语音增强 被引量:4
3
作者 刘作桢 吴愁 +1 位作者 黎塔 赵庆卫 《声学学报》 EI CAS CSCD 北大核心 2023年第2期415-424,共10页
提出一种面向自定义语音唤醒的单通道语音增强方法。该方法预先将关键词音素信息存入文本编码矩阵,并在常规语音增强模型基础上添加一个基于注意力机制的音素偏置模块。该模块利用语音增强模型中间特征从文本编码矩阵中获取当前帧的音... 提出一种面向自定义语音唤醒的单通道语音增强方法。该方法预先将关键词音素信息存入文本编码矩阵,并在常规语音增强模型基础上添加一个基于注意力机制的音素偏置模块。该模块利用语音增强模型中间特征从文本编码矩阵中获取当前帧的音素信息,并将其融入语音增强模型的后续计算中,从而提升语音增强模型对关键词相关音素的增强效果。在不同噪声环境下的实验结果表明,该方法可以更有效地抑制关键词部分噪声。同时所提出方法对比常规语音增强方法与其他文本相关语音增强方法,在自定义语音唤醒性能上可以分别获得14.3%和7.6%的相对提升。 展开更多
关键词 语音增强 语音唤醒 关键词相关 深度学习
下载PDF
一种新的关键词确认方法 被引量:3
4
作者 戴海生 朱小燕 +1 位作者 罗予频 杨士元 《电子学报》 EI CAS CSCD 北大核心 2005年第1期101-105,共5页
本文提出了一种新的基于模型距离矩阵的关键词确认算法 ,并给出模型距离的定义及其训练方法 ,利用模型相对距离矩阵对语音识别结果进行确认 .对于关键词库较大的关键词检出系统 ,通过对关键词分段 ,得到扩展的模型距离矩阵确认算法 ,使... 本文提出了一种新的基于模型距离矩阵的关键词确认算法 ,并给出模型距离的定义及其训练方法 ,利用模型相对距离矩阵对语音识别结果进行确认 .对于关键词库较大的关键词检出系统 ,通过对关键词分段 ,得到扩展的模型距离矩阵确认算法 ,使得大词表确认问题得到很好的解决 ,并能够获得和小词表系统一样的确认效果 .为了对关键词库进行方便的操作 ,模型距离矩阵的更新算法使得用户可以很方便地修改关键词库内的关键词 ,而不必重新训练整个模型距离矩阵 . 展开更多
关键词 隐马尔可夫模型 最大似然准则 语音确认 关键词检出
下载PDF
LDA单词图像表示的蒙古文古籍图像关键词检索方法 被引量:7
5
作者 白淑霞 鲍玉来 《现代情报》 CSSCI 北大核心 2017年第7期51-54,88,共5页
[目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于... [目的 ]为了克服传统视觉词袋方法(Bag-of-Visual-Words)中忽略视觉单词间的空间关系和语义信息等问题。[方法 ]本文提出一种与视觉语言模型相结合的基于LDA主题模型,并采用查询似然模型实现检索。[结果 ]实验数据表明,本文所提出的基于LDA的表示方法可以高效、准确地解决蒙古文古籍的关键词检索问题。[结论 ]同时,该方法的性能比Bo VW方法有显著提高。 展开更多
关键词 隐含狄利克雷分配(LDA) 主题模型 视觉语言模型 蒙古文古籍 关键词检索 查询似然模型
下载PDF
语音识别音字转换中的快速容错算法 被引量:5
6
作者 李明琴 王作英 陆大■ 《中文信息学报》 CSCD 北大核心 2002年第5期38-43,共6页
本文研究了汉语连续语音识别音字转换中的容错算法,以纠正声学识别的替代、插入、删除错误。为了解决容错算法的计算量问题,本文提出了两种快速算法。一是针对单独出现错误的快速容错算法;二是针对关键词的快速容错算法。快速算法有效... 本文研究了汉语连续语音识别音字转换中的容错算法,以纠正声学识别的替代、插入、删除错误。为了解决容错算法的计算量问题,本文提出了两种快速算法。一是针对单独出现错误的快速容错算法;二是针对关键词的快速容错算法。快速算法有效地限制了容错算法的搜索空间,提高了计算效率。快速容错算法应用在电话对话系统中,字正确率从78.97%提高到86.68%,关键词检测正确率从80.56%提高到88.52%,并且算法运算时间满足实时性要求。 展开更多
关键词 语音识别 音字转换 快速容错算法 稳健语音识别 口语对话系统 关键词检测 搜索空间
下载PDF
基于SRAM缓存和存内计算的低功耗关键词唤醒系统
7
作者 黄至锐 贾心茹 +1 位作者 朱浩哲 陈迟晓 《计算机工程与科学》 CSCD 北大核心 2024年第8期1331-1339,共9页
为了解决关键词唤醒算法部署在边缘计算硬件会带来较高功耗、给电池驱动的设备带来续航挑战的问题,提出了一种基于存内计算技术和软硬件协同优化的低功耗关键词唤醒系统。在算法层面,基于标准MFCC算法拓扑结构提出了一种三值量化MFCC-CN... 为了解决关键词唤醒算法部署在边缘计算硬件会带来较高功耗、给电池驱动的设备带来续航挑战的问题,提出了一种基于存内计算技术和软硬件协同优化的低功耗关键词唤醒系统。在算法层面,基于标准MFCC算法拓扑结构提出了一种三值量化MFCC-CNN联合算法,将MFCC中的全部通用矩阵乘映射到神经网络加速器当中。在电路层面,提出了一种基于SRAM的存内计算核心,用于解决传统冯·诺依曼架构加速器存在的功耗墙和存储墙问题。同时通过复用存内计算核心的SRAM存储功能提出了一种基于查找表实现的缓存电路,用于替代寄存器延迟链电路。SRAM存内计算核心和SRAM缓存电路均采用定制单元实现。在系统层面,基于以上2种定制电路设计了一种低功耗关键词唤醒系统。该系统采用ASIC与定制化电路设计流程设计,并使用28 nm CMOS工艺库对该设计进行了ASIC综合,在250 kHz下,关键词唤醒系统运行10分类任务的延迟是64 ms,整体功耗为645.28μW,其中MFCC流水线的动态功耗占总动态功耗的5.9%,总功耗仅占系统功耗的1.3%。 展开更多
关键词 关键词唤醒 三值量化神经网络 存内计算 串行快速傅里叶变换 软硬件协同设计
下载PDF
HarkMan──A Vocabulary-Independent Keyword Spotter for Spontaneous Chinese Speech
8
作者 郑方 徐明星 +3 位作者 牟晓隆 武健 吴文虎 方棣棠 《Journal of Computer Science & Technology》 SCIE EI CSCD 1999年第1期18-26,共9页
in this paper a novel technique adopted in HarkMan is introduced. HarkMan is a keyword-spotter designed to automatically spot the given words of a vocabulary-independent task in unconstrained Chinese telephone speech.... in this paper a novel technique adopted in HarkMan is introduced. HarkMan is a keyword-spotter designed to automatically spot the given words of a vocabulary-independent task in unconstrained Chinese telephone speech. The speak- ing manner and the number of keywords are not limited. This paper focuses on the novel technique which addresses acoustic modeling, keyword spotting network, search strategies, robustness, and rejection. The underlying technologies used in HarkMan given in this paper are useful not only for keyword spotting but also for continuous speech recognition. The system has achieved a figure-of-merit value over 90%. 展开更多
关键词 keyword spotting keyword spotter vocabulary independent acoustic modeling continuous speech recognition
原文传递
基于仿生模式识别的语音识别研究 被引量:2
9
作者 徐毅 殷业 王沛 《上海电机学院学报》 2007年第2期127-130,共4页
与传统模式识别的方法相比,仿生模式识别能识别单模板,并大大减小误识率。基于这两个优点,将仿生模式识别应用于语音信号处理中,进行2次识别。第1次使用传统模式识别方法,第2次为单模板识别。对小词汇量的关键词识别实验结果表明能够大... 与传统模式识别的方法相比,仿生模式识别能识别单模板,并大大减小误识率。基于这两个优点,将仿生模式识别应用于语音信号处理中,进行2次识别。第1次使用传统模式识别方法,第2次为单模板识别。对小词汇量的关键词识别实验结果表明能够大大降低误识率。 展开更多
关键词 语音识别 模式识别 仿生模式识别 关键词识别 误识率
下载PDF
关键词检测系统中声学置信度的应用 被引量:2
10
作者 刘鑫 陆林生 《计算机工程》 CAS CSCD 北大核心 2004年第8期28-30,共3页
从假设检验和模式识别的角度分别介绍了置信度的概念及其在实际关键词检测系统中的应用,并提出3种新的基于识别结果本身信息的声学置信度:基于状态长度归一化的置信度、基于特征矢量信息的置信度和基于状态驻留的声学置信度。与传统... 从假设检验和模式识别的角度分别介绍了置信度的概念及其在实际关键词检测系统中的应用,并提出3种新的基于识别结果本身信息的声学置信度:基于状态长度归一化的置信度、基于特征矢量信息的置信度和基于状态驻留的声学置信度。与传统的基于似然比的声学置信度相比,这3种置信度几乎不需额外的训练和建模,计算简单,且均较易设置统一的拒识门限。实验结果表明基于状态驻留和基于特征矢量信息的置信度的性能较好,能够有效降低基线系统的虚警率。 展开更多
关键词 关键词检测 确认 置信度 置信区间
下载PDF
基于模板匹配的快速语音关键词检出方法 被引量:5
11
作者 朱国腾 孙伟 《计算机应用》 CSCD 北大核心 2013年第11期3138-3140,共3页
在缺乏训练样本的情况下对语音信号进行关键词检出,基于模板匹配的方法与传统的方法相比,仍然能够对语音进行关键词检出。但是由于模板匹配方法计算局部最小距离的方式是逐帧移动,所以计算时间长。局部最小距离的极值点通常在音素分割... 在缺乏训练样本的情况下对语音信号进行关键词检出,基于模板匹配的方法与传统的方法相比,仍然能够对语音进行关键词检出。但是由于模板匹配方法计算局部最小距离的方式是逐帧移动,所以计算时间长。局部最小距离的极值点通常在音素分割点附近,利用这两者的位置关系并结合插值思想,提出一种快速的模板匹配方法。该方法通过在音素分割点之间插值计算局部最小距离,能够有效地缩短计算时间。在TIMIT和CASIA语料库中进行实验,改进的方法与常规的模板匹配方法相比较,快了约2.8倍。 展开更多
关键词 关键词检出 动态时间规整 音素分割 插值
下载PDF
基于特征空间轨迹匹配方式的语音关键词检测法 被引量:2
12
作者 吴旭辉 吴亚栋 《计算机工程与应用》 CSCD 北大核心 2003年第36期83-86,共4页
语音关键词识别是近年来颇受重视的一个研究领域,文章基于特征空间轨迹的时间规整化原理,提出了一种高性能的关键词检测法,并探讨了轨迹等分长度对该算法检测性能的影响。实验结果表明,基于特征空间轨迹匹配方式的关键词检测法的检测性... 语音关键词识别是近年来颇受重视的一个研究领域,文章基于特征空间轨迹的时间规整化原理,提出了一种高性能的关键词检测法,并探讨了轨迹等分长度对该算法检测性能的影响。实验结果表明,基于特征空间轨迹匹配方式的关键词检测法的检测性能接近于人工检测,具有一定的实用性。 展开更多
关键词 动态匹配 语音识别 模式匹配 特征空间轨迹 语音关键词检测法 匹配方式
下载PDF
基于加权有限状态机的动态匹配词图生成算法 被引量:4
13
作者 郭宇弘 黎塔 +2 位作者 肖业鸣 潘接林 颜永红 《电子与信息学报》 EI CSCD 北大核心 2014年第1期140-146,共7页
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论... 由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。 展开更多
关键词 自动语音识别 加权有限状态机 词图生成 关键词检索
下载PDF
采用词图相交融合的语音关键词检测方法 被引量:4
14
作者 李鹏 屈丹 《信号处理》 CSCD 北大核心 2015年第6期702-709,共8页
针对词图合并方法产生的词图冗余信息过多,规模较大,导致检索速度较慢的问题,本文提出了一种基于词图相交融合的语音关键词检测方法。首先,将不同语音识别系统产生的词图取交集,并对相同路径上的声学模型、语言模型得分进行得分融合;然... 针对词图合并方法产生的词图冗余信息过多,规模较大,导致检索速度较慢的问题,本文提出了一种基于词图相交融合的语音关键词检测方法。首先,将不同语音识别系统产生的词图取交集,并对相同路径上的声学模型、语言模型得分进行得分融合;然后,对于融合后词图中存在的间断路径,直接利用性能最优的语音识别系统产生的词图进行补充,得到完整的融合词图;最后,在相交融合后的词图上进行关键词检测。实验表明,相交融合后的词图综合利用了各词图的得分信息,在基本不损失词图对正确内容覆盖率基础上,减少了冗余信息,有效降低了索引规模;并且在关键词检测性能ATWV指标下,基于词图相交融合的关键词检测方法相比词图合并方法相对提升5.3%。 展开更多
关键词 子空间高斯混合模型 深层神经网络 相交词图 关键词检测
下载PDF
广播新闻语音的关键词检测系统 被引量:1
15
作者 张鹏远 邵健 +1 位作者 赵庆卫 颜永红 《通信学报》 EI CSCD 北大核心 2007年第12期131-135,共5页
提出了一种两阶段的关键词检测策略,关键词表可即时配置、即时使用。与以往不同的是,解码是在整个声学空间上进行的,而不仅仅是关键词所构成的声学空间。首先,利用维特比解码得到最优候选的音素序列。然后,通过关键词列表,可以产生候选... 提出了一种两阶段的关键词检测策略,关键词表可即时配置、即时使用。与以往不同的是,解码是在整个声学空间上进行的,而不仅仅是关键词所构成的声学空间。首先,利用维特比解码得到最优候选的音素序列。然后,通过关键词列表,可以产生候选的关键词。最后,采用了基于声学模型的置信度与基于网格的置信度相结合的方法来降低虚警。实验证明,新的框架下关键词检测的性能得到了显著的提高。 展开更多
关键词 关键词检测 音节识别器 置信度计算
下载PDF
基于动态匹配词格检索的关键词检测 被引量:2
16
作者 郑永军 张连海 《应用科学学报》 CAS CSCD 北大核心 2014年第2期149-155,共7页
对生活中涌现的海量语音数据需要进行快速而准确的检索.提出一种基于动态匹配词格检索的关键词检测方法,应用TRAP特征和多层感知器创建更为精准的音素Lattice.在索引阶段执行一个改进的维特比算法遍历Lattice来创建一个固定长度的音素... 对生活中涌现的海量语音数据需要进行快速而准确的检索.提出一种基于动态匹配词格检索的关键词检测方法,应用TRAP特征和多层感知器创建更为精准的音素Lattice.在索引阶段执行一个改进的维特比算法遍历Lattice来创建一个固定长度的音素序列数据库,在检索阶段应用最小编辑距离作为置信度来实现关键词的检出.实验结果表明,该方法相比应用MFCC和PLP特征的基线系统具有一定的优势,召回率可提升5%左右. 展开更多
关键词 关键词检测 动态匹配词格检索 TRAP特征 最小编辑距离
下载PDF
基于维吾尔语单词清、浊音组成结构特征的连续语音单词切分算法 被引量:3
17
作者 木合塔尔.沙地克 布合力齐姑丽.瓦斯力 李晓 《西北师范大学学报(自然科学版)》 CAS 北大核心 2013年第4期34-37,共4页
提出了面向关键词检索的连续语音单词切分算法.算法的核心是一组多元高斯分布,其5个参数分别由语音信号的短时能量、短时过零率、短时自相关系数、第一个预测系数、预测误差归一化能量等声学特征获取.证明了基于单词声学特征的连续语音... 提出了面向关键词检索的连续语音单词切分算法.算法的核心是一组多元高斯分布,其5个参数分别由语音信号的短时能量、短时过零率、短时自相关系数、第一个预测系数、预测误差归一化能量等声学特征获取.证明了基于单词声学特征的连续语音单词切分比等宽单词切分具有更好的单词切分及检索效率;讨论了优化算法的构思. 展开更多
关键词 语音识别 关键词检索 声学特征 清音 浊音
下载PDF
关键词检测系统中基于音素网格的置信度计算 被引量:3
18
作者 张鹏远 韩疆 颜永红 《电子与信息学报》 EI CSCD 北大核心 2007年第9期2063-2066,共4页
该文提出了一种基于音素网格的置信度计算方法。与传统的基于整个声学模型的置信度不同的是,这种方法在解码器生成的音素网格上计算关键词的置信度,从而具有更好的拒识能力。另外,针对两种置信度取值范围的不同,该文采用权重因子的方法... 该文提出了一种基于音素网格的置信度计算方法。与传统的基于整个声学模型的置信度不同的是,这种方法在解码器生成的音素网格上计算关键词的置信度,从而具有更好的拒识能力。另外,针对两种置信度取值范围的不同,该文采用权重因子的方法综合利用两种置信度,取得了较好的效果。在自然对话的电话数据测试中,与传统的置信度计算方式相比,混和置信度的FOM(Figure Of Merit)值相对提高了17.0%。 展开更多
关键词 语音识别 关键词检测 置信度 后验概率 网格
下载PDF
基于GMM的说话人分类自适应算法 被引量:1
19
作者 刘鑫 王炳锡 《信息工程大学学报》 2001年第4期35-37,共3页
本文提出了一种基于GMM(GaussianMixtureModel)的说话人分类算法 ,主要介绍了GMM模型和具体实现以及基于GMM的说话人分类算法在关键词检测系统中的应用。实验结果证明 ,该算法计算量小、实现速度快 ,能够提高系统的识别率 ,扩大应用人... 本文提出了一种基于GMM(GaussianMixtureModel)的说话人分类算法 ,主要介绍了GMM模型和具体实现以及基于GMM的说话人分类算法在关键词检测系统中的应用。实验结果证明 ,该算法计算量小、实现速度快 ,能够提高系统的识别率 ,扩大应用人群范围 。 展开更多
关键词 GaussianMixtureModel 说话人分类 关键词检测 GMM 自适应算法 语音识别
下载PDF
基于音节拼接的关键词识别系统 被引量:1
20
作者 石峰 秦敏 李治柱 《计算机工程》 CAS CSCD 北大核心 2004年第9期157-158,共2页
针对不确定的汉语语音关键词识别系统,为每个关键词分别建立模型是非常烦琐的,采用音节作为次词具有很好的灵活性。通过同传统的关键词识别系统作比较后发现用音节作为次词的系统具有相当高的识别率,其运算效率也非常高。
关键词 隐含马尔可夫模型 关键词识别 次词 音节拼接 汉语语音关键词识别系统
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部