期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于word2vec的语音识别后文本纠错 被引量:19
1
作者 张佳宁 严冬梅 王勇 《计算机工程与设计》 北大核心 2020年第11期3235-3240,共6页
针对特定场合长音频语音识别结果错误率高,提出一种基于word2vec的语音识别后文本纠错方法。利用word2vec结合语境核心词生成关键词,使用深度语言模型对文本进行检错,利用拼音混淆集结合语义和语境信息对可能出错的词进行纠错。通过调... 针对特定场合长音频语音识别结果错误率高,提出一种基于word2vec的语音识别后文本纠错方法。利用word2vec结合语境核心词生成关键词,使用深度语言模型对文本进行检错,利用拼音混淆集结合语义和语境信息对可能出错的词进行纠错。通过调用百度语音识别API进行实验,所提方法相比于其它纠错方法和不使用语境信息的纠错方法,纠错准确率、召回率、F1值得到了提高。 展开更多
关键词 语音识别 文本纠错 深度学习 语境 词向量
下载PDF
HM-BERT:一种采用分级掩码的风电语音文本纠正方法
2
作者 高永兵 郑伟业 +1 位作者 李春灿 姜春光 《内蒙古科技大学学报》 CAS 2023年第4期367-371,共5页
采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进... 采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进后的模型称为HM-BERT.实验证明:HM-BERT在提升纠正效果的同时还加强了纠正模型的鲁棒性,该方法对其他领域的文本纠正也提供了解决思路. 展开更多
关键词 BERT MLM 分级掩码 语音文本纠正
下载PDF
语音转录后文本的中文拼写纠错模型
3
作者 邢月晗 郑岩 《电子测量技术》 北大核心 2023年第6期57-61,共5页
针对目前语音转录文本错误率较高的问题,本文提出一种基于MacBERT的文本先检错后纠错模型,对语音转录后文本进行校正。检错阶段使用MacBERT-BiLSTM-CRF模型检查文本是否有错及出错位置。纠错阶段从置信度和字音相似度两个维度出发,划定... 针对目前语音转录文本错误率较高的问题,本文提出一种基于MacBERT的文本先检错后纠错模型,对语音转录后文本进行校正。检错阶段使用MacBERT-BiLSTM-CRF模型检查文本是否有错及出错位置。纠错阶段从置信度和字音相似度两个维度出发,划定“置信度-字音相似度”曲线判断候选字是否进行纠错。候选字的置信度使用MacBERT语言模型计算,并提出一种基于拼音码的字音相似度计算方法。在语音公开数据集Thchs-30上通过调用百度语音识别API进行实验,相比现有方法,在检错阶段和纠错阶段的精确率、召回率、F1值都得到了提高,其中纠错阶段精确率达到83.32%,提高了转录文本的正确性。 展开更多
关键词 语音 文本纠错 MacBERT 拼音码 Thchs-30
下载PDF
融合音素的缅甸语语音识别文本纠错
4
作者 陈璐 董凌 +3 位作者 王文君 王剑 余正涛 高盛祥 《计算机工程与科学》 CSCD 北大核心 2024年第6期1121-1127,共7页
缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法... 缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法。通过参数共享策略对转录文本及其音素进行联合建模,利用音素信息辅助检测并纠正缅甸语同音和空格错误。实验结果表明,本文所提方法相比基线方法ConvSeq2Seq,在缅甸语语音识别纠错任务中的F1值提升了85.97%,达到了79.15%。 展开更多
关键词 缅甸语 语音识别文本纠错 音素 共享参数 BERT
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部