期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于语音语义引导的语音分割方法
1
作者 高盛祥 杨尚龙 +2 位作者 余正涛 董凌 周国江 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期1042-1050,共9页
[目的]语音分割旨在将音频流或者较长的音频分割为短的音频片段,是语音翻译任务中的一个必要步骤.恰当的分割使音频段具有完整的语义,从而使语音翻译模型更关注句子完整的上下文信息,解码得到更优的翻译结果.[方法]本文提出一种基于语... [目的]语音分割旨在将音频流或者较长的音频分割为短的音频片段,是语音翻译任务中的一个必要步骤.恰当的分割使音频段具有完整的语义,从而使语音翻译模型更关注句子完整的上下文信息,解码得到更优的翻译结果.[方法]本文提出一种基于语音语义引导的语音分割方法,使用基于HuBERT的帧分类器对音频帧进行分类,得到每个音频帧是否为语音帧的概率,并使用ipDAC算法对音频进行递归切割,从而实现对音频的分割.[结果]本文方法在Must-C英语-越南语翻译数据集上的BLEU值上相较已有方法取得了0.6个百分点的提升.[结论]通过对比不同的分割方法对模型性能的影响,证明所提方法能有效减少语音翻译模型在解码时的性能损失. 展开更多
关键词 语音翻译 语音分割 hubert训练模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部