期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于word2vec的语音识别后文本纠错
被引量:
19
1
作者
张佳宁
严冬梅
王勇
《计算机工程与设计》
北大核心
2020年第11期3235-3240,共6页
针对特定场合长音频语音识别结果错误率高,提出一种基于word2vec的语音识别后文本纠错方法。利用word2vec结合语境核心词生成关键词,使用深度语言模型对文本进行检错,利用拼音混淆集结合语义和语境信息对可能出错的词进行纠错。通过调...
针对特定场合长音频语音识别结果错误率高,提出一种基于word2vec的语音识别后文本纠错方法。利用word2vec结合语境核心词生成关键词,使用深度语言模型对文本进行检错,利用拼音混淆集结合语义和语境信息对可能出错的词进行纠错。通过调用百度语音识别API进行实验,所提方法相比于其它纠错方法和不使用语境信息的纠错方法,纠错准确率、召回率、F1值得到了提高。
展开更多
关键词
语音识别
文本纠错
深度学习
语境
词向量
下载PDF
职称材料
HM-BERT:一种采用分级掩码的风电语音文本纠正方法
2
作者
高永兵
郑伟业
+1 位作者
李春灿
姜春光
《内蒙古科技大学学报》
CAS
2023年第4期367-371,共5页
采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进...
采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进后的模型称为HM-BERT.实验证明:HM-BERT在提升纠正效果的同时还加强了纠正模型的鲁棒性,该方法对其他领域的文本纠正也提供了解决思路.
展开更多
关键词
BERT
MLM
分级掩码
语音文本纠正
下载PDF
职称材料
语音转录后文本的中文拼写纠错模型
3
作者
邢月晗
郑岩
《电子测量技术》
北大核心
2023年第6期57-61,共5页
针对目前语音转录文本错误率较高的问题,本文提出一种基于MacBERT的文本先检错后纠错模型,对语音转录后文本进行校正。检错阶段使用MacBERT-BiLSTM-CRF模型检查文本是否有错及出错位置。纠错阶段从置信度和字音相似度两个维度出发,划定...
针对目前语音转录文本错误率较高的问题,本文提出一种基于MacBERT的文本先检错后纠错模型,对语音转录后文本进行校正。检错阶段使用MacBERT-BiLSTM-CRF模型检查文本是否有错及出错位置。纠错阶段从置信度和字音相似度两个维度出发,划定“置信度-字音相似度”曲线判断候选字是否进行纠错。候选字的置信度使用MacBERT语言模型计算,并提出一种基于拼音码的字音相似度计算方法。在语音公开数据集Thchs-30上通过调用百度语音识别API进行实验,相比现有方法,在检错阶段和纠错阶段的精确率、召回率、F1值都得到了提高,其中纠错阶段精确率达到83.32%,提高了转录文本的正确性。
展开更多
关键词
语音
文本纠错
MacBERT
拼音码
Thchs-30
下载PDF
职称材料
融合音素的缅甸语语音识别文本纠错
4
作者
陈璐
董凌
+3 位作者
王文君
王剑
余正涛
高盛祥
《计算机工程与科学》
CSCD
北大核心
2024年第6期1121-1127,共7页
缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法...
缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法。通过参数共享策略对转录文本及其音素进行联合建模,利用音素信息辅助检测并纠正缅甸语同音和空格错误。实验结果表明,本文所提方法相比基线方法ConvSeq2Seq,在缅甸语语音识别纠错任务中的F1值提升了85.97%,达到了79.15%。
展开更多
关键词
缅甸语
语音识别文本纠错
音素
共享参数
BERT
下载PDF
职称材料
题名
基于word2vec的语音识别后文本纠错
被引量:
19
1
作者
张佳宁
严冬梅
王勇
机构
天津财经大学理工学院
出处
《计算机工程与设计》
北大核心
2020年第11期3235-3240,共6页
基金
国家自然科学基金项目(11701410)。
文摘
针对特定场合长音频语音识别结果错误率高,提出一种基于word2vec的语音识别后文本纠错方法。利用word2vec结合语境核心词生成关键词,使用深度语言模型对文本进行检错,利用拼音混淆集结合语义和语境信息对可能出错的词进行纠错。通过调用百度语音识别API进行实验,所提方法相比于其它纠错方法和不使用语境信息的纠错方法,纠错准确率、召回率、F1值得到了提高。
关键词
语音识别
文本纠错
深度学习
语境
词向量
Keywords
speech
recognition
text
correction
deep
learning
con
text
word2vec
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
HM-BERT:一种采用分级掩码的风电语音文本纠正方法
2
作者
高永兵
郑伟业
李春灿
姜春光
机构
内蒙古科技大学信息工程学院
中冶西北工程技术有限公司市政设计研究院
出处
《内蒙古科技大学学报》
CAS
2023年第4期367-371,共5页
基金
内蒙古自治区自然科学基金资助项目(2021LHMS06004).
文摘
采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进后的模型称为HM-BERT.实验证明:HM-BERT在提升纠正效果的同时还加强了纠正模型的鲁棒性,该方法对其他领域的文本纠正也提供了解决思路.
关键词
BERT
MLM
分级掩码
语音文本纠正
Keywords
BERT
MLM
hierarchical
mask
speech
text
correction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
语音转录后文本的中文拼写纠错模型
3
作者
邢月晗
郑岩
机构
北京邮电大学人工智能学院
出处
《电子测量技术》
北大核心
2023年第6期57-61,共5页
基金
教育部-中国移动科研基金(MCM20190701)项目资助
文摘
针对目前语音转录文本错误率较高的问题,本文提出一种基于MacBERT的文本先检错后纠错模型,对语音转录后文本进行校正。检错阶段使用MacBERT-BiLSTM-CRF模型检查文本是否有错及出错位置。纠错阶段从置信度和字音相似度两个维度出发,划定“置信度-字音相似度”曲线判断候选字是否进行纠错。候选字的置信度使用MacBERT语言模型计算,并提出一种基于拼音码的字音相似度计算方法。在语音公开数据集Thchs-30上通过调用百度语音识别API进行实验,相比现有方法,在检错阶段和纠错阶段的精确率、召回率、F1值都得到了提高,其中纠错阶段精确率达到83.32%,提高了转录文本的正确性。
关键词
语音
文本纠错
MacBERT
拼音码
Thchs-30
Keywords
speech
text
error
correction
MacBERT
pinyin
code
Thchs-30
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
融合音素的缅甸语语音识别文本纠错
4
作者
陈璐
董凌
王文君
王剑
余正涛
高盛祥
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2024年第6期1121-1127,共7页
基金
国家自然科学基金(U21B2027,61972186)
云南高新技术产业发展项目(201606)
+2 种基金
云南省重大科技专项计划(202103AA080015,202302AD080003)
云南省基础研究计划(202001AS070014)
云南省学术和技术带头人后备人才(202105AC160018)。
文摘
缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法。通过参数共享策略对转录文本及其音素进行联合建模,利用音素信息辅助检测并纠正缅甸语同音和空格错误。实验结果表明,本文所提方法相比基线方法ConvSeq2Seq,在缅甸语语音识别纠错任务中的F1值提升了85.97%,达到了79.15%。
关键词
缅甸语
语音识别文本纠错
音素
共享参数
BERT
Keywords
Burmese
language
speech
recognition
text
correction
phoneme
shared
parameter
bidirectional
encoder
representations
from
transformers(BERT)
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于word2vec的语音识别后文本纠错
张佳宁
严冬梅
王勇
《计算机工程与设计》
北大核心
2020
19
下载PDF
职称材料
2
HM-BERT:一种采用分级掩码的风电语音文本纠正方法
高永兵
郑伟业
李春灿
姜春光
《内蒙古科技大学学报》
CAS
2023
0
下载PDF
职称材料
3
语音转录后文本的中文拼写纠错模型
邢月晗
郑岩
《电子测量技术》
北大核心
2023
0
下载PDF
职称材料
4
融合音素的缅甸语语音识别文本纠错
陈璐
董凌
王文君
王剑
余正涛
高盛祥
《计算机工程与科学》
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部