期刊文献+
共找到10,162篇文章
< 1 2 250 >
每页显示 20 50 100
脯氨酸的构象及性质 被引量:13
1
作者 王朝杰 李永 +1 位作者 杨新宇 林丽 《物理化学学报》 SCIE CAS CSCD 北大核心 2007年第3期305-310,共6页
用X3LYP法在6-311++G(d,p)和6-311++G(3df,3pd)基组水平上对脯氨酸15种构象的几何结构、相对能量、电子结构、红外光谱、偶极矩、极化率等性质进行了研究,并与PBE1PBE/6-311++G(d,p)的结果和文献相比较,从而得到:(1)的脯氨酸的15种构象... 用X3LYP法在6-311++G(d,p)和6-311++G(3df,3pd)基组水平上对脯氨酸15种构象的几何结构、相对能量、电子结构、红外光谱、偶极矩、极化率等性质进行了研究,并与PBE1PBE/6-311++G(d,p)的结果和文献相比较,从而得到:(1)的脯氨酸的15种构象中能量最低的有4种,不同构象中存在着强弱不同的5种氢键,其中以N…H—O氢键最强,并存在特殊的C—H…O=C氢键.两种方法计算的几何结构数据相近,均与实验值吻合;(2)在构象相对能差计算方面,X3LYP具有明显的优势,用中等基组就可以得到与高水平从头算法和大基组相同的结果,而PBE1PBE法计算的相对能值则相差较大;(3)脯氨酸不同构象中偶极矩最大和极化率最小的是最稳定的构象1和2,两种方法计算的结果一致. 展开更多
关键词 脯氨酸 X3LYP 构象 偶极矩 转动系数
下载PDF
使用Conformer增强的混合CTC/Attention端到端中文语音识别 被引量:5
2
作者 陈戈 谢旭康 +1 位作者 孙俊 陈祺东 《计算机工程与应用》 CSCD 北大核心 2023年第4期97-103,共7页
最近,基于自注意力的Transformer结构在不同领域的一系列任务上表现出非常好的性能。探索了基于Transformer编码器和LAS(listen,attend and spell)解码器的Transformer-LAS语音识别模型的效果,并针对Transformer不善于捕捉局部信息的问... 最近,基于自注意力的Transformer结构在不同领域的一系列任务上表现出非常好的性能。探索了基于Transformer编码器和LAS(listen,attend and spell)解码器的Transformer-LAS语音识别模型的效果,并针对Transformer不善于捕捉局部信息的问题,使用Conformer代替Transformer,提出Conformer-LAS模型。由于Attention过于灵活的对齐方式,使得在嘈杂环境中的效果急剧下降,采用连接时序分类(connectionist temporal classification,CTC)辅助训练以加快收敛,并加入音素级别的中间CTC损失联合优化,提出了效果更好的Conformer-LAS-CTC语音识别模型。在开源中文普通话Aishell-1数据集上对提出来的模型进行验证,实验结果表明,Conformer-LAS-CTC相对于采用的基线BLSTM-LAS和Transformer-LAS模型在测试集上的字错率分别相对降低了22.58%和48.76%,模型最终字错误率为4.54%。 展开更多
关键词 端到端 语音识别 conformer LAS 连接时序分类
下载PDF
基于深度学习的构音障碍人群语音事件识别模型 被引量:1
3
作者 杨熠 张子鹏 《电脑与信息技术》 2024年第1期1-3,共3页
构音障碍是许多患有特殊疾病的患者所要面对的问题,会造成说话人发音不清晰。为更好地理解构音障碍患者所表达的语音事件,文章提出了一个新的基于深度学习的语音事件识别模型。模型以语音片段作为输入,运用格拉姆角场保留了时间序列的... 构音障碍是许多患有特殊疾病的患者所要面对的问题,会造成说话人发音不清晰。为更好地理解构音障碍患者所表达的语音事件,文章提出了一个新的基于深度学习的语音事件识别模型。模型以语音片段作为输入,运用格拉姆角场保留了时间序列的原始特征,利用Conformer对序列的局部特征和全局特征进行提取,最后用Res Net作为分类模型。在EasyCall corpus数据集上的实验结果表明,文章提出的模型具有良好的识别效果。 展开更多
关键词 语音事件识别 格拉姆角场 conformer ResNet
下载PDF
基于多尺度阶梯时频Conformer GAN的语音增强算法 被引量:3
4
作者 金玉堂 王以松 +1 位作者 王丽会 赵鹏利 《计算机应用》 CSCD 北大核心 2023年第11期3607-3615,共9页
针对频率域语音增强算法中因相位混乱产生人工伪影,导致去噪性能受限、语音质量不高的问题,提出一种基于多尺度阶梯型时频Conformer生成对抗网络(MSLTF-CMGAN)的语音增强算法。将语音语谱图的实部、虚部和振幅谱作为输入,生成器首先在... 针对频率域语音增强算法中因相位混乱产生人工伪影,导致去噪性能受限、语音质量不高的问题,提出一种基于多尺度阶梯型时频Conformer生成对抗网络(MSLTF-CMGAN)的语音增强算法。将语音语谱图的实部、虚部和振幅谱作为输入,生成器首先在多个尺度上利用时间-频率Conformer学习时域和频域的全局及局部特征依赖;其次,利用Mask Decoder分支学习振幅掩码,而Complex Decoder分支则直接学习干净的语谱图,融合这两个Decoder分支的输出可得到重建后的语音;最后,利用指标判别器判别语音的评价指标得分,通过极大极小训练使生成器生成高质量的语音。采用主观评价平均意见得分(MOS)和客观评价指标在公开数据集VoiceBank+Demand上与各类语音增强模型进行对比,结果显示,所提算法的MOS信号失真(CSIG)和MOS噪声失真(CBAK)比目前最先进的方法CMGAN(基于Conformer的指标生成对抗网络语音增强模型)分别提高了0.04和0.07,尽管它的MOS整体语音质量(COVL)和语音质量的感知评估(PESQ)略低于CMGAN,但与其他对比模型相比在多项主客观语音质量评估方面的评分均处于领先水平。 展开更多
关键词 语音增强 多尺度 conformer 生成对抗网络 指标判别器 深度学习
下载PDF
基于特征提示的跨语种语音识别模型
5
作者 王嘉文 高定国 +1 位作者 索朗曲珍 尼琼 《科学技术与工程》 北大核心 2024年第24期10348-10355,共8页
跨语种语音识别是一种利用多种源语言的数据来训练一个能够识别目标语言的语音识别系统,它可以促进不同语言和文化之间的交流和理解。为解决跨语种语音识别存在着如何利用多语种数据来提高低资源语言的识别性能,源语言和目标语言之间的... 跨语种语音识别是一种利用多种源语言的数据来训练一个能够识别目标语言的语音识别系统,它可以促进不同语言和文化之间的交流和理解。为解决跨语种语音识别存在着如何利用多语种数据来提高低资源语言的识别性能,源语言和目标语言之间的领域偏移或干扰,不同语言之间的任务权重和数据分布等问题,通过特征提示的方法研究跨语种语音识别模型;为简化传统需要专业人员对音素进行统一标注的过程,通过对原数据标识对应语种的方法研究跨语种语音数据标注方式,在2个公开数据集上进行实验。结果表明:所提模型相比于目前主流的语音识别模型Conformer模型平均错误率降低46.44%,相比于基线模型平均错误率降低2.1%,达到较高的识别准确率。研究成果为跨语种语音识别领域提供了新的思路和方法。 展开更多
关键词 特征提示 跨语种 语音识别 conformer Contextnet
下载PDF
结合Conformer与N-gram的中文语音识别 被引量:5
6
作者 许鸿奎 卢江坤 +5 位作者 张子枫 周俊杰 胡文烨 姜彤彤 郭文涛 李振业 《计算机系统应用》 2022年第7期194-202,共9页
Transformer模型对输入序列中重要的信息进行学习,相比传统的ASR(automatic speech recognition)模型提升了准确性.Conformer模型在Transformer的编码器中加入卷积模块,增加了获取细微局部信息的能力,进一步提高了模型性能.本文结合使用... Transformer模型对输入序列中重要的信息进行学习,相比传统的ASR(automatic speech recognition)模型提升了准确性.Conformer模型在Transformer的编码器中加入卷积模块,增加了获取细微局部信息的能力,进一步提高了模型性能.本文结合使用Conformer模型和N-gram语言模型(language model,LM)用于中文语音识别,获得了良好的识别效果.在数据集AISHELL-1和aidatatang_200zh上的实验表明,使用Conformer模型字错率分别可降低到5.79%和5.60%,较Transformer模型降低了5.82%和2.71%.结合N-gram语言模型后字错率分别可降低到4.86%和5.10%达到最佳性能,实时率(real time factor,RTF)达到0.14566.测试信噪比降低为20 dB时模型字错率才明显下降到8.58%,表明该模型具有一定的抗噪能力. 展开更多
关键词 语音识别 TRANSFORMER 语言模型 conformer 深度学习
下载PDF
低资源非自回归壮语语音合成
7
作者 王杰 秦董洪 《中央民族大学学报(自然科学版)》 2024年第2期40-47,共8页
基于FastSpeech2模型,文章提出了非自回归的壮语语音合成模型Zhuang-TTS。为了提升模型合成壮语语音的韵律,根据壮语特点及实地调查提出了一套新的壮语音系(声调、声母或辅音、韵母或元音),同时针对壮语声学特点进行了改进:(1)使用壮语... 基于FastSpeech2模型,文章提出了非自回归的壮语语音合成模型Zhuang-TTS。为了提升模型合成壮语语音的韵律,根据壮语特点及实地调查提出了一套新的壮语音系(声调、声母或辅音、韵母或元音),同时针对壮语声学特点进行了改进:(1)使用壮语音素序列表征壮语发音信息;(2)使用音素级的声学调节器(与FastPitch类似),使合成结果更加稳定;(3)使用Conformer代替FastSpeech2模型中的Transformer,同时构建了一个壮语语音合成语料库。实验结果表明,Zhuang-TTS在韵律方面的意见评分(Mean Opinion Score, MOS)达到3.90,合成实时率达8.65×10^(-2)。该模型在合成壮语语音的质量和速度方面获得了较大提升,优于Tacotron2和FastSpeech2基线模型,研究推动了壮语语音合成领域的发展。 展开更多
关键词 壮语语音合成 非自回归声学模型 非自回归声码器 conformer
下载PDF
基于改进Conformer的新闻领域端到端语音识别
8
作者 张济民 早克热·卡德尔 +2 位作者 艾山·吾买尔 申云飞 汪烈军 《中文信息学报》 CSCD 北大核心 2024年第4期156-164,共9页
目前,开源的中文语音识别数据集大多面向通用领域,缺少面向新闻领域的开源语音识别语料库,因此该文构建了面向新闻领域的中文语音识别数据集CH_NEWS_ASR,并使用ESPNET-0.9.6框架的RNN、Transformer和Conformer等模型对数据集的有效性进... 目前,开源的中文语音识别数据集大多面向通用领域,缺少面向新闻领域的开源语音识别语料库,因此该文构建了面向新闻领域的中文语音识别数据集CH_NEWS_ASR,并使用ESPNET-0.9.6框架的RNN、Transformer和Conformer等模型对数据集的有效性进行了验证,实验表明,该文所构建的语料在最好的模型上CER为4.8%,SER为39.4%。由于新闻联播主持人说话语速相对较快,该文构建的数据集文本平均长度为28个字符,是Aishell_1数据集文本平均长度的2倍;且以往的研究中训练目标函数通常为基于字或词水平,缺乏明确的句子水平关系,因此该文提出了一个句子层级的一致性模块,与Conformer模型结合,直接减少源语音和目标文本的表示差异,在开源的Aishell_1数据集上其CER降低0.4%,SER降低2%;在CH_NEWS_ASR数据集上其CER降低0.9%,SER降低3%,实验结果表明,该方法在不增加模型参数量的前提下能有效提升语音识别的质量。 展开更多
关键词 端到端语音识别 conformer 句子层级一致性
下载PDF
基于Conformer的端到端语音识别方法
9
作者 胡从刚 申艺翔 +1 位作者 孙永奇 赵思聪 《计算机应用研究》 CSCD 北大核心 2024年第7期2018-2024,共7页
针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构,增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将... 针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构,增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将多分支融合为单分支,以降低计算复杂度、加快模型推理速度。然后,利用基于压缩和激励网络的通道注意力机制弥补缺失的通道特征信息,以提高语音识别准确率。最后,在公开数据集Aishell-1上的实验结果表明:相较于Conformer,所提出方法的字错误率降低了10.67%,验证了方法的先进性。此外,RepVGG-SE声学输入网络能够有效提高多种Transformer变体的端到端语音识别模型的整体性能,具有很好的泛化能力。 展开更多
关键词 语音识别 conformer RepVGG 压缩和激励网络
下载PDF
基于层次化Conformer的语音合成
10
作者 吴克伟 韩超 +2 位作者 孙永宣 彭梦昊 谢昭 《计算机科学》 CSCD 北大核心 2024年第2期161-171,共11页
语音合成需要将输入语句的文本转换为包含音素、单词和语句的语音信号。现有语音合成方法将语句看作一个整体,难以准确地合成出不同长度的语音信号。通过分析语音信号中蕴含的层次化关系,分别设计基于Conformer的层次化文本编码器和基于... 语音合成需要将输入语句的文本转换为包含音素、单词和语句的语音信号。现有语音合成方法将语句看作一个整体,难以准确地合成出不同长度的语音信号。通过分析语音信号中蕴含的层次化关系,分别设计基于Conformer的层次化文本编码器和基于Conformer的层次化语音编码器,并提出了一种基于层次化文本-语音Conformer的语音合成模型。首先,该模型根据输入文本信号的长度,构建层次化文本编码器,包括音素级、单词级、语句级文本编码器3个层次,不同层次的文本编码器描述不同长度的文本信息;并使用Conformer的注意力机制来学习该长度信号中不同时间特征之间的关系。利用层次化的文本编码器,能够找出语句中不同长度需要强调的信息,有效实现不同长度的文本特征提取,缓解合成的语音信号持续时间长度不确定的问题。其次,层次化语音编码器包括音素级、单词级、语句级语音编码器3个层次。每个层次的语音编码器将文本特征作为Conformer的查询向量,将语音特征作为Conformer的关键字向量和值向量,来提取文本特征和语音特征的匹配关系。利用层次化的语音编码器和文本语音匹配关系,可以缓解不同长度语音信号合成不准确的问题。所提模型的层次化文本-语音编码器可以灵活地嵌入现有的多种解码器中,通过文本和语音之间的互补,提供更为可靠的语音合成结果。在LJSpeech和LibriTTS两个数据集上进行实验验证,实验结果表明,所提方法的梅尔倒谱失真小于现有语音合成方法。 展开更多
关键词 语音合成 文本编码器 语音编码器 层次化模型 conformer
下载PDF
基于多任务损失附加语言模型的语音识别方法 被引量:1
11
作者 柳永利 张绍阳 +1 位作者 王裕恒 解熠 《江苏大学学报(自然科学版)》 CAS 北大核心 2023年第5期564-569,共6页
针对Attention过于灵活的对齐方式在复杂环境中适应性差、简单端到端模型对语言特征利用不充分的问题,研究了基于多任务损失附加语言模型的语音识别方法.通过分析语音信号特征,训练中选用包含更多信息的特征.以基于Attention的Conforme... 针对Attention过于灵活的对齐方式在复杂环境中适应性差、简单端到端模型对语言特征利用不充分的问题,研究了基于多任务损失附加语言模型的语音识别方法.通过分析语音信号特征,训练中选用包含更多信息的特征.以基于Attention的Conformer端到端模型为基础,采用CTC损失辅助纯Conformer(Attention)的多任务损失训练模型,得到Conformer-CTC语音识别模型.在Conformer-CTC模型基础上,通过分析对比部分语言模型的特点与效果,将Transformer语言模型通过重打分机制附加至上述模型的训练中,最终得到Conformer-CTC-Transformer语音识别模型.在AISHELL-1数据集上对上述模型进行了试验.结果表明:Conformer-CTC模型相对于纯Conformer(Attention)模型在测试集上的字错率(character error rate,CER)降低了0.49%,而Conformer-CTC-Transformer模型相对于Conformer-CTC模型在测试集上的CER又降低了0.79%.CTC损失可以改善Attention对齐方式在复杂环境中的适应性,并且对Conformer-CTC模型附加Transformer语言模型重打分后能再次提升0.30%的识别准确率.相较于现有的部分端到端模型,Conformer-CTC-Transformer模型识别效果较好,说明该模型具有一定的有效性. 展开更多
关键词 语音识别 深度学习 语言模型 多任务损失 conformer TRANSFORMER CTC
下载PDF
基于Conformer的时域多通道语音分离方法 被引量:1
12
作者 陈佳佳 张海剑 华光 《无线电工程》 北大核心 2023年第9期2054-2060,共7页
多通道语音中的空间特征信息为说话人分离提供了重要的线索,为了更好地提取通道间信息并有效降低网络的处理时延,提出一种多通道时域语音分离方法。利用多层编码器实现语音特征提取并挖掘通道间信息,在逐层编码过程中获得不同时间分辨... 多通道语音中的空间特征信息为说话人分离提供了重要的线索,为了更好地提取通道间信息并有效降低网络的处理时延,提出一种多通道时域语音分离方法。利用多层编码器实现语音特征提取并挖掘通道间信息,在逐层编码过程中获得不同时间分辨率的语音特征并降低特征时间维度;引入Conformer结构对语音全局时间关系进行建模,在解码阶段使用特征加权跳跃连接融合对应编码层的输出特征进行解码,并将高维语音特征恢复为时域信号。在基于LibriSpeech仿真的多通道混响带噪语音数据集中进行实验,实验结果表明,所提方法通过多层编解码机制充分利用了多通道语音信息并降低了网络处理时延,通过Conformer实现并行数据处理和全局时间关系建模,在推理速度、分离语音质量和语音感知质量方面均优于基线单通道和多通道时域语音分离算法。 展开更多
关键词 语音分离 conformer 多通道 多层编码器
下载PDF
一种改进的线性注意力机制语音识别方法 被引量:1
13
作者 李宜亭 屈丹 +2 位作者 杨绪魁 张昊 沈小龙 《信号处理》 CSCD 北大核心 2023年第3期516-525,共10页
Conformer模型因其优越的性能,吸引了越来越多研究者的关注,逐渐成为语音识别领域的主流模型,但因其采用注意力机制从输入中提取信息,需要对输入序列中所有样本点进行交互计算,导致网络计算复杂度为输入序列长度的平方,因此在对长语音... Conformer模型因其优越的性能,吸引了越来越多研究者的关注,逐渐成为语音识别领域的主流模型,但因其采用注意力机制从输入中提取信息,需要对输入序列中所有样本点进行交互计算,导致网络计算复杂度为输入序列长度的平方,因此在对长语音进行识别时需要消耗更多计算资源,其识别速度较慢。针对此问题,本文提出一种线性注意力机制的语音识别方法。首先,提出一种新型门控线性注意力结构将多头注意力改进为单头,将注意力计算复杂度改进为序列长度的线性关系,以有效减少注意力计算复杂度。其次,为了弥补使用线性注意力导致的模型建模能力下降,在线性注意力求解过程中,综合使用局部注意力和全局注意力,联合线性注意力编码,提高模型识别精度。最后,为了进一步提升模型识别效果,在注意力损失和连接时序分类(connectionist temporal classification,CTC)损失的基础上使用注意力引导损失和中间CTC损失融合建模目标函数。在中文普通话数据集AISHELL-1和英文LibriSpeech数据集上的实验结果表明,改进模型的性能明显优于基线模型,且模型显存消耗下降,训练、识别速度得到较大提升。 展开更多
关键词 语音识别 端到端 高效注意力 连接时序分类 conformer
下载PDF
基于CNN和Transformer的双路径语音分离
14
作者 王钧谕 高勇 《通信技术》 2023年第5期585-589,共5页
使用深度学习技术进行语音分离已经取得了优异的成果。当前主流的语音分离模型主要基于注意力模块或卷积神经网络,它们通过许多中间状态传递信息,难以对较长的语音序列建模导致分离性能不佳。首先提出了一种端到端的双路径语音分离网络(... 使用深度学习技术进行语音分离已经取得了优异的成果。当前主流的语音分离模型主要基于注意力模块或卷积神经网络,它们通过许多中间状态传递信息,难以对较长的语音序列建模导致分离性能不佳。首先提出了一种端到端的双路径语音分离网络(DPCFNet),该网络通过引入改进的密集连接块,使编码器能提取到丰富的语音特征。然后使用卷积增强Transformer(Conformer)作为分离层的主要组成部分,使语音序列中的元素可以直接交互,不再通过中间状态传递信息。最后将Conformer与双路径结构相结合使得该模型能够有效地进行长语音序列建模。实验结果表明,相比于当前主流的Conv-Tasnet算法及DPTNet算法,所提出的模型在信噪失真比(Signal to noise Distortion Ratio,SDR)和尺度不变信噪失真比(Scale-Invariant Signal to noise Distortion Ratio,SI-SDR)上有明显提高,分离性能更好。 展开更多
关键词 深度学习 conformer 双路径网络 单通道语音分离 密集连接块
下载PDF
语音识别中的Conformer模型压缩研究
15
作者 卢江坤 许鸿奎 +3 位作者 张子枫 周俊杰 李振业 郭文涛 《计算机时代》 2023年第4期16-22,28,共8页
针对使用Conformer模型的语音识别算法在实际应用时设备算力不足及资源缺乏的问题,提出一种基于Conformer模型间隔剪枝和参数量化相结合的模型压缩方法。实验显示,使用该方法压缩后,模型的实时率(real time factor, RTF)达到0.107614,... 针对使用Conformer模型的语音识别算法在实际应用时设备算力不足及资源缺乏的问题,提出一种基于Conformer模型间隔剪枝和参数量化相结合的模型压缩方法。实验显示,使用该方法压缩后,模型的实时率(real time factor, RTF)达到0.107614,较基线模型的推理速度提升了16.2%,而识别准确率只下降了1.79%,并且模型大小也由原来的207.91MB下降到72.69MB。该方法在模型准确率损失很小的情况下,较大程度地提升了模型的适用性。 展开更多
关键词 深度学习 模型压缩 模型量化 模型剪枝 conformer
下载PDF
基于U-Conformer的多特征融合鸟鸣声分离方法
16
作者 倪东明 石煜炜 +1 位作者 夏灿玮 谢将剑 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期388-395,共8页
针对多个鸟类个体同时发声导致的鸣声混叠问题,本文提出了一种融合录音通道间空间特征的鸟类鸣声分离方法.该方法将混叠鸣声信号的声谱特征和空间特征作为分离模型的输入,提出深度学习模型U-Conformer来预测每个鸣声源方向的幅值谱掩膜(... 针对多个鸟类个体同时发声导致的鸣声混叠问题,本文提出了一种融合录音通道间空间特征的鸟类鸣声分离方法.该方法将混叠鸣声信号的声谱特征和空间特征作为分离模型的输入,提出深度学习模型U-Conformer来预测每个鸣声源方向的幅值谱掩膜(spectral magnitude mask,SMM),通过模型估计的SMM从混叠鸣声信号中恢复每个鸣声源信号.由多源混叠鸟类鸣声数据的实验结果表明,本文提出的分离方法较其他深度学习模型结构具有更好的分离效果,有助于更好地分析野外鸟类鸣声录音. 展开更多
关键词 鸟鸣声分离 空间特征 conformer 幅值谱掩膜
下载PDF
面向铁路客运站场景的语音降噪模型研究
17
作者 高志强 戴琳琳 +1 位作者 景辉 王心雨 《铁路计算机应用》 2023年第2期7-12,共6页
为进一步提升铁路客运站嘈杂环境下的语音识别效果,文章提出一种基于Conformer的语音降噪模型ConformerGAN。其训练流程类似生成对抗网络,生成器采用Conformer进行语音特征提取,对特征建模;鉴别器使用代理评估函数对语音感知进行质量评... 为进一步提升铁路客运站嘈杂环境下的语音识别效果,文章提出一种基于Conformer的语音降噪模型ConformerGAN。其训练流程类似生成对抗网络,生成器采用Conformer进行语音特征提取,对特征建模;鉴别器使用代理评估函数对语音感知进行质量评价。为增强模型的泛化能力并提高模型对未知噪声的降噪能力,在噪声的叠加上采用随机截取片段融入的方式,并构建铁路客运站场景噪声数据集。与语音降噪相关模型效果对比的结果表明,ConformerGAN模型可将客观语音质量评估(PESQ,Perceptual Evaluation of Speech Quality)分数提高0.19,有效提高铁路客运站嘈杂环境下的语音识别准确率,改善铁路旅客语音交互体验。 展开更多
关键词 铁路客运站 语音降噪 conformer 生成对抗网络(GAN) 语音识别
下载PDF
基于Conformer模型的智能电网调度语音识别研究
18
作者 邓彬 彭超逸 张宗包 《制造业自动化》 2024年第6期126-131,共6页
完成智能虚拟电网调度,语音识别是重要一部分,识别的准确性直接由语言模型决定。提出一种基于Conformer模型的智能电网调度语音识别技术,在Transformer模型里面引入卷积模块来提高模型的细微特征学习能力,首先介绍了Conformer的原理,并... 完成智能虚拟电网调度,语音识别是重要一部分,识别的准确性直接由语言模型决定。提出一种基于Conformer模型的智能电网调度语音识别技术,在Transformer模型里面引入卷积模块来提高模型的细微特征学习能力,首先介绍了Conformer的原理,并结合LAS解码器构建了语音识别模型;然后输入电网调度语言进行特征提取,提高模型的适应性;最后通过试验验证,所提模型在电网调度语音识别中具有很高的准确性,验证相对于常见的语音识别Transformer模型与CTC模型,在验证集上的字错率分别降低了11.23%、21.76%,表明模型具有很好的效果。 展开更多
关键词 电网调度 语音识别 conformer TRANSFORMER 特征学习
下载PDF
应用原子键电负性均衡方法σπ模型研究顺式丙烯酸的分子内氢键和构象 被引量:5
19
作者 杨忠志 范文杰 《辽宁师范大学学报(自然科学版)》 CAS 北大核心 2005年第2期189-192,共4页
在密度泛函理论框架下发展的原子键电负性均衡方法σπ模型(ABEEMσπ),在探讨有机分子体系的结构和性质等方面取得了令人满意的成果.本文利用该模型计算了顺式丙烯酸不同构象的氢键值.根据氢键能与构象稳定性的关系,预测并解释了构象... 在密度泛函理论框架下发展的原子键电负性均衡方法σπ模型(ABEEMσπ),在探讨有机分子体系的结构和性质等方面取得了令人满意的成果.本文利用该模型计算了顺式丙烯酸不同构象的氢键值.根据氢键能与构象稳定性的关系,预测并解释了构象的稳定性,并与从头计算结果相比较,取得了很好的一致性. 展开更多
关键词 σπ模型 均衡方法 丙烯酸 电负性 分子内氢键 顺式 原子键 应用 构象稳定性 理论框架 密度泛函 模型计算 分子体系 计算结果 一致性 键能
下载PDF
利格列汀多晶型研究
20
作者 刘奇 刘沫毅 +2 位作者 董思雨 王学重 何运良 《高等学校化学学报》 SCIE EI CSCD 北大核心 2024年第1期33-42,共10页
研究了利格列汀复杂的晶型现象及其晶格中的构象变化.通过培养利格列汀的单晶并进行X射线单晶衍射分析,首次得到了包括晶型A在内的3种晶体结构;结合文献已报道的2种晶体结构,分析了各晶体结构的特点及其晶格中的分子构象.研究结果表明,... 研究了利格列汀复杂的晶型现象及其晶格中的构象变化.通过培养利格列汀的单晶并进行X射线单晶衍射分析,首次得到了包括晶型A在内的3种晶体结构;结合文献已报道的2种晶体结构,分析了各晶体结构的特点及其晶格中的分子构象.研究结果表明,5种晶体里存在晶型A和晶型F两种晶型,其中晶型F为准多晶型,可以包含多种溶剂,形成通道型溶剂合物,其晶格参数随包含的溶剂略有变化.晶型A的构象与晶型F的构象存在较高能垒,导致2种晶型难以互相转化.晶型F不同溶剂合物之间的分子构象并不完全相同,在粉末X射线衍射(PXRD)谱图上也有显著差异.最后,通过混悬转晶和热分析等方法研究了晶型之间的转化关系. 展开更多
关键词 利格列汀 多晶型 构象 通道型溶剂合物
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部