期刊文献+
共找到219篇文章
< 1 2 11 >
每页显示 20 50 100
基于注意力机制和一致性损失的深度伪造人脸检测方法 被引量:2
1
作者 范智贤 程晴晴 杨高明 《湖北民族大学学报(自然科学版)》 CAS 2023年第3期338-343,359,共7页
为解决目前深度仿造检测方法对于跨数据集的检测性能难以提高的问题,提出基于注意力机制和一致性损失相结合的深度伪造人脸检测方法(method based on attention mechanism and consistency loss,MAMCL)。采用多注意力机制,迫使网络捕捉... 为解决目前深度仿造检测方法对于跨数据集的检测性能难以提高的问题,提出基于注意力机制和一致性损失相结合的深度伪造人脸检测方法(method based on attention mechanism and consistency loss,MAMCL)。采用多注意力机制,迫使网络捕捉到更细微的局部异常。采用基于注意力机制的擦除方式,鼓励模型深入挖掘之前忽略的区域。设计一致性模块获取伪造图像中普遍存在的不一致细节特征,并应用一致性损失引导模型更加关注伪造细节。在面部取证++(FaceForensics++,FF++)数据集上进行实验,准确率达到96.38%,受试者工作特征曲线(receiver operating characteristic curve,ROC)的曲线下面积达到99.34%,在泛化性能测试中也取得了良好的效果。通过消融实验,证明了每个模块的有效性。结果表明,提出的检测方法能够较为准确地检测深度伪造人脸,且具有良好的泛化性能,可以作为应对当前人脸伪造威胁的有效检测手段。 展开更多
关键词 深度伪造检测 多注意力机制 擦除 一致性损失 余弦相似度 人脸
下载PDF
基于层次时空特征与多头注意力的恶意加密流量识别 被引量:24
2
作者 蒋彤彤 尹魏昕 +1 位作者 蔡冰 张琨 《计算机工程》 CAS CSCD 北大核心 2021年第7期101-108,共8页
为实现互联网全面加密环境下的恶意加密流量精确检测,针对传统识别方法较依赖专家经验且对加密流量特征的区分能力不强等问题,提出一种基于层次时空特征与多头注意力(HST-MHSA)模型的端到端恶意加密流量识别方法。基于流量层次结构,结... 为实现互联网全面加密环境下的恶意加密流量精确检测,针对传统识别方法较依赖专家经验且对加密流量特征的区分能力不强等问题,提出一种基于层次时空特征与多头注意力(HST-MHSA)模型的端到端恶意加密流量识别方法。基于流量层次结构,结合长短时记忆网络和Text CNN有效整合加密流量的多尺度局部特征和双层全局特征,并引入多头注意力机制进一步增强关键特征的区分度。在公开数据集CICAnd Mal2017上的实验结果表明,HST-MHSA模型的流量识别F1值相较基准模型最高提升了16.77个百分点,漏报率比HAST-Ⅱ和HABBi LSTM模型分别降低了3.19和2.18个百分点,说明其对恶意加密流量具有更强的表征和识别能力。 展开更多
关键词 加密流量识别 多头注意力机制 恶意流量识别 卷积神经网络 长短时记忆网络
下载PDF
基于多注意力多尺度特征融合的图像描述生成算法 被引量:17
3
作者 陈龙杰 张钰 +1 位作者 张玉梅 吴晓军 《计算机应用》 CSCD 北大核心 2019年第2期354-359,共6页
针对图像描述生成中对图像细节表述质量不高、图像特征利用不充分、循环神经网络层次单一等问题,提出基于多注意力、多尺度特征融合的图像描述生成算法。该算法使用经过预训练的目标检测网络来提取图像在卷积神经网络不同层上的特征,将... 针对图像描述生成中对图像细节表述质量不高、图像特征利用不充分、循环神经网络层次单一等问题,提出基于多注意力、多尺度特征融合的图像描述生成算法。该算法使用经过预训练的目标检测网络来提取图像在卷积神经网络不同层上的特征,将图像特征分层输入多注意力结构中,依次将多注意力结构与多层循环神经网络相连,构造出多层次的图像描述生成网络模型。在多层循环神经网络中加入残差连接来提高网络性能,并且可以有效避免因为网络加深导致的网络退化问题。在MSCOCO测试集中,所提算法的BLEU-1和CIDEr得分分别可以达到0. 804及1. 167,明显优于基于单一注意力结构的自上而下图像描述生成算法;通过人工观察对比可知,所提算法生成的图像描述可以表现出更好的图像细节。 展开更多
关键词 长短期记忆网络 图像描述 多注意力机制 多尺度特征融合 深度神经网络
下载PDF
基于多头注意力机制Tree-LSTM的句子语义相似度计算 被引量:18
4
作者 胡艳霞 王成 +2 位作者 李弼程 李海林 吴以茵 《中文信息学报》 CSCD 北大核心 2020年第3期23-33,共11页
针对现有句子语义相似度计算由于缺乏语义结构信息导致精度低的问题,该文在依存关系树的基础上,提出了一种基于多头注意力机制Tree-LSTM(multi-head attention Tree-LSTM,MA-Tree-LSTM)的句子语义相似度计算方法。首先,MA-Tree-LSTM将... 针对现有句子语义相似度计算由于缺乏语义结构信息导致精度低的问题,该文在依存关系树的基础上,提出了一种基于多头注意力机制Tree-LSTM(multi-head attention Tree-LSTM,MA-Tree-LSTM)的句子语义相似度计算方法。首先,MA-Tree-LSTM将外部具有指导意义的特征作为输入,再将输入结合多头注意力机制作用在Tree-LSTM树节点的所有孩子节点上,为每个孩子节点赋予不同的权重值,从而实现多头注意力机制和Tree-LSTM的融合;其次,将三层的MA-Tree-LSTM应用于句子语义相似度计算并实现句子对的相互指导,从而得到句子对语义特征的多层表示;最后联合多层的语义特征建立句子对语义相似度计算模型,从而实现句子对间相关的语义结构特征的充分利用。该文提出的方法鲁棒性强,可解释性强,对句子单词的顺序不敏感,不需要特征工程。在SICK和STS数据集上的实验结果表明,基于MA-Tree-LSTM的句子语义相似度计算的精度优于非注意力机制的Tree-LSTM方法以及融合了多头注意力机制的BiLSTM方法。 展开更多
关键词 句子语义相似度计算 多头注意力机制 Tree-LSTM 语义依存树
下载PDF
多头注意力与字词融合的中文命名实体识别 被引量:15
5
作者 赵丹丹 黄德根 +2 位作者 孟佳娜 谷丰 张攀 《计算机工程与应用》 CSCD 北大核心 2022年第7期142-149,共8页
命名实体识别(named entity recognition,NER)是自然语言处理中重要的基础任务,而中文命名实体识别(Chinese named entity recognition,CNER)因分词歧义和一词多义等问题使其尤显困难。针对这些问题,提出多头注意力机制(multi-heads att... 命名实体识别(named entity recognition,NER)是自然语言处理中重要的基础任务,而中文命名实体识别(Chinese named entity recognition,CNER)因分词歧义和一词多义等问题使其尤显困难。针对这些问题,提出多头注意力机制(multi-heads attention mechanism,Multi-Attention)与字词融合的中文命名实体识别模型(CWA-CNER)。将汉语文本字向量与其在句中可能成词的词向量进行拼接,并将其送入长短时记忆网络(bidirectional long short-term memory neural network,BiLSTM)提取上下文语义信息,进而利用多头注意力机制捕获句中元素间联系的紧密程度,最后通过条件随机场(conditional random field,CRF)进行实体标注。该模型在Boson数据集,1998和2014年《人民日报》三种语料上进行实验,其F1值均达到90%以上,结果表明了模型的有效性。 展开更多
关键词 命名实体识别(NER) 多头注意力机制 字词融合
下载PDF
基于多头注意力机制的用户窃电行为检测 被引量:11
6
作者 肖丁 张玙璠 纪厚业 《计算机科学》 CSCD 北大核心 2022年第1期140-145,共6页
窃电对社会和经济发展造成了重大损害。如何基于电力大数据来检测用户恶意窃电行为,已受到学术界和工业界的广泛关注。针对传统方法依赖于手工特征、行为序列表征不足和检测精度差等问题,提出了一种基于多头注意力机制的窃电检测模型(El... 窃电对社会和经济发展造成了重大损害。如何基于电力大数据来检测用户恶意窃电行为,已受到学术界和工业界的广泛关注。针对传统方法依赖于手工特征、行为序列表征不足和检测精度差等问题,提出了一种基于多头注意力机制的窃电检测模型(Electricity Theft Detection Based on Multi-Head Attention, ETD-MHA)。该模型基于双向门控循环神经网络(Bidirectional Gated Recurrent Unit, BiGRU)充分捕获用户用电行为序列的时序特征,引入多头注意力机制来进一步增强关键特征的区分度,并通过加深网络来提高学习效果。在爱尔兰和中国国家电网智能电表数据集上进行了大量的实验,结果表明,相比传统的逻辑回归(Linear Regression, LR)、支持向量机(Support Vector Machine, SVM)、随机森林(Random Forest, RF)等多种算法,所提模型展现出了明显的优势。例如,在爱尔兰智能电表数据集上,其AUC值相比LR算法最高提升了34.6%。 展开更多
关键词 智能电网 窃电检测 深度学习 门控循环神经网络 多头注意力机制
下载PDF
融入领域术语词典的司法舆情敏感信息识别 被引量:10
7
作者 张泽锋 毛存礼 +2 位作者 余正涛 黄于欣 刘奕洋 《中文信息学报》 CSCD 北大核心 2022年第9期76-83,92,共9页
司法舆情敏感信息识别主要是从海量网络文本中识别出与司法领域相关的敏感舆情。当前,面向司法舆情敏感信息识别的研究较少,相比通用领域的敏感信息识别任务,司法舆情敏感信息具有描述不规范、冗余信息多以及领域词汇过多等特点,这使得... 司法舆情敏感信息识别主要是从海量网络文本中识别出与司法领域相关的敏感舆情。当前,面向司法舆情敏感信息识别的研究较少,相比通用领域的敏感信息识别任务,司法舆情敏感信息具有描述不规范、冗余信息多以及领域词汇过多等特点,这使得通用模型并不适用该任务。为此,该文提出融入领域术语词典的司法舆情敏感信息识别模型。首先使用双向循环神经网络和多头注意力机制对舆情文本进行编码,得到具有权重信息的文本表示;其次将领域术语词典作为分类的指导知识,与舆情文本表征构建相似矩阵,得到融入领域术语词典的司法敏感文本表征;然后利用卷积神经网络对其进行局部信息编码,再利用多头注意力机制获取具有敏感权重的局部特征;最后实现司法领域敏感信息识别。实验结果表明,相比Bi-LSTM Attention基线模型,F_(1)值提升了8%。 展开更多
关键词 司法舆情 敏感信息 领域术语词典 多头注意力机制
下载PDF
融合语义信息与问题关键信息的多阶段注意力答案选取模型 被引量:10
8
作者 张仰森 王胜 +2 位作者 魏文杰 彭媛媛 郑佳 《计算机学报》 EI CSCD 北大核心 2021年第3期491-507,共17页
自动问答系统可以帮助人们快速从海量文本中提取出有效信息,而答案选取作为其中的关键一步,在很大程度上影响着自动问答系统的性能.针对现有答案选择模型中答案关键信息捕获不准确的问题,本文提出了一种融合语义信息与问题关键信息的多... 自动问答系统可以帮助人们快速从海量文本中提取出有效信息,而答案选取作为其中的关键一步,在很大程度上影响着自动问答系统的性能.针对现有答案选择模型中答案关键信息捕获不准确的问题,本文提出了一种融合语义信息与问题关键信息的多阶段注意力答案选取模型.该方法首先利用双向LSTM模型分别对问题和候选答案进行语义表示;然后采用问题的关键信息,包括问题类型和问题中心词,利用注意力机制对候选答案集合进行信息增强,筛选Top K个候选答案;然后采用问题的语义信息,再次利用注意力机制对Top K个候选答案集合进行信息增强,筛选出最佳答案.通过分阶段地将问题的关键信息和语义信息与候选答案的语义表示相结合,有效提高了对候选答案关键信息的捕获能力,从而提升了答案选取系统的性能.在三个数据集上对本文所提出的模型进行验证,相较已知同类最好模型,最高性能提升达1.95%. 展开更多
关键词 答案选取 语义信息 关键信息 相似度计算 多阶段注意力机制
下载PDF
基于多注意力长短时记忆的实体属性情感分析 被引量:9
9
作者 支淑婷 李晓戈 +1 位作者 王京博 王鹏华 《计算机应用》 CSCD 北大核心 2019年第1期160-167,共8页
属性情感分析是细粒度的情感分类任务。针对传统神经网络模型无法准确构建属性情感特征的问题,提出了一种融合多注意力和属性上下文的长短时记忆(LSTM-MATT-AC)神经网络模型。在双向长短时记忆(LSTM)的不同位置加入不同类型的注意力机制... 属性情感分析是细粒度的情感分类任务。针对传统神经网络模型无法准确构建属性情感特征的问题,提出了一种融合多注意力和属性上下文的长短时记忆(LSTM-MATT-AC)神经网络模型。在双向长短时记忆(LSTM)的不同位置加入不同类型的注意力机制,充分利用多注意力机制的优势,让模型能够从不同的角度关注句子中特定属性的情感信息,弥补了单一注意力机制的不足;同时,融合双向LSTM独立编码的属性上下文语义信息,获取更深层次的情感特征,有效识别特定属性的情感极性;最后在Sem Eval2014 Task4和Twitter数据集上进行实验,验证了不同注意力机制和独立上下文处理方式对属性情感分析模型的有效性。实验结果表明,模型在Restaurant、Laptop和Twitter领域数据集上的准确率分别达到了80. 6%、75. 1%和71. 1%,较之前基于神经网络的情感分析模型在准确率上有了进一步的提高。 展开更多
关键词 属性情感分析 多注意力机制 上下文语义特征 神经网络 自然语言处理
下载PDF
基于多注意力机制级联LSTM模型的猪脸表情识别 被引量:8
10
作者 温长吉 张笑然 +4 位作者 吴建双 杨策 李卓识 石磊 于合龙 《农业工程学报》 EI CAS CSCD 北大核心 2021年第12期181-190,共10页
面部表情是传递情感的重要信息,是家畜生理、心理和行为的综合反映,可以用于评估家畜福利。由于家畜面部肌群结构简单,因此家畜面部不同区域的细微变化对于表情的反映较难识别。该研究提出一种基于多注意力机制级联LSTM框架模型(Multi-a... 面部表情是传递情感的重要信息,是家畜生理、心理和行为的综合反映,可以用于评估家畜福利。由于家畜面部肌群结构简单,因此家畜面部不同区域的细微变化对于表情的反映较难识别。该研究提出一种基于多注意力机制级联LSTM框架模型(Multi-attention Cascaded Long Short Term Memory,MA-LSTM)对家猪时序面部表情进行分类识别。首先通过简化的多任务级联卷积结构实现帧图像中猪脸的快速检测与定位,去除非猪脸区域对于识别性能的影响。其次提出一种多注意力机制模块,利用不同特征通道视觉信息不同相应峰值响应区域也不同这一特性,通过对峰值响应相近区域进行聚类捕获表情变化引起的面部显著性区域,实现对面部细微变化的关注。在自标注构建的家猪表情数据集上的试验结果表明,该研究提出的多注意力机制级联LSTM模型在4类表情的平均识别准确率为91.826%,对比关闭多注意力机制模块平均识别准确率平均提升6.3个百分点,同时误分率也有较为明显的降低。对比其他常用面部表情识别算法LBP-TOP、HOG-TOP、ELRCN、STC-NLSTM,MA-LSTM模型平均识别精度分别提升约32.6、18.0、5.9和4.4个百分点。试验结果验证了该研究提出的多注意力机制级联LSTM模型在猪脸表情识别的有效性。 展开更多
关键词 模型 表情识别 多注意力机制 多任务级联卷积网络 长短时记忆网络 家畜福利
下载PDF
基于改进SE-Net网络与多注意力的脑肿瘤分类方法 被引量:4
11
作者 张晓倩 罗建 +2 位作者 杨梅 金芊芊 朱熹 《西华师范大学学报(自然科学版)》 2024年第1期93-101,共9页
手工筛选肿瘤图像来预测脑肿瘤类别的方法非常耗时,而将深度学习与医学图像相结合的方式,可以在一定程度上帮助医生解决这一问题,因此提出改进的SE-Net网络。首先,将Swish激活函数代替批归一化和特征融合后的ReLU激活函数,使模型更好地... 手工筛选肿瘤图像来预测脑肿瘤类别的方法非常耗时,而将深度学习与医学图像相结合的方式,可以在一定程度上帮助医生解决这一问题,因此提出改进的SE-Net网络。首先,将Swish激活函数代替批归一化和特征融合后的ReLU激活函数,使模型更好地学习有效特征;其次,在第一层和第二层卷积层后分别添加ECA和改进的BAM注意力模块,在空间和通道2个方向并发进行特征提取,使目标特征充分被利用;最后,在SE注意力模块中添加全局最大池化,利用双通道池化层提取有效特征,抑制无效特征,提高模型准确率。在Kaggle公开的数据集中进行训练与测试,最终结果表明,该方法在脑肿瘤分类测试集中的准确率、召回率、精确率和F1值分别达到99.47%、99.42%、99.45%和99.43%,充分验证了改进模型的有效性。 展开更多
关键词 脑肿瘤 多注意力机制 深度卷积神经网络 计算机辅助诊断系统 分类
下载PDF
多传感器融合和MHA-LSTM的电机轴承剩余寿命预测 被引量:3
12
作者 张菀 张泰瑀 +1 位作者 贾民平 蔡骏 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第3期84-93,共10页
轴承作为电机的核心部件,主要起到支撑引导轴、减小设备摩擦、连接不同设备等作用,其剩余寿命预测对系统健康管理起着十分重要的作用。针对单一传感器信号通常难以全面描述系统的潜在退化机制,论文提出一种基于多头注意力机制和长短时... 轴承作为电机的核心部件,主要起到支撑引导轴、减小设备摩擦、连接不同设备等作用,其剩余寿命预测对系统健康管理起着十分重要的作用。针对单一传感器信号通常难以全面描述系统的潜在退化机制,论文提出一种基于多头注意力机制和长短时记忆神经网络的电机轴承剩余寿命预测模型。首先,基于马氏距离确定轴承性能退化起始点,将滚动轴承全寿命周期分为正常阶段与退化阶段;其次,使用自编码器自动提取振动信号特征,并将其与电机电流、轴承温度融合,构成多源信息特征矩阵;然后基于多头注意力机制和长短时记忆网络模型动态选择相关度较高的特征,提高寿命预测的准确性。最后,采用实验数据进行验证,结果表明所提出的模型具有更高的准确性。 展开更多
关键词 电机轴承 多传感器融合 多头注意力机制 长短期记忆网络 剩余寿命预测
下载PDF
多尺度特征提取和多层次注意力机制的迷彩伪装目标分割算法 被引量:7
13
作者 梁新宇 权冀川 +2 位作者 杨辉 肖铠鸿 王中伟 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2022年第5期683-692,共10页
针对现阶段语义分割算法在野外战场环境中对迷彩伪装目标分割边界不理想、小目标分割精度低的问题,提出一种结合多尺度特征提取和多层次注意力机制的迷彩伪装目标语义分割算法CSS-Net.该算法由编码结构和解码结构组成.编码部分利用轻量... 针对现阶段语义分割算法在野外战场环境中对迷彩伪装目标分割边界不理想、小目标分割精度低的问题,提出一种结合多尺度特征提取和多层次注意力机制的迷彩伪装目标语义分割算法CSS-Net.该算法由编码结构和解码结构组成.编码部分利用轻量化的深度可分离卷积联合残差结构构建特征编码器,对迷彩伪装目标图像进行特征提取;解码部分设计了策略选择的多尺度特征融合模块和多层次注意力特征增强模块,用以获取图像的多尺度信息和通道信息,在逐步精细化分割结果的同时进一步增强图像的语义解码过程.实验结果表明,CSS-Net算法能够有效实现复杂战场环境下伪装目标的分割识别,总体分割的平均交并比指标达到91.98%,分割边界得到改善.与DeepLabv3+算法相比,CSS-Net算法用于迷彩伪装小目标图像分割时的平均交并比指标增长3.71个百分点,对于多尺度目标分割的平均交并比指标均超过85%,分割效果提升明显. 展开更多
关键词 语义分割 迷彩伪装目标 多尺度特征融合 多层次注意力机制
下载PDF
MU-GAN:Facial Attribute Editing Based on Multi-Attention Mechanism 被引量:6
14
作者 Ke Zhang Yukun Su +2 位作者 Xiwang Guo Liang Qi Zhenbing Zhao 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2021年第9期1614-1626,共13页
Facial attribute editing has mainly two objectives:1)translating image from a source domain to a target one,and 2)only changing the facial regions related to a target attribute and preserving the attribute-excluding d... Facial attribute editing has mainly two objectives:1)translating image from a source domain to a target one,and 2)only changing the facial regions related to a target attribute and preserving the attribute-excluding details.In this work,we propose a multi-attention U-Net-based generative adversarial network(MU-GAN).First,we replace a classic convolutional encoder-decoder with a symmetric U-Net-like structure in a generator,and then apply an additive attention mechanism to build attention-based U-Net connections for adaptively transferring encoder representations to complement a decoder with attribute-excluding detail and enhance attribute editing ability.Second,a self-attention(SA)mechanism is incorporated into convolutional layers for modeling long-range and multi-level dependencies across image regions.Experimental results indicate that our method is capable of balancing attribute editing ability and details preservation ability,and can decouple the correlation among attributes.It outperforms the state-of-the-art methods in terms of attribute manipulation accuracy and image quality.Our code is available at https://github.com/SuSir1996/MU-GAN. 展开更多
关键词 attention U-Net connection encoder-decoder archi-tecture facial attribute editing multi-attention mechanism
下载PDF
基于循环生成对抗网络的超分辨率重建算法研究 被引量:7
15
作者 蔡文郁 张美燕 +1 位作者 吴岩 郭嘉豪 《电子与信息学报》 EI CSCD 北大核心 2022年第1期178-186,共9页
为了提高图像超分辨率重建的效果,该文将注意力机制引入多级残差网络(Multi-level Residual Attention Network,MRAN)作为CycleGAN的重建网络,提出了基于循环生成对抗网络(CycleGAN)的超分辨率重建模型MRA-GAN。MRA-GAN模型中重建网络... 为了提高图像超分辨率重建的效果,该文将注意力机制引入多级残差网络(Multi-level Residual Attention Network,MRAN)作为CycleGAN的重建网络,提出了基于循环生成对抗网络(CycleGAN)的超分辨率重建模型MRA-GAN。MRA-GAN模型中重建网络负责将低分辨率(LR)图像重建为高分辨率(HR)图像,退化网络负责将HR图像降采样为LR图像,LR判别器负责鉴别真实LR图像和通过退化网络降采样得到的LR图像,HR判别器负责鉴别真实HR图像和通过重建网络重建得到的HR图像,并且改进了CycleGAN原有的判别器判别方式和损失函数。实验结果验证了MRA-GAN模型与现有算法相比,在峰值信噪比(PSNR)和结构相似性(SSIM)等指标上都有所改进。 展开更多
关键词 图像超分辨重建 多级残差网络 循环生成对抗网络 峰值信噪比 结构化相似性
下载PDF
改进MFCC和并行混合模型的语音情感识别 被引量:6
16
作者 崔琳 崔晨露 +1 位作者 刘政伟 薛凯 《计算机科学》 CSCD 北大核心 2023年第S01期156-162,共7页
传统MFCC不仅忽略了浊音信号中基音频率的影响,还不能表征语音的动态特征,因此提出利用滑动平均滤波器滤除浊音信号的基音频率,并在提取完静态MFCC特征后再通过提取其一阶差分与二阶差分来获取动态特征。将得到的特征送入模型中进行训练... 传统MFCC不仅忽略了浊音信号中基音频率的影响,还不能表征语音的动态特征,因此提出利用滑动平均滤波器滤除浊音信号的基音频率,并在提取完静态MFCC特征后再通过提取其一阶差分与二阶差分来获取动态特征。将得到的特征送入模型中进行训练,为了构建更高效的语音情感识别模型,搭建了一种融合多头注意力机制的并行混合模型。多头注意力机制不仅可以有效防止梯度消失现象,构建更深层的网络,各个注意力头还可以执行不同的任务来提高准确率。最后进行情感特征分类,传统softmax在进行分类时类内距离可能会变大导致模型的置信度差,因此引入了中心损失函数,将两者联合来进行分类。实验结果表明,所提方法在RAVDESS数据集和EMO-DB数据集上的准确率可以分别达到98.15%和96.26%。 展开更多
关键词 语音情感识别 MFCC 多头注意力机制 滑动平均滤波器 softmax
下载PDF
多维注意力特征聚合立体匹配算法 被引量:7
17
作者 张亚茹 孔雅婷 刘彬 《自动化学报》 EI CAS CSCD 北大核心 2022年第7期1805-1815,共11页
现有基于深度学习的立体匹配算法在学习推理过程中缺乏有效信息交互,而特征提取和代价聚合两个子模块的特征维度存在差异,导致注意力方法在立体匹配网络中应用较少、方式单一.针对上述问题,本文提出了一种多维注意力特征聚合立体匹配算... 现有基于深度学习的立体匹配算法在学习推理过程中缺乏有效信息交互,而特征提取和代价聚合两个子模块的特征维度存在差异,导致注意力方法在立体匹配网络中应用较少、方式单一.针对上述问题,本文提出了一种多维注意力特征聚合立体匹配算法.设计2D注意力残差模块,通过在原始残差网络中引入无降维自适应2D注意力残差单元,局部跨通道交互并提取显著信息,为匹配代价计算提供丰富有效的特征.构建3D注意力沙漏聚合模块,以堆叠沙漏结构为骨干设计3D注意力沙漏单元,捕获多尺度几何上下文信息,进一步扩展多维注意力机制,自适应聚合和重新校准来自不同网络深度的代价体.在三大标准数据集上进行评估,并与相关算法对比,实验结果表明所提算法具有更高的预测视差精度,且在无遮挡的显著对象上效果更佳. 展开更多
关键词 深度学习 立体匹配 多维注意力机制 信息交互
下载PDF
融合注意力机制的轨道入侵异物检测轻量级模型研究 被引量:6
18
作者 管岭 贾利民 谢征宇 《铁道学报》 EI CAS CSCD 北大核心 2023年第5期72-81,共10页
基于智能视频分析的轨道线路环境入侵物自主识别是保障轨道交通运营安全的关键技术之一。然而基于神经网络的高精度目标检测模型严重依赖算力,部署成本高,很难普及运用。为此,提出一种改进yolov4-tiny的轻量级网络模型。在网络主干,通... 基于智能视频分析的轨道线路环境入侵物自主识别是保障轨道交通运营安全的关键技术之一。然而基于神经网络的高精度目标检测模型严重依赖算力,部署成本高,很难普及运用。为此,提出一种改进yolov4-tiny的轻量级网络模型。在网络主干,通过融合跨阶段结构和通道混洗策略,提出CSPShuffleNet结构,加快网络推理;在网络颈部,引入多头注意力机制,增强网络目标定位能力;在网络头部,使用深度可分离卷积替换传统卷积,进一步压缩网络参数量。基于铁路异物数据集的实验结果表明:相比于原始yolov4-tiny,本模型的均值平均精度最大提高1.4%,参数量减少49.9%,模型容量减少55.4%。验证了本模型对于固定平台和移动平台检测系统的普适性,从而为铁路安全保障提供决策支持。 展开更多
关键词 异物入侵检测 轻量化神经网络 深度可分离卷积 通道混洗 多头注意力机制
下载PDF
多注意力机制的口罩检测网络 被引量:6
19
作者 余阿祥 李承润 +1 位作者 于书仪 李洪均 《南京师范大学学报(工程技术版)》 CAS 2021年第1期23-29,共7页
提出一种口罩佩戴检测模型,引入多注意力机制,提升了网络特征挖掘能力;利用柔性非极大抑制方法,消除多余目标检测框.在公共数据库上的仿真实验表明,该模型检测人脸口罩佩戴的平均精度达到93.81%,帧率达到11.8 fps,能有效地进行人脸口罩... 提出一种口罩佩戴检测模型,引入多注意力机制,提升了网络特征挖掘能力;利用柔性非极大抑制方法,消除多余目标检测框.在公共数据库上的仿真实验表明,该模型检测人脸口罩佩戴的平均精度达到93.81%,帧率达到11.8 fps,能有效地进行人脸口罩佩戴检测. 展开更多
关键词 口罩佩戴检测 多注意力机制 特征挖掘 柔性非极大抑制
下载PDF
基于DeepFM的深度兴趣因子分解机网络 被引量:6
20
作者 王瑞平 贾真 +2 位作者 刘畅 陈泽威 李天瑞 《计算机科学》 CSCD 北大核心 2021年第1期226-232,共7页
推荐系统能够根据用户的喜好从海量信息中筛选出其可能感兴趣的信息并进行排序展示。随着深度学习在多个研究领域取得了良好的效果,其也开始应用于推荐系统。目前基于深度学习的推荐排序算法常采用Embedding&MLP模式,只能获得高阶... 推荐系统能够根据用户的喜好从海量信息中筛选出其可能感兴趣的信息并进行排序展示。随着深度学习在多个研究领域取得了良好的效果,其也开始应用于推荐系统。目前基于深度学习的推荐排序算法常采用Embedding&MLP模式,只能获得高阶的特征交互。为了解决该问题,DeepFM在上述模式中加入了因子分解机(Factorization Machine,FM),能够实现端到端的低阶与高阶特征交互学习,但其缺乏用户兴趣多样性的表示。鉴于此,通过将多头注意力机制引入DeepFM,提出了深度兴趣因子分解机网络(Deep Interest Factorization Machine Network,DIFMN)。DIFMN能够根据待推荐的不同物品自适应地学习用户表示,展示用户兴趣的多样性。此外,该模型根据用户历史行为的种类添加了喜好表征,从而不仅能够应用于只记录用户爱好的历史行为的任务,还可以处理同时记录用户喜欢与不喜欢的历史行为的任务。采用tensorflow-gpu进行算法的实现,在Amazon(Electronics)和movieLen-20m两个公开数据集上进行对比测试,实验表明所提算法相比DeepFM分别有17.70%和35.24%的RelaImpr提升,验证了其可行性与有效性。 展开更多
关键词 推荐算法 DeepFM 多头注意力机制 深度学习 CTR预测 用户兴趣建模
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部