期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于并联CNN-SE-Bi-LSTM的轴承剩余使用寿命预测 被引量:8
1
作者 曹正志 叶春明 《计算机应用研究》 CSCD 北大核心 2021年第7期2103-2107,共5页
滚动轴承作为一种机械标准件,广泛应用于各类旋转机械设备,其健康状况对机器设备的正常运行至关重要,掌握其剩余使用寿命(RUL)可以更好地保证生产活动安全有效的进行。针对目前基于深度学习的机器RUL预测方法普遍存在:a)预测性能很大程... 滚动轴承作为一种机械标准件,广泛应用于各类旋转机械设备,其健康状况对机器设备的正常运行至关重要,掌握其剩余使用寿命(RUL)可以更好地保证生产活动安全有效的进行。针对目前基于深度学习的机器RUL预测方法普遍存在:a)预测性能很大程度依赖手工特征设计;b)模型不能够充分提取数据中的有用特征;c)学习过程中没有明确考虑多传感器数据等缺点,提出了一种新的深度预测网络——并联多个带有压缩激励机制的卷积神经网络和双向长短期记忆网络集成网络(CNN-SE-Bi-LSTM),用于设备的RUL预测。在该预测网络中,不同传感器采集的监测数据直接作为预测网络的输入。然后,在改进的压缩激励卷积网络(CNN-SE-Net)提取空间特征的基础上进一步通过双向长短期记忆网络(Bi-LSTM)提取时序特征,建立起多个独立的可以自动从输入数据中学习高级表示的RUL预测模型分支。最后,将各独立分支学习到的特征通过全连接层并联获得最终的RUL预测模型。通过滚动轴承加速退化实验的数据,验证了所提网络的有效性并与现有的一些改进算法进行了对比实验。结果表明,面对原始多传感器数据,该算法能够自适应地提供准确的RUL预测结果,且预测表现优于现有一些预测方法。 展开更多
关键词 剩余使用寿命预测 深度学习 双向长短期记忆网络 se-net
下载PDF
基于改进Resnet18的垃圾分类收运监管方法研究 被引量:2
2
作者 何彦弘 徐怡宁 +2 位作者 傅嘉琪 陈书航 李俊峰 《软件工程》 2023年第1期24-33,共10页
为解决垃圾分类收运过程中,由于错误收运导致的混装率高、垃圾分类效果下降的问题,文章提出了一种基于改进Resnet18的垃圾分类收运监管方法。首先,在Resnet18残差结构的始端引入SE-Net通道注意力机制模块,可以有效提升网络的特征提取能... 为解决垃圾分类收运过程中,由于错误收运导致的混装率高、垃圾分类效果下降的问题,文章提出了一种基于改进Resnet18的垃圾分类收运监管方法。首先,在Resnet18残差结构的始端引入SE-Net通道注意力机制模块,可以有效提升网络的特征提取能力;其次,采用一种基于空洞卷积的多尺度感受野融合模块,使网络能够融合不同尺度的特征信息。实验结果表明,残差结构始端和晚期融合的改进方案效果更佳,加权F1值较原Resnet18分别提升了9.26%和7.36%。改进后的模型加权的F1值达97.27%,较原Resnet18分别提升了10.26%,并且对不同颜色垃圾桶识别的准确率更高。此外,改进后的Resnet18的每秒检测帧数(FPS)达到65.03,可以满足监管实时性的要求。同时,采用数据增强和天气模拟的方法处理数据集,使模型能适应多种环境,提升了模型的鲁棒性。 展开更多
关键词 Resnet18 垃圾分类收运监管 se-net 多尺度感受野融合 扩张卷积
下载PDF
基于SE-CapsNet的肺结节良恶性诊断研究 被引量:4
3
作者 叶枫 王路遥 +2 位作者 洪卫 丁国军 车镓荣 《中国生物医学工程学报》 CAS CSCD 北大核心 2021年第1期71-80,共10页
在过去的几年中,肺癌是癌症相关死亡的主要原因。提出一种针对低剂量计算机断层扫描(CT)影像精细化预处理条件下的SE-CapsNet分类方法,解决传统肺结节诊断方法中分类精度低、假阳性高等问题。改进胶囊神经网络分类算法:对最新Hinton的... 在过去的几年中,肺癌是癌症相关死亡的主要原因。提出一种针对低剂量计算机断层扫描(CT)影像精细化预处理条件下的SE-CapsNet分类方法,解决传统肺结节诊断方法中分类精度低、假阳性高等问题。改进胶囊神经网络分类算法:对最新Hinton的胶囊神经网络进行改进,引入新的非线性激活向量,避免全局向量压缩;采用特征重标定的方法,在特征通道层面进行模型优化。在标定的感兴趣区域,利用自动阈值法对CT影像进行预处理,并在中心结节处进行样本采样,获得预处理结果数据样本。选用内含1 010个病例的公开数据集LIDC-IDRI和某医院30个脱敏肿瘤患者病例,评估改进的SE-CapsNet算法,评价指标包括准确性、敏感性和特异性。在LIDC-IDRI数据集与医院数据集中,SE-CapsNet算法的平均准确率分别达到95.83%和94.67%,优于基于Caps Net分类算法的平均准确率。此外,在分类算法的耗时方面也具有明显优势,改进的胶囊网络能够更快地收敛,得到稳定的结果。 展开更多
关键词 Caps nets se-net 肺结节 CT图像 计算机辅助诊断
下载PDF
Sika Deer Behavior Recognition Based on Machine Vision
4
作者 He Gong Mingwang Deng +6 位作者 Shijun Li Tianli Hu Yu Sun Ye Mu Zilian Wang Chang Zhang Thobela Louis Tyasi 《Computers, Materials & Continua》 SCIE EI 2022年第12期4953-4969,共17页
With the increasing intensive and large-scale development of the sika deer breeding industry,it is crucial to assess the health status of the sika deer by monitoring their behaviours.A machine vision-based method for ... With the increasing intensive and large-scale development of the sika deer breeding industry,it is crucial to assess the health status of the sika deer by monitoring their behaviours.A machine vision-based method for the behaviour recognition of sika deer is proposed in this paper.Google Inception Net(GoogLeNet)is used to optimise the model in this paper.First,the number of layers and size of the model were reduced.Then,the 5×5 convolution was changed to two 3×3 convolutions,which reduced the parameters and increased the nonlinearity of the model.A 5×5 convolution kernel was used to replace the original convolution for extracting coarse-grained features and improving the model’s extraction ability.A multi-scale module was added to the model to enhance the multi-faceted feature extraction capability of the model.Simultaneously,the Squeeze-and-Excitation Networks(SE-Net)module was included to increase the channel’s attention and improve the model’s accuracy.The dataset’s images were rotated to reduce overfitting.For image rotation,the angle wasmultiplied by 30°to obtain the dataset enhanced by rotation operations of 30°,60°,90°,120°and 150°.The experimental results showed that the recognition rate of this model in the behaviour of sika deer was 98.92%.Therefore,the model presented in this paper can be applied to the behaviour recognition of sika deer.The results will play an essential role in promoting animal behaviour recognition technology and animal health monitoring management. 展开更多
关键词 Behaviour recognition se-net module multi-scale module improved Inception module
下载PDF
基于改进YOLOv5s的安全帽检测算法 被引量:17
5
作者 赵睿 刘辉 +2 位作者 刘沛霖 雷音 李达 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第8期2050-2061,共12页
针对现有安全帽检测算法难以检测小目标、密集目标等缺点,提出一种基于YOLOv5s的安全帽检测改进算法。采用DenseBlock模块来代替主干网络中的切片结构,提升网络的特征提取能力;在网络颈部检测层加入SE-Net通道注意力模块,引导模型更加... 针对现有安全帽检测算法难以检测小目标、密集目标等缺点,提出一种基于YOLOv5s的安全帽检测改进算法。采用DenseBlock模块来代替主干网络中的切片结构,提升网络的特征提取能力;在网络颈部检测层加入SE-Net通道注意力模块,引导模型更加关注小目标信息的通道特征,以提升对小目标的检测性能;对数据增强方式进行改进,丰富小尺度样本数据集;增加一个检测层以便能更好地学习密集目标的多级特征,从而提高模型应对复杂密集场景的能力。此外,构建一个面向密集目标及远距离小目标的安全帽检测数据集。实验结果表明:所提改进算法比原始YOLOv5s算法平均精确率(mAP@0.5)提升6.57%,比最新的YOLOX-L及PP-YOLOv2算法平均精确率分别提升1.05%与1.21%,在密集场景及小目标场景下具有较强的泛化能力。 展开更多
关键词 安全帽检测 YOLOv5s算法 数据增强 DenseBlock模块 se-net注意力模块
下载PDF
采用改进CNN对生猪异常状态声音识别 被引量:9
6
作者 耿艳利 宋朋首 +2 位作者 林彦伯 季燕凯 杨淑才 《农业工程学报》 EI CAS CSCD 北大核心 2021年第20期187-193,共7页
猪只声音能够体现出其生长状态,该研究针对人工监测猪只声音造成的猪只疾病误判以及耗时耗力等问题,研究基于卷积神经网络CNN(Convolutional Neural Network)的生猪异常状态声音识别方法。该研究首先设计猪只声音实时采集系统,并利用4G... 猪只声音能够体现出其生长状态,该研究针对人工监测猪只声音造成的猪只疾病误判以及耗时耗力等问题,研究基于卷积神经网络CNN(Convolutional Neural Network)的生猪异常状态声音识别方法。该研究首先设计猪只声音实时采集系统,并利用4G通讯技术将声音信息上传至云服务器,基于专业人员指导制作猪只异常声音(生病、打架、饥饿等)数据集,提取猪只异常声音的梅尔谱图特征信息;其次引入多种注意力机制对CNN进行改进,并对CBAM(Convolutional Block Attention Module)注意力机制进行优化,提出_CBAM-CNN网络模型;最后将_CBAM-CNN网络模型分别与引入SE_NET(Squeeze and Excitation Network)、ECA_NET(Efficient Channel Attention Networks)和CBAM注意力机制的CNN神经网络进行对比,试验结果表明该文提出的_CBAM-CNN网络模型在最优参数为128维梅尔频率、2048点FFT(Fast Fourier Transform)点数、512点窗移下的梅尔谱图特征下相较于其他模型对猪只异常声音识别效果最佳,识别率达到94.46%,验证了算法的有效性。该研究有助于生猪养殖过程中对猪只异常行为的监测,并对智能化、现代化猪场的建设具有重要意义。 展开更多
关键词 声音信号处理 动物 异常声音 卷积神经网络 se_net CBAM ECA_net
下载PDF
基于改进Yolov5l的航空小目标检测算法 被引量:1
7
作者 戴得恩 朱瑞飞 +2 位作者 陈长征 秦磊 马经宇 《计算机工程与设计》 北大核心 2023年第9期2610-2618,共9页
针对航空图像小目标检测存在的检测精度低、误检与漏检严重等问题,提出一种基于改进Yolov5l的航空小目标检测算法(AS-Yolov5)。在Yolov5的主干特征提取网络中引入空洞卷积,使用Transform的Decode模块,在特征融合网络中新增检测头,FPN+PA... 针对航空图像小目标检测存在的检测精度低、误检与漏检严重等问题,提出一种基于改进Yolov5l的航空小目标检测算法(AS-Yolov5)。在Yolov5的主干特征提取网络中引入空洞卷积,使用Transform的Decode模块,在特征融合网络中新增检测头,FPN+PAN特征融合时设置融合权重,输出端采用SE-Net注意力机制,测试时进行多尺寸输入及测试时间增强(TTA)。算法在visdron2021数据集上进行验证,实验结果表明,AS-Yolov5的均值平均精度@0.5(mAP@0.5)为41.0%,较Yolov5l的28.5%提升12.5%,有效提高Yolov5l难以在远距离、暗环境、密集分布和图像模糊的场景下的小目标检测能力。 展开更多
关键词 航空小目标检测 Yolov5l模型 空洞卷积 se-net注意力模块 权重融合 深度学习 目标检测
下载PDF
基于改进YOLO v3的自然场景下冬枣果实识别方法 被引量:34
8
作者 刘天真 滕桂法 +2 位作者 苑迎春 刘博 刘智国 《农业机械学报》 EI CAS CSCD 北大核心 2021年第5期17-25,共9页
为实现自然场景下冬枣果实的快速、精准识别,考虑到光线变化、枝叶遮挡、果实密集重叠等复杂因素,基于YOLO v3深度卷积神经网络提出了一种基于改进YOLO v3(YOLO v3-SE)的冬枣果实识别方法。YOLO v3-SE模型利用SE Net的SE Block结构将特... 为实现自然场景下冬枣果实的快速、精准识别,考虑到光线变化、枝叶遮挡、果实密集重叠等复杂因素,基于YOLO v3深度卷积神经网络提出了一种基于改进YOLO v3(YOLO v3-SE)的冬枣果实识别方法。YOLO v3-SE模型利用SE Net的SE Block结构将特征层的特征权重校准为特征权值,强化了有效特征,弱化了低效或无效特征,提高了特征图的表现能力,从而提高了模型识别精度。YOLO v3-SE模型经过训练和比较,选取0.55作为置信度最优阈值用于冬枣果实检测,检测结果准确率P为88.71%、召回率R为83.80%、综合评价指标F为86.19%、平均检测精度为82.01%,与YOLO v3模型相比,F提升了2.38个百分点,mAP提升了4.78个百分点,检测速度无明显差异。为检验改进模型在冬枣园自然场景下的适应性,在光线不足、密集遮挡和冬枣不同成熟期的情况下对冬枣果实图像进行检测,并与YOLO v3模型的检测效果进行对比,结果表明,本文模型召回率提升了2.43~5.08个百分点,F提升了1.75~2.77个百分点,mAP提升了2.38~4.81个百分点,从而验证了本文模型的有效性。 展开更多
关键词 冬枣 自然场景 果实识别 YOLO v3 卷积神经网络 se net
下载PDF
基于深度学习与多尺度特征融合的烤烟烟叶分级方法 被引量:8
9
作者 鲁梦瑶 周强 +3 位作者 姜舒文 王聪 陈栋 陈天恩 《中国农机化学报》 北大核心 2022年第1期158-166,共9页
为实现烤烟等级的快速准确识别,降低人工分级中主观因素对分级结果的影响,提高烟叶分级的准确性和一致性,提出一种基于烤烟RGB图像和深度学习的多尺度特征融合的烟叶图像等级分类方法,采用ResNet50提取烟叶图像特征,并引入基于注意力机... 为实现烤烟等级的快速准确识别,降低人工分级中主观因素对分级结果的影响,提高烟叶分级的准确性和一致性,提出一种基于烤烟RGB图像和深度学习的多尺度特征融合的烟叶图像等级分类方法,采用ResNet50提取烟叶图像特征,并引入基于注意力机制的SE模块(压缩激发模块),增强不同通道特征的重要程度;同时,采用FPN(特征金字塔网络)对提取的由浅及深不同层级的烟叶特征进行融合,以实现烟叶多尺度特征的表达。采集皖南地区6068个烤烟的正面和背面图像用于建模和分析。结果表明,提出的烟叶分级方法的分级正确率比经典CNN(卷积神经网络)高出5.21%,分级模型在新批次7个等级烟叶上的分级正确率为80.14%,相邻等级的分级正确率为91.50%。因此,采用RGB图像结合深度学习技术可实现烤烟烟叶等级的良好识别,可为烤烟烟叶收购等级评价提供一种新方法。 展开更多
关键词 烟叶分级 深度学习 图像分类 特征融合 特征金字塔网络 se模块
下载PDF
基于CNN‑LSTM‑SE的心电图分类算法研究
10
作者 王建荣 邓黎明 +1 位作者 程伟 李国翚 《测试技术学报》 2024年第3期264-273,共10页
心血管疾病是我国死亡率较高的疾病之一,通过观察心电图来判断心电信号是否出现异常能够对心血管疾病进行预防和筛查。由于心电图数据规模大且繁杂,临床医护人员在心电图筛查时,工作负担大且容易出现误诊或漏诊的情况。为了提高心电图... 心血管疾病是我国死亡率较高的疾病之一,通过观察心电图来判断心电信号是否出现异常能够对心血管疾病进行预防和筛查。由于心电图数据规模大且繁杂,临床医护人员在心电图筛查时,工作负担大且容易出现误诊或漏诊的情况。为了提高心电图的筛查效率、减少医护人员的压力,提出了一种基于卷积神经网络、长短期记忆神经网络和SE网络的心电图分类算法模型(CNN-LSTM-SE),该模型将心电图分成5种不同的类别。主要研究内容包括:选用MIT-BIH心律失常数据集作为心电信号的数据来源,使用巴特沃斯带通滤波器对心电信号进行去噪处理,通过Z-score方法对心电信号进行标准化处理,利用独热编码方法对心电信号标签进行编码,最后使用处理后的心电数据对所提算法模型进行训练和测试。实验结果表明:所提模型相较于其它模型,能够有效提高心电图分类的准确性,在实验数据集上的分类准确率达到99.1%。 展开更多
关键词 心律失常 心电图 卷积神经网络 se网络 长短期记忆神经网络
下载PDF
基于改进SE-Net和深度可分离残差的高光谱图像分类
11
作者 王燕 王振宇 《兰州理工大学学报》 CAS 北大核心 2024年第2期87-95,共9页
针对目前常见的用于高光谱图像分类的卷积神经网络参数数量多,训练时间长,对样本数量依赖性大的问题,提出一种适用于有限训练样本条件下基于改进压缩激活网络和深度可分离残差的分类网络MDSR&SE-Net.首先使用主成分分析对原始高光... 针对目前常见的用于高光谱图像分类的卷积神经网络参数数量多,训练时间长,对样本数量依赖性大的问题,提出一种适用于有限训练样本条件下基于改进压缩激活网络和深度可分离残差的分类网络MDSR&SE-Net.首先使用主成分分析对原始高光谱图像进行通道降维,然后通过三维卷积神经网络连接多特征残差结构,同时嵌入改进的SE模块提取高光谱图像的空间和光谱细节特征,最后将提取到的特征数据输入Softmax分类器激活分类.为了使网络更加轻量,通过在残差结构中使用深度可分离卷积和引入全局平均池化减少参数数量.实验结果显示,使用有限训练样本在三种常见高光谱数据集上总体分类精度均达到99%以上. 展开更多
关键词 高光谱图像 深度可分离卷积 残差网络 压缩激活网络
下载PDF
基于深度学习的在线烟叶等级判定研究 被引量:1
12
作者 齐玥程 王燕 +1 位作者 李丽 熊攀攀 《安徽农业科学》 CAS 2023年第3期235-239,共5页
对烟叶进行等级判定可以合理利用烟叶资源,提高卷烟产品质量,对实现经济利益最大化有重要意义。提出一种基于深度学习的在线烟叶等级判定方法,该方法采用ResNeXt为基础网络,在残差结构中嵌入SE模块以增强重要通道的信息,并引入FPN+PAN... 对烟叶进行等级判定可以合理利用烟叶资源,提高卷烟产品质量,对实现经济利益最大化有重要意义。提出一种基于深度学习的在线烟叶等级判定方法,该方法采用ResNeXt为基础网络,在残差结构中嵌入SE模块以增强重要通道的信息,并引入FPN+PAN结构将网络浅层细节特征和高层语义特征进行融合,以实现多尺度特征表达。测试结果表明,该方法烟叶等级判定的准确率达到92.8%,因此该方法对烟叶等级具备良好识别的能力,可适用实际生产。 展开更多
关键词 烟叶等级判定 深度学习 卷积神经网络 se模块 特征融合
下载PDF
基于虚拟对抗训练的合成话音检测方法
13
作者 杨玲 高勇 《通信技术》 2023年第4期425-433,共9页
自动说话人确认(Automatic Speaker Verification,ASV)技术在日常生活中起着重要作用,同时它也面临着语音合成等欺骗攻击的威胁,因此为ASV系统提供一个有效的合成话音检测方法刻不容缓。近年来,检测任务更加侧重于在真实物理环境下对合... 自动说话人确认(Automatic Speaker Verification,ASV)技术在日常生活中起着重要作用,同时它也面临着语音合成等欺骗攻击的威胁,因此为ASV系统提供一个有效的合成话音检测方法刻不容缓。近年来,检测任务更加侧重于在真实物理环境下对合成话音展开研究。为了提高模型的鲁棒性,引入虚拟对抗训练对检测任务进行数据增强。实验中在前端提取了多个特征,并在后端采用了SE-Res2net50和ECAPA2D-BL/BG模型。最后还将多个特征,多个模型的打分结果进行融合,提高了总体的检测性能。在逻辑访问场景中,ASVspoof2019挑战赛评估集的串联成本检测代价(tandem Detection Cost Function,t-DCF)和等错率(Equal Error Rate,EER)分别达到0.0187和0.56%,ASVspoof2021挑战赛评估集的t-DCF和EER分别达到0.3073和6.05%。 展开更多
关键词 合成话音检测 虚拟对抗训练 se-Res2net Bi-LSTM Bi-GRU 模型融合
下载PDF
基于改进的YOLOv3算法的乳腺超声肿瘤识别 被引量:2
14
作者 徐立芳 傅智杰 莫宏伟 《智能系统学报》 CSCD 北大核心 2021年第1期21-29,共9页
为了提高乳腺癌诊断的效率以及准确性,本文提出一种基于改进的YOLOv3算法来构建一个乳腺超声肿瘤识别算法,辅助医生进行乳腺癌的诊断。首先在Res2Net网络上融入SE模块构建SE-Res2Net网络来取代原始YOLOv3中的特征提取网络,以此提升模型... 为了提高乳腺癌诊断的效率以及准确性,本文提出一种基于改进的YOLOv3算法来构建一个乳腺超声肿瘤识别算法,辅助医生进行乳腺癌的诊断。首先在Res2Net网络上融入SE模块构建SE-Res2Net网络来取代原始YOLOv3中的特征提取网络,以此提升模型特征提取的能力。然后通过搭建一个新型下采样模块(downsample block)来解决原始模型中下采样操作容易出现信息丢失的不足。最后为了进一步提升模型特征提取的能力,结合残差连接网络以及密集连接网络的优点构建Res-DenseNet网络来替换原始模型的残差连接方式。实验结果表明:改进后的YOLOv3算法比原始YOLOv3算法的m AP提高了4.56%,取得较好的检测结果。 展开更多
关键词 乳腺癌 超声影像 YOLOv3 se-Res2net 下采样模块 残差连接 密集连接
下载PDF
基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术
15
作者 张海艳 李洁 +2 位作者 张博学 刘静 唐雪蕊 《信息技术》 2022年第5期177-182,共6页
为了有效提高宫颈癌的诊断准确率,提出一种基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术。在YOLOv3算法模型的基础上,将SE模块嵌入Res2Net网络中,创建一种能够替换原特征提取网络的SE-Res2Net网络,使模型的特征提取能力得到提升。... 为了有效提高宫颈癌的诊断准确率,提出一种基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术。在YOLOv3算法模型的基础上,将SE模块嵌入Res2Net网络中,创建一种能够替换原特征提取网络的SE-Res2Net网络,使模型的特征提取能力得到提升。利用重新构建的下采样模块,保证了下采样操作后信息的完整性。将密集连接网络与残差连接网络相结合,组建Res-DenseNet网络以改进YOLOv3模型的原有残差连接方式。实验结果表明,该方法的性能明显优于传统YOLOv3算法,适于在临床诊断中普及应用。 展开更多
关键词 se-Res2net网络 宫颈癌超声图像 采样 特征提取 识别性能
下载PDF
Fused behavior recognition model based on attention mechanism
16
作者 Lei Chen Rui Liu +2 位作者 Dongsheng Zhou Xin Yang Qiang Zhang 《Visual Computing for Industry,Biomedicine,and Art》 2020年第1期71-80,共10页
With the rapid development of deep learning technology,behavior recognition based on video streams has made great progress in recent years.However,there are also some problems that must be solved:(1)In order to improv... With the rapid development of deep learning technology,behavior recognition based on video streams has made great progress in recent years.However,there are also some problems that must be solved:(1)In order to improve behavior recognition performance,the models have tended to become deeper,wider,and more complex.However,some new problems have been introduced also,such as that their real-time performance decreases;(2)Some actions in existing datasets are so similar that they are difficult to distinguish.To solve these problems,the ResNet34-3DRes18 model,which is a lightweight and efficient two-dimensional(2D)and three-dimensional(3D)fused model,is constructed in this study.The model used 2D convolutional neural network(2DCNN)to obtain the feature maps of input images and 3D convolutional neural network(3DCNN)to process the temporal relationships between frames,which made the model not only make use of 3DCNN’s advantages on video temporal modeling but reduced model complexity.Compared with state-of-the-art models,this method has shown excellent performance at a faster speed.Furthermore,to distinguish between similar motions in the datasets,an attention gate mechanism is added,and a Res34-SE-IM-Net attention recognition model is constructed.The Res34-SE-IM-Net achieved 71.85%,92.196%,and 36.5%top-1 accuracy(The predicting label obtained from model is the largest one in the output probability vector.If the label is the same as the target label of the motion,the classification is correct.)respectively on the test sets of the HMDB51,UCF101,and Something-Something v1 datasets. 展开更多
关键词 Action recognition Resnet34-3DRes18 Res34-se-IM-net Attention mechanism
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部