期刊文献+
共找到88篇文章
< 1 2 5 >
每页显示 20 50 100
基于残差通道注意力和多级特征融合的图像超分辨率重建 被引量:13
1
作者 席志红 袁昆鹏 《激光与光电子学进展》 CSCD 北大核心 2020年第4期254-262,共9页
针对模型VDSR(very deep super resolution)中存在的忽略特征通道间的相互联系,不能充分利用各层特征,以及参数量过大,计算复杂度过高等问题,本文提出了一种基于残差通道注意力和多级特征融合的图像超分辨率重建网络结构,通过引入残差... 针对模型VDSR(very deep super resolution)中存在的忽略特征通道间的相互联系,不能充分利用各层特征,以及参数量过大,计算复杂度过高等问题,本文提出了一种基于残差通道注意力和多级特征融合的图像超分辨率重建网络结构,通过引入残差通道注意力,自适应校正信道的特征响应,提高了网络的表征能力。网络整体使用递归结构,在每个递归块内实现参数共享,减少了参数数量;多级特征融合的方式可以充分提取图像特征;用分组卷积代替传统卷积,进一步减少了参数数量,并降低了计算复杂度。所提算法在保证图像重建质量的同时,减少了模型的参数量并降低了计算复杂度,在图片放大4倍时,参数量和计算复杂度分别约为VDSR的0.33和0.02。 展开更多
关键词 机器视觉 超分辨率 深度学习 递归结构 分组卷积 残差通道注意力 多级特征融合
原文传递
自适应感受野网络的行人重识别 被引量:9
2
作者 王松 纪鹏 +2 位作者 张云洲 朱尚栋 暴吉宁 《控制与决策》 EI CSCD 北大核心 2022年第1期119-126,共8页
行人重识别通常删除特征提取网络中的最后一个空间下采样操作,以增加最后输出特征图的分辨率,保留更多的细粒度特征.然而,这种操作会大幅减小神经网络的感受野,而更大的感受野可以为行人重识别提供更多的上下文信息.同时,在实际的视觉... 行人重识别通常删除特征提取网络中的最后一个空间下采样操作,以增加最后输出特征图的分辨率,保留更多的细粒度特征.然而,这种操作会大幅减小神经网络的感受野,而更大的感受野可以为行人重识别提供更多的上下文信息.同时,在实际的视觉皮层中,相同区域的神经元的感受野是不同的,但当前行人重识别网络的设计大多忽视了这一点.为了解决上述问题,提出一种新颖的自适应感受野网络.网络的设计受启发于生物的视觉系统,通过在多分支网络上设置不同大小的感受野,结合注意力机制让网络自行选择合适的感受野特征,从而实现网络感受野的自适应,并且采用分组卷积使得自适应感受野模块更加轻量级.同时在各个分支利用空洞卷积增大感受野,补偿删除最后下采样操作所减少的网络感受野.在公开的大规模数据集上进行实验,实验结果表明,所提出的算法相比于基线方法有显著的提升,当使用ResNet-50作为特征提取网络时,在DukeMTMC-reID、Market-1501数据集上的Rank-1和mAP分别达到89.2%和76.0%、95.2%和87.2%.与现有方法相比,所提出算法在精度上有明显的提升. 展开更多
关键词 行人重识别 深度学习 自适应感受野 注意力机制 空洞卷积 分组卷积
原文传递
利用改进Faster-RCNN识别小麦条锈病和黄矮病 被引量:9
3
作者 毛锐 张宇晨 +4 位作者 王泽玺 高圣昌 祝涛 王美丽 胡小平 《农业工程学报》 EI CAS CSCD 北大核心 2022年第17期176-185,共10页
条锈病和黄矮病是严重威胁小麦生产的重大病害,病害的早期识别对病害防控具有重要意义。现有病害识别模型对相似表型症状识别困难,对早期病害的识别准确度低。为此,该研究构建了一种改进的快速区域卷积神经网络(Faster Regions with CNN... 条锈病和黄矮病是严重威胁小麦生产的重大病害,病害的早期识别对病害防控具有重要意义。现有病害识别模型对相似表型症状识别困难,对早期病害的识别准确度低。为此,该研究构建了一种改进的快速区域卷积神经网络(Faster Regions with CNN Features,Faster-RCNN)的病害识别方法。该方法采用卷积核拆解和下采样延迟策略优化了深度残差网络(Deep Residual Neural Network,ResNet-50),用优化后的ResNet-50作为主干特征提取网络以增强所提取特征的表达力,同时简化模型的参数;并采用ROI(Region of Interest)Align改进ROI迟化层以降低特征量化误差,提升识别的精度。在自建的涵盖200余种不同发病时期、不同抗感性的小麦叶部图像数据集上进行试验,结果表明:改进的Faster-RCNN识别方法比其他SSD(Single Shot Multi-Box Detector)、YOLO(You Only Look Once)和Faster-RCNN网络模型的平均精度均值(mean Average Precision,m AP)分别提升了9.26个百分点、7.64个百分点和14.97个百分点。对小麦条锈病、黄矮病、健康小麦和其他黄化症状小麦识别的平均精度均值可达98.74%;对小麦条锈病和黄矮病轻、重症识别的平均精度均值可达91.06%。同时,模型损失函数值降低更快,整体性能表现更优。进一步开发小麦病害智能识别系统部署研究模型,使用微信小程序进行田间小麦病害的识别。在最大并发100的条件下,小程序平均返回时延为5.02 s,识别返回成功率为97.85%,对两种小麦病害及其细分轻重症识别的平均准确率为93.56%,能够有效满足实际应用需求,可用于指导病害的科学防控。 展开更多
关键词 模型 病害识别 Faster-RCNN ResNet 分组卷积 数据增强
下载PDF
改进残差神经网络在遥感图像分类中的应用 被引量:9
4
作者 刘春容 宁芊 +1 位作者 雷印杰 陈炳才 《科学技术与工程》 北大核心 2021年第31期13421-13429,共9页
针对传统卷积神经网络随着深度加深而导致网络退化以及计算量大等问题,提出一种改进残差神经网络的遥感图像场景分类方法。该方法以残差网络ResNet50作为主框架,在残差结构中引入深度可分离卷积和分组卷积,减少了网络的参数量和计算量,... 针对传统卷积神经网络随着深度加深而导致网络退化以及计算量大等问题,提出一种改进残差神经网络的遥感图像场景分类方法。该方法以残差网络ResNet50作为主框架,在残差结构中引入深度可分离卷积和分组卷积,减少了网络的参数量和计算量,加快模型收敛的同时也提升了分类精度。此外在网络中嵌入多尺度squeeze and excitation block模块对通道特征进行重校准,提取出更加重要的特征信息,进一步提升了网络的分类性能。在航空图像数据集(aerial image dataset,AID)和UCMerced_Land Use两个公开数据集上的分类精度分别为91.92%和93.52%,相比常规残差网络分类精度分别提高了3.38%和10.24%,证明所提方法在遥感图像场景分类任务中的可行性和有效性。 展开更多
关键词 遥感图像 场景分类 残差神经网络 分组卷积 深度可分离卷积 多尺度缩聚与激发模块
下载PDF
基于SqueezeNet的轻量化卷积神经网络SlimNet 被引量:8
5
作者 董艺威 于津 《计算机应用与软件》 北大核心 2018年第11期226-232,共7页
结构参数量和计算量限制了卷积神经网络在移动设备上的应用。主要研究在尽量保持精度的前提下减少结构参数量和计算量。针对分组卷积引起的分组通道间不流通的问题,提出分组瓶颈;针对如何提升分类精度问题,提出奇异瓶颈;使用上述策略改... 结构参数量和计算量限制了卷积神经网络在移动设备上的应用。主要研究在尽量保持精度的前提下减少结构参数量和计算量。针对分组卷积引起的分组通道间不流通的问题,提出分组瓶颈;针对如何提升分类精度问题,提出奇异瓶颈;使用上述策略改进SqueezeNet,提出轻量化结构SlimNet。实验表明:引入分组瓶颈和奇异瓶颈具有有效性,提出的轻量化结构Slim Net在分类精度、结构参数量及计算量上均优于SqueezeNet。 展开更多
关键词 图像分类 卷积神经网络 轻量化 分组卷积 分组瓶颈 奇异瓶颈 SlimNet
下载PDF
基于密集层和注意力机制的快速语义分割 被引量:9
6
作者 程晓悦 赵龙章 +1 位作者 胡穹 史家鹏 《计算机工程》 CAS CSCD 北大核心 2020年第4期247-252,259,共7页
针对传统语义分割网络速度慢、精度低的问题,提出一种基于密集层和注意力机制的快速场景语义分割方法.在ResNet网络中加入密集层和注意力模块,密集层部分采用两路传播方式,以更好地获得多尺度目标,并使用分组卷积减少计算量.同时在特征... 针对传统语义分割网络速度慢、精度低的问题,提出一种基于密集层和注意力机制的快速场景语义分割方法.在ResNet网络中加入密集层和注意力模块,密集层部分采用两路传播方式,以更好地获得多尺度目标,并使用分组卷积减少计算量.同时在特征提取网络中加入注意力模块,以减少精度损失.实验结果表明,该方法在保证分割精度的前提下提升了分割速度,在Cityscapes数据集上得到了81.5%的MIOU,速度为42.3 frame/s,在ADE20K数据集上得到了61.8%的MIOU,速度为27.9 frame/s. 展开更多
关键词 语义分割 轻量级网络 分组卷积 密集层 注意力机制
下载PDF
基于分组卷积进行特征融合的全景分割算法 被引量:8
7
作者 冯兴杰 张天泽 《计算机应用》 CSCD 北大核心 2021年第7期2054-2061,共8页
针对图像全景分割任务对于实践应用中现有网络结构运算不够快速的问题,提出一种基于分组卷积进行特征融合的全景分割算法。首先,通过自底向上的方式选择经典残差网络结构(ResNet)进行特征提取,并采用不同扩张率的空洞卷积空间金字塔池... 针对图像全景分割任务对于实践应用中现有网络结构运算不够快速的问题,提出一种基于分组卷积进行特征融合的全景分割算法。首先,通过自底向上的方式选择经典残差网络结构(ResNet)进行特征提取,并采用不同扩张率的空洞卷积空间金字塔池化操作(ASPP)对提取到的特征进行语义分割与实例分割的多尺度特征融合;然后,通过提出一种单路分组卷积上采样方法,整合语义与实例特征进行上采样特征融合至指定大小;最后,通过对语义分支、实例分支以及实例中心点这三个分支进行损失函数运算以得到更加精细的全景分割输出结果。该模型在CityScapes数据集上与注意力引导的联合全景分割网络(AUNet)、全景特征金字塔网络(Panoptic FPN)、亲和金字塔单阶段实例分割算法(SSAP)、联合全景分割网络(UPSNet)、Panoptic-DeepLab等方法进行了实验对比。实验结果表明,与对比方法中表现最好的Panoptic-DeepLab模型相比,所提模型在极大减少了解码网络参数量的情况下,全景分割质量(PQ)值为0.565,仅下降了0.003,在建筑物、火车、自行车等物体的分割质量上有0.3~5.5的提升,平均精确率(AP)、目标IoU阈值超过50%的平均精确率(AP50)分别提升了0.002与0.014,平均交并比(mIoU)值提升了0.06。可见该方法能提升图像全景分割速度,在PG、AP、mIoU三个指标上均有较好的精度,可以有效地完成全景分割任务。 展开更多
关键词 图像全景分割 语义分割 实例分割 分组卷积 空洞卷积 空间金字塔池化
下载PDF
基于自适应特征增强分组卷积网络的电能质量扰动分类 被引量:4
8
作者 张锐 张闯 +1 位作者 高辉 程政铎 《中国电机工程学报》 EI CSCD 北大核心 2023年第15期5808-5817,共10页
分布式电源在接入电网时会产生复杂的电能质量扰动(power quality disturbances,PQDs),为提高对PQDs信号分类识别的准确率,构建了自适应特征增强分组卷积神经网络(grouping convolutional neural network with adaptive feature enhance... 分布式电源在接入电网时会产生复杂的电能质量扰动(power quality disturbances,PQDs),为提高对PQDs信号分类识别的准确率,构建了自适应特征增强分组卷积神经网络(grouping convolutional neural network with adaptive feature enhanced network,GCNN-AFEN)。GCNN-AFEN模型的核心:首先,对PQDs信号进行S变换形成时频矩阵图像,利用CNN与结构稀疏的GCNN相结合作为特征学习的基础框架以减少模型参数,进而提高运算速度;然后,AEFN模块通过通道注意力机制、频域特征增强和软阈值去噪环节,自适应学习扰动类型与对应特征图的相关性,增加信噪比,突出能够代表扰动类别的深层特征;最后,通过全连接层(fully connected layers,FC)和Softmax分类器进行分类识别。仿真实验表明,提出的模型对于电能质量扰动信号具有较高的分类识别准确率和噪声鲁棒性,能够用于电能质量扰动的快速识别和分类。 展开更多
关键词 电能质量扰动 分组卷积 混洗卷积 通道注意力机制 自适应特征增强网络
下载PDF
一种应用于光遗传激光投影系统的目标检测算法 被引量:8
9
作者 史再峰 叶鹏 +3 位作者 孙诚 罗韬 王汉杰 潘惠卓 《激光与光电子学进展》 CSCD 北大核心 2020年第6期280-285,共6页
设计了一种用于无线光传输的激光投影系统并提出了一种基于深度学习的改进型YOLOv3(you only look once,v3)网络用于检测小鼠图像的位置。该网络使用分组卷积对网络参数进行压缩以提高目标检测速度,使用通道混洗方法以增强网络的信息流... 设计了一种用于无线光传输的激光投影系统并提出了一种基于深度学习的改进型YOLOv3(you only look once,v3)网络用于检测小鼠图像的位置。该网络使用分组卷积对网络参数进行压缩以提高目标检测速度,使用通道混洗方法以增强网络的信息流通能力。利用交叉熵损失函数中的两个超参数来调整正、负样本的比例以降低易分类样本在损失函数中的权值,提高了目标检测精度。在PASCAL VOC2007和自制小鼠图像数据集上分别进行实验,结果表明提出的基于改进型YOLOv3网络的检测算法检测精度达90.3%,检测速度和检测精度都优于传统型网络结构。应用该算法的激光投影系统可以实时检测运动小鼠目标并进行无线光传输等光遗传实验。 展开更多
关键词 机器视觉 光遗传 目标检测 分组卷积 通道混洗 损失函数
原文传递
基于轻量级分组注意力模块的图像分类算法 被引量:8
10
作者 张盼盼 李其申 杨词慧 《计算机应用》 CSCD 北大核心 2020年第3期645-650,共6页
针对图像分类任务中现有神经网络模型对分类对象特征表征能力不足,导致识别精度不高的问题,提出一种基于轻量级分组注意力模块(LGAM)的图像分类算法。该模块从输入特征图的通道和空间两个方向出发重构特征图:首先,将输入特征图沿通道方... 针对图像分类任务中现有神经网络模型对分类对象特征表征能力不足,导致识别精度不高的问题,提出一种基于轻量级分组注意力模块(LGAM)的图像分类算法。该模块从输入特征图的通道和空间两个方向出发重构特征图:首先,将输入特征图沿通道方向进行分组并生成每个分组对应的通道注意力权重,同时采用阶梯型结构解决分组间信息不流通的问题;然后,基于各分组串联成的新特征图生成全局空间注意力权重,通过两种注意力权重加权得到重构特征图;最后,将重构特征图与输入特征图融合得到增强的特征图。以分类Top-1错误率作为评估指标,基于Cifar10和Cifar100数据集以及部分ImageNet2012数据集,对经LGAM增强之后的ResNet、Wide-ResNet、ResNeXt进行对比实验。实验结果表明,经LGAM增强之后的神经网络模型其Top-1错误率均低于增强之前1至2个百分点。因此LGAM能够提升现有神经网络模型的特征表征能力,从而提高图像分类的识别精度。 展开更多
关键词 注意力机制 图像分类 通道注意力 空间注意力 分组卷积
下载PDF
卷积神经网络轻量化技术研究 被引量:5
11
作者 包志龙 《无线通信技术》 2022年第1期36-41,47,共7页
近些年,卷积神经网络的发展日趋成熟,在图像识别、目标检测、自然语言处理等多个领域的性能超过了传统的机器学习算法。然而随着网络性能的提升,部署和运行神经网络对于硬件设备要求越来越高。为了将卷积神经网络部署到算力较低的设备,... 近些年,卷积神经网络的发展日趋成熟,在图像识别、目标检测、自然语言处理等多个领域的性能超过了传统的机器学习算法。然而随着网络性能的提升,部署和运行神经网络对于硬件设备要求越来越高。为了将卷积神经网络部署到算力较低的设备,必须在参数量和准确率之间寻求一个平衡。本文首先介绍三种常规的卷积方式,然后从参数量和计算量的角度加以分析,接着详细介绍近些年比较流行的轻量化网络模型结构,对于各自的优缺点进行总结,同时结合其在ImageNet上面的表现评估其轻量化技巧的优劣,最后展望轻量化神经网络的发展前景。 展开更多
关键词 轻量化 分组卷积 深度可分离卷积 卷积神经网络
下载PDF
降低参数规模的卷积神经网络模型压缩方法 被引量:6
12
作者 朱雪晨 陈三林 +1 位作者 蔡刚 黄志洪 《计算机与现代化》 2021年第9期83-89,共7页
针对卷积神经网络模型参数规模越来越大导致难以在计算与存储资源有限的嵌入式设备上大规模部署的问题,提出一种降低参数规模的卷积神经网络模型压缩方法。通过分析发现,卷积层参数量与输入输出特征图数量以及卷积核大小有关,而全连接... 针对卷积神经网络模型参数规模越来越大导致难以在计算与存储资源有限的嵌入式设备上大规模部署的问题,提出一种降低参数规模的卷积神经网络模型压缩方法。通过分析发现,卷积层参数量与输入输出特征图数量以及卷积核大小有关,而全连接层参数数量众多且难以大幅减少。通过分组卷积减少输入输出特征图数量,通过卷积拆分减小卷积核大小,同时采用全局平均池化层代替全连接层的方法来解决全连接层参数数量众多的问题。将上述方法应用于LeNet5和AlexNet进行实验,实验结果表明通过使用组合压缩方法对LeNet5模型进行最大压缩后,参数规模可减少97%,识别准确率降低了不到2个百分点,而压缩后的AlexNet模型参数规模可减少95%,识别准确率提高了6.72个百分点,在保证卷积神经网络精度的前提下,可大幅减少模型的参数量。 展开更多
关键词 卷积神经网络 参数规模 分组卷积 卷积拆分 全局平均池化
下载PDF
一种基于多分支轻量级神经网络的图像分类方法
13
作者 李良 宁靖 《辽东学院学报(自然科学版)》 CAS 2024年第1期54-60,共7页
传统神经网络在提取图片特征时,存在网络参数量过多、计算复杂度过高等问题,且网络对移动设备的存储空间和计算能力有着极高的要求,限制了网络图像分类方法在嵌入式设备上的发展与应用。为此,提出一种基于分组神经网络卷积与深度可分离... 传统神经网络在提取图片特征时,存在网络参数量过多、计算复杂度过高等问题,且网络对移动设备的存储空间和计算能力有着极高的要求,限制了网络图像分类方法在嵌入式设备上的发展与应用。为此,提出一种基于分组神经网络卷积与深度可分离卷积的轻量级图像分类方法。引入分组参数g和扩展参数n,实现网络精度与复杂度之间的平衡,并将分组卷积中普通卷积替换成深度可分离卷积,有效减少了神经网络中的参数量。实验结果表明,与MobileNet V1方法相比,所提方法在数据集CIFAR-10上的准确率提高了4.75%,达到88.66%,且参数量仅为1.5 M。 展开更多
关键词 深度学习 轻量级神经网络 分组卷积 深度可分离卷积 图像分类
下载PDF
深度学习轻量化侦察图像压缩网络
14
作者 谌宇 谌德荣 +2 位作者 崇魁奇 王泽鹏 张凯 《探测与控制学报》 CSCD 北大核心 2024年第1期78-84,共7页
为了满足小型侦察平台对低复杂度图像编码算法的应用需求,提出基于深度学习轻量化侦察图像压缩网络。轻量化侦察图像压缩网络编码端利用三个卷积模块直接将图像映射为服从均匀分布的二进制码流,得到压缩数据;在卷积模块中采用深度可分... 为了满足小型侦察平台对低复杂度图像编码算法的应用需求,提出基于深度学习轻量化侦察图像压缩网络。轻量化侦察图像压缩网络编码端利用三个卷积模块直接将图像映射为服从均匀分布的二进制码流,得到压缩数据;在卷积模块中采用深度可分离卷积、分组卷积+通道重排等方式降低了编码端参数量和计算量。轻量化侦察图像压缩网络解码端采用转置卷积和残差连接等方式提高特征提取能力,进而提高解码图像质量。对分辨率为128×128实际采集图像的测试结果表明,与JPGE2000算法相比,基于深度学习轻量化侦察图像压缩网络PSNR提高了3.85 dB,编码时间降低了91%,实现了图像的轻量化编码压缩。 展开更多
关键词 侦察图像压缩 深度可分离卷积 分组卷积 通道重排
下载PDF
基于胶囊卷积网络的多视图三维重建 被引量:2
15
作者 胡荣林 付浩志 +2 位作者 何旭琴 张新新 陆文豪 《南京师范大学学报(工程技术版)》 CAS 2023年第1期46-55,92,共11页
从深度神经网络对重建效果影响的角度,提出了基于胶囊卷积网络的多视图三维重建模型Caps-MVSNet,包括特征提取、构建代价体、代价体正则化、回归深度图和细化深度图5个阶段.提出了FENet-T特征提取网络和3D-CapsCNN网络,并分别应用于模... 从深度神经网络对重建效果影响的角度,提出了基于胶囊卷积网络的多视图三维重建模型Caps-MVSNet,包括特征提取、构建代价体、代价体正则化、回归深度图和细化深度图5个阶段.提出了FENet-T特征提取网络和3D-CapsCNN网络,并分别应用于模型的特征提取阶段和代价体正则化阶段.其中,FENet-T利用高效的Block计数比率以及大尺度空洞卷积和分组卷积提高网络的特征提取效率.3D-CapsCNN使用比卷积神经网络更强空间表示能力的3D胶囊网络来正则化代价体.Caps-MVSNet在DTU数据集上完成了效果测试,结果表明,与先前主流重建方法相比该模型在完整性上达到了最优结果,在准确性、整体性上均取得较大提升.另外,与基准模型MVSNet相比,该模型在准确性、整体性和完整性上分别提高3.3%、4.9%和8.2%,参数量减少3.3%. 展开更多
关键词 特征提取网络 3D胶囊网络 空洞卷积 分组卷积 多视立体匹配
下载PDF
主动学习联合聚类分组网络的高光谱遥感图像分类
16
作者 刘敬 李银桥 刘逸 《光学精密工程》 EI CAS CSCD 北大核心 2024年第9期1395-1407,共13页
基于卷积神经网络的高光谱图像(Hyperspectral Image,HSI)分类面临网络参数量大,带类标样本少的现状,针对这些问题,提出了基于主动学习和聚类分组网络的高光谱图像分类方法(AL-CGNet)。AL-CGNet采用主动学习和聚类联合卷积神经网络进行... 基于卷积神经网络的高光谱图像(Hyperspectral Image,HSI)分类面临网络参数量大,带类标样本少的现状,针对这些问题,提出了基于主动学习和聚类分组网络的高光谱图像分类方法(AL-CGNet)。AL-CGNet采用主动学习和聚类联合卷积神经网络进行HSI的特征提取与分类,设计了基于分组卷积的轻量化网络模型以降低网络参数量。对线性判别分析(Linear Discriminant Analysis,LDA)降维后的高光谱图像采用小批量K均值聚类算法划分成不同的簇,并用簇中心的光谱特征代表不同的簇,以利用无类标样本的信息。在分组网络中将生成的特征图沿光谱维划分成一系列小组,每组通过多个残差块依次提取空间-光谱特征,这种分组策略可以充分利用波段的冗余性和差异性,降低网络参数,并实现轻量化。最后,采用主动学习选取信息量大的样本作为训练样本集,以解决带类标样本少的问题。实验结果表明,AL-CGNet在使用相同比例的6%训练样本的情况下,在Indian Pines,Botswana,Houston 3个数据集下的分类结果明显高于ClusterCNN,SSRN和HybridSN等方法,其OA分别为99.57%,99.23%,98.82%,甚至在训练样本更少5%的小样本情况下也是有效的。该方法不仅大大提高了HSI的分类效率,在获得高精度的同时还能高效率地提取特征。 展开更多
关键词 高光谱图像分类 卷积神经网络 分组卷积 聚类 轻量化
下载PDF
基于FBank特征与改进CNN的声纹识别研究
17
作者 王茂 何勇 《智能计算机与应用》 2024年第8期40-47,共8页
在声纹识别研究中,针对声纹信号特征的表征能力不足,模型的识别准确率不高的问题,提出基于CNN卷积神经网络的声纹识别方法,使用能体现更多声音本质的FBank梅尔语谱图特征作为模型的输入;此外,大多数研究为提高识别率而广泛使用多层堆叠... 在声纹识别研究中,针对声纹信号特征的表征能力不足,模型的识别准确率不高的问题,提出基于CNN卷积神经网络的声纹识别方法,使用能体现更多声音本质的FBank梅尔语谱图特征作为模型的输入;此外,大多数研究为提高识别率而广泛使用多层堆叠的网络结构,使得网络参数量与计算量较大,难以部署到计算资源和存储资源紧缺的边缘智能设备。为此,提出采用分组卷积的方式对CNN标准主干网络结构进行优化,降低网络参数量和计算量;同时为了保证网络模型的识别准确率,采用CBAM注意力机制进一步优化网络,使其关注通道和空间中更有价值的地方。经实验验证,所提方法有较高的声纹识别准确率,且相较于标准CNN,优化后的模型参数量与计算量均有较大程度的减少。 展开更多
关键词 声纹识别 卷积神经网络 FBank特征 分组卷积 CBAM注意力机制
下载PDF
跨层细节感知和分组注意力引导的遥感图像语义分割
18
作者 李林娟 贺赟 +2 位作者 谢刚 张浩雪 柏艳红 《中国图象图形学报》 CSCD 北大核心 2024年第5期1277-1290,共14页
目的 语义分割是遥感图像智能解译的关键任务之一,遥感图像覆盖面广,背景交叉复杂,且地物尺寸差异性大。现有方法在复杂背景下的多尺度地物上分割效果较差,且分割区域破碎边界不连续。针对上述问题,提出了一种跨层细节感知和分组注意力... 目的 语义分割是遥感图像智能解译的关键任务之一,遥感图像覆盖面广,背景交叉复杂,且地物尺寸差异性大。现有方法在复杂背景下的多尺度地物上分割效果较差,且分割区域破碎边界不连续。针对上述问题,提出了一种跨层细节感知和分组注意力引导的语义分割模型用于高分辨率遥感图像解析。方法 首先采用结构新颖的ConvNeXt骨干网络,编码输入图像的各层次特征。其次,设计了分组协同注意力模块,分组并行建模通道和空间维度的特征依赖性,通道注意力和空间注意力协同强化重要通道和区域的特征信息。接着,引入了自注意力机制,构建了跨层细节感知模块,利用低层特征中丰富的细节信息,指导高层特征层学习空间细节,保证分割结果的区域完整性和边界连续性。最后,以山西省太原市为研究区域,自制高分辨率遥感太原市城区土地覆盖数据集(Taiyuan urban land cover dataset,TULCD),所提方法实现了太原市城区土地覆盖精细分类任务。结果 实验在自制数据集TULCD和公开数据集Vaihingen上与最新的5种算法进行了比较,所提方法在两个数据集上平均像素准确率(mean pixel accuracy,mPA)为74.23%、87.26%,平均交并比(mean intersection over union,mIoU)为58.91%、77.02%,平均得分mF_(1)为72.24%、86.35%,均优于对比算法。结论 本文提出的高分辨率遥感图像语义分割模型具有较强的空间和细节感知能力,对类间差异小的相邻地物也有较强的鉴别能力,模型的整体分割精度较高。 展开更多
关键词 遥感图像 语义分割 卷积网络(FCN) 注意力机制 分组卷积
原文传递
轻量级遥感影像目标检测方法研究
19
作者 孙燕 杨鹏森 阚中强 《工程勘察》 2024年第2期43-47,63,共6页
常规目标检测模型在推理中需要消耗较多的计算资源,而在计算能力有限的星载或机载硬件中很难直接部署并进行流畅运行。针对以上问题,提出一种轻量级遥感影像目标检测模型。首先,采用分组卷积构建附有注意力机制的特征提取层;其次,构建... 常规目标检测模型在推理中需要消耗较多的计算资源,而在计算能力有限的星载或机载硬件中很难直接部署并进行流畅运行。针对以上问题,提出一种轻量级遥感影像目标检测模型。首先,采用分组卷积构建附有注意力机制的特征提取层;其次,构建双层的多尺度特征金字塔进行特征图语义信息强化;此外,利用改进的非极大值抑制算法输出最终的检测框。以高分辨率遥感影像集“Aerial Image和UCMerced_LandUse”为基础数据,通过数据增强处理,构建数据集,并以MobileNet-v3、MobileNet-SSD、shuffleNet作为对比模型,通过精度均值、平均精度均值、模型占内存大小,计算量等指标对模型进行评价。实验结果表明,所提出模型对于单类别目标的最高精度均值可达89.62%,对于所有类别目标的平均精度均值能达到86.05%,相比其余三组对比模型分别提高9.01%、15.04%以及12.58%。在检测速度、计算量以及内存大小等方面均有明显优势,说明本文所提出模型在算力有限的嵌入式硬件环境中能够对遥感影像中的多类别目标实施快速精准检测。 展开更多
关键词 遥感影像 目标检测 深度学习 分组卷积 非极大值抑制
下载PDF
基于注意力改进残差网络结构的表情识别方法
20
作者 张智 魏蘅 《计算机应用与软件》 北大核心 2024年第8期162-167,共6页
针对目前CNN在复杂图像中特征提取不充分的问题,提出一种基于注意力的改进残差网络的表情识别网络。设计一个双流网络在完成粗特征表情识别的同时检测关键点,并使用注意力机制增大关键点周边特征的权重。随后以残差网络为基础模型,改进... 针对目前CNN在复杂图像中特征提取不充分的问题,提出一种基于注意力的改进残差网络的表情识别网络。设计一个双流网络在完成粗特征表情识别的同时检测关键点,并使用注意力机制增大关键点周边特征的权重。随后以残差网络为基础模型,改进残差块之间的跳跃连接方式,并将残差块中的普通卷积改进为分组卷积来强化特征提取能力。最后联合两个表情识别网络进行分类,实验结果验证了该模型方案有着更卓越的性能。 展开更多
关键词 人脸表情识别 残差网络 注意力机制 分组卷积
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部