-
题名基于双目图像与跨级特征引导的语义分割模型
被引量:3
- 1
-
-
作者
张娣
陆建峰
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第10期275-281,288,共8页
-
基金
国家重点研发计划(2017YFB1300205)。
-
文摘
为改善单目图像语义分割网络对图像深度变化区域的分割效果,提出一种结合双目图像的深度信息和跨层次特征进行互补应用的语义分割模型。在不改变已有单目孪生网络结构的前提下,利用该模型分别提取双目左、右输入图像的二维信息,并基于ParallelNet设计色彩深度融合模块,计算双目图像特征点的不同视差等级相似度提取深度信息,同时将其与二维信息进行融合获得深度特征。同时,在高层语义信息指导下使用跨级特征注意力模块得到准确的低层类别边界信息,以提高各尺度特征的利用率与边缘区域的准确率。实验结果表明,与传统ParallelNet双目基准模型相比,该模型分割得到图像的平均交并比与像素精度分别提高3.67和3.32个百分点,对栅栏和交通标志等相似区域的分割更细致准确。
-
关键词
语义分割
双目图像
深度信息
跨级特征
注意力
-
Keywords
semantic segmentation
binocular image
depth information
cross-level feature
attention
-
分类号
TP753
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名多尺度特征融合与交互的伪装目标检测网络
- 2
-
-
作者
张成
刘研
宋慧慧
-
机构
南京信息工程大学江苏省大数据分析技术重点实验室
江苏省大气环境与装备技术协同创新中心
-
出处
《计算机系统应用》
2024年第8期90-97,共8页
-
基金
国家自然科学基金(61872189)。
-
文摘
伪装目标检测是一项在复杂场景中定位和识别伪装目标的任务.目前基于深度神经网络的方法已初步运用,但在复杂场景下遇到干扰时,许多方法无法充分利用目标的多级特征来提取丰富的语义信息,仅依靠固定尺寸特征识别伪装目标.为解决这一问题,本文提出了一种基于多尺度特征融合交互的伪装目标检测网络.该网络包含两个创新设计:多尺度特征感知模块和双阶段邻级交互模块.前者旨在通过结合多尺度特征的方式充分捕获复杂场景中丰富的局部-全局场景对比信息.后者则是整合来自相邻层的特征以利用跨层相关性将有价值的上下文信息从编码器传输到解码器网络.本文在CHAMELEON、CAMO-Test、COD10K-Test这3个公共数据集上对提出的方法进行了评测并与当前的主流方法对比.实验结果表明,本文方法的性能超越了当前的主流方法,在各项指标上达到了优异的性能水平.
-
关键词
伪装目标检测
多尺度特征提取
跨级特征融合
深度学习
-
Keywords
camouflaged object detection(COD)
multi-scale feature extraction
cross-level feature fusion
deep learning
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—计算机科学与技术]
-
-
题名双分支跨级特征融合的自然场景文本检测
- 3
-
-
作者
刘光辉
张钰敏
孟月波
占华
-
机构
西安建筑科技大学信息与控制工程学院
-
出处
《智能系统学报》
CSCD
北大核心
2023年第5期1079-1089,共11页
-
基金
国家自然科学基金项目(52278125)
陕西省重点研发计划(2021SF-429)。
-
文摘
现有的场景文本检测方法在处理任意形状文本时,由于复杂背景的影响会造成文本区域定位不准确、相邻文本漏检误检的问题,基于此提出一种双分支跨级特征融合的自然场景文本检测方法。首先,以Resnet50为主干网络提取初始特征,设计跨级特征分布增强模块(cross-level feature distribution enhancement module,CFDEM),增强跨级特征文本信息的交互性,提高特征的表达能力;然后,为自适应地选择过滤非文本或冗余特征,降低误检率和漏检率,提出自适应融合策略(adaptive fusion strategy,AFS),利用双分支结构加强不同维度特征之间的联系,优化融合过程;最后,预测阶段采用可微分二值化的方法来生成文本检测结果。所提方法在ICDAR2015、ICDAR2017、Total-Text、CTW1500数据集上进行消融实验,实验结果表明该方法能准确定位文本区域,克服文本漏检误检影响。
-
关键词
文本检测
任意形状
跨级特征分布增强
自适应融合
双分支
空间维度
通道维度
可微分二值化
-
Keywords
text detection
arbitrarily shaped
cross-level feature distribution enhancement
adaptive fusion
double branch
spatial dimension
channel dimension
differentiable binarization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于残差双注意力与跨级特征融合模块的静态手势识别
被引量:1
- 4
-
-
作者
吴佳璐
田秋红
岳金鸿
-
机构
浙江理工大学信息学院
-
出处
《计算机系统应用》
2022年第11期111-119,共9页
-
基金
国家自然科学基金(51405448)
浙江理工大学博士科研启动项目(11122932611817)
+2 种基金
浙江理工大学信息学院教育教学改革研究项目(11120033312202)
国家级大学生创新创业训练计划(11120032382104)
浙江省大学生科技成果推广项目(14530031661961)
-
文摘
为解决卷积神经网络提取特征遗漏、手势多特征提取不充分问题,本文提出基于残差双注意力与跨级特征融合模块的静态手势识别方法.设计了一种残差双注意力模块,该模块对ResNet50网络提取的低层特征进行增强,能够有效学习关键信息并更新权重,提高对高层特征的注意力,然后由跨级特征融合模块对不同阶段的高低层特征进行融合,丰富高级特征图中不同层级之间的语义和位置信息,最后使用全连接层的Softmax分类器对手势图像进行分类识别.本文在ASL美国手语数据集上进行实验,平均准确率为99.68%,相比基础ResNet50网络准确率提升2.52%.结果验证本文方法能充分提取与复用手势特征,有效提高手势图像的识别精度.
-
关键词
手势图像识别
ResNet
残差双注意力模块
跨级特征融合
深度学习
-
Keywords
gesture image recognition
ResNet
residual double attention module
cross-level feature fusion module
deep learning
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—计算机科学与技术]
-