从光学到SAR:基于多级跨模态对齐的SAR图像舰船检测算法

From optical to SAR:A SAR ship detection algorithm based on multi-level cross-modality alignment

导出

摘要合成孔径雷达(SAR)舰船检测是近年来的研究热点。然而,与光学图像不同,SAR成像的特点会导致不直观的特征表示。此外,由于SAR图像数据量不足,现有的基于大量标记SAR图像的方法可能难以达到较好的检测效果。为了解决这些问题,本文提出了一种基于多级跨模态对齐的SAR图像舰船检测算法MCMA-Net(Multi-level Cross-Modality Alignment Network),通过将光学模态中丰富的知识迁移到SAR模态来增强SAR图像的特征表示。该算法首先设计了一个基于邻域—全局注意力的特征交互网络NGAN(Neighborhood-Global Attention Network),通过对骨干网络的浅层特征采用邻域注意力机制进行局部交互、对深层特征采取全局自注意力机制进行全局上下文交互,在兼顾全局上下文建模能力的同时,提升局部特征的编码能力,使得网络在不同层级更合理的关注相应的信息,从而能够促进后续的多级别模态对齐。其次,本文设计了一个多级模态对齐模块MLMA(Multi-level Modality Alignment),通过从局部级别到全局级别再到实例级别的对两种模态不同隐含空间中的特征进行对齐,促进模型有效地学习模态不变特征,缓解了光学图像和SAR图像之间的模态鸿沟,实现了从光学模态到SAR模态的知识传输。大量的实验证明我们的算法优于现阶段的检测算法,取得了最好的实验结果。 In recent years,interest in Synthetic Aperture Radar(SAR)ship detection has considerably grown.Its distinctive strengths position it as a pivotal player in numerous fields of research.However,the inherent characteristics of SAR images have presented a range of challenges.For instance,in contrast to optical images,SAR images have counterintuitive feature representation.Additionally,owing to the constrained number of SAR image data,achieving satisfactory results with existing methods that depend on a substantial number of annotated SAR images might be challenging.How to effectively train a high-performance SAR ship detection network with a limited quantity of SAR images should be investigated.Given that single-modality SAR detection algorithms have inherent limitations,other effective modalities that can assist the SAR modality in completing tasks are needed.For instance,in SAR image target detection,optical images can serve as supplementary data sources.A knowledge-rich model can be developed by utilizing a large volume of optical data in training with SAR data.Hence,reasonable training approaches for effectively utilizing images from SAR and optical modalities should be explored.To address these challenges,a SAR ship detection algorithm called MCMA-Net,which is based on multilevel cross-modality alignment,is proposed in this paper.The MCMA-Net enriches SAR feature representation by incorporating valuable knowledge from optical modality.First,we propose a neighborhood–global attention-based feature interaction network(NGAN),which employs a neighborhood attention mechanism that enables the local interaction of low-level features and a global self-attention mechanism that captures global context from high-level features.When the ability of global context modeling is considered,the encoding ability of local features improves,NGAN enables the network to focus on corresponding information at different levels and can promote the subsequent multilevel modality alignment.Second,we propose a multilevel modality alignment

作者何佳月宿南徐从安尹璐廖艳苹闫奕名 HE Jiayue;SU Nan;XU Cong’an;YIN Lu;LIAO Yanping;YAN Yiming(College of Information and Communication Engineering,Harbin Engineering University,Harbin 150001,China;Research Institute of Information Fusion,Naval Aviation University,Yantai 264001,China;Beijing Institute of Remote Sensing Information,Beijing 100192,China)

机构地区哈尔滨工程大学信息与通信工程学院海军航空大学信息融合研究所北京市遥感信息研究所

出处《遥感学报》 EI CSCD 北大核心 2024年第7期1789-1801,共13页 NATIONAL REMOTE SENSING BULLETIN

基金国家自然科学基金(编号:62271159,62071136,62002083,61971153) 黑龙江省优秀青年基金(编号:YQ2022F002) 黑龙江省博士后基金(编号:LBH-Q20085,LBH-Z20051) 中央高校基本科研业务费资金资助(编号:3072022QBZ0805,3072021CFT0801,3072022CF0808) 高分专项中俄边境地区国家安全监测及综合服务产业化示范(编号:72-Y50G11-9001-22/23)。

关键词遥感 SAR 目标检测跨模态特征对齐注意力机制 remote sensing SAR target detection cross-modality feature alignment attention mechanism

分类号 P2 [天文地球—测绘科学与技术]

引文网络
相关文献

参考文献6

1曹琼,马爱龙,钟燕飞,赵济,赵贝,张良培.高光谱-LiDAR多级融合城区地表覆盖分类[J].遥感学报,2019,23(5):892-903. 被引量：23
2侯卫,李勇.基于SAR影像数据的多分辨率CFAR目标检测算法及精度分析[J].北京测绘,2023,37(1):104-109. 被引量：1
3姚艳清,程塨,谢星星,韩军伟.多分辨率特征融合的光学遥感图像目标检测[J].遥感学报,2021,25(5):1124-1137. 被引量：31
4于野,艾华,贺小军,于树海,钟兴,朱瑞飞.A-FPN算法及其在遥感图像船舶检测中的应用[J].遥感学报,2020,24(2):107-115. 被引量：19
5张帆,陆圣涛,项德良,袁新哲.一种改进的高分辨率SAR图像超像素CFAR舰船检测算法[J].雷达学报（中英文）,2023,12(1):120-139. 被引量：4
6周培诚,程塨,姚西文,韩军伟.高分辨率遥感影像解译中的机器学习范式[J].遥感学报,2021,25(1):182-197. 被引量：50

二级参考文献33

1姚红革,王诚,喻钧,白小军,李蔚.复杂卫星图像中的小目标船舶识别[J].遥感学报,2020,24(2):116-125. 被引量：13
2杨桄,刘湘南.遥感影像解译的研究现状和发展趋势[J].国土资源遥感,2004,16(2):7-10. 被引量：55
3吴一戎,洪文,王彦平.极化干涉SAR的研究现状与启示[J].电子与信息学报,2007,29(5):1258-1262. 被引量：51
4田巳睿,孙根云,王超,张红.基于引力场增强的SAR图像舰船检测方法研究[J].遥感学报,2007,11(4):452-459. 被引量：5
5陈鹏,刘仁义,黄韦艮.SAR图像复合分布船只检测模型[J].遥感学报,2010,14(3):546-557. 被引量：3
6张云秀,赵春晖.基于直方图参数估计CFAR的SAS图像目标检测算法的研究[J].黑龙江大学自然科学学报,2011,28(3):399-404. 被引量：2
7刘国庆,熊红,黄顺吉.基于小波变换和马尔可夫随机场的极化SAR图像自动分类[J].电子科学学刊,2000,22(3):359-365. 被引量：3
8周志华.基于分歧的半监督学习[J].自动化学报,2013,39(11):1871-1878. 被引量：86
9朱洁丽,汤俊.基于改进的ZMNL和SIRP的K分布杂波模拟方法[J].雷达学报（中英文）,2014,3(5):533-540. 被引量：8
10童庆禧,张兵,张立福.中国高光谱遥感的前沿进展[J].遥感学报,2016,20(5):689-707. 被引量：247

共引文献111

1张琪,张光辉,张岩,王佳希,余双武.基于不同分辨率遥感影像自动提取切沟的精度分析和转换模型[J].遥感技术与应用,2022,37(5):1217-1226. 被引量：2
2李欣,杨懿,王宁,顾海燕,丁少鹏,李海涛.遥感影像样本自动生成与智能迭代分类方法[J].测绘科学,2022,47(8):197-203. 被引量：3
3杜星乾,侯艳杰,唐轶.高光谱遥感影像与高程数据融合方法综述[J].云南民族大学学报（自然科学版）,2020,29(1):47-58. 被引量：7
4林勇,易扬,张桂莲,张浪,邢璐琪.高光谱遥感技术在城市绿地调查中的应用及发展趋势[J].园林,2020(6):70-75. 被引量：6
5潘绍明.基于多融合多尺度特征的高光谱图像分类研究[J].激光杂志,2021,42(2):110-114. 被引量：1
6李树涛,李聪妤,康旭东.多源遥感图像融合发展现状与未来展望[J].遥感学报,2021,25(1):148-166. 被引量：74
7龚威,史硕,陈必武,宋沙磊,牛铮,王成,管海燕,李伟,高帅,林沂,孙嘉,杨健,杜霖.对地观测高光谱激光雷达发展及展望[J].遥感学报,2021,25(1):501-513. 被引量：13
8姚艳清,程塨,谢星星,韩军伟.多分辨率特征融合的光学遥感图像目标检测[J].遥感学报,2021,25(5):1124-1137. 被引量：31
9光睿智,安博文,潘胜达.基于无锚框网络的航拍航道船舶检测算法[J].计算机工程与应用,2021,57(15):251-258. 被引量：2
10张继贤,李海涛,顾海燕,张鹤,杨懿,谭相瑞,李淼,沈晶.人机协同的自然资源要素智能提取方法[J].测绘学报,2021,50(8):1023-1032. 被引量：27

1刘月月.浅谈信息化手段在英语教学中的应用[J].新教育时代电子杂志（学生版）,2020(1):269-269.
2李月.嵌入视角下社会力量参与农业新型劳动者培育的实践机理与优化路径[J].财经科学,2024(6):101-115.
3戎贤,张健新.新工科视角下土木工程专业协同育人模式研究[J].科技风,2024(19):49-51.
4Fan Zhang,Gongguan Chen,Hua Wang,Caiming Zhang.CF-DAN: Facial-expression recognition based on cross-fusion dual-attention network[J].Computational Visual Media,2024,10(3):593-608.
5曲涛,莫靖妤,许多.Castrol ON将电动车油液领先优势向商用车延续专访嘉实多高层[J].汽车之友,2024(8):12-12.
6余忠岚.新课标下初中物理高效课堂教学策略研究[J].环球慈善,2024(3):0106-0108.
7温艳萍.基于人工智能的计算机应用软件开发技术[J].计算机产品与流通,2024(3):80-82.
8李燕凌,郭毓捷.邯郸赛戏短视频传播策略研究——以抖音平台为例[J].采写编,2024(8):76-77.
9张镜,陈广锋.结合特征约束学习的可见光-红外行人重识别[J].激光与光电子学进展,2024,61(12):211-218.
10王为,夏恩君.在线众包健康社区用户社会化交互网络结构与特征[J].科技和产业,2024,24(15):156-167.

遥感学报

2024年第7期

浏览历史

内容加载中请稍等...

从光学到SAR:基于多级跨模态对齐的SAR图像舰船检测算法

参考文献6

二级参考文献33

共引文献111

相关作者

相关机构

相关主题

浏览历史