期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
从视觉到文本:图像描述生成的研究进展综述
被引量:
14
1
作者
魏忠钰
范智昊
+3 位作者
王瑞泽
承怡菁
赵王榕
黄萱菁
《中文信息学报》
CSCD
北大核心
2020年第7期19-29,共11页
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像...
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。
展开更多
关键词
图像描述生成
跨模态特征对齐
文献综述
下载PDF
职称材料
从光学到SAR:基于多级跨模态对齐的SAR图像舰船检测算法
被引量:
1
2
作者
何佳月
宿南
+3 位作者
徐从安
尹璐
廖艳苹
闫奕名
《遥感学报》
EI
CSCD
北大核心
2024年第7期1789-1801,共13页
合成孔径雷达(SAR)舰船检测是近年来的研究热点。然而,与光学图像不同,SAR成像的特点会导致不直观的特征表示。此外,由于SAR图像数据量不足,现有的基于大量标记SAR图像的方法可能难以达到较好的检测效果。为了解决这些问题,本文提出了...
合成孔径雷达(SAR)舰船检测是近年来的研究热点。然而,与光学图像不同,SAR成像的特点会导致不直观的特征表示。此外,由于SAR图像数据量不足,现有的基于大量标记SAR图像的方法可能难以达到较好的检测效果。为了解决这些问题,本文提出了一种基于多级跨模态对齐的SAR图像舰船检测算法MCMA-Net(Multi-level Cross-Modality Alignment Network),通过将光学模态中丰富的知识迁移到SAR模态来增强SAR图像的特征表示。该算法首先设计了一个基于邻域—全局注意力的特征交互网络NGAN(Neighborhood-Global Attention Network),通过对骨干网络的浅层特征采用邻域注意力机制进行局部交互、对深层特征采取全局自注意力机制进行全局上下文交互,在兼顾全局上下文建模能力的同时,提升局部特征的编码能力,使得网络在不同层级更合理的关注相应的信息,从而能够促进后续的多级别模态对齐。其次,本文设计了一个多级模态对齐模块MLMA(Multi-level Modality Alignment),通过从局部级别到全局级别再到实例级别的对两种模态不同隐含空间中的特征进行对齐,促进模型有效地学习模态不变特征,缓解了光学图像和SAR图像之间的模态鸿沟,实现了从光学模态到SAR模态的知识传输。大量的实验证明我们的算法优于现阶段的检测算法,取得了最好的实验结果。
展开更多
关键词
遥感
SAR
目标检测
跨模态
特征对齐
注意力机制
原文传递
基于像素对齐和特征对齐的跨模态行人重识别
3
作者
李俊峰
楼琼
+1 位作者
钱亚冠
孙安临
《浙江科技学院学报》
CAS
2022年第3期251-260,共10页
为了减少可见光-红外跨模态行人重识别中较大的跨模态差异,提出一种联合像素对齐和特征对齐的跨模态行人重识别方法。首先,从像素级角度出发,利用对齐生成对抗网络(alignment generative adversarial network,AlignGAN),将可见光图像转...
为了减少可见光-红外跨模态行人重识别中较大的跨模态差异,提出一种联合像素对齐和特征对齐的跨模态行人重识别方法。首先,从像素级角度出发,利用对齐生成对抗网络(alignment generative adversarial network,AlignGAN),将可见光图像转换为红外图像,减少可见光和红外图像之间的跨模态差距。其次,从特征级角度出发,通过交换可见光和红外图像的模态特定特征来生成跨模态配对图像,同时进行全局集合级对齐和细粒度实例级对齐。最后,运用基于非局部块的深度为50层的残差网络(50-layer residual nets,ResNet-50)捕获图像的长距离依赖关系。在SYSU-MM01数据集上进行了大量试验,我们的方法得到41.8%的识别准确率,在相比较的方法中准确率最高。可见,本方法可以有效地减少跨模态行人重识别中较大的跨模态差异。本研究结果可为跨模态行人重识别的研究提供参考。
展开更多
关键词
行人重识别
跨模态
像素对齐
特征对齐
非局部神经网络
下载PDF
职称材料
基于图像和特征联合优化的跨模态行人重识别研究
4
作者
张辉
刘世洪
钟武
《荆楚理工学院学报》
2023年第2期9-17,共9页
跨模态行人重识别(VI-ReID)旨在匹配可见光和红外摄像头下捕获的行人图像,十分具有挑战性。为减小可见光图像和红外图像之间的模态差异,本文提出了异质图像增广方法和跨模态特征对齐方法来优化跨模态行人重识别网络,利用轻量级异质图像...
跨模态行人重识别(VI-ReID)旨在匹配可见光和红外摄像头下捕获的行人图像,十分具有挑战性。为减小可见光图像和红外图像之间的模态差异,本文提出了异质图像增广方法和跨模态特征对齐方法来优化跨模态行人重识别网络,利用轻量级异质图像卷积生成器对可见光图像进行增广,采用色彩抖动方式对红外图像进行增广,并使用正样本优化轻量级异构图像卷积生成器来约束损失。在此基础上,使用两个模态分类器和跨模态特征对齐损失作为指导,不断学习获得模态共享的特征。在两个数据集上的大量实验表明,我们的方法具有优异的性能,在SYSU-MM01和RegDB数据集上分别达到了rank1/mAP 57.82%/54.35%和80.39%/75.05%的精度。
展开更多
关键词
跨模态行人重识别
模态差异
异质图像增广
跨模态特征对齐
下载PDF
职称材料
题名
从视觉到文本:图像描述生成的研究进展综述
被引量:
14
1
作者
魏忠钰
范智昊
王瑞泽
承怡菁
赵王榕
黄萱菁
机构
复旦大学大数据学院
复旦大学工程与应用技术研究院
复旦大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2020年第7期19-29,共11页
基金
国家自然科学基金(71991471)
国家社会科学基金(20ZDA060)
上海市科学技术委员会(18DZ1201000,17JC1420200)
文摘
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。
关键词
图像描述生成
跨模态特征对齐
文献综述
Keywords
image
captioning
cross
-
modality
alignment
literature
review
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
从光学到SAR:基于多级跨模态对齐的SAR图像舰船检测算法
被引量:
1
2
作者
何佳月
宿南
徐从安
尹璐
廖艳苹
闫奕名
机构
哈尔滨工程大学信息与通信工程学院
海军航空大学信息融合研究所
北京市遥感信息研究所
出处
《遥感学报》
EI
CSCD
北大核心
2024年第7期1789-1801,共13页
基金
国家自然科学基金(编号:62271159,62071136,62002083,61971153)
黑龙江省优秀青年基金(编号:YQ2022F002)
+2 种基金
黑龙江省博士后基金(编号:LBH-Q20085,LBH-Z20051)
中央高校基本科研业务费资金资助(编号:3072022QBZ0805,3072021CFT0801,3072022CF0808)
高分专项中俄边境地区国家安全监测及综合服务产业化示范(编号:72-Y50G11-9001-22/23)。
文摘
合成孔径雷达(SAR)舰船检测是近年来的研究热点。然而,与光学图像不同,SAR成像的特点会导致不直观的特征表示。此外,由于SAR图像数据量不足,现有的基于大量标记SAR图像的方法可能难以达到较好的检测效果。为了解决这些问题,本文提出了一种基于多级跨模态对齐的SAR图像舰船检测算法MCMA-Net(Multi-level Cross-Modality Alignment Network),通过将光学模态中丰富的知识迁移到SAR模态来增强SAR图像的特征表示。该算法首先设计了一个基于邻域—全局注意力的特征交互网络NGAN(Neighborhood-Global Attention Network),通过对骨干网络的浅层特征采用邻域注意力机制进行局部交互、对深层特征采取全局自注意力机制进行全局上下文交互,在兼顾全局上下文建模能力的同时,提升局部特征的编码能力,使得网络在不同层级更合理的关注相应的信息,从而能够促进后续的多级别模态对齐。其次,本文设计了一个多级模态对齐模块MLMA(Multi-level Modality Alignment),通过从局部级别到全局级别再到实例级别的对两种模态不同隐含空间中的特征进行对齐,促进模型有效地学习模态不变特征,缓解了光学图像和SAR图像之间的模态鸿沟,实现了从光学模态到SAR模态的知识传输。大量的实验证明我们的算法优于现阶段的检测算法,取得了最好的实验结果。
关键词
遥感
SAR
目标检测
跨模态
特征对齐
注意力机制
Keywords
remote
sensing
SAR
target
detection
cross
-
modality
feature
alignment
attention
mechanism
分类号
P2 [天文地球—测绘科学与技术]
原文传递
题名
基于像素对齐和特征对齐的跨模态行人重识别
3
作者
李俊峰
楼琼
钱亚冠
孙安临
机构
浙江科技学院理学院
出处
《浙江科技学院学报》
CAS
2022年第3期251-260,共10页
基金
国家自然科学基金项目(11801511)。
文摘
为了减少可见光-红外跨模态行人重识别中较大的跨模态差异,提出一种联合像素对齐和特征对齐的跨模态行人重识别方法。首先,从像素级角度出发,利用对齐生成对抗网络(alignment generative adversarial network,AlignGAN),将可见光图像转换为红外图像,减少可见光和红外图像之间的跨模态差距。其次,从特征级角度出发,通过交换可见光和红外图像的模态特定特征来生成跨模态配对图像,同时进行全局集合级对齐和细粒度实例级对齐。最后,运用基于非局部块的深度为50层的残差网络(50-layer residual nets,ResNet-50)捕获图像的长距离依赖关系。在SYSU-MM01数据集上进行了大量试验,我们的方法得到41.8%的识别准确率,在相比较的方法中准确率最高。可见,本方法可以有效地减少跨模态行人重识别中较大的跨模态差异。本研究结果可为跨模态行人重识别的研究提供参考。
关键词
行人重识别
跨模态
像素对齐
特征对齐
非局部神经网络
Keywords
person
re-identification
cross
-
modality
pixel
alignment
feature
alignment
non-local
neural
network
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于图像和特征联合优化的跨模态行人重识别研究
4
作者
张辉
刘世洪
钟武
机构
武汉迈力特通信有限公司
重庆金美通信有限责任公司
出处
《荆楚理工学院学报》
2023年第2期9-17,共9页
文摘
跨模态行人重识别(VI-ReID)旨在匹配可见光和红外摄像头下捕获的行人图像,十分具有挑战性。为减小可见光图像和红外图像之间的模态差异,本文提出了异质图像增广方法和跨模态特征对齐方法来优化跨模态行人重识别网络,利用轻量级异质图像卷积生成器对可见光图像进行增广,采用色彩抖动方式对红外图像进行增广,并使用正样本优化轻量级异构图像卷积生成器来约束损失。在此基础上,使用两个模态分类器和跨模态特征对齐损失作为指导,不断学习获得模态共享的特征。在两个数据集上的大量实验表明,我们的方法具有优异的性能,在SYSU-MM01和RegDB数据集上分别达到了rank1/mAP 57.82%/54.35%和80.39%/75.05%的精度。
关键词
跨模态行人重识别
模态差异
异质图像增广
跨模态特征对齐
Keywords
VI-reID
modality
differences
heterogeneous
image
enhancement
cross
-
modality
feature
alignment
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
从视觉到文本:图像描述生成的研究进展综述
魏忠钰
范智昊
王瑞泽
承怡菁
赵王榕
黄萱菁
《中文信息学报》
CSCD
北大核心
2020
14
下载PDF
职称材料
2
从光学到SAR:基于多级跨模态对齐的SAR图像舰船检测算法
何佳月
宿南
徐从安
尹璐
廖艳苹
闫奕名
《遥感学报》
EI
CSCD
北大核心
2024
1
原文传递
3
基于像素对齐和特征对齐的跨模态行人重识别
李俊峰
楼琼
钱亚冠
孙安临
《浙江科技学院学报》
CAS
2022
0
下载PDF
职称材料
4
基于图像和特征联合优化的跨模态行人重识别研究
张辉
刘世洪
钟武
《荆楚理工学院学报》
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部