期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度学习的图像-文本匹配研究综述
被引量:
6
1
作者
刘萌
齐
孟津
+3 位作者
詹圳宇
曲磊钢
聂秀山
聂礼强
《计算机学报》
EI
CAS
CSCD
北大核心
2023年第11期2370-2399,共30页
图像-文本匹配任务旨在衡量图像和文本描述之间的相似性,其在桥接视觉和语言中起着至关重要的作用.近年来,图像与句子的全局对齐以及区域与单词的局部对齐研究方面取得了很大的进展.本文对当前先进的研究方法进行分类和描述.具体地,本...
图像-文本匹配任务旨在衡量图像和文本描述之间的相似性,其在桥接视觉和语言中起着至关重要的作用.近年来,图像与句子的全局对齐以及区域与单词的局部对齐研究方面取得了很大的进展.本文对当前先进的研究方法进行分类和描述.具体地,本文将现有方法划分为基于全局特征的图像-文本匹配方法、基于局部特征的图像-文本匹配方法、基于外部知识的图像-文本匹配方法、基于度量学习的图像-文本匹配方法以及多模态预训练模型,对于基于全局特征的图像-文本匹配方法,本文依据流程类型划分为两类:基于嵌入的方法和基于交互的方法;而对于基于局部特征的图像-文本匹配方法,依据其交互模式的不同,则被细分为三类:基于模态内关系建模的方法、基于模态间关系建模的方法以及基于混合交互建模的方法.随后,本文对当前图像-文本匹配任务的相关数据集进行了整理,并对现有方法的实验结果进行分析与总结.最后,对未来研究可能面临的挑战进行了展望.
展开更多
关键词
图像-文本匹配
跨模态图像检索
多模态预训练模型
综述
深度学习
人工智能
下载PDF
职称材料
上下文感知的深度弱监督图像哈希表示学习方法
被引量:
1
2
作者
刘萌
周迪
+2 位作者
田传发
齐
孟津
聂秀山
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2022年第3期85-92,共8页
针对现有深度监督图像哈希表示学习方法依赖于图像的类别信息,难以在现实中被广泛应用问题,利用与图像相关的标签信息作为监督信息,提出上下文感知的深度弱监督图像哈希表示学习方法。该方法一方面通过自适应捕获图像区域特征的相关上...
针对现有深度监督图像哈希表示学习方法依赖于图像的类别信息,难以在现实中被广泛应用问题,利用与图像相关的标签信息作为监督信息,提出上下文感知的深度弱监督图像哈希表示学习方法。该方法一方面通过自适应捕获图像区域特征的相关上下文来增强它们的表示能力,另一方面通过引入判别损失来提高学习到的哈希码表示的判别性。在现有两个公开数据集上的大量实验结果证明了该方法的有效性。
展开更多
关键词
图像哈希
弱监督学习
图像检索
区域上下文建模
判别损失
下载PDF
职称材料
题名
基于深度学习的图像-文本匹配研究综述
被引量:
6
1
作者
刘萌
齐
孟津
詹圳宇
曲磊钢
聂秀山
聂礼强
机构
山东建筑大学计算机科学与技术学院
山东大学(青岛)计算机科学与技术学院
哈尔滨工业大学(深圳)计算机科学与技术学院
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2023年第11期2370-2399,共30页
基金
国家自然科学基金项目(No.62006142、No.U1936203)
山东省杰出青年基金项目(No.ZR2021JQ26)
+2 种基金
山东省基金重大基础研究项目(No.ZR2021ZD15)
山东省高等学校青年创新科技创新计划(No.2021KJ036)
山东建筑大学特聘教授专项基金资助。
文摘
图像-文本匹配任务旨在衡量图像和文本描述之间的相似性,其在桥接视觉和语言中起着至关重要的作用.近年来,图像与句子的全局对齐以及区域与单词的局部对齐研究方面取得了很大的进展.本文对当前先进的研究方法进行分类和描述.具体地,本文将现有方法划分为基于全局特征的图像-文本匹配方法、基于局部特征的图像-文本匹配方法、基于外部知识的图像-文本匹配方法、基于度量学习的图像-文本匹配方法以及多模态预训练模型,对于基于全局特征的图像-文本匹配方法,本文依据流程类型划分为两类:基于嵌入的方法和基于交互的方法;而对于基于局部特征的图像-文本匹配方法,依据其交互模式的不同,则被细分为三类:基于模态内关系建模的方法、基于模态间关系建模的方法以及基于混合交互建模的方法.随后,本文对当前图像-文本匹配任务的相关数据集进行了整理,并对现有方法的实验结果进行分析与总结.最后,对未来研究可能面临的挑战进行了展望.
关键词
图像-文本匹配
跨模态图像检索
多模态预训练模型
综述
深度学习
人工智能
Keywords
image-text matching
cross-modal image retrieval
multimodal pre-training model
survey
deep learning
artificial intelligence
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
上下文感知的深度弱监督图像哈希表示学习方法
被引量:
1
2
作者
刘萌
周迪
田传发
齐
孟津
聂秀山
机构
山东建筑大学计算机科学与技术学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2022年第3期85-92,共8页
基金
国家自然科学基金资助项目(62006142)。
文摘
针对现有深度监督图像哈希表示学习方法依赖于图像的类别信息,难以在现实中被广泛应用问题,利用与图像相关的标签信息作为监督信息,提出上下文感知的深度弱监督图像哈希表示学习方法。该方法一方面通过自适应捕获图像区域特征的相关上下文来增强它们的表示能力,另一方面通过引入判别损失来提高学习到的哈希码表示的判别性。在现有两个公开数据集上的大量实验结果证明了该方法的有效性。
关键词
图像哈希
弱监督学习
图像检索
区域上下文建模
判别损失
Keywords
image hashing
weakly supervised learning
image retrieval
region context modeling
discrimination loss
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度学习的图像-文本匹配研究综述
刘萌
齐
孟津
詹圳宇
曲磊钢
聂秀山
聂礼强
《计算机学报》
EI
CAS
CSCD
北大核心
2023
6
下载PDF
职称材料
2
上下文感知的深度弱监督图像哈希表示学习方法
刘萌
周迪
田传发
齐
孟津
聂秀山
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2022
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部