期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一致性协议匹配的跨模态图像文本检索方法 被引量:2
1
作者 宫大汉 陈辉 +2 位作者 陈仕江 包勇军 丁贵广 《智能系统学报》 CSCD 北大核心 2021年第6期1143-1150,共8页
跨模态图像文本检索的任务对于理解视觉和语言之间的对应关系很重要,大多数现有方法利用不同的注意力模块挖掘区域到词和词到区域的对齐来探索细粒度的跨模态关联。然而,现有的方法没有考虑到基于双重注意力会导致对齐不一致的问题。为... 跨模态图像文本检索的任务对于理解视觉和语言之间的对应关系很重要,大多数现有方法利用不同的注意力模块挖掘区域到词和词到区域的对齐来探索细粒度的跨模态关联。然而,现有的方法没有考虑到基于双重注意力会导致对齐不一致的问题。为此,本文提出了一种一致性协议匹配方法,旨在利用一致性对齐来增强跨模态检索的性能。本文采用注意力实现跨模态关联对齐,并基于跨模态对齐结果设计了基于竞争性投票的跨模态协议,该协议衡量了跨模态对齐的一致性,可以有效提升跨模态图像文本检索的性能。在Flickr30K和MS COCO两个基准数据集上,本文通过大量的实验证明了所提出的方法的有效性。 展开更多
关键词 人工智能 计算机视觉 视觉和语言 跨模态检索 一致性协议匹配 注意力 卷积神经网络 循环神经网络 门控循环单元
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部