期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多模态双向导向注意的视觉问答
被引量:
1
1
作者
鲜荣
何小海
+1 位作者
吴晓红
卿粼波
《太赫兹科学与电子信息学报》
2021年第1期156-161,共6页
针对视觉问答(VQA)任务中现存深度协同注意模型只考虑问题引导图像的单向注意方式,导致多模态学习交互性不足的问题,提出一种多模态双向导向注意力网络。该网络由多模态特征提取模块、双向导向注意力模块、特征融合模块以及分类器组成...
针对视觉问答(VQA)任务中现存深度协同注意模型只考虑问题引导图像的单向注意方式,导致多模态学习交互性不足的问题,提出一种多模态双向导向注意力网络。该网络由多模态特征提取模块、双向导向注意力模块、特征融合模块以及分类器组成。将提取出的图像和问题特征分别经过层层注意后输出加权的注意特征;经过特征线性融合后送入softmax分类器,得到问题的预测答案;再结合计数模块提升模型的计数能力。结果表明,该模型在公共数据集VQA v2.0上表现良好,在testdev和teststd测试子集上分别获得70.77%、71.28%的总体分类准确率,与大多数先进模型相比,体现出一定优势。
展开更多
关键词
视觉问答
深度协同注意
单向注意
双向导向注意
特征融合
下载PDF
职称材料
题名
基于多模态双向导向注意的视觉问答
被引量:
1
1
作者
鲜荣
何小海
吴晓红
卿粼波
机构
四川大学电子信息学院
出处
《太赫兹科学与电子信息学报》
2021年第1期156-161,共6页
基金
国家自然科学基金资助项目(61871278)
成都市产业集群协同创新资助项目(2016-XT00-00015-GX)
四川省科技计划资助项目(2018HH0143)。
文摘
针对视觉问答(VQA)任务中现存深度协同注意模型只考虑问题引导图像的单向注意方式,导致多模态学习交互性不足的问题,提出一种多模态双向导向注意力网络。该网络由多模态特征提取模块、双向导向注意力模块、特征融合模块以及分类器组成。将提取出的图像和问题特征分别经过层层注意后输出加权的注意特征;经过特征线性融合后送入softmax分类器,得到问题的预测答案;再结合计数模块提升模型的计数能力。结果表明,该模型在公共数据集VQA v2.0上表现良好,在testdev和teststd测试子集上分别获得70.77%、71.28%的总体分类准确率,与大多数先进模型相比,体现出一定优势。
关键词
视觉问答
深度协同注意
单向注意
双向导向注意
特征融合
Keywords
Visual
Question
Answering
deep
collaborative
attention
unidirectional
attention
bidirectional
guided
attention
feature
fusion
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多模态双向导向注意的视觉问答
鲜荣
何小海
吴晓红
卿粼波
《太赫兹科学与电子信息学报》
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部