期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
从视觉到文本:图像描述生成的研究进展综述
被引量:
14
1
作者
魏忠钰
范智昊
+3 位作者
王瑞泽
承怡菁
赵王
榕
黄萱菁
《中文信息学报》
CSCD
北大核心
2020年第7期19-29,共11页
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像...
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。
展开更多
关键词
图像描述生成
跨模态特征对齐
文献综述
下载PDF
职称材料
题名
从视觉到文本:图像描述生成的研究进展综述
被引量:
14
1
作者
魏忠钰
范智昊
王瑞泽
承怡菁
赵王
榕
黄萱菁
机构
复旦大学大数据学院
复旦大学工程与应用技术研究院
复旦大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2020年第7期19-29,共11页
基金
国家自然科学基金(71991471)
国家社会科学基金(20ZDA060)
上海市科学技术委员会(18DZ1201000,17JC1420200)
文摘
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。
关键词
图像描述生成
跨模态特征对齐
文献综述
Keywords
image captioning
cross-modality alignment
literature review
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
从视觉到文本:图像描述生成的研究进展综述
魏忠钰
范智昊
王瑞泽
承怡菁
赵王
榕
黄萱菁
《中文信息学报》
CSCD
北大核心
2020
14
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部