期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
知识驱动的多模态语义理解研究综述
被引量:
1
1
作者
郑祎豪
郭奕君
+1 位作者
毋立芳
黄岩
《模式识别与人工智能》
EI
CSCD
北大核心
2023年第12期1127-1138,共12页
基于深度学习模型的多模态学习方法已在静态、可控等简单场景下取得较优的语义理解性能,但在动态、开放等复杂场景下的泛化性仍然较低.近期已有不少研究工作尝试将类人知识引入多模态语义理解方法中,并取得不错效果.为了更深入了解当前...
基于深度学习模型的多模态学习方法已在静态、可控等简单场景下取得较优的语义理解性能,但在动态、开放等复杂场景下的泛化性仍然较低.近期已有不少研究工作尝试将类人知识引入多模态语义理解方法中,并取得不错效果.为了更深入了解当前知识驱动的多模态语义理解研究进展,文中在对相关方法进行系统调研与分析的基础上,归纳总结关系型和对齐型这两类主要的多模态知识表示框架.然后选择多个代表性应用进行具体介绍,包括图文匹配、目标检测、语义分割、视觉-语言导航等.此外,文中总结当前相关方法的优缺点并展望未来可能的发展趋势.
展开更多
关键词
机器学习
深度学习
多
模态
语义理解
多
模态
知识表示
多
模态
语义分析
知识
驱动
下载PDF
职称材料
题名
知识驱动的多模态语义理解研究综述
被引量:
1
1
作者
郑祎豪
郭奕君
毋立芳
黄岩
机构
北京工业大学信息学部
中国科学院自动化研究所智能感知与计算研究中心
中国科学院自动化研究所多模态人工智能系统全国重点实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2023年第12期1127-1138,共12页
基金
科技创新2030-“新一代人工智能”重大项目(No.2018AAA0100400)
国家自然科学基金项目(No.62236010,62276261)资助。
文摘
基于深度学习模型的多模态学习方法已在静态、可控等简单场景下取得较优的语义理解性能,但在动态、开放等复杂场景下的泛化性仍然较低.近期已有不少研究工作尝试将类人知识引入多模态语义理解方法中,并取得不错效果.为了更深入了解当前知识驱动的多模态语义理解研究进展,文中在对相关方法进行系统调研与分析的基础上,归纳总结关系型和对齐型这两类主要的多模态知识表示框架.然后选择多个代表性应用进行具体介绍,包括图文匹配、目标检测、语义分割、视觉-语言导航等.此外,文中总结当前相关方法的优缺点并展望未来可能的发展趋势.
关键词
机器学习
深度学习
多
模态
语义理解
多
模态
知识表示
多
模态
语义分析
知识
驱动
Keywords
Machine Learning
Deep Learning
Multimodal Semantic Understanding
Multimodal Knowledge Representation
Multimodal Semantic Analysis
Knowledge-Driven
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
知识驱动的多模态语义理解研究综述
郑祎豪
郭奕君
毋立芳
黄岩
《模式识别与人工智能》
EI
CSCD
北大核心
2023
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部