跨媒体语义共享子空间学习研究进展被引量：14

Advances in Semantically Shared Subspace Learning for Cross-Media Data

下载PDF

导出

摘要随着信息技术的飞速发展,现实世界中涌现出大量的跨媒体数据.所谓跨媒体数据是指那些表达的内容相似,但以不同模态、不同来源、不同背景等形式出现的数据.比如,一张描述花豹的网页通常采用共生的图片和文本等不同的模态刻画花豹的外形和习性.这些跨媒体数据通常呈现出底层特征异构、高层语义相关的特性.传统的单媒体学习方法已无法适应跨媒体数据呈现出的特征异构性.因此,跨媒体学习相关理论与方法的研究是当前数字媒体分析领域的热点研究课题之一.该文主要介绍了跨媒体学习的研究背景和应用价值,概括介绍了各类跨媒体学习相关方法的数学原理和基本特性,并重点介绍了跨媒体共享子空间学习的研究进展,比较了基于投影、矩阵分解、任务和度量等四大类子空间学习方法的优缺点,分析了未来的发展方向. With the rapid development of information technology, there are many CMD （Cross- Media Data） in the real world. The so-called cross-media data refer to information items with similar underlying contents, which arrive in different modalities, sources or backgrounds, and so on. For example, a webpage describing leopards uses co-occurring text and image of different modalities to represent leopards. These CMD show characteristics of the heterogeneity of low- level features and the correlation of high-level semantics. Traditional Mono-Media Learning （MML） methods have not been able to adapt to the feature heterogeneity of CMD. Thus, the research on related problems in CML （Cross-Media Learning） have been One of the hot research topics in the field of digital media analysis recently. This paper mainly introduces the research background and application value of CML, and provides an overview of mathematical principle and specialties of various related methods in CML. Meanwhile, the advances in cross-media shared subspace learning are presented. Furthermore, the paper compares the advantages and disadvantages of four kinds of subspace learning task and measurement, respectively. Finally. methods based on projection, matrix decomposition, the future development of CMI. is analyzed.

作者张磊赵耀朱振峰 ZHANG Lei ZHAO Yao ZHU Zhen-Feng(institute of Information Engineering, Chinese Academy of Sciences, Beijing 100093 institute of Information Science, Beijing Jiaotong University, Beijing 100044 Beijing Key Laboratory of Advanced Information Science and Network Technology, Beijing Jiaotong University, Beijing 100044)

机构地区中国科学院信息工程研究所北京交通大学信息科学研究所北京交通大学现代信息科学与网络技术北京市重点实验室

出处《计算机学报》 EI CSCD 北大核心 2017年第6期1394-1421,共28页 Chinese Journal of Computers

基金国家"九七三"重点基础研究发展规划项目基金(2012CB316401) 国家自然科学基金(61532005 61572068 61271275 61501457 61601458 61602465) 长江学者和创新研究团队项目(IRT201206) 新世纪优秀人才支持计划(13-0661)资助~~

关键词跨媒体异构数据共享子空间多视角学习优化人工智能 cross-media heterogeneous data shared subspace multi-view learning optimization： arlificiall inlelligence

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献21

1田春娜..复杂背景下多视角人脸检测与识别[D].西安电子科技大学,2008:
2张鸿..基于相关性挖掘的跨媒体检索研究[D].浙江大学,2007:
3刘宏..基于多视角的我国商业银行盈利能力研究[D].吉林大学,2010:
4冯巍..分布式多视角目标跟踪算法研究[D].复旦大学,2011:
5何宁..图像检索中跨模语义信息获取方法研究[D].武汉大学,2013:
6古平..基于贝叶斯模型的文档分类及相关技术研究[D].重庆大学,2006:
7黄东山..特征选择及半监督分类方法研究[D].华中科技大学,2011:
8张博锋..面向内容安全的文本分类研究[D].国防科学技术大学,2007:
9朱建章..复杂场景下实时视觉目标跟踪的若干研究[D].武汉大学,2014:
10刘磊..基于多普勒超声信号的脉象分析与分类研究[D].哈尔滨工业大学,2013:

同被引文献61

1王杨,许闪闪,李昌,艾世成,张卫东,甄磊,孟丹.基于支持向量机的中文极短文本分类模型[J].计算机应用研究,2020,37(2):347-350. 被引量：30
2陈悦,陈超美,刘则渊,胡志刚,王贤文.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253. 被引量：6977
3张鸿,吴飞,庄越挺.跨媒体相关性推理与检索研究[J].计算机研究与发展,2008,45(5):869-876. 被引量：20
4张鸿,吴飞,庄越挺,陈建勋.一种基于内容相关性的跨媒体检索方法[J].计算机学报,2008,31(5):820-826. 被引量：34
5胡涛,武港山,任桐炜,吉亮.基于Ontology的跨媒体检索技术[J].计算机工程,2009,35(8):266-268. 被引量：12
6蔡平,王志强,傅向华.基于语义的跨媒体信息检索技术研究[J].微电子学与计算机,2010,27(3):102-105. 被引量：14
7杨琬琪,高阳,周新民,杨育彬,商琳.多模态张量数据挖掘算法及应用[J].计算机科学,2012,39(1):9-13. 被引量：3
8马茜,谷峪,张天成,于戈.一种基于数据质量的异构多源多模态感知数据获取方法[J].计算机学报,2013,36(10):2120-2131. 被引量：21
9王振振,何明,杜永萍.基于LDA主题模型的文本相似度计算[J].计算机科学,2013,40(12):229-232. 被引量：95
10倪祥龙,康建设,王广彦,白永生.黑箱模型输出不确定性的敏感性分析[J].计算机仿真,2014,31(4):22-26. 被引量：3

引证文献14

1彭欣.基于深度学习的数字图书馆跨媒体语义检索方法研究[J].情报探索,2018(2):16-19. 被引量：14
2金汉均,段贝贝.卷积神经网络在跨媒体检索中的应用研究[J].电子测量技术,2018,41(7):54-57. 被引量：3
3金汉均,段贝贝.基于深度视觉特征正则化的跨媒体检索研究[J].电子测量技术,2018,41(12):114-118. 被引量：1
4张伟民.数字图书馆跨媒体语义检索模型研究[J].图书馆学刊,2018,40(6):98-101. 被引量：4
5闫小强,叶阳东.共享和私有信息最大化的跨媒体聚类[J].计算机研究与发展,2019,56(7):1370-1382. 被引量：3
6陈凤,蒙祖强.基于哈希算法的异构多模态数据检索研究[J].计算机科学,2019,46(10):49-54. 被引量：11
7蒋伟,王爽,蒋玉暕,刘京宇.视听觉融合效应及其信息融合处理方法综论[J].中国传媒大学学报（自然科学版）,2019,26(6):6-11.
8林敏鸿,蒙祖强.基于注意力神经网络的多模态情感分析[J].计算机科学,2020,47(S02):508-514. 被引量：17
9肖雄,王萌.跨媒体检索方法研究进展的citespace知识图谱分析[J].电脑与信息技术,2020,28(6):21-25. 被引量：2
10吴蕊,孔前进,王世勋,孙东山,翟怡星.双模态Logistic Regression及其应用[J].计算机应用与软件,2020,37(12):244-248. 被引量：1

二级引证文献67

1王开心,徐秀娟,刘宇,赵哲焕,赵小薇.在线评论的静态多模态情感分析[J].应用科学学报,2022,40(1):25-35. 被引量：2
2尹朝.基于内容生成与特征提取的图像情感识别模型研究[J].系统仿真技术,2023,19(2):141-147.
3金汉均,吴静.基于深度柯西哈希的图像检索研究[J].电子测量技术,2020(9):104-108. 被引量：1
4张伟民.数字图书馆跨媒体语义检索模型研究[J].图书馆学刊,2018,40(6):98-101. 被引量：4
5王雪静.基于深度学习技术的数字图书馆智能化服务模式研究[J].农业图书情报学刊,2018,30(9):150-153. 被引量：4
6焦艳,刘娟,丛聪,贾晨曦,于丽,韩学平.航空医学科研知识服务[J].中华医学图书情报杂志,2018,27(5):65-68. 被引量：2
7杨金龙,曾梦玲,刘千里.2000年以来我国信息检索模型研究综述[J].图书情报导刊,2019,4(4):72-79. 被引量：2
8李志义,许洪凯,段斌.基于深度学习CNN模型的图像情感特征抽取研究[J].图书情报工作,2019,63(11):96-107. 被引量：23
9李弘,黄肖俊.面向传统出版的知识表示与挖掘技术应用探析[J].科技与出版,2019(4):76-79.
10刘逸,应捷,陈明玺.基于深度学习的多类道路场景感知[J].电子测量技术,2019,42(11):118-121. 被引量：3

1王磊,郭晓霞.面向媒体融合的海量异构数据一致性表示算法研究[J].广播电视信息,2016,0(8):62-67.
2双鱼.“苹果”是这样吃的 PC“捕获”Leopard教程[J].网友世界,2008(8):57-58.
3刘海明.信息安全中的信息隐藏技术及其应用[J].科技信息,2009(6):182-182. 被引量：3
4张鸿,吴飞,庄越挺.基于特征子空间学习的跨媒体检索方法[J].模式识别与人工智能,2008,21(6):739-745. 被引量：5
5王海珍,廉佐政.基于模糊集和粗糙集理论的故障诊断方法的研究[J].齐齐哈尔大学学报（自然科学版）,2006,22(1):38-40. 被引量：3
6李丽新,袁烨.网络安全技术浅析[J].现代情报,2007,27(10):121-122. 被引量：4
7张桂霞,关祥杰,陈凤牛.内容相关性的跨媒体检索技术研究[J].电脑编程技巧与维护,2015(23):64-65.
8杜智华.WINDOWS系统的数据库访问技术[J].新疆师范大学学报（自然科学版）,2002,21(2):16-21.
9殷亚玲,张蕾.搜索引擎中语义相关反馈技术的研究[J].计算机技术与发展,2006,16(2):167-170. 被引量：2
10李瑞峰,贾建军.一种复杂背景下的手势提取方法[J].华中科技大学学报（自然科学版）,2008,36(S1):186-188. 被引量：6

计算机学报

2017年第6期

浏览历史

内容加载中请稍等...

跨媒体语义共享子空间学习研究进展被引量：14

参考文献21

同被引文献61

引证文献14

二级引证文献67

相关作者

相关机构

相关主题

浏览历史

跨媒体语义共享子空间学习研究进展 被引量：14

参考文献21

同被引文献61

引证文献14

二级引证文献67

相关作者

相关机构

相关主题

浏览历史

跨媒体语义共享子空间学习研究进展被引量：14