期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
跨模态检索研究文献综述 被引量:8
1
作者 陈宁 段友祥 孙歧峰 《计算机科学与探索》 CSCD 北大核心 2021年第8期1390-1404,共15页
随着互联网技术的蓬勃发展和智能设备的普及,多媒体数据在数量爆炸式增长的同时,其形态也越来越多样化。人们获取信息的需求已经不满足于单一模态的数据检索,通过不同模态的知识协同实现跨模态的检索成为近几年研究的热点。在深入了解... 随着互联网技术的蓬勃发展和智能设备的普及,多媒体数据在数量爆炸式增长的同时,其形态也越来越多样化。人们获取信息的需求已经不满足于单一模态的数据检索,通过不同模态的知识协同实现跨模态的检索成为近几年研究的热点。在深入了解分析跨模态检索研究背景和研究进展的基础上,以跨模态检索的关键技术——公共子空间建模为主线,对跨模态检索技术的三大类方法传统统计分析方法、深度学习方法与哈希学习方法,从不同角度对研究内容、关键技术、局限性、适用性和特点等方面进行了全方位、多角度的对比分析,并进行了实验以更深入地对比。最后,对跨模态检索有待解决的难点、未来的探索方向、近些年主流设计思路以及发展趋势进行了充分展望,为进一步研究提供理论基础。 展开更多
关键词 跨模态检索 多媒体数据 知识协同 公共子空间
下载PDF
多模态检索研究综述
2
作者 金涛 金冉 +2 位作者 侯腾达 袁杰 顾骁哲 《计算机工程与应用》 CSCD 北大核心 2024年第5期62-75,共14页
多模态数据的日益增长使得多模态检索技术也相继受到了不少关注。随着汽车、医学等行业引入计算机与大数据技术,大量的行业数据其本身都是以多模态形式呈现出来的,行业的快速发展使人们对信息的需求不断增加,单一模态数据检索已经无法... 多模态数据的日益增长使得多模态检索技术也相继受到了不少关注。随着汽车、医学等行业引入计算机与大数据技术,大量的行业数据其本身都是以多模态形式呈现出来的,行业的快速发展使人们对信息的需求不断增加,单一模态数据检索已经无法满足人们对信息的需求。为了解决这些问题,满足一种模态的数据检索其他模态数据的需求,通过文献的查阅对多模态检索的方法进行研究,分析了公共子空间、深度学习、多模态哈希算法等不同的研究方法,梳理了近年来提出的解决这些问题的多模态检索技术。最后,对近几年来提出的多模态检索方法根据检索的准确性、检索的效率以及特点等多方面进行评价对比;对多模态检索所遇到的挑战进行分析,并展望多模态检索未来的应用前景。 展开更多
关键词 多模态检索 公共子空间 深度学习 哈希算法
下载PDF
基于迁移学习的无监督跨域人脸表情识别 被引量:5
3
作者 莫宏伟 傅智杰 《智能系统学报》 CSCD 北大核心 2021年第3期397-406,共10页
本文主要研究了基于迁移学习的无监督跨域人脸表情识别。在过去的几年里,提出的许多方法在人脸表情识别方面取得了令人满意的识别效果。但这些方法通常认为训练和测试数据来自同一个数据集,因此其具有相同的分布。而在实际应用中,这一... 本文主要研究了基于迁移学习的无监督跨域人脸表情识别。在过去的几年里,提出的许多方法在人脸表情识别方面取得了令人满意的识别效果。但这些方法通常认为训练和测试数据来自同一个数据集,因此其具有相同的分布。而在实际应用中,这一假设通常并不成立,特别当训练集和测试集来自不同的数据集时,即跨域人脸表情识别问题。为了解决这一问题,本文提出将一种基于联合分布对齐的迁移学习方法(domain align learning)应用于跨域人脸表情识别,该方法通过找到一个特征变换,将源域和目标域数据映射到一个公共子空间中,在该子空间中联合对齐边缘分布和条件分布来减小域之间的分布差异,然后对变换后的特征进行训练得到一个域适应分类器来预测目标域样本标签。为了验证提出算法的有效性,在CK+、Oulu-CASIA NIR和Oulu-CASIA VIS这3个不同的数据库上做了大量实验,实验结果证明所提算法在跨域表情识别上是有效性的。 展开更多
关键词 表情识别 无监督 跨域 迁移学习 特征变换 联合对齐 公共子空间 域适应
下载PDF
基于超分辨重建和公共特征子空间的低分辨率人脸识别 被引量:4
4
作者 李云红 刘杏瑞 +3 位作者 谢蓉蓉 苏雪平 张蕾涛 拜晓桦 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期241-247,共7页
针对传统低分辨率人脸识别准确率较低的问题,提出了一种基于超分辨重建和公共特征子空间的低分辨率人脸识别网络InGLRNet(inception GAN low resolution Net)。InGLRNet网络采用生成对抗网络结构,首先,由超分辨InSRNet网络和特征提取网... 针对传统低分辨率人脸识别准确率较低的问题,提出了一种基于超分辨重建和公共特征子空间的低分辨率人脸识别网络InGLRNet(inception GAN low resolution Net)。InGLRNet网络采用生成对抗网络结构,首先,由超分辨InSRNet网络和特征提取网络构成生成网络,InSRNet网络将Inception结构中3×3卷积核分解为1×3、3×1和1×1的卷积核,同时,增加残差网络的旁路直连方式,减轻梯度消失问题。其次,利用公共特征子空间法,将变换后的低分辨率样本图像和高分辨率基准图像在公共空间中的距离作为训练深度卷积神经网络的目标函数,通过损失函数匹配高、低分辨率图像的特征,实现人脸的精准特征识别。最后,将InGLRNet与CLPMs、MDS、Deep-Face和Face-Net经典的4种低分辨人脸识别方法进行对比,实验结果表明,构建的网络在人脸识别性能上有显著提升,在不同低分辨率下都优于其他4种方法。 展开更多
关键词 公共特征子空间 InSRNet 人脸识别 InGLRNet
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部