期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
多源数据行人重识别研究综述 被引量:23
1
作者 叶钰 王正 +3 位作者 梁超 韩镇 陈军 胡瑞敏 《自动化学报》 EI CSCD 北大核心 2020年第9期1869-1884,共16页
行人重识别是近年来计算机视觉领域的热点问题,经过多年的发展,基于可见光图像的一般行人重识别技术已经趋近成熟.然而,目前的研究多基于一个相对理想的假设,即行人图像都是在光照充足的条件下拍摄的高分辨率图像.因此虽然大多数的研究... 行人重识别是近年来计算机视觉领域的热点问题,经过多年的发展,基于可见光图像的一般行人重识别技术已经趋近成熟.然而,目前的研究多基于一个相对理想的假设,即行人图像都是在光照充足的条件下拍摄的高分辨率图像.因此虽然大多数的研究都能取得较为满意的效果,但在实际环境中并不适用.多源数据行人重识别即利用多种行人信息进行行人匹配的问题.除了需要解决一般行人重识别所面临的问题外,多源数据行人重识别技术还需要解决不同类型行人信息与一般行人图片相互匹配时的差异问题,如低分辨率图像、红外图像、深度图像、文本信息和素描图像等.因此,与一般行人重识别方法相比,多源数据行人重识别研究更具实用性,同时也更具有挑战性.本文首先介绍了一般行人重识别的发展现状和所面临的问题,然后比较了多源数据行人重识别与一般行人重识别的区别,并根据不同数据类型总结了5类多源数据行人重识别问题,分别从方法、数据集两个方面对现有工作做了归纳和分析.与一般行人重识别技术相比,多源数据行人重识别的优点是可以充分利用各类数据学习跨模态和类型的特征转换.最后,本文讨论了多源数据行人重识别未来的发展. 展开更多
关键词 多源数据行人重识别 跨模态 度量学习 特征模型 统一模态
下载PDF
面向机器智能的情感分析 被引量:2
2
作者 彭俊杰 《自然杂志》 CAS 2024年第2期150-156,共7页
大模型的兴起,尤其是以大模型为基础的人工智能技术的发展与应用引起了全社会对人工智能技术的广泛关注。人工智能技术已经在很多方面达到甚至超越人类,可以替代人工完成一些技艺要求较高的工作。不过,在人工智能迈向人类智慧的道路上,... 大模型的兴起,尤其是以大模型为基础的人工智能技术的发展与应用引起了全社会对人工智能技术的广泛关注。人工智能技术已经在很多方面达到甚至超越人类,可以替代人工完成一些技艺要求较高的工作。不过,在人工智能迈向人类智慧的道路上,仍然有许多难题亟待克服与解决,其中一个重要的问题就是情感分析与理解问题,如让机器准确理解人类的情感。针对该问题,文章从情感的定义与分类入手,对情感分析研究需要解决的问题,研究方向、研究现状、面临的挑战、应用前景与展望等进行了讨论。 展开更多
关键词 机器智能 情感分析 多模态 信息融合 特征提取
下载PDF
基于改进困难三元组损失的跨模态行人重识别框架 被引量:8
3
作者 李灏 唐敏 +1 位作者 林建武 赵云波 《计算机科学》 CSCD 北大核心 2020年第10期180-186,共7页
为了提升跨模态行人重识别算法的识别精度,提出了一种基于改进困难三元组损失的特征学习框架。首先,改进了传统困难三元组损失,使其转换为全局三元组损失。其次,基于跨模态行人重识别中存在模态间变化及模态内变化的问题,设计了模态间... 为了提升跨模态行人重识别算法的识别精度,提出了一种基于改进困难三元组损失的特征学习框架。首先,改进了传统困难三元组损失,使其转换为全局三元组损失。其次,基于跨模态行人重识别中存在模态间变化及模态内变化的问题,设计了模态间三元组损失及模态内三元组损失,以配合全局三元组损失进行模型训练。在改进困难三元组损失的基础上,首次在跨模态行人重识别模型中设计属性特征来提高模型的特征提取能力。最后,针对跨模态行人重识别中出现的类别失衡问题,首次将Focal Loss用于替代传统交叉熵损失来进行模型训练。相比现有算法,在RegDB数据集实验中,所提框架在各项指标中均有1.9%~6.4%的提升。另外,通过消融实验证明了3种方法均能提升模型的特征提取能力。 展开更多
关键词 跨模态 行人重识别 困难三元组损失 属性特征 类别失衡
下载PDF
视频文本跨模态检索研究综述 被引量:1
4
作者 陈磊 习怡萌 刘立波 《计算机工程与应用》 CSCD 北大核心 2024年第4期1-20,共20页
模态代表着数据特定的存在形式,不同模态数据的快速增长,使得多模态学习受到广泛关注。跨模态检索作为多模态学习的一个重要分支,在图文方面已得到显著发展。然而视频相对于图像而言承载了更多模态的数据,也包含更广泛的信息,能够满足... 模态代表着数据特定的存在形式,不同模态数据的快速增长,使得多模态学习受到广泛关注。跨模态检索作为多模态学习的一个重要分支,在图文方面已得到显著发展。然而视频相对于图像而言承载了更多模态的数据,也包含更广泛的信息,能够满足用户对信息检索全面性、灵活性的要求,近年来逐渐成为跨模态检索的研究热点。为全面认识和理解视频文本跨模态检索及其前沿工作,对现有代表性方法进行了梳理和综述。首先归纳分析了当前基于深度学习的单向、双向视频文本跨模态检索方法,对每类方法中的经典工作进行了详细分析并阐述了优缺点。接着从实验的角度给出视频文本跨模态检索的基准数据集和评价指标,并在多个常用基准数据集上比较了一些典型方法的性能。最后讨论了视频文本跨模态检索的应用前景、待解决问题及未来研究挑战。 展开更多
关键词 多模态 跨模态检索 深度学习 特征提取
下载PDF
基于同质中间模态的跨模态行人再识别方法
5
作者 罗智徽 胡海涛 +1 位作者 马潇峰 程文刚 《图学学报》 CSCD 北大核心 2024年第4期670-682,共13页
可见光-红外跨模态行人再识别(VI-Re ID)旨在对不同摄像头采集同一行人的可见光图像和红外图像进行检索与匹配。除了存在可见光行人再识别(Re ID)中因位姿、视角、局部遮挡等造成的模态内差异外,可见光图像和红外图像的模态间差异是VI-R... 可见光-红外跨模态行人再识别(VI-Re ID)旨在对不同摄像头采集同一行人的可见光图像和红外图像进行检索与匹配。除了存在可见光行人再识别(Re ID)中因位姿、视角、局部遮挡等造成的模态内差异外,可见光图像和红外图像的模态间差异是VI-ReID的主要挑战。现有方法通常对2种模态的图像进行联合特征学习来缩小模态间差异,忽略了可见光和红外两种模态图像在通道上的本质不同。为此,本文试图从2种模态共同生成一种中间模态来辅助缩小模态间差异,并在标准ViT(vision transformer)网络上通过局部特征和全局特征的融合来优化特征嵌入学习。首先,设计同质中间模态生成器,通过可见光图像和红外图像共同生成同质中间模态(H-modality)图像,将3种模态图像投影到统一的特征空间进行联合约束,从而借助中间模态缩小可见光模态和红外模态间的差异,实现图像级对齐。进一步提出一种基于同质中间模态的Transformer跨模态行人再识别方法,使用ViT提取全局特征,设计一个局部分支以增强网络的局部感知能力。在全局特征提取中,为了增强全局特征的多样性,引入头部多样性模块(head enrich module)使不同的头聚合图像不同的模式。该方法融合全局特征与局部特征,能够提高模型的判别能力,在SYSU-MM01和RegDB数据集上的rank-1/m AP分别达到67.68%/64.37%和86.16%/79.11%,优于现有大多数最前沿的方法。 展开更多
关键词 行人再识别 跨模态 TRANSFORMER 中间模态 特征融合
下载PDF
融合事件相机的视觉场景识别
6
作者 刘熠晨 余磊 +1 位作者 余淮 杨文 《中国图象图形学报》 CSCD 北大核心 2024年第4期1018-1029,共12页
目的 传统视觉场景识别(visual place recognition,VPR)算法的性能依赖光学图像的成像质量,因此高速和高动态范围场景导致的图像质量下降会进一步影响视觉场景识别算法的性能。针对此问题,提出一种融合事件相机的视觉场景识别算法,利用... 目的 传统视觉场景识别(visual place recognition,VPR)算法的性能依赖光学图像的成像质量,因此高速和高动态范围场景导致的图像质量下降会进一步影响视觉场景识别算法的性能。针对此问题,提出一种融合事件相机的视觉场景识别算法,利用事件相机的低延时和高动态范围的特性,提升视觉场景识别算法在高速和高动态范围等极端场景下的识别性能。方法 本文提出的方法首先使用图像特征提取模块提取质量良好的参考图像的特征,然后使用多模态特征融合模块提取查询图像及其曝光区间事件信息的多模态融合特征,最后通过特征匹配查找与查询图像最相似的参考图像。结果 在MVSEC(multi-vehicle stereo event camera dataset)和RobotCar两个数据集上的实验表明,本文方法对比现有视觉场景识别算法在高速和高动态范围场景下具有明显优势。在高速高动态范围场景下,本文方法在MVSEC数据集上相较对比算法最优值在召回率与精度上分别提升5.39%和8.55%,在RobotCar数据集上相较对比算法最优值在召回率与精度上分别提升3.36%与4.41%。结论 本文提出了融合事件相机的视觉场景识别算法,利用了事件相机在高速和高动态范围场景的成像优势,有效提升了视觉场景识别算法在高速和高动态范围场景下的场景识别性能。 展开更多
关键词 视觉场景识别(VPR) 事件相机 多模态 特征融合 特征匹配
原文传递
从光学到SAR:基于多级跨模态对齐的SAR图像舰船检测算法
7
作者 何佳月 宿南 +3 位作者 徐从安 尹璐 廖艳苹 闫奕名 《遥感学报》 EI CSCD 北大核心 2024年第7期1789-1801,共13页
合成孔径雷达(SAR)舰船检测是近年来的研究热点。然而,与光学图像不同,SAR成像的特点会导致不直观的特征表示。此外,由于SAR图像数据量不足,现有的基于大量标记SAR图像的方法可能难以达到较好的检测效果。为了解决这些问题,本文提出了... 合成孔径雷达(SAR)舰船检测是近年来的研究热点。然而,与光学图像不同,SAR成像的特点会导致不直观的特征表示。此外,由于SAR图像数据量不足,现有的基于大量标记SAR图像的方法可能难以达到较好的检测效果。为了解决这些问题,本文提出了一种基于多级跨模态对齐的SAR图像舰船检测算法MCMA-Net(Multi-level Cross-Modality Alignment Network),通过将光学模态中丰富的知识迁移到SAR模态来增强SAR图像的特征表示。该算法首先设计了一个基于邻域—全局注意力的特征交互网络NGAN(Neighborhood-Global Attention Network),通过对骨干网络的浅层特征采用邻域注意力机制进行局部交互、对深层特征采取全局自注意力机制进行全局上下文交互,在兼顾全局上下文建模能力的同时,提升局部特征的编码能力,使得网络在不同层级更合理的关注相应的信息,从而能够促进后续的多级别模态对齐。其次,本文设计了一个多级模态对齐模块MLMA(Multi-level Modality Alignment),通过从局部级别到全局级别再到实例级别的对两种模态不同隐含空间中的特征进行对齐,促进模型有效地学习模态不变特征,缓解了光学图像和SAR图像之间的模态鸿沟,实现了从光学模态到SAR模态的知识传输。大量的实验证明我们的算法优于现阶段的检测算法,取得了最好的实验结果。 展开更多
关键词 遥感 SAR 目标检测 跨模态 特征对齐 注意力机制
原文传递
A Dual Discriminator Method for Generalized Zero-Shot Learning
8
作者 Tianshu Wei Jinjie Huang 《Computers, Materials & Continua》 SCIE EI 2024年第4期1599-1612,共14页
Zero-shot learning enables the recognition of new class samples by migrating models learned from semanticfeatures and existing sample features to things that have never been seen before. The problems of consistencyof ... Zero-shot learning enables the recognition of new class samples by migrating models learned from semanticfeatures and existing sample features to things that have never been seen before. The problems of consistencyof different types of features and domain shift problems are two of the critical issues in zero-shot learning. Toaddress both of these issues, this paper proposes a new modeling structure. The traditional approach mappedsemantic features and visual features into the same feature space;based on this, a dual discriminator approachis used in the proposed model. This dual discriminator approach can further enhance the consistency betweensemantic and visual features. At the same time, this approach can also align unseen class semantic features andtraining set samples, providing a portion of information about the unseen classes. In addition, a new feature fusionmethod is proposed in the model. This method is equivalent to adding perturbation to the seen class features,which can reduce the degree to which the classification results in the model are biased towards the seen classes.At the same time, this feature fusion method can provide part of the information of the unseen classes, improvingits classification accuracy in generalized zero-shot learning and reducing domain bias. The proposed method isvalidated and compared with othermethods on four datasets, and fromthe experimental results, it can be seen thatthe method proposed in this paper achieves promising results. 展开更多
关键词 Generalized zero-shot learning modality consistent DISCRIMINATOR domain shift problem feature fusion
下载PDF
基于跨模态共享特征学习的夜间牛脸识别方法
9
作者 许兴时 王云飞 +1 位作者 邓红兴 宋怀波 《华南农业大学学报》 CAS CSCD 北大核心 2024年第5期793-801,共9页
【目的】解决夜间环境下牛只身份信息难以有效识别的问题,以期为牛只全天候监测提供技术基础。【方法】提出了一种基于跨模态共享特征学习的夜间牛脸识别方法。首先,模型框架采用浅层双流结构,有效提取不同模态的牛脸图像中的共享特征信... 【目的】解决夜间环境下牛只身份信息难以有效识别的问题,以期为牛只全天候监测提供技术基础。【方法】提出了一种基于跨模态共享特征学习的夜间牛脸识别方法。首先,模型框架采用浅层双流结构,有效提取不同模态的牛脸图像中的共享特征信息;其次,引入Triplet注意力机制,跨维度地捕捉交互信息,以增强牛只身份信息的提取;最后,通过嵌入扩展模块进一步挖掘跨模态身份信息的表征。【结果】本文提出的夜间牛脸识别模型在测试集上的平均精度均值、一阶累积匹配特征值(CMC-1)和五阶累积匹配特征值(CMC-5)分别为90.68%、94.73%和97.82%,相较于未进行跨模态训练的模型,提高了19.67、18.91和12.00个百分点。【结论】本研究所提出的模型为夜间牛只身份识别问题提供了可靠的解决方案,为实现牛只全天候持续监测奠定了坚实的技术基础。 展开更多
关键词 身份识别 异质面部识别 跨模态 注意力机制 共享特征 夜间
下载PDF
结合数据增强与特征融合的跨模态行人重识别
10
作者 宋雨 王帮海 曹钢钢 《计算机工程与应用》 CSCD 北大核心 2024年第4期133-141,共9页
可见光-红外行人重识别问题的难点在于图像间模态差异大,大多数现有的方法通过生成对抗网络生成伪图像或提取原始图像上的模态共享特征来缓解模态差异。然而,训练生成对抗网络需要消耗大量的计算资源且生成的伪图像容易引入噪声,提取模... 可见光-红外行人重识别问题的难点在于图像间模态差异大,大多数现有的方法通过生成对抗网络生成伪图像或提取原始图像上的模态共享特征来缓解模态差异。然而,训练生成对抗网络需要消耗大量的计算资源且生成的伪图像容易引入噪声,提取模态共享特征也会不可避免地导致与行人身份相关的重要判别特征丢失。针对以上问题,提出新的跨模态行人重识别网络。首先将进行自动数据增强后的训练数据集作为网络输入,提高模型的鲁棒性;然后在网络中引入实例正则化来缩小模态差异;最后将网络各层提取到的不同尺度的行人特征进行有机融合,融合后的特征包含更多与行人身份相关的判别特征。该方法在SYSU-MM01数据集的全局搜索模式下Rank-1/mAP分别达到69.47%/65.05%,在RegDB数据集的可见光到红外模式下Rank-1/mAP分别达到85.73%/77.77%,实验结果获得显著提升。 展开更多
关键词 跨模态 行人重识别 自动数据增强 特征融合
下载PDF
基于变换匹配层融合的双模态生物特征识别方法 被引量:1
11
作者 孙妍 胡龙 冯雪玲 《计算机工程》 CAS CSCD 北大核心 2023年第5期269-276,共8页
自新冠疫情发生以来,戴口罩预防疾病可能会成为大众的常态化行为。若大部分面部特征被遮挡会影响人脸识别方法的精度,同时距离也会对面部识别造成一定影响。然而,步态作为一种可远距离并且难以伪装的生物特征,容易受身体遮挡、角度等外... 自新冠疫情发生以来,戴口罩预防疾病可能会成为大众的常态化行为。若大部分面部特征被遮挡会影响人脸识别方法的精度,同时距离也会对面部识别造成一定影响。然而,步态作为一种可远距离并且难以伪装的生物特征,容易受身体遮挡、角度等外部条件变化的影响。提出一种基于变换匹配层的识别方法,以融合步态和面部特征。通过步态特征提取网络提取人体轮廓图中具有区分度的时空生物特征,以解决单模态人脸识别技术难以在远距离条件下对带口罩目标进行识别的问题,采用面部特征提取网络提取脸部的细粒度特征,以增强网络对于目标主体轮廓被遮挡的鲁棒性。在匹配层将面部特征与步态特征进行归一化后再将信息融合,以达到特征互补的效果。此外,构建相关联的全局-局部时空特征提取模块。通过局部特征提取模块提取细粒度的步态特征,并采用基于互补掩码的多尺度随机带状分割策略增强各个局部特征之间的关联关系。全局特征提取模块提取全局步态信息,与局部细粒度信息形成互补,从而提高步态特征提取网络对于遮挡、视角变化的鲁棒性。实验结果表明,该方法的识别准确率达到99.16%,相较于步态、面部特征提取网络分别提高6.56和0.45个百分点,并且在远距离且戴口罩的真实场景下识别准确率达到94.52%,分别提升1.92和5.98个百分点。 展开更多
关键词 生物特征 双模态 特征融合 步态识别 面部识别
下载PDF
基于mRMR和CCA的AD分类方法研究
12
作者 张国栋 董爱美 +1 位作者 齐志云 刘思迪 《齐鲁工业大学学报》 CAS 2023年第6期24-33,共10页
目前,多模态神经影像数据被广泛应用于阿尔茨海默症(AD)分类研究,然而,这些研究方法存在着一定缺陷。首先,原始特征维度较高且包含大量冗余信息,需要大量的计算资源进行处理和分析。其次,同一患者的完整多模态数据不易获得,导致样本数... 目前,多模态神经影像数据被广泛应用于阿尔茨海默症(AD)分类研究,然而,这些研究方法存在着一定缺陷。首先,原始特征维度较高且包含大量冗余信息,需要大量的计算资源进行处理和分析。其次,同一患者的完整多模态数据不易获得,导致样本数量较少,不利于训练出可靠的分类模型。为此,提出了一种基于最大相关-最小冗余和典型相关性分析的AD分类方法(mRMR-CCA)。首先使用最大相关-最小冗余(mRMR)算法从各模态数据选择出与分类标签最相关的判别性特征,然后使用典型相关性分析(CCA)算法来挖掘多模态数据间的内在联系,最后进行分类。使用阿尔茨海默氏病神经影像学倡议数据库中的数据进行了实验,实验结果证明了此方法在AD分类中的有效性。 展开更多
关键词 阿尔茨海默症 多模态数据 模态融合 特征选择
下载PDF
双粒度特征融合网络的跨模态行人再识别
13
作者 马潇峰 程文刚 《中国图象图形学报》 CSCD 北大核心 2023年第5期1422-1433,共12页
目的可见光—红外跨模态行人再识别旨在匹配具有相同行人身份的可见光图像和红外图像。现有方法主要采用模态共享特征学习或模态转换来缩小模态间的差异,前者通常只关注全局或局部特征表示,后者则存在生成模态不可靠的问题。事实上,轮... 目的可见光—红外跨模态行人再识别旨在匹配具有相同行人身份的可见光图像和红外图像。现有方法主要采用模态共享特征学习或模态转换来缩小模态间的差异,前者通常只关注全局或局部特征表示,后者则存在生成模态不可靠的问题。事实上,轮廓具有一定的跨模态不变性,同时也是一种相对可靠的行人识别线索。为了有效利用轮廓信息减少模态间差异,本文将轮廓作为辅助模态,提出了一种轮廓引导的双粒度特征融合网络,用于跨模态行人再识别。方法在全局粒度上,通过行人图像到轮廓图像的融合,用于增强轮廓的全局特征表达,得到轮廓增广特征。在局部粒度上,通过轮廓增广特征和基于部件的局部特征的融合,用于联合全局特征和局部特征,得到融合后的图像表达。结果在可见光—红外跨模态行人再识别的两个公开数据集对模型进行评估,结果优于一些代表性方法。在SYSU-MM01(Sun Yat-sen University multiple modality 01)数据集上,本文方法rank-1准确率和平均精度均值(mean average precision,mAP)分别为62.42%和58.14%。在RegDB(Dongguk body-based person recognition database)数据集上,本文方法rank-1和mAP分别为84.42%和77.82%。结论本文将轮廓信息引入跨模态行人再识别,提出一种轮廓引导的双粒度特征融合网络,在全局粒度和局部粒度上进行特征融合,从而学习具有判别性的特征,性能超过了近年来一些具有代表性的方法,验证了轮廓线索及其使用方法的有效性。 展开更多
关键词 行人再识别 跨模态 特征融合 轮廓 特征学习
原文传递
“一般”的助词化及其主观描摹功能 被引量:4
14
作者 胡承佼 《汉语学习》 CSSCI 北大核心 2015年第2期24-33,共10页
"一般"经历了从临时数量短语到形容词再到比况助词的演化历程,其功能也相应地由标示种类至陈述类同,进而比拟描摹情状。以比拟描摹为基础,"一般"进一步衍生出主观性更强的测断描摹功能,主要包括正向测断和逆向测断... "一般"经历了从临时数量短语到形容词再到比况助词的演化历程,其功能也相应地由标示种类至陈述类同,进而比拟描摹情状。以比拟描摹为基础,"一般"进一步衍生出主观性更强的测断描摹功能,主要包括正向测断和逆向测断两种方式,并呈现揣测性评价和否定性评价两种不同的情态特征。助词化"一般"的功能可以看作由比拟描摹至测断描摹的描摹连续统。 展开更多
关键词 “一般” 助词化 主观性 情态特征 描摹功能
下载PDF
基于跨模态特征增强的RGB-T行人检测算法研究 被引量:2
15
作者 王留洋 芮挺 +2 位作者 郑南 胡睿哲 蒋群艳 《兵器装备工程学报》 CSCD 北大核心 2022年第5期254-260,共7页
针对目标检测任务中目标受光照变化、遮挡等不利的影响,导致检准确率低、丢失率高的问题,提出了一种跨模态特征增强网络,用于RGB-T图像目标检测。构建双模态特征提取网络,用于可见光和热红外图像深度特征的提取;通过空间和通道注意力机... 针对目标检测任务中目标受光照变化、遮挡等不利的影响,导致检准确率低、丢失率高的问题,提出了一种跨模态特征增强网络,用于RGB-T图像目标检测。构建双模态特征提取网络,用于可见光和热红外图像深度特征的提取;通过空间和通道注意力机制对提取的双模态特征信息进行跨模态特征增强,提高2种模态特征信息的表征能力;对双模态特征进行像素信息融合,在特征层次上实现RGB-T图像的信息互补。在KAIST多谱行人检测数据集上的检测速度达到了47帧每秒(FPS),丢失率仅有5.17%。实验结果表明,跨模态特征增强算法能够有效融合可见光与红外特征,降低检测的丢失率。 展开更多
关键词 目标检测 RGB-T 注意力机制 跨模态 特征融合
下载PDF
汉语主观情态语用意义研究 被引量:2
16
作者 王晓军 《黑河学院学报》 2016年第2期88-90,共3页
情态(модальность)是人类语言中一个重要的语法范畴。情态是语言的一个特殊功能,在语用学视角下,对情态进行定义:语者要表述的句子内容的信息本身(客观要素),另一个信息是语者对这个客观要素所持的主观意愿和态度(主观要素)... 情态(модальность)是人类语言中一个重要的语法范畴。情态是语言的一个特殊功能,在语用学视角下,对情态进行定义:语者要表述的句子内容的信息本身(客观要素),另一个信息是语者对这个客观要素所持的主观意愿和态度(主观要素)。以情态动词和情态副词为例,分析汉语中主观情态的语用特征:该命题的情态动词和情态副词的基本功能和附加功能来实现主观的更深层次的情态意愿。 展开更多
关键词 情态 语用特征 情态动词 情态副词
下载PDF
基于双路卷积局部对齐的文本行人跨模态检索 被引量:1
17
作者 莫承见 《电视技术》 2022年第4期25-30,共6页
文本行人跨模态检索是指通过对行人的语言描述在行人图像集中检索出对应身份的图像。针对文本特征判别性不足的问题,提出在文本支路结合BERT模型和Text-CNN网络来提升文本特征判别性的方法。该方法主要采用BERT模型作为词嵌入工具,并使... 文本行人跨模态检索是指通过对行人的语言描述在行人图像集中检索出对应身份的图像。针对文本特征判别性不足的问题,提出在文本支路结合BERT模型和Text-CNN网络来提升文本特征判别性的方法。该方法主要采用BERT模型作为词嵌入工具,并使用Text-CNN网络对文本特征进行进一步的特征提取。此外,除了使用全局匹配以外,该方法还考虑了局部特征对检索的影响。在CUHK-PEDES数据集上对所提方法进行了实验验证,实验结果证明了所提方法的有效性和优越性。 展开更多
关键词 跨模态 特征提取 局部特征
下载PDF
基于字典学习的跨媒体检索技术 被引量:2
18
作者 戚玉丹 张化祥 刘一鹤 《计算机应用研究》 CSCD 北大核心 2019年第4期1265-1269,共5页
在研究跨媒体信息检索时,对于不同模态数据的异构性提出了挑战,针对如何更好地克服异构问题以提高多模态数据之间的检索精度,提出了一种基于字典学习的跨媒体检索新技术。首先,通过字典学习方法学习两个不同模态数据之间的稀疏系数;然后... 在研究跨媒体信息检索时,对于不同模态数据的异构性提出了挑战,针对如何更好地克服异构问题以提高多模态数据之间的检索精度,提出了一种基于字典学习的跨媒体检索新技术。首先,通过字典学习方法学习两个不同模态数据之间的稀疏系数;然后,通过特征映射方案由两个不同的投影矩阵分别把它们投入共同的特征子空间;最后,通过标签对齐同一类来增强不同模态之间的相关性。实验结果表明,与传统的同构子空间学习方法相比,基于字典的算法分类性能优越,该实验方法在两个数据集上优于几种最先进的方法。 展开更多
关键词 跨媒体检索 字典学习 稀疏表示 模态独立 特征映射
下载PDF
长汀传统民居平面形态研究 被引量:2
19
作者 潘磊 《福建建设科技》 2016年第1期42-47,共6页
民居是传统建筑的重要类型之一,长汀传统民居是在长汀特有的自然环境中,受社会因素制约,与当地自然经济相适应,经过长期的发展形成的。长汀自然条件复杂,并且各地社会经济发展不平衡,使长汀传统民居的建筑形式差异较大。它因地制宜、就... 民居是传统建筑的重要类型之一,长汀传统民居是在长汀特有的自然环境中,受社会因素制约,与当地自然经济相适应,经过长期的发展形成的。长汀自然条件复杂,并且各地社会经济发展不平衡,使长汀传统民居的建筑形式差异较大。它因地制宜、就地取材、功能合理、构造经济,具有浓厚的南方民居特色。 展开更多
关键词 长汀传统民居 平面形态 建筑特色
下载PDF
跨模态异构行人再识别的研究进展 被引量:2
20
作者 孙锐 赵争晖 +1 位作者 杨梓 高隽 《模式识别与人工智能》 EI CSCD 北大核心 2020年第12期1066-1082,共17页
同构行人再识别技术研究基于可见光图像的行人检索问题,但无法完全应对复杂多变真实场景,大量研究工作开始探索基于可见光图像与其它异构数据之间的行人检索问题,即跨模态异构行人再识别.该研究相比同构行人再识别,更具挑战性.文中首先... 同构行人再识别技术研究基于可见光图像的行人检索问题,但无法完全应对复杂多变真实场景,大量研究工作开始探索基于可见光图像与其它异构数据之间的行人检索问题,即跨模态异构行人再识别.该研究相比同构行人再识别,更具挑战性.文中首先简述跨模态异构行人再识别的概念及与一般行人再识别的区别,再针对文本与图像、图像与视频、跨分辨率图像、红外图像与可见光图像、深度图与可见光图像、素描与可见光图像这6类场景,归纳整理和分析跨模态异构行人再识别的代表性工作、常用数据集及一些算法的性能表现.最后,总结目前整体研究进展,展望未来发展趋势. 展开更多
关键词 行人再识别(ReID) 异构行人再识别(Hetero-ReID) 跨模态 度量学习 特征表示 深度学习
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部