期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于深度学习的行人重识别综述 被引量:11
1
作者 杨锋 许玉 +3 位作者 尹梦晓 符嘉成 黄冰 梁芳烜 《计算机应用》 CSCD 北大核心 2020年第5期1243-1252,共10页
行人重识别(Re-ID)是计算机视觉领域的热点问题,主要研究的是“如何关联位于不同物理位置的不同摄像机捕获到的特定人员的问题”。传统的行人Re-ID方法主要基于底层特征如局部描述符、颜色直方图和人体姿势的提取。近几年,针对行人遮挡... 行人重识别(Re-ID)是计算机视觉领域的热点问题,主要研究的是“如何关联位于不同物理位置的不同摄像机捕获到的特定人员的问题”。传统的行人Re-ID方法主要基于底层特征如局部描述符、颜色直方图和人体姿势的提取。近几年,针对行人遮挡和姿势不对齐等传统方法所遗留问题,业内提出了基于区域、注意力机制、姿势和生成对抗性网络(GAN)等深度学习的行人Re-ID方法,实验结果得到较明显的提高。故对深度学习在行人Re-ID中的研究进行了总结和分类,区别于以前的综述,将行人重识别方法分成四大类来讨论。首先,通过区域、注意力、姿势和GAN四类方法来综述基于深度学习的行人Re-ID方法;然后,分析这些方法在主流数据集上的mAP和Rank-1指标性能表现,结果显示基于深度学习的方法可以增强局部特征之间的联系并缩小域间隙,从而减少模型过拟合;最后,展望了行人Re-ID方法研究的发展方向。 展开更多
关键词 行人重识别 深度学习 生成对抗性网络 区域 注意力 姿势
下载PDF
Joint training with local soft attention and dual cross-neighbor label smoothing for unsupervised person re-identification
2
作者 Qing Han Longfei Li +4 位作者 Weidong Min Qi Wang Qingpeng Zeng Shimiao Cui Jiongjin Chen 《Computational Visual Media》 SCIE EI CSCD 2024年第3期543-558,共16页
Existing unsupervised person re-identification approaches fail to fully capture thefine-grained features of local regions,which can result in people with similar appearances and different identities being assigned the... Existing unsupervised person re-identification approaches fail to fully capture thefine-grained features of local regions,which can result in people with similar appearances and different identities being assigned the same label after clustering.The identity-independent information contained in different local regions leads to different levels of local noise.To address these challenges,joint training with local soft attention and dual cross-neighbor label smoothing(DCLS)is proposed in this study.First,the joint training is divided into global and local parts,whereby a soft attention mechanism is proposed for the local branch to accurately capture the subtle differences in local regions,which improves the ability of the re-identification model in identifying a person’s local significant features.Second,DCLS is designed to progressively mitigate label noise in different local regions.The DCLS uses global and local similarity metrics to semantically align the global and local regions of the person and further determines the proximity association between local regions through the cross information of neighboring regions,thereby achieving label smoothing of the global and local regions throughout the training process.In extensive experiments,the proposed method outperformed existing methods under unsupervised settings on several standard person re-identification datasets. 展开更多
关键词 person re-identification(Re-id) unsupervised learning(USL) local soft attention joint training dual cross-neighbor label smoothing(DCLS)
原文传递
加强重识别的行人多目标跟踪算法 被引量:3
3
作者 王黎明 孙俊 陈祺东 《计算机工程与应用》 CSCD 北大核心 2022年第21期213-222,共10页
在多目标跟踪任务中,重识别(re-identification,Re-ID)效果通常依赖于检测性能的好坏,检测偏差会导致ReID特征模糊,从而降低重识别精度。特别是在尺度变化和频繁遮挡等复杂场景下,Re-ID鲁棒性不高,多目标跟踪效果较差。针对该问题,提出... 在多目标跟踪任务中,重识别(re-identification,Re-ID)效果通常依赖于检测性能的好坏,检测偏差会导致ReID特征模糊,从而降低重识别精度。特别是在尺度变化和频繁遮挡等复杂场景下,Re-ID鲁棒性不高,多目标跟踪效果较差。针对该问题,提出一种加强重识别的行人多目标跟踪算法。该算法以CenterNet为检测器,通过预测目标中心点热力图来检测目标位置,并设计检测偏差损失加强对预测热力图响应值的约束,以缓解因检测不准确导致的ReID特征模糊问题。为提高Re-ID鲁棒性,提出Re-ID可学习特征动态扩充策略。该策略通过自适应扩充目标中心的Re-ID可学习特征来提高特征质量,并减小Re-ID对中心点检测精度的依赖。在MOT16和MOT17测试集上进行验证,结果表明,算法能有效提升Re-ID性能,与主流算法相比具有更好的跟踪效果,且兼顾了实时性,达到25.6 FPS。 展开更多
关键词 多目标跟踪 重识别 中心点检测 实时
下载PDF
An efficient deep learning-assisted person re-identification solution for intelligent video surveillance in smart cities
4
作者 Muazzam MAQSOOD Sadaf YASMIN +3 位作者 Saira GILLANI Maryam BUKHARI Seungmin RHO Sang-Soo YEO 《Frontiers of Computer Science》 SCIE EI CSCD 2023年第4期83-96,共14页
Innovations on the Internet of Everything(IoE)enabled systems are driving a change in the settings where we interact in smart units,recognized globally as smart city environments.However,intelligent video-surveillance... Innovations on the Internet of Everything(IoE)enabled systems are driving a change in the settings where we interact in smart units,recognized globally as smart city environments.However,intelligent video-surveillance systems are critical to increasing the security of these smart cities.More precisely,in today’s world of smart video surveillance,person re-identification(Re-ID)has gained increased consideration by researchers.Various researchers have designed deep learningbased algorithms for person Re-ID because they have achieved substantial breakthroughs in computer vision problems.In this line of research,we designed an adaptive feature refinementbased deep learning architecture to conduct person Re-ID.In the proposed architecture,the inter-channel and inter-spatial relationship of features between the images of the same individual taken from nonidentical camera viewpoints are focused on learning spatial and channel attention.In addition,the spatial pyramid pooling layer is inserted to extract the multiscale and fixed-dimension feature vectors irrespective of the size of the feature maps.Furthermore,the model’s effectiveness is validated on the CUHK01 and CUHK02 datasets.When compared with existing approaches,the approach presented in this paper achieves encouraging Rank 1 and 5 scores of 24.6% and 54.8%,respectively. 展开更多
关键词 Internet of Everything(IoE) visual surveillance systems big data security systems person re-identification(Re-id) deep learning
原文传递
Person Re-Identification with Effectively Designed Parts 被引量:2
5
作者 Yali Zhao Yali Li Shengjin Wang 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2020年第3期415-424,共10页
Person re-IDentification(re-ID) is an important research topic in the computer vision community, with significance for a range of applications. Pedestrians are well-structured objects that can be partitioned, although... Person re-IDentification(re-ID) is an important research topic in the computer vision community, with significance for a range of applications. Pedestrians are well-structured objects that can be partitioned, although detection errors cause slightly misaligned bounding boxes, which lead to mismatches. In this paper, we study the person re-identification performance of using variously designed pedestrian parts instead of the horizontal partitioning routine typically applied in previous hand-crafted part works, and thereby obtain more effective feature descriptors. Specifically, we benchmark the accuracy of individual part matching with discriminatively trained Convolutional Neural Network(CNN) descriptors on the Market-1501 dataset. We also investigate the complementarity among different parts using combination and ablation studies, and provide novel insights into this issue. Compared with the state-of-the-art, our method yields a competitive accuracy rate when the best part combination is used on two large-scale datasets(Market-1501 and CUHK03) and one small-scale dataset(VIPeR). 展开更多
关键词 person re-identification(re-id) Convolutional Neural Network(CNN) part model
原文传递
Attributes-based person re-identification via CNNs with coupled clusters loss 被引量:1
6
作者 SUN Rui HUANG Qiheng +1 位作者 FANGWei ZHANG Xudong 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第1期45-55,共11页
Person re-identification(re-id)involves matching a person across nonoverlapping views,with different poses,illuminations and conditions.Visual attributes are understandable semantic information to help improve the iss... Person re-identification(re-id)involves matching a person across nonoverlapping views,with different poses,illuminations and conditions.Visual attributes are understandable semantic information to help improve the issues including illumination changes,viewpoint variations and occlusions.This paper proposes an end-to-end framework of deep learning for attribute-based person re-id.In the feature representation stage of framework,the improved convolutional neural network(CNN)model is designed to leverage the information contained in automatically detected attributes and learned low-dimensional CNN features.Moreover,an attribute classifier is trained on separate data and includes its responses into the training process of our person re-id model.The coupled clusters loss function is used in the training stage of the framework,which enhances the discriminability of both types of features.The combined features are mapped into the Euclidean space.The L2 distance can be used to calculate the distance between any two pedestrians to determine whether they are the same.Extensive experiments validate the superiority and advantages of our proposed framework over state-of-the-art competitors on contemporary challenging person re-id datasets. 展开更多
关键词 person re-identification(re-id) convolutions neural network(CNN) attributes coupled clusters loss(CCL)
下载PDF
Feature mapping space and sample determination for person re-identification
7
作者 HOU Wei HU Zhentao +1 位作者 LIU Xianxing SHI Changsen 《High Technology Letters》 EI CAS 2022年第3期237-246,共10页
Person re-identification(Re-ID) is integral to intelligent monitoring systems.However,due to the variability in viewing angles and illumination,it is easy to cause visual ambiguities,affecting the accuracy of person r... Person re-identification(Re-ID) is integral to intelligent monitoring systems.However,due to the variability in viewing angles and illumination,it is easy to cause visual ambiguities,affecting the accuracy of person re-identification.An approach for person re-identification based on feature mapping space and sample determination is proposed.At first,a weight fusion model,including mean and maximum value of the horizontal occurrence in local features,is introduced into the mapping space to optimize local features.Then,the Gaussian distribution model with hierarchical mean and covariance of pixel features is introduced to enhance feature expression.Finally,considering the influence of the size of samples on metric learning performance,the appropriate metric learning is selected by sample determination method to further improve the performance of person re-identification.Experimental results on the VIPeR,PRID450 S and CUHK01 datasets demonstrate that the proposed method is better than the traditional methods. 展开更多
关键词 person re-identification(Re-id) mapping space feature optimization sample determination
下载PDF
Learning Deep RGBT Representations for Robust Person Re-identification 被引量:1
8
作者 Ai-Hua Zheng Zi-Han Chen +2 位作者 Cheng-Long Li Jin Tang Bin Luo 《International Journal of Automation and computing》 EI CSCD 2021年第3期443-456,共14页
Person re-identification(Re-ID)is the scientific task of finding specific person images of a person in a non-overlapping camera networks,and has achieved many breakthroughs recently.However,it remains very challenging... Person re-identification(Re-ID)is the scientific task of finding specific person images of a person in a non-overlapping camera networks,and has achieved many breakthroughs recently.However,it remains very challenging in adverse environmental conditions,especially in dark areas or at nighttime due to the imaging limitations of a single visible light source.To handle this problem,we propose a novel deep red green blue(RGB)-thermal(RGBT)representation learning framework for a single modality RGB person ReID.Due to the lack of thermal data in prevalent RGB Re-ID datasets,we propose to use the generative adversarial network to translate labeled RGB images of person to thermal infrared ones,trained on existing RGBT datasets.The labeled RGB images and the synthetic thermal images make up a labeled RGBT training set,and we propose a cross-modal attention network to learn effective RGBT representations for person Re-ID in day and night by leveraging the complementary advantages of RGB and thermal modalities.Extensive experiments on Market1501,CUHK03 and Duke MTMC-re ID datasets demonstrate the effectiveness of our method,which achieves stateof-the-art performance on all above person Re-ID datasets. 展开更多
关键词 Person re-identification(Re-id) thermal infrared generative networks ATTENTION deep learning
原文传递
基于室内可见光照明的位置服务系统 被引量:30
9
作者 娄鹏华 张洪明 +2 位作者 郎凯 姚敏玉 徐正元 《光电子.激光》 EI CAS CSCD 北大核心 2012年第12期2298-2303,共6页
设计并实现了一种基于室内LED照明光源的位置服务系统。系统利用LED标签(LEDID)技术,LED提供照明的同时广播自身的位置ID信息,移动终端将接收到的ID信息与位置关联,实现自身的被动定位。可见光通信的调制编码以及解调解码模块均采用... 设计并实现了一种基于室内LED照明光源的位置服务系统。系统利用LED标签(LEDID)技术,LED提供照明的同时广播自身的位置ID信息,移动终端将接收到的ID信息与位置关联,实现自身的被动定位。可见光通信的调制编码以及解调解码模块均采用单片机处理器(PC)实现,并提供UART接口分别与PC控制端和手机显示端进行通信。PC控制端向LED信号源发送位置服务信息,LED信号源通过空间光传输方式将自身位置ID和接收到的位置服务信息广播出去。手机使用终端加载有Android操作环境下的室内定位导航软件,可以实时更新位置和位置服务信息。 展开更多
关键词 可见光通信 室内定位导航 LED标签(LEDid)技术 单灯定位
原文传递
多源数据行人重识别研究综述 被引量:23
10
作者 叶钰 王正 +3 位作者 梁超 韩镇 陈军 胡瑞敏 《自动化学报》 EI CSCD 北大核心 2020年第9期1869-1884,共16页
行人重识别是近年来计算机视觉领域的热点问题,经过多年的发展,基于可见光图像的一般行人重识别技术已经趋近成熟.然而,目前的研究多基于一个相对理想的假设,即行人图像都是在光照充足的条件下拍摄的高分辨率图像.因此虽然大多数的研究... 行人重识别是近年来计算机视觉领域的热点问题,经过多年的发展,基于可见光图像的一般行人重识别技术已经趋近成熟.然而,目前的研究多基于一个相对理想的假设,即行人图像都是在光照充足的条件下拍摄的高分辨率图像.因此虽然大多数的研究都能取得较为满意的效果,但在实际环境中并不适用.多源数据行人重识别即利用多种行人信息进行行人匹配的问题.除了需要解决一般行人重识别所面临的问题外,多源数据行人重识别技术还需要解决不同类型行人信息与一般行人图片相互匹配时的差异问题,如低分辨率图像、红外图像、深度图像、文本信息和素描图像等.因此,与一般行人重识别方法相比,多源数据行人重识别研究更具实用性,同时也更具有挑战性.本文首先介绍了一般行人重识别的发展现状和所面临的问题,然后比较了多源数据行人重识别与一般行人重识别的区别,并根据不同数据类型总结了5类多源数据行人重识别问题,分别从方法、数据集两个方面对现有工作做了归纳和分析.与一般行人重识别技术相比,多源数据行人重识别的优点是可以充分利用各类数据学习跨模态和类型的特征转换.最后,本文讨论了多源数据行人重识别未来的发展. 展开更多
关键词 多源数据行人重识别 跨模态 度量学习 特征模型 统一模态
下载PDF
面向行人重识别的局部特征研究进展、挑战与展望 被引量:10
11
作者 姚足 龚勋 +2 位作者 陈锐 卢奇 罗彬 《自动化学报》 EI CAS CSCD 北大核心 2021年第12期2742-2760,共19页
行人重识别(Person re-identification,Re-ID)旨在跨区域、跨场景的视频中实现行人的检索及跟踪,其成果在智能监控、刑事侦查、反恐防暴等领域具有广阔的应用前景.由于真实场景下的行人图像存在光照差异大、拍摄视角不统一、物体遮挡等... 行人重识别(Person re-identification,Re-ID)旨在跨区域、跨场景的视频中实现行人的检索及跟踪,其成果在智能监控、刑事侦查、反恐防暴等领域具有广阔的应用前景.由于真实场景下的行人图像存在光照差异大、拍摄视角不统一、物体遮挡等问题,导致从图像整体提取的全局特征易受无关因素的干扰,识别精度不高.基于局部特征的方法通过挖掘行人姿态、人体部位、视角特征等关键信息,可加强模型对人体关键区域的学习,降低无关因素的干扰,从而克服全局特征的缺陷,也因此成为近几年的研究热点.本文对近年基于局部特征的行人重识别文献进行梳理,简述了行人重识别的发展历程,将基于局部特征的方法归纳为基于姿势提取、基于特征空间分割、基于视角信息、基于注意力机制四类,并详细阐述了每一类的原理及优缺点.然后在三个主流行人数据集上对典型方法的识别性能进行了分析比较,最后总结了目前基于局部特征算法的难点,并对未来本领域的研究趋势和发展方向进行展望. 展开更多
关键词 行人重识别 局部特征 深度学习 计算机视觉
下载PDF
融合子空间共享特征的多尺度跨模态行人重识别方法 被引量:5
12
作者 王凤随 闫涛 +2 位作者 刘芙蓉 钱亚萍 许月 《电子与信息学报》 EI CSCD 北大核心 2023年第1期325-334,共10页
跨模态行人重识别(Re-ID)是智能监控系统所面临的一项具有很大挑战的问题,现有的跨模态研究方法中主要基于全局或局部学习表示有区别的模态共享特征。然而,很少有研究尝试融合全局与局部的特征表示。该文提出一种新的多粒度共享特征融合... 跨模态行人重识别(Re-ID)是智能监控系统所面临的一项具有很大挑战的问题,现有的跨模态研究方法中主要基于全局或局部学习表示有区别的模态共享特征。然而,很少有研究尝试融合全局与局部的特征表示。该文提出一种新的多粒度共享特征融合(MSFF)网络,该网络结合了全局和局部特征来学习两种模态的不同粒度表示,从骨干网络中提取多尺度、多层次的特征,全局特征表示的粗粒度信息与局部特征表示的细粒度信息相互协同,形成更具有区别度的特征描述符。此外,为使网络能够提取更有效的共享特征,该文还针对网络中的两种模态的嵌入模式提出了子空间共享特征模块的改进方法,改变传统模态特征权重的特征嵌入方式。将该模块提前放入骨干网络中,使两种模态的各自特征映射到同一子空间中,经过骨干网络产生更丰富的共享权值。在两个公共数据集实验结果证明了所提方法的有效性,SYSU-MM01数据集最困难全搜索单镜头模式下平均精度m AP达到了60.62%。 展开更多
关键词 行人重识别 跨模态 全局和局部特征 多粒度共享特征融合 子空间共享特征
下载PDF
基于孪生网络和重排序的行人重识别 被引量:7
13
作者 陈首兵 王洪元 +1 位作者 金翠 张玮 《计算机应用》 CSCD 北大核心 2018年第11期3161-3166,共6页
针对非重叠多摄像头下的行人重识别(Re-ID)易受到光照、姿势及遮挡等影响和实验过程中存在图像错误匹配的情况,提出一种基于孪生网络和重排序的行人重识别方法。首先,给定一对行人训练图像,孪生网络可以同时学习一个具有辨别力的卷积神... 针对非重叠多摄像头下的行人重识别(Re-ID)易受到光照、姿势及遮挡等影响和实验过程中存在图像错误匹配的情况,提出一种基于孪生网络和重排序的行人重识别方法。首先,给定一对行人训练图像,孪生网络可以同时学习一个具有辨别力的卷积神经网络(CNN)特征和相似性度量,并预测两个输入图像的行人身份以及判断它们是否属于同一个行人;然后,通过k互近邻方法来降低图像错误匹配的情况;最后,将欧氏距离和杰卡德距离加权来对排序表进行重排序。在数据集Market1501和CUHK03上进行多次实验,实验结果显示在Market1501上Single Query情况下在图库中第一次就成功匹配的概率(Rank1)达到83.44%,平均精度均值(mAP)为68.75%,在CUHK03上singleshot情况下Rank1达到85.56%,mAP为88.32%,明显高于传统的基于特征表示和度量学习的方法。 展开更多
关键词 行人重识别 孪生网络 k互近邻 杰卡德距离 重排序
下载PDF
基于关系融合和特征分解的车辆重识别算法
14
作者 刘寒松 《光电子.激光》 CAS CSCD 北大核心 2024年第7期708-715,共8页
在车辆重识别(re-identification,Re-ID)任务中,通过对全局及局部信息的联合提取已成为目前主流的方法,是许多重识别模型在提取局部信息时只关注了丰富程度而忽略了完整性。针对该问题,提出了一种基于关系融合和特征分解的算法。该算法... 在车辆重识别(re-identification,Re-ID)任务中,通过对全局及局部信息的联合提取已成为目前主流的方法,是许多重识别模型在提取局部信息时只关注了丰富程度而忽略了完整性。针对该问题,提出了一种基于关系融合和特征分解的算法。该算法从空间与通道维度出发,设计对骨干网络所提取的特征沿垂直、水平、通道3维度分割,首先,为了更好地凸显车辆的前景区域,提出一种混合注意力模块(mixed attention module,MAM),之后,为了在空间维度上挖掘丰富特征信息的同时使得网络关注更完整的感兴趣区域,设计对垂直及水平方向的分割后的特征实现基于图的关系融合。为了赋予网络捕捉更具判别性信息的能力,在通道方向上对分割后的局部特征实现特征分解。最后,在全局分支特征与局部分支下所提取的鲁棒性特征的共同作用下实现车辆重识别。实验结果表明,本文算法在两个主流车辆重识别数据集上取得了更先进的性能。 展开更多
关键词 车辆重识别(Re-id) 关系融合 特征分解 注意力机制
原文传递
融合姿态信息和注意力机制的行人重识别研究
15
作者 梁丹阳 魏丹 +1 位作者 庄须瑶 江磊 《上海工程技术大学学报》 CAS 2024年第2期179-186,共8页
针对行人重识别(person re-identification,Re-ID)任务中行人遮挡以及背景信息杂乱不便于提取具有辨识度特征的问题,引入人体关键点模型定位出行人的关键点坐标以便于消除背景信息,根据关键点坐标将图片分割成具有语义信息的区域块。对... 针对行人重识别(person re-identification,Re-ID)任务中行人遮挡以及背景信息杂乱不便于提取具有辨识度特征的问题,引入人体关键点模型定位出行人的关键点坐标以便于消除背景信息,根据关键点坐标将图片分割成具有语义信息的区域块。对于骨干网络,为使其提取的特征更加鲁棒,设计一个强化注意力模块(enhanced attention module,EAM),使网络自动分配权重,最终得到更加具有辨识度的特征向量。最后将这些区域块和整体图片送入修改后的注意力机制的神经网络并且联合多个损失一起优化网络。在几个行人重识别数据集试验验证了本研究提出方法优于大多数方法。试验结果还表明该网络针对跨域以及遮挡问题也起到积极作用。 展开更多
关键词 行人重识别 姿态信息 注意力模块 分块特征 特征融合 跨域识别
下载PDF
多尺度融合与双输出U-Net网络的行人重识别
16
作者 胡庆 《计算机工程》 CAS CSCD 北大核心 2024年第6期102-109,共8页
受行人姿态的多变性和行人被遮挡等因素的影响,行人重识别模型难以提取行人关键特征。为增强模型的特征表达能力,提出一种基于多尺度融合与双输出U-Net网络的行人重识别方法,旨在解决现有方法中难以提取行人关键特征、特征表达能力较低... 受行人姿态的多变性和行人被遮挡等因素的影响,行人重识别模型难以提取行人关键特征。为增强模型的特征表达能力,提出一种基于多尺度融合与双输出U-Net网络的行人重识别方法,旨在解决现有方法中难以提取行人关键特征、特征表达能力较低的问题。首先,提出多尺度融合的双输出U-Net网络,并对输出特征进行欧氏距离和散度距离约束;其次,设计联合损失函数,解决生成对抗网络在训练过程中不易收敛的问题,提高训练过程的收敛速度。在3个公共基准数据集上的仿真实验结果表明,相比经典特征提取网络,所提特征提取网络的平均精度均值(mAP)提升超过10%,所提行人重识别方法相比主流方法的mAP提高约2%,该方法能够增强模型的特征表达能力,提高行人重识别的准确率。 展开更多
关键词 行人重识别 生成对抗网络 特征提取 多尺度融合 联合约束
下载PDF
基于深度学习的多模态行人重识别综述
17
作者 张国庆 杨珊 +3 位作者 汪海蕊 王准 杨艳 周洁琼 《南京信息工程大学学报》 CAS 北大核心 2024年第4期437-450,共14页
行人重识别(Re-ID)旨在跨像机检索同一目标行人,它是智能视频监控领域的一项关键技术.由于监控场景的复杂性,单模态行人重识别在低光、雾天等极端情况下的适用性较差.因实际应用的需要以及深度学习的快速发展,基于深度学习的多模态行人... 行人重识别(Re-ID)旨在跨像机检索同一目标行人,它是智能视频监控领域的一项关键技术.由于监控场景的复杂性,单模态行人重识别在低光、雾天等极端情况下的适用性较差.因实际应用的需要以及深度学习的快速发展,基于深度学习的多模态行人重识别受到了广泛的关注.本文针对近年来多模态行人重识别的发展脉络进行综述:阐述了传统单模态行人重识别方法存在的不足;归纳了多模态行人重识别的常见应用场景及其优势,以及各数据集的构成;重点分析了各种场景下多模态行人重识别的相关方法及其分类,并探讨了当前研究的热点和挑战;最后,讨论了多模态行人重识别的未来发展趋势及其潜在应用价值. 展开更多
关键词 深度学习 神经网络 行人重识别 多模态
下载PDF
基于融合注意力和特征增强的跨模态行人重识别
18
作者 黄驰涵 沈肖波 《南京信息工程大学学报》 CAS 北大核心 2024年第4期451-460,共10页
跨模态行人重识别是一项具有挑战性的任务,目的是在可见光和红外模式之间匹配行人图像,以便在犯罪调查和智能视频监控应用中发挥重要作用.为了解决跨模态行人重识别任务中对细粒度特征提取能力不强的问题,本文提出一种基于融合注意力和... 跨模态行人重识别是一项具有挑战性的任务,目的是在可见光和红外模式之间匹配行人图像,以便在犯罪调查和智能视频监控应用中发挥重要作用.为了解决跨模态行人重识别任务中对细粒度特征提取能力不强的问题,本文提出一种基于融合注意力和特征增强的行人重识别模型.首先,利用自动数据增强技术缓解不同摄像机的视角、尺度差异,并基于交叉注意力多尺度Vision Transformer,通过处理多尺度特征生成具有更强区分性的特征表示;接着,提出通道注意力和空间注意力机制,在融合可见光和红外图像特征时学习对区分特征重要的信息;最后,设计损失函数,采用基于自适应权重的难三元组损失,增强了每个样本之间的相关性,提高了可见光和红外图像对不同行人的识别能力.在SYSU-MM01和RegDB数据集上进行大量实验,结果表明,本文提出方法的mAP分别达到了68.05%和85.19%,相较之前的工作性能有所提升,且通过消融实验和对比分析验证了本文模型的先进性和有效性. 展开更多
关键词 行人重识别 跨模态 交叉注意力 特征提取 多尺度
下载PDF
结合视觉文本匹配和图嵌入的可见光-红外行人重识别
19
作者 张红颖 樊世钰 +1 位作者 罗谦 张涛 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第9期3662-3671,共10页
对于可见光-红外跨模态行人重识别(Re-ID),大多数方法采用基于模态转换的策略,通过对抗网络生成图像,以此建立不同模态间的相互联系。然而这些方法往往不能有效降低模态间的差距,导致重识别性能不佳。针对此问题,该文提出一种基于视觉... 对于可见光-红外跨模态行人重识别(Re-ID),大多数方法采用基于模态转换的策略,通过对抗网络生成图像,以此建立不同模态间的相互联系。然而这些方法往往不能有效降低模态间的差距,导致重识别性能不佳。针对此问题,该文提出一种基于视觉文本匹配和图嵌入的双阶段跨模态行人重识别方法。该方法通过上下文优化方案构建可学习文本模板,生成行人描述作为模态间的关联信息。具体而言,在第1阶段基于图片-文本对的预训练(CLIP)模型实现同一行人不同模态间的统一文本描述作为先验信息辅助降低模态差异。同时在第2阶段引入基于图嵌入的跨模态约束框架,设计模态间自适应损失函数,提升行人识别准确率。为了验证所提方法的有效性,在SYSU-MM01和Reg DB数据集上进行了大量实验,其中SYSU-MM01数据集上的首次命中(Rank-1)和平均精度均值(m AP)分别达到64.2%,60.2%。实验结果表明,该文所提方法能够提升可见光-红外跨模态行人重识别的准确率。 展开更多
关键词 行人重识别 跨模态 图片-文本对的预训练模型 上下文优化 图嵌入
下载PDF
针对大角度下视角差异的行人重识别方法研究
20
作者 蔡毅翔 秦品乐 +3 位作者 曾建潮 晋赞霞 秦佳 翟双姣 《计算机工程》 CAS CSCD 北大核心 2024年第5期330-341,共12页
行人重识别(Re-ID)也称为行人再识别,旨在给定一个目标行人,确定该行人是否出现在不同的摄像机下,或者是在不同的时间出现在相同的摄像机下。通常由于不同摄像机拍摄到的行人视角不同,在视角差异过大的情况下会对行人重识别准确率造成... 行人重识别(Re-ID)也称为行人再识别,旨在给定一个目标行人,确定该行人是否出现在不同的摄像机下,或者是在不同的时间出现在相同的摄像机下。通常由于不同摄像机拍摄到的行人视角不同,在视角差异过大的情况下会对行人重识别准确率造成严重影响。因此,针对目标行人相对摄像机的视角不同而带来的识别率下降问题,提出一种基于外观-步态特征融合的行人重识别算法,使用视角信息对RGB图像与步态能量图(GEI)进行重要性权重估计后再加权融合,以此来克服视角不同而带来的影响。具体来讲,首先利用Res Net-50提取图像序列中每张图像的特征,采用时间池化的方式将其聚合为外观特征。其次使用另一个Res Net-50对GEI图像提取步态特征。然后对行人进行视角估计之后,映射函数将估计的角度映射为两种特征的重要性权重。最后基于自编码器结构将两种特征在重要性权重的指导下进行加权融合,生成对视角鲁棒的融合特征。在CASIA-B数据集上的实验结果表明,对于具有大角度视角差异的行人Re-ID,所提出方法在m AP和Rank-1评估指标上都表现出了显著的改进。在大角度差异情况下进行测试,准确率最高提升了2.7%。 展开更多
关键词 行人重识别 视角差异 外观特征 步态特征 特征融合
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部