期刊文献+
共找到351篇文章
< 1 2 18 >
每页显示 20 50 100
人运动的视觉分析综述 被引量:276
1
作者 王亮 胡卫明 谭铁牛 《计算机学报》 EI CSCD 北大核心 2002年第3期225-237,共13页
目前 ,人运动的视觉分析是计算机视觉领域中最活跃的研究主题之一 ,其核心是利用计算机视觉技术从图像序列中检测、跟踪、识别人并对其行为进行理解与描述 ,它在虚拟现实、视觉监控、感知接口等领域均有着广阔的应用前景 .人运动的视觉... 目前 ,人运动的视觉分析是计算机视觉领域中最活跃的研究主题之一 ,其核心是利用计算机视觉技术从图像序列中检测、跟踪、识别人并对其行为进行理解与描述 ,它在虚拟现实、视觉监控、感知接口等领域均有着广阔的应用前景 .人运动的视觉分析系统一般遵从下述的处理过程 :(1)运动检测 ,(2 )运动目标分类 ,(3)人的跟踪 ,(4)行为理解与描述 .该文将重点从此四个方面回顾人运动分析的发展水平和常用的处理方法 。 展开更多
关键词 视觉分析 运动检测 行为理解 计算机视觉 人运动
下载PDF
基于自适应背景模型的全方位视觉人体运动检测 被引量:19
2
作者 皮文凯 刘宏 查红彬 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第3期458-464,共7页
设计了一种新的全方位视觉系统 ,用来在室内对多个人体目标进行实时运动检测。系统中使用全方位摄像机作为图像采集设备 ,能在一幅图像中获取水平方向 36 0°的环境信息。在检测开始之前 ,首先由摄像机对无人环境持续观测一段时间 ... 设计了一种新的全方位视觉系统 ,用来在室内对多个人体目标进行实时运动检测。系统中使用全方位摄像机作为图像采集设备 ,能在一幅图像中获取水平方向 36 0°的环境信息。在检测开始之前 ,首先由摄像机对无人环境持续观测一段时间 ,建立背景的统计模型 ;在检测开始之后 ,将每一时刻全方位摄像机采集到的图像变换成柱状全景图像 ,再利用背景的统计模型 ,通过自适应的动态背景减除算法得到前景区域 ,同时在线更新背景模型。最后进行区域分割 ,确定人体的位置。试验结果表明 ,该系统在复杂背景的室内环境下 。 展开更多
关键词 运动检测 人体跟踪 全方位摄像机 自适应背景减除
下载PDF
基于运动模式在线分类的移动机器人目标跟踪 被引量:21
3
作者 苑晶 李阳 +1 位作者 董星亮 黄亚楼 《仪器仪表学报》 EI CAS CSCD 北大核心 2017年第3期568-577,共10页
区别于以往采用固定运动模式的目标跟踪研究,提出一种基于单目视觉传感器的人体运动模式在线识别算法,及基于此算法的人体目标跟踪方法。首先,利用视觉信息检测运动目标,并提取其视觉特征;然后通过单目视觉深度提取算法,获取目标的运动... 区别于以往采用固定运动模式的目标跟踪研究,提出一种基于单目视觉传感器的人体运动模式在线识别算法,及基于此算法的人体目标跟踪方法。首先,利用视觉信息检测运动目标,并提取其视觉特征;然后通过单目视觉深度提取算法,获取目标的运动特征;接着将连续几帧的特征变化矢量送入随机森林(RF)进行学习,实现对人体运动模式的在线分类;最后根据分类结果在线选取不同的目标运动模型,并利用近似最优的粒子滤波器实现对目标运动状态的准确估计。实验结果证明了本文提出算法的有效性。 展开更多
关键词 移动机器人 人体跟踪 单目视觉 运动模式分类
下载PDF
Human-Tracking Strategies for a Six-legged Rescue Robot Based on Distance and View 被引量:18
4
作者 PAN Yang GAO Feng +1 位作者 QI Chenkun CHAI Xun 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2016年第2期219-230,共12页
Human tracking is an important issue for intelligent robotic control and can be used in many scenarios, such as robotic services and human-robot cooperation. Most of current human-tracking methods are targeted for mob... Human tracking is an important issue for intelligent robotic control and can be used in many scenarios, such as robotic services and human-robot cooperation. Most of current human-tracking methods are targeted for mobile/tracked robots, but few of them can be used for legged robots. Two novel human-tracking strategies, view priority strategy and distance priority strategy, are proposed specially for legged robots, which enable them to track humans in various complex terrains. View priority strategy focuses on keeping humans in its view angle arrange with priority, while its counterpart, distance priority strategy, focuses on keeping human at a reasonable distance with priority. To evaluate these strategies, two indexes(average and minimum tracking capability) are defined. With the help of these indexes, the view priority strategy shows advantages compared with distance priority strategy. The optimization is done in terms of these indexes, which let the robot has maximum tracking capability. The simulation results show that the robot can track humans with different curves like square, circular, sine and screw paths. Two novel control strategies are proposed which specially concerning legged robot characteristics to solve human tracking problems more efficiently in rescue circumstances. 展开更多
关键词 human-tracking legged robot intelligent control algorithm
下载PDF
基于粒子Mean Shift迁移的红外人体目标跟踪算法 被引量:14
5
作者 云廷进 郭永彩 高潮 《计算机学报》 EI CSCD 北大核心 2009年第6期1222-1228,共7页
提出了一种基于粒子Mean Shift迁移过程的红外人体跟踪方法.算法通过采样粒子迁移和聚类动态建立目标的状态模型和量测模型.在被跟踪区域随机布撒粒子,以各粒子对应像素的亮度作为特征值进行Mean Shift收敛性分析,使用收敛后的粒子集表... 提出了一种基于粒子Mean Shift迁移过程的红外人体跟踪方法.算法通过采样粒子迁移和聚类动态建立目标的状态模型和量测模型.在被跟踪区域随机布撒粒子,以各粒子对应像素的亮度作为特征值进行Mean Shift收敛性分析,使用收敛后的粒子集表达目标的当前状态;以状态粒子的坐标位置为特征值对其进行Mean Shift聚类,作为对目标的量测.连续跟踪时,下一帧的采样粒子基于上一帧的量测结果产生.与传统的基于序贯重要性采样的粒子滤波方法相比,算法不需要目标的相似性测度计算,仅用少数粒子即可实现对目标的可靠跟踪. 展开更多
关键词 粒子迁移 人体跟踪 红外图像 Mean SHIFT 粒子滤波
下载PDF
监控系统中的多摄像机协同(英文) 被引量:10
6
作者 Nam T. Nguyen Svetha Venkatesh +1 位作者 Geoff West Hung H. Bui 《自动化学报》 EI CSCD 北大核心 2003年第3期408-422,共15页
描述了一个用于室内场合对多个目标进行跟踪的分布式监控系统 .该系统由多个廉价的固定镜头的摄像机构成 ,具有多个摄像机处理模块和一个中央模块用于协调摄像机间的跟踪任务 .由于每个运动目标有可能被多个摄像机同时跟踪 ,因此如何选... 描述了一个用于室内场合对多个目标进行跟踪的分布式监控系统 .该系统由多个廉价的固定镜头的摄像机构成 ,具有多个摄像机处理模块和一个中央模块用于协调摄像机间的跟踪任务 .由于每个运动目标有可能被多个摄像机同时跟踪 ,因此如何选择最合适的摄像机对某一目标跟踪 ,特别是在系统资源紧张时 ,成为一个问题 .提出的新算法能根据目标与摄像机之间的距离并考虑到遮挡的情况 ,把目标分配给相应的摄像机 ,因此在遮挡出现时 ,系统能把遮挡的目标分配给能看见目标并距离最近的那个摄像机 .实验表明该系统能协调好多个摄像机进行目标跟踪 。 展开更多
关键词 分布式监控系统 目标跟踪 摄像机处理模块 摄像机协同
下载PDF
人体三维运动实时跟踪与建模系统 被引量:5
7
作者 徐一华 李京峰 贾云得 《自动化学报》 EI CSCD 北大核心 2006年第4期560-567,共8页
提出了一种新的人体三维运动实时跟踪与建模系统设计方法,并基于此实现了一套鲁棒的参考应用系统.针对人机交互等对跟踪精度要求不是很高的应用场合,系统在跟踪精确性和简易性与可推广性之间做了很好的折中.系统使用多个摄像头采集图... 提出了一种新的人体三维运动实时跟踪与建模系统设计方法,并基于此实现了一套鲁棒的参考应用系统.针对人机交互等对跟踪精度要求不是很高的应用场合,系统在跟踪精确性和简易性与可推广性之间做了很好的折中.系统使用多个摄像头采集图像,实时计算场景深度信息,然后结合使用深度和颜色信息进行人体跟踪.应用一个简易的人体上半身三维模型,并使用基于颜色直方图的粒子滤波算法对头部和手部进行跟踪,从而恢复出模型的各个参数.系统以人脸检测和人手肤色聚类算法为初始化方法.大量实验证明,该系统能在复杂背景下进行人体上半身的跟踪和三维模型恢复,能进行完全自动的初始化,有较强的抗干扰能力和自动错误恢复能力.系统在2.4GHz PC机上能以25帧/秒的速度运行. 展开更多
关键词 人体跟踪 人体建模 人体三维模型 人机交互
下载PDF
多特征自适应均值漂移算法的目标跟踪 被引量:11
8
作者 贾松敏 王爽 +1 位作者 王丽佳 李秀智 《光电子.激光》 EI CAS CSCD 北大核心 2014年第10期2018-2024,共7页
针对传统均值漂移(mean-shift)算法存在对目标特征描述不完整、目标模型不能动态更新、无法解决目标遮挡等问题,本文提出多特征自适应均值漂移算法的目标跟踪。首先利用人体躯干侧影改进模型核函数,采用目标颜色特征与纹理特征建立目标... 针对传统均值漂移(mean-shift)算法存在对目标特征描述不完整、目标模型不能动态更新、无法解决目标遮挡等问题,本文提出多特征自适应均值漂移算法的目标跟踪。首先利用人体躯干侧影改进模型核函数,采用目标颜色特征与纹理特征建立目标直方图模型,提高算法对目标描述能力;提出选择性模型更新策略,自适应地调整目标模型,改善了传统整体更新策略由于过度更新导致的跟踪发散;最后利用扩展卡尔曼滤波(EKF,extend Kalman filter)提取目标运动特征确定目标位置。与传统算法相比,本文所提算法能在背景干扰条件下准确跟踪目标;同时,图像处理平均速度达140frame/s,满足实时性要求。实验结果表明,本文算法可以实时准确地跟踪目标,对环境干扰、目标遮挡具有鲁棒性。 展开更多
关键词 目标跟踪 多特征 均值漂移 选择性更新策略
原文传递
基于计算机视觉的公交车人流量统计系统 被引量:9
9
作者 李衡宇 何小海 +1 位作者 吴炜 杨晓敏 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第4期825-830,共6页
对人体目标识别和跟踪的研究是计算机视觉领域一个重要的方面,具有很大的实用价值,其目的是让计算机代替人类完成诸如视频监控和人流量统计等任务.根据公交车上下客的特点,作者构建了一个统计乘客人数的系统,并提出了一种基于差分统计... 对人体目标识别和跟踪的研究是计算机视觉领域一个重要的方面,具有很大的实用价值,其目的是让计算机代替人类完成诸如视频监控和人流量统计等任务.根据公交车上下客的特点,作者构建了一个统计乘客人数的系统,并提出了一种基于差分统计的计数算法.该算法既可以独立完成乘客人数统计的任务,也可以作为具有更高准确率计数算法的前端算法.实验结果表明,该算法的计数准确率达到85%以上,具有实际的应用价值. 展开更多
关键词 人体目标 识别 跟踪 人流量
下载PDF
人工翻译与神经网络机器翻译译后编辑比较研究——基于对隐喻翻译的眼动追踪与键盘记录数据 被引量:10
10
作者 王湘玲 赖思 贾艳芳 《外语教学理论与实践》 CSSCI 北大核心 2021年第4期115-126,共12页
本文通过眼动追踪、键盘记录、反省报告和问卷调查多元互证,比较了30名译者对隐喻表达进行人工翻译(HT)与译后编辑(PE)的认知负荷和译文质量。研究发现:无论是HT还是PE,译文区的注视时间均明显长于原文区,且隐喻译文的准确度均高于忠实... 本文通过眼动追踪、键盘记录、反省报告和问卷调查多元互证,比较了30名译者对隐喻表达进行人工翻译(HT)与译后编辑(PE)的认知负荷和译文质量。研究发现:无论是HT还是PE,译文区的注视时间均明显长于原文区,且隐喻译文的准确度均高于忠实度。不同之处含PE中原文区的注视次数、注视时间及单位单词停顿次数均显著少于HT,且隐喻译文的忠实度和准确度均显著高于HT。本研究表明PE在处理隐喻表达时,既可减少译者认知负荷还可提高译文质量。 展开更多
关键词 神经网络机器翻译译后编辑 人工翻译 隐喻翻译 眼动追踪 键盘记录
原文传递
基于图像识别技术的卷烟零售数据采集方法 被引量:9
11
作者 梁冬 陈智斌 +2 位作者 农英雄 潘剑 汪倍贝 《中国烟草学报》 CAS CSCD 北大核心 2021年第5期81-89,共9页
为了实现卷烟零售数据的自动化采集,提出了一种基于图像识别技术的卷烟零售数据采集方法。首先,基于深度图设计一种人体检测与跟踪算法,稳定跟踪消费者在购买卷烟期间的行动轨迹;其次,实现一种7点式的人体关键点检测算法,检测顶式视角... 为了实现卷烟零售数据的自动化采集,提出了一种基于图像识别技术的卷烟零售数据采集方法。首先,基于深度图设计一种人体检测与跟踪算法,稳定跟踪消费者在购买卷烟期间的行动轨迹;其次,实现一种7点式的人体关键点检测算法,检测顶式视角下的人体关键点;然后,构建卷烟的检测与识别算法,检测卷烟在图像中位置与姿态并识别卷烟的牌号;最后,融合人体跟踪信息、人体关键点信息、卷烟位置和牌号信息构建一种消费者行为识别方法,实现卷烟零售数据的采集。结果表明:数据采集方法的准确率达到95.6%,通过图像识别技术实现卷烟零售数据的自动化采集是可行的。 展开更多
关键词 卷烟零售数据 图像识别 人体跟踪 人体关键点 卷烟牌号识别 行为识别
下载PDF
基于时空切片轨迹分析的复杂人体运动跟踪 被引量:8
12
作者 杨景景 苏小红 马培军 《信号处理》 CSCD 北大核心 2012年第2期246-256,共11页
时空切片方法是一种有效的时空分析方法。然而,现有的算法仅讨论处理近似直线的简单轨迹情况,不能满足实际存在复杂曲线轨迹的处理要求。针对这一问题,本文提出一种实时的时空切片复杂轨迹分析方法来实现人体运动跟踪。首先在视频不同... 时空切片方法是一种有效的时空分析方法。然而,现有的算法仅讨论处理近似直线的简单轨迹情况,不能满足实际存在复杂曲线轨迹的处理要求。针对这一问题,本文提出一种实时的时空切片复杂轨迹分析方法来实现人体运动跟踪。首先在视频不同高度处提取水平时空切片,在各切片中分别使用高斯背景模型检测人体轨迹;然后拼合不同高度切片中的人体轨迹,在拼合后的轨迹上使用Hough变换计算人体对应的轨迹方程;最后根据轨迹方程和轨迹检测结果,确定人体的当前坐标、宽和高等信息。实验表明,相对于传统跟踪方法,该方法降低了跟踪的轨迹误差,满足实时性跟踪要求,且在人体短时遮挡情况下仍然能够实现有效的人体跟踪。 展开更多
关键词 人体跟踪 时空分析 时空切片 HOUGH变换
下载PDF
基于梯度方向-亮度联合空间的红外人体跟踪 被引量:5
13
作者 王江涛 王建国 +1 位作者 杨静宇 刘锁兰 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第3期492-498,共7页
针对红外图像中人体成像的特点,提出一种新颖的红外人体跟踪算法。为克服红外图像中人体目标描述信息不足的缺点,该方法首先在梯度方向-亮度二维联合空间中构建人体目标的特征直方图,然后给出了一种最优直方图级数的选择准则对最具鉴别... 针对红外图像中人体成像的特点,提出一种新颖的红外人体跟踪算法。为克服红外图像中人体目标描述信息不足的缺点,该方法首先在梯度方向-亮度二维联合空间中构建人体目标的特征直方图,然后给出了一种最优直方图级数的选择准则对最具鉴别性能的级数进行选择;进而将上述表达模型与粒子滤波相融合,设计了粒子滤波框架下的人体跟踪算法。不同场景中的人体跟踪结果表明,与通用的跟踪算法相比,本文提出的算法具有更高的鲁棒性和稳健性。 展开更多
关键词 人体跟踪 红外图像 粒子滤波 联合直方图
下载PDF
基于HSV与RGB颜色空间的人体检测与跟踪算法 被引量:6
14
作者 杨鸽 郑嘉龙 王莹 《自动化技术与应用》 2022年第9期17-20,28,共5页
针对在光照变化、人影干扰等特殊场景下人体灰度与环境背景灰度相近时,难以将人体与背景分割开来这一问题,提出了一种基于HSV与RGB颜色空间的人体检测与跟踪算法。首先,在RGB颜色空间构建高斯背景更新模型;然后,使用背景减除法计算待检... 针对在光照变化、人影干扰等特殊场景下人体灰度与环境背景灰度相近时,难以将人体与背景分割开来这一问题,提出了一种基于HSV与RGB颜色空间的人体检测与跟踪算法。首先,在RGB颜色空间构建高斯背景更新模型;然后,使用背景减除法计算待检测图像与背景图像R、G、B分量的欧氏距离检测出人体目标,根据检测结果实时更新背景模型;最后,根据阴影在HSV空间下的特点对阴影进行检测与去除,计算目标区域颜色直方图的相关性对目标进行跟踪。实验结果表明,在复杂场景下此方法能够有效的消除因光照和人体形变等因素造成的干扰,准确实现人体检测和跟踪,算法具有较好的鲁棒性。 展开更多
关键词 人体检测 背景差分 HSV 阴影检测 目标跟踪
下载PDF
基于自适应Kalman滤波的移动机器人人体目标跟随 被引量:6
15
作者 董辉 王亚男 +2 位作者 童辉 吴祥 杨旭升 《高技术通讯》 EI CAS 北大核心 2019年第3期249-256,共8页
本文研究了复杂背景环境下基于视觉的移动机器人人体目标跟随问题。首先,考虑目标状态的随机性给系统建模带来的影响,采用RGB-D相机获取包含目标的彩色图像和深度图像,从而确定目标与机器人之间的相对位置关系并建立移动机器人跟随模型... 本文研究了复杂背景环境下基于视觉的移动机器人人体目标跟随问题。首先,考虑目标状态的随机性给系统建模带来的影响,采用RGB-D相机获取包含目标的彩色图像和深度图像,从而确定目标与机器人之间的相对位置关系并建立移动机器人跟随模型。其次,考虑系统量测误差的不确定性对滤波器稳定性的影响,采用假设检验的方式引入自适应因子,设计自适应卡尔曼滤波器(AKF),实现对移动机器人跟随状态的预测和更新。最后,通过实验验证了所提方法的有效性。本文设计的基于AKF方法的移动机器人目标跟踪方法不依赖于历史量测数据,适用于噪声统计特性时变的状态估计问题。 展开更多
关键词 移动机器人 人体目标跟随 量测误差 自适应卡尔曼滤波器(AKF)
下载PDF
一种基于模型融合的行人跟踪算法 被引量:6
16
作者 江帆 王贵锦 +1 位作者 刘畅 林行刚 《电视技术》 北大核心 2010年第3期85-87,91,共4页
提出了一种基于模型融合的行人跟踪算法。该算法在粒子滤波框架中融合了基于颜色直方图特征的产生式模型以及基于HOG特征的鉴别式模型,并结合离线学习和在线互学习对HOG鉴别式模型进行更新。实验结果表明,该方法能够有效地适应跟踪过程... 提出了一种基于模型融合的行人跟踪算法。该算法在粒子滤波框架中融合了基于颜色直方图特征的产生式模型以及基于HOG特征的鉴别式模型,并结合离线学习和在线互学习对HOG鉴别式模型进行更新。实验结果表明,该方法能够有效地适应跟踪过程中的光照变化、姿势变化以及部分遮挡。 展开更多
关键词 行人跟踪 模型融合 粒子滤波
下载PDF
HiTL-based adaptive fuzzy tracking control of MASs:A distributed fixed-time strategy 被引量:2
17
作者 LIU Yang CHI RongHu +2 位作者 LI HongYi WANG LiJie LIN Na 《Science China(Technological Sciences)》 SCIE EI CAS CSCD 2023年第10期2907-2916,共10页
Human-in-the-loop(HiTL)control is promising for the cooperative control problem of multi-agent systems(MASs)under the complicated environment.By considering the effect of human intelligence and decision making,the sys... Human-in-the-loop(HiTL)control is promising for the cooperative control problem of multi-agent systems(MASs)under the complicated environment.By considering the effect of human intelligence and decision making,the system robustness and security are notably enhanced.Hence,a distributed fixed-time tracking control problem is investigated in this paper for heterogeneous MASs based on the HiTL idea.First,a lemma of practically fixed-time stable is given where an explicit relationship of settling time and convergence domain is clearly shown.Then,under the framework of the adaptive backstepping approach,a series of modified intermediate control signals is designed to avoid the singularity problem by taking advantage of power transformation,fuzzy logic systems,and inequality schemes.Finally,the numerical example and comparison results are utilized to testify the effectiveness of the proposed method. 展开更多
关键词 human-in-the-Loop heterogeneous MASs fixed-time stable adaptive tracking control fuzzy logic systems
原文传递
基于渐进式卡尔曼滤波器的人体目标跟踪方法分析
18
作者 陈锡锻 陈芝腾 《集成电路应用》 2024年第1期33-35,共3页
阐述一种渐进式卡尔曼滤波器算法,将该算法应用于人体目标跟踪中。仿真结果表明,该方法在长时间的目标跟踪中,能够有效地提高系统的鲁棒性。实验室环境中的测试结果表明,该方法对人体目标的运动趋势和方向能够做出正确的预测估计。
关键词 图像识别 人体目标 跟踪 渐进式 卡尔曼滤波 鲁棒性
下载PDF
融合视觉图像处理的目标识别技术在移动机器人中的应用
19
作者 潘萍 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第3期314-322,共9页
为了提升移动机器人的运动人体识别效果,研究利用Faster-RCNN-KF对动态人体图像进行实时跟踪,并结合Facenet-MTCNN实现跟踪对象人脸识别。运动人体跟踪检测实验和人脸识别测试结果显示,Faster-RCNN-KF算法跟踪误差仅为0.000 5 m,且跟踪... 为了提升移动机器人的运动人体识别效果,研究利用Faster-RCNN-KF对动态人体图像进行实时跟踪,并结合Facenet-MTCNN实现跟踪对象人脸识别。运动人体跟踪检测实验和人脸识别测试结果显示,Faster-RCNN-KF算法跟踪误差仅为0.000 5 m,且跟踪响应速度和误差更正速度较快;Facenet-MTCNN目标识别算法在训练中的分类精度最高能够达到99.15%,分类中的时间延迟为0.01 s,能够有效识别跟踪对象的身份信息。研究结果表明,视觉图像处理技术能够实现人体的有效跟踪检测,并能对不同身份的跟踪对象进行人脸识别,对移动机器人跟踪与识别技术发展具有重要价值。 展开更多
关键词 人体跟踪 人脸识别 图像处理 Faster-RCNN 卡尔曼滤波 Facenet网络
下载PDF
DPT‐tracker:Dual pooling transformer for efficient visual tracking
20
作者 Yang Fang Bailian Xie +3 位作者 Uswah Khairuddin Zijian Min Bingbing Jiang Weisheng Li 《CAAI Transactions on Intelligence Technology》 SCIE EI 2024年第4期948-959,共12页
Transformer tracking always takes paired template and search images as encoder input and conduct feature extraction and target‐search feature correlation by self and/or cross attention operations,thus the model compl... Transformer tracking always takes paired template and search images as encoder input and conduct feature extraction and target‐search feature correlation by self and/or cross attention operations,thus the model complexity will grow quadratically with the number of input images.To alleviate the burden of this tracking paradigm and facilitate practical deployment of Transformer‐based trackers,we propose a dual pooling transformer tracking framework,dubbed as DPT,which consists of three components:a simple yet efficient spatiotemporal attention model(SAM),a mutual correlation pooling Trans-former(MCPT)and a multiscale aggregation pooling Transformer(MAPT).SAM is designed to gracefully aggregates temporal dynamics and spatial appearance information of multi‐frame templates along space‐time dimensions.MCPT aims to capture multi‐scale pooled and correlated contextual features,which is followed by MAPT that aggregates multi‐scale features into a unified feature representation for tracking prediction.DPT tracker achieves AUC score of 69.5 on LaSOT and precision score of 82.8 on Track-ingNet while maintaining a shorter sequence length of attention tokens,fewer parameters and FLOPs compared to existing state‐of‐the‐art(SOTA)Transformer tracking methods.Extensive experiments demonstrate that DPT tracker yields a strong real‐time tracking baseline with a good trade‐off between tracking performance and inference efficiency. 展开更多
关键词 human‐computer interfacing image motion analysis pattern recognition signal processing tracking
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部