期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
融合深度学习与粒子滤波的移动机器人重定位方法 被引量:21
1
作者 杨傲雷 金宏宙 +1 位作者 陈灵 费敏锐 《仪器仪表学报》 EI CAS CSCD 北大核心 2021年第7期226-233,共8页
为有效解决移动机器人重定位问题,提出一种融合深度学习和粒子滤波的机器人重定位方法。首先,提出了3自由度移动机器人重定位方法架构,主要包含重定位模型构建和机器人在线重定位两个递进阶段;其次,在PoseNet基础上提出并构建了针对3自... 为有效解决移动机器人重定位问题,提出一种融合深度学习和粒子滤波的机器人重定位方法。首先,提出了3自由度移动机器人重定位方法架构,主要包含重定位模型构建和机器人在线重定位两个递进阶段;其次,在PoseNet基础上提出并构建了针对3自由度移动机器人的重定位网络模型GPoseNet,并将由GPoseNet预测的位姿结果作为粒子滤波定位算法的初始化状态,支撑后续重定位过程;然后,提出了一种基于数据模型的机器人绑架状态判定方法,以确定是否启动重定位过程;最后,在公开数据集上与实际环境中做了大量实验验证了此方法,结果表明:GPoseNet模型能够保证一定的位置预测精度并提升了姿态角预测精度,机器人重定位成功率达到87%。 展开更多
关键词 深度学习 位姿回归 粒子滤波定位 机器人绑架 重定位
下载PDF
一种改进的轻量级人体姿态估计算法 被引量:5
2
作者 王名赫 徐望明 蒋昊坤 《液晶与显示》 CAS CSCD 北大核心 2023年第7期955-963,共9页
现有的多数人体姿态估计算法通过设计复杂的网络结构以获得高精度而导致速度较低。YOLO-Pose人体姿态估计算法吸收了先进目标检测算法的优点同时获得了较高的精度和速度,然而仍然存在漏检和误检问题。本文对YOLOPose算法进一步改进,针... 现有的多数人体姿态估计算法通过设计复杂的网络结构以获得高精度而导致速度较低。YOLO-Pose人体姿态估计算法吸收了先进目标检测算法的优点同时获得了较高的精度和速度,然而仍然存在漏检和误检问题。本文对YOLOPose算法进一步改进,针对人体姿态非刚性和人体关键点分布多样性的特点提出一种新的轻量级人体姿态检测算法。首先,设计了轻量级通道和空间注意力网络LCSA-Net以提升模型的特征提取能力;其次,采用了基于距离自适应的加权策略在模型训练时计算人体关键点回归损失以增强模型对远距离人体关键点的回归能力。在COCO 2017人体姿态数据集上的实验结果表明,与基准模型相比,两种改进策略均有效提升了人体姿态估计性能,实现了2%的mAP提升、1.5%的AP50提升和1.7%的AR提升。 展开更多
关键词 人体姿态估计 YOLO-pose 注意力网络 自适应加权 回归损失
下载PDF
基于三维重建的人脸姿态估计 被引量:6
3
作者 熊黎丽 王国胤 龚勋 《重庆邮电大学学报(自然科学版)》 北大核心 2010年第3期375-380,共6页
人脸姿态估计是计算机视觉及人脸识别领域的一项关键研究内容。将三维模型应用于估计人脸图像姿态参数,提出了基于三维重建的人脸姿态估计算法。根据人脸正面图片上的特征点计算出形状参数,实现三维人脸重建。基于三维人脸模型,由姿态... 人脸姿态估计是计算机视觉及人脸识别领域的一项关键研究内容。将三维模型应用于估计人脸图像姿态参数,提出了基于三维重建的人脸姿态估计算法。根据人脸正面图片上的特征点计算出形状参数,实现三维人脸重建。基于三维人脸模型,由姿态图片上提取的特征点信息推知等姿态下模型上对应特征点的信息,针对照模型正面姿态,运用线性回归估计姿态参数。实验表明,重建的三维人脸具有较好的真实感,在较大的姿态变化范围内,该方法也能够取得较好的估计精确并具有鲁棒性。 展开更多
关键词 人脸建模 线性对象类 稀疏变形模型 姿态估计 线性回归
下载PDF
轻量化视觉定位技术综述
4
作者 叶翰樵 刘养东 申抒含 《中国图象图形学报》 CSCD 北大核心 2024年第10期2880-2911,共32页
视觉定位旨在从已知的三维场景中恢复当前观测图像的相机位姿。视觉定位技术具备低成本、高精度和易于集成等优势,是实现计算设备与真实世界建立智能交互过程的关键技术之一,如今获得了混合现实、自动驾驶等应用领域的广泛关注。作为计... 视觉定位旨在从已知的三维场景中恢复当前观测图像的相机位姿。视觉定位技术具备低成本、高精度和易于集成等优势,是实现计算设备与真实世界建立智能交互过程的关键技术之一,如今获得了混合现实、自动驾驶等应用领域的广泛关注。作为计算机视觉领域长期探索的基础任务之一,视觉定位方法至今已取得显著的研究进展,然而现有方法普遍存在计算开销和存储占用过大等不足,这些问题导致视觉定位在移动端的高效部署和场景模型的更新维护方面存在困难,并因此在很大程度上限制着视觉定位技术的实际应用。针对这一问题,部分研究工作开始聚焦于推动视觉定位技术的轻量化发展。轻量化视觉定位旨在研究更加高效的场景表达形式及其视觉定位方法,目前正逐渐成为视觉定位领域重要的研究方向。本文首先回顾早期视觉定位框架,随后从场景表达形式的角度对具备轻量化特性的现有视觉定位研究工作进行分类。在各个方法类别下,分析总结其特点优势、应用场景和技术难点,并同时介绍代表性成果。进一步地,本文对部分轻量化视觉定位的代表性方法在常用室内外数据集上的性能表现进行对比分析,评估指标主要包含离线建图的用时、场景地图的存储占用和定位精度3个维度。现有的轻量化视觉定位技术仍然面临着诸多的难题与挑战,场景模型的表达能力、定位方法的泛化性与鲁棒性尚存在较大的提升空间。最后,本文对轻量化视觉定位未来的发展趋势进行分析与展望。 展开更多
关键词 视觉定位 相机位姿估计 三维场景表达 轻量化地图 特征匹配 场景坐标回归 位姿回归
原文传递
基于弱监督迁移网络的3D人体关节点识别
5
作者 孙志勇 李宏友 叶俊勇 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第1期251-258,共8页
针对2D图像缺少深度信息,行为姿态空间结构信息不完备的问题,提出一种基于弱监督迁移网络的3D人体关节点识别方法。首先,提出一种用于真实图像的端到端3D人体姿态估计框架,使用2D与3D混合标签图像对深度神经网络进行训练,在2D人体姿态... 针对2D图像缺少深度信息,行为姿态空间结构信息不完备的问题,提出一种基于弱监督迁移网络的3D人体关节点识别方法。首先,提出一种用于真实图像的端到端3D人体姿态估计框架,使用2D与3D混合标签图像对深度神经网络进行训练,在2D人体姿态识别子网络中,添加深度回归模块对2D人体姿态识别子网络进行改进,解决3D人体姿态识别出现的深度歧义性问题;其次,在3D人体姿态识别子网络中,引入3D几何约束对人体姿态识别进行规范化操作,针对无真实深度标签的情况,可更好地学习深度特征,有效解决存在遮挡情况的人体姿态识别问题。在Human 3.6M和MPII数据集中关节点预测平均误差低于其他方法,具有更好的3D人体姿态识别效果。 展开更多
关键词 迁移网络 姿态识别 3D关节点 几何约束 深度回归
原文传递
基于姿态编码器的2D/3D脊椎医学图像实时配准方法 被引量:2
6
作者 徐少康 张战成 +2 位作者 姚浩男 邹智伟 张宝成 《计算机应用》 CSCD 北大核心 2023年第2期589-594,共6页
2D/3D医学图像配准是骨科手术三维实时导航中的一项关键技术,然而传统的基于优化迭代的2D/3D配准方法需要经过多次迭代计算,无法满足医生在手术过程中对于实时配准的要求。针对该问题,提出一种基于自编码器的姿态回归网络来通过隐空间... 2D/3D医学图像配准是骨科手术三维实时导航中的一项关键技术,然而传统的基于优化迭代的2D/3D配准方法需要经过多次迭代计算,无法满足医生在手术过程中对于实时配准的要求。针对该问题,提出一种基于自编码器的姿态回归网络来通过隐空间解码捕获几何姿态信息,从而快速地回归出术中X射线图像对应的术前脊椎位置的3D姿态,并经过重新投影生成最终的配准图像。通过引入新的损失函数,以“粗细”结合配准的方式对模型进行约束,保证了姿态回归的精确度。在CTSpine1K脊椎数据集中抽取100组CT扫描图像进行10折交叉验证,实验结果表明:所提出的模型所生成的配准结果图像与X射线图像的平均绝对误差(MAE)为0.04,平均目标配准误差(mTRE)为1.16 mm,单帧耗时1.7 s。与基于传统优化的方法相比,该模型配准时间大幅缩短。相较于基于学习的方法,该模型在快速配准的同时,保证了较高的配准精度。可见,所提模型可以满足术中实时高精配准的要求。 展开更多
关键词 2D/3D图像配准 自编码器 隐空间 姿态回归 骨科手术
下载PDF
VNLSTM-PoseNet: A novel deep ConvNet for real-time 6-DOF camera relocalization in urban streets 被引量:2
7
作者 Ming Li Jiangying Qin +3 位作者 Deren Li Ruizhi Chen Xuan Liao Bingxuan Guo 《Geo-Spatial Information Science》 SCIE EI CSCD 2021年第3期422-437,共16页
Image-based relocalization is a renewed interest in outdoor environments,because it is an important problem with many applications.PoseNet introduces Convolutional Neural Network(CNN)for the first time to realize the ... Image-based relocalization is a renewed interest in outdoor environments,because it is an important problem with many applications.PoseNet introduces Convolutional Neural Network(CNN)for the first time to realize the real-time camera pose solution based on a single image.In order to solve the problem of precision and robustness of PoseNet and its improved algorithms in complex environment,this paper proposes and implements a new visual relocation method based on deep convolutional neural networks(VNLSTM-PoseNet).Firstly,this method directly resizes the input image without cropping to increase the receptive field of the training image.Then,the image and the corresponding pose labels are put into the improved Long Short-Term Memory based(LSTM-based)PoseNet network for training and the network is optimized by the Nadam optimizer.Finally,the trained network is used for image localization to obtain the camera pose.Experimental results on outdoor public datasets show our VNLSTM-PoseNet can lead to drastic improvements in relocalization performance compared to existing state-of-theart CNN-based methods. 展开更多
关键词 Camera relocalization pose regression deep convnet RGB image camera pose
原文传递
岭估计在稀疏孔径望远镜主镜姿态控制中的应用 被引量:2
8
作者 曹海峰 张景旭 +1 位作者 杨飞 安其昌 《红外与激光工程》 EI CSCD 北大核心 2019年第3期244-253,共10页
研究了稀疏孔径镜面硬点与边缘传感器布局对稀疏孔径相对位姿控制精度的影响。利用离散孔径镜面几何特性,建立了一个由7个圆形子孔径组成的主镜模型,并推导了子孔径间相对位姿控制矩阵。鉴于控制矩阵条件数大这一特点,采用广义最小二乘... 研究了稀疏孔径镜面硬点与边缘传感器布局对稀疏孔径相对位姿控制精度的影响。利用离散孔径镜面几何特性,建立了一个由7个圆形子孔径组成的主镜模型,并推导了子孔径间相对位姿控制矩阵。鉴于控制矩阵条件数大这一特点,采用广义最小二乘法求解,引入岭估计并给出了控制矩阵误差函数上确界,分析了128种边缘传感器与硬点布局以及几何距离对控制矩阵条件数的影响。仿真结果表明:硬点和边缘传感器的几何布局与系数矩阵存在内在联系;离散孔径相对位姿控制系数矩阵存在严重的复共线现象,法矩阵出现严重病态;硬点布局与改善系数矩阵病态性弱相关;在硬点布局一定时,增大相邻两边缘传感器间距,控制矩阵条件数明显减小。针对控制矩阵病态问题,采用岭估计通过选择合适的岭参数病态特征得到了有效抑制,该方法更能有效利用冗余的边缘传感器结构,实现数据融合并保证测量系统的稳定可靠。 展开更多
关键词 主动光学 位姿控制 岭估计 稀疏孔径
下载PDF
采用轻量级姿态估计网络的脊柱侧弯筛查方法 被引量:1
9
作者 魏旋旋 黄子健 +2 位作者 曹乐 杨皓 方宇 《智能系统学报》 CSCD 北大核心 2023年第5期1039-1046,共8页
脊柱侧弯是一种复杂的脊柱三维畸形,如不及时矫正将对身体健康产生严重影响。通过拍摄X光片或测量人体表面形貌的方法可以对脊柱侧弯进行筛查,但现有方法存在成本高、效率低且不适用于所有人群等缺点。本文提出了一种采用轻量级姿态估... 脊柱侧弯是一种复杂的脊柱三维畸形,如不及时矫正将对身体健康产生严重影响。通过拍摄X光片或测量人体表面形貌的方法可以对脊柱侧弯进行筛查,但现有方法存在成本高、效率低且不适用于所有人群等缺点。本文提出了一种采用轻量级姿态估计网络的脊柱侧弯筛查方法,首先,将MobileNetV3的前13层作为轻量级人体姿态估计网络的编码器,经过坐标解码得到关键点的二维坐标。其次,利用各关节点的坐标计算人体姿态的空间特征;最后,用3个SVM(support vector machine)二分类器对脊柱侧弯进行详细分级,并将训练好的姿态估计和脊柱侧弯筛查模型移植到嵌入式平台。实验结果显示,该系统可以对4种不同程度的侧弯进行筛查,准确率分别为93.0%、81.7%、81.3%、86.6%。该方法的提出为脊柱侧弯筛查工作提供了一种便捷解决方案,易于在全民健康普测工作中进行推广。 展开更多
关键词 脊柱侧弯 姿态估计 轻量化 反池化 反卷积 热图回归 分类器 筛查系统
下载PDF
Exploring 2D projection and 3D spatial information for aircraft 6D pose
10
作者 Daoyong FU Songchen HAN +2 位作者 BinBin LIANG Xinyang YUAN Wei LI 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2023年第8期258-268,共11页
The 6D pose estimation is important for the safe take-off and landing of the aircraft using a single RGB image. Due to the large scene and large depth, the exiting pose estimation methods have unstratified performance... The 6D pose estimation is important for the safe take-off and landing of the aircraft using a single RGB image. Due to the large scene and large depth, the exiting pose estimation methods have unstratified performance on the accuracy. To achieve precise 6D pose estimation of the aircraft, an end-to-end method using an RGB image is proposed. In the proposed method, the2D and 3D information of the keypoints of the aircraft is used as the intermediate supervision,and 6D pose information of the aircraft in this intermediate information will be explored. Specifically, an off-the-shelf object detector is utilized to detect the Region of the Interest(Ro I) of the aircraft to eliminate background distractions. The 2D projection and 3D spatial information of the pre-designed keypoints of the aircraft is predicted by the keypoint coordinate estimator(Kp Net).The proposed method is trained in an end-to-end fashion. In addition, to deal with the lack of the related datasets, this paper builds the Aircraft 6D Pose dataset to train and test, which captures the take-off and landing process of three types of aircraft from 11 views. Compared with the latest Wide-Depth-Range method on this dataset, our proposed method improves the average 3D distance of model points metric(ADD) and 5° and 5 m metric by 86.8% and 30.1%, respectively. Furthermore, the proposed method gets 9.30 ms, 61.0% faster than YOLO6D with 23.86 ms. 展开更多
关键词 2D and 3D information 6D pose regression aircraft 6D pose estimation End-to-end network RGB image
原文传递
3D Human Pose Estimation from a Monocular Image Using Model Fitting in Eigenspaces
11
作者 Geli Bo Katsunori Onishi +1 位作者 Tetsuya Takiguchi Yasuo Ariki 《Journal of Software Engineering and Applications》 2010年第11期1060-1066,共7页
Generally, there are two approaches for solving the problem of human pose estimation from monocular images. One is the learning-based approach, and the other is the model-based approach. The former method can estimate... Generally, there are two approaches for solving the problem of human pose estimation from monocular images. One is the learning-based approach, and the other is the model-based approach. The former method can estimate the poses rapidly but has the disadvantage of low estimation accuracy. While the latter method is able to accurately estimate the poses, its computational cost is high. In this paper, we propose a method to integrate the learning-based and model-based approaches to improve the estimation precision. In the learning-based approach, we use regression analysis to model the mapping from visual observations to human poses. In the model-based approach, a particle filter is employed on the results of regression analysis. To solve the curse of the dimensionality problem, the eigenspace of each motion is learned using Principal Component Analysis (PCA). Finally, the proposed method was estimated using the CMU Graphics Lab Motion Capture Database. The RMS error of human joint angles was 6.2 degrees using our method, an improvement of up to 0.9 degrees compared to the method without eigenspaces. 展开更多
关键词 HOG regression Analysis Eigenspaces PARTICLE FILTER pose Estimation
下载PDF
利用深度信息检测驾驶员头部姿态 被引量:1
12
作者 吴福华 汪同庆 《烟台大学学报(自然科学与工程版)》 CAS 2017年第2期155-159,168,共6页
头部姿态估计是检测驾驶员打瞌睡的一个重要手段.针对传统彩色图像存在的易受遮挡、光照变化和不均匀的干扰,仅仅通过微软公司的Kinect传感器提供的深度图像流,利用具有判别性的随机回归森林实时估计头部的位置和朝向.首先构造决策树,... 头部姿态估计是检测驾驶员打瞌睡的一个重要手段.针对传统彩色图像存在的易受遮挡、光照变化和不均匀的干扰,仅仅通过微软公司的Kinect传感器提供的深度图像流,利用具有判别性的随机回归森林实时估计头部的位置和朝向.首先构造决策树,联合决策树生成随机森林,在训练分裂节点过程中同时减小类标签分布的熵值和头部位置和朝向的方差.在训练过程中,考虑到深度图像不仅仅有头部,还包括驾驶员上半身,因此在投票确定头部姿态之前,需要将头部图像块分类出来.最后在模拟的真实车内环境进行实验,结果证明,光照的明暗变化和部分遮挡以及驾驶员的本身的穿戴(例如戴墨镜和戴帽子等)对头部姿态的估计没有影响,本文的方法具有较好的鲁棒性. 展开更多
关键词 头部姿态 深度信息 随机森林 分类和回归
下载PDF
基于深度学习的人体姿态估计方法综述 被引量:45
13
作者 邓益侬 罗健欣 金凤林 《计算机工程与应用》 CSCD 北大核心 2019年第19期22-42,共21页
基于深度学习的人体姿态估计方法旨在通过构建合适的神经网络,直接从二维的图像特征中回归出人体姿态信息。主要按照2D人体姿态估计到3D人体姿态估计的顺序,并从单人检测与多人检测、稀疏的关节点检测与密集的模型构建等方面,对近年来... 基于深度学习的人体姿态估计方法旨在通过构建合适的神经网络,直接从二维的图像特征中回归出人体姿态信息。主要按照2D人体姿态估计到3D人体姿态估计的顺序,并从单人检测与多人检测、稀疏的关节点检测与密集的模型构建等方面,对近年来基于深度学习的人体姿态估计方法进行系统介绍,从而初步了解如何通过深度学习的方法得到人体姿态的各个要素,包括肢体部件的相对朝向和比例尺度、骨骼关节点的位置坐标和连接关系,甚至更为复杂的人体蒙皮模型信息。最后,对当前研究面临的挑战以及未来的热点动向进行概述,清晰地呈现出该领域的发展脉络。 展开更多
关键词 人体姿态估计 深度学习 关节点坐标 人体模型 检测回归
下载PDF
三维人体姿态估计研究综述 被引量:14
14
作者 王发明 李建微 陈思喜 《计算机工程与应用》 CSCD 北大核心 2021年第10期26-38,共13页
三维人体姿态估计在本质上是一个分类问题和回归问题,主要通过图像估计人体的三维姿态。基于传统方法和深度学习方法的三维人体姿态估计是当前研究的主流方法。按照传统方法到深度学习方法的顺序对近年来三维人体姿态估计方法进行系统介... 三维人体姿态估计在本质上是一个分类问题和回归问题,主要通过图像估计人体的三维姿态。基于传统方法和深度学习方法的三维人体姿态估计是当前研究的主流方法。按照传统方法到深度学习方法的顺序对近年来三维人体姿态估计方法进行系统介绍,从而了解传统方法通过生成和判别等方法得到人体姿态的众多要素完成三维人体姿态的估计。基于深度学习的三维人体姿态估计方法主要通过构建神经网络,从图像特征中回归出人体姿态信息,大致可以分为基于直接回归方法、基于2D信息方法和基于混合方法的三维人体姿态估计这三类。最后对当前三维人体姿态估计研究所面临的困难与挑战进行阐述,并对未来的研究趋势做出展望。 展开更多
关键词 三维人体姿态估计 神经网络 深度学习 关键点检测 回归与检测
下载PDF
稀疏正交普鲁克回归处理跨姿态人脸识别问题 被引量:13
15
作者 张娟 《计算机科学》 CSCD 北大核心 2017年第2期302-305,共4页
正交普鲁克分析是一种常用的处理矩阵近似问题的技术。最近,该技术被引入到正交普鲁克回归模型中来处理人脸姿态识别问题并取得了不错的效果。然而,这个模型对残差项使用了矩阵F范数约束,使得模型对于一些噪声(比如光照)非常敏感。为解... 正交普鲁克分析是一种常用的处理矩阵近似问题的技术。最近,该技术被引入到正交普鲁克回归模型中来处理人脸姿态识别问题并取得了不错的效果。然而,这个模型对残差项使用了矩阵F范数约束,使得模型对于一些噪声(比如光照)非常敏感。为解决该问题,用更加鲁棒的1范约束替代原始的矩阵F范数约束,提出稀疏正交普鲁克回归模型。该模型可以由一个有效的交替迭代算法解决。在几个流行的人脸数据库上做了验证实验,实验结果证明该模型可以有效地处理人脸姿态变化。 展开更多
关键词 正交普鲁克分析 人脸姿态 回归模型
下载PDF
基于卡尔曼滤波和随机回归森林的实时头部姿态估计 被引量:10
16
作者 李成龙 钟凡 +1 位作者 马昕 秦学英 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第12期2309-2316,共8页
头部姿态估计在许多高层次的人脸分析任务中起着至关重要的作用,然而准确鲁棒的头部姿态估计仍然是具有挑战性的.针对当前流行的Kinect,提出一种基于卡尔曼滤波和随机回归森林的准确头部姿态估计方法.首先使用卡尔曼滤波在深度图中预测... 头部姿态估计在许多高层次的人脸分析任务中起着至关重要的作用,然而准确鲁棒的头部姿态估计仍然是具有挑战性的.针对当前流行的Kinect,提出一种基于卡尔曼滤波和随机回归森林的准确头部姿态估计方法.首先使用卡尔曼滤波在深度图中预测头部的位置,并在预测区域内采样深度块;然后将采样深度块通过已训练的随机回归森林进行头部姿态估计,并将姿态估计值作为卡尔曼滤波的测量值;最后利用卡尔曼滤波结合预测值和测量值得到最终的头部姿态估计参数.实验结果表明,与现有的随机森林算法相比,该方法具有更快的速度、更好的鲁棒性和更高的准确率. 展开更多
关键词 头部姿态估计 卡尔曼滤波 随机回归森林
下载PDF
流形学习与非线性回归结合的头部姿态估计 被引量:8
17
作者 范进富 陈锻生 《中国图象图形学报》 CSCD 北大核心 2012年第8期1002-1010,共9页
流形学习的目的是发现非线性数据的内在结构,可用于非线性降维。广义回归网络是人工神经网络的一种,可用于非线性回归。基于流形学习和非线性回归,提出了用于解决头部姿态估计的ManiNLR方法。该方法首先用流形学习对图像数据进行降维,... 流形学习的目的是发现非线性数据的内在结构,可用于非线性降维。广义回归网络是人工神经网络的一种,可用于非线性回归。基于流形学习和非线性回归,提出了用于解决头部姿态估计的ManiNLR方法。该方法首先用流形学习对图像数据进行降维,然后用非线性回归的方法将数据映射到线性可分空间,利用非线性回归的结果对人脸的头部姿态进行估计。实验结果表明,ManiNLR算法能够较好地估计图像中的头部姿态,并具有较快的速度和较高的鲁棒性。 展开更多
关键词 流形学习 头部姿态估计 非线性回归 人工神经网络
原文传递
基于深度学习的二维人体姿态估计:现状及展望 被引量:3
18
作者 李佳宁 王东凯 张史梁 《计算机学报》 EI CAS CSCD 北大核心 2024年第1期231-250,共20页
二维人体姿态估计旨在从摄像机拍摄的图像中识别并定位每个行人的人体关键点.作为行人分析和理解领域的基础任务之一,人体姿态估计能够为多个下游任务和应用提供支持.近年来,随着深度学习技术的进步,人体姿态估计的研究迎来快速发展.基... 二维人体姿态估计旨在从摄像机拍摄的图像中识别并定位每个行人的人体关键点.作为行人分析和理解领域的基础任务之一,人体姿态估计能够为多个下游任务和应用提供支持.近年来,随着深度学习技术的进步,人体姿态估计的研究迎来快速发展.基于图像包含的行人数量,人体姿态估计可以分为单人姿态估计和多人姿态估计两大类.本文首先介绍人体姿态估计的研究背景、问题定义、任务难点以及当前方法中的关键点表示方法.在此基础上,本文进一步总结和介绍了具有代表性的单人姿态估计和多人姿态估计方法.单人姿态估计方法包括回归法和检测法,主要关注于网络结构设计、热力图编解码、多任务学习等.对于多人姿态估计,本文分别介绍了基于热力图预测的方法和基于向量场回归的方法.随后,本文总结了当前常用的代表性数据集和性能度量方法,总结了代表性方法在几个常用数据集上的性能,对它们的预测错误的场景进行了详细分析和对比.最终,本文分析了现有二维人体姿态估计算法仍未有效解决的难题,对未来研究进行了展望. 展开更多
关键词 单人姿态估计 多人姿态估计 深度学习 自顶向下 自底向上 向量场回归
下载PDF
典型相关分析在人脸姿态估计中的应用 被引量:6
19
作者 赵松 潘可 张培仁 《小型微型计算机系统》 CSCD 北大核心 2009年第5期983-987,共5页
在单一物体角度估计中,典型相关分析(CCA)可以用来建立图像空间和角度空间的联系.基于人脸总体形状的相似性,提出了基于外观的人脸姿态估计方法.使用CCA建立姿态变化时人脸这一类物体的外观空间和姿态空间的关系.典型相关向量最大化人... 在单一物体角度估计中,典型相关分析(CCA)可以用来建立图像空间和角度空间的联系.基于人脸总体形状的相似性,提出了基于外观的人脸姿态估计方法.使用CCA建立姿态变化时人脸这一类物体的外观空间和姿态空间的关系.典型相关向量最大化人脸外观空间和姿态空间的相关性,张成了它们的相关子空间.在相关子空间中,通过线性回归的方法,估计未知姿态图像的角度.为了更好的处理外观空间的非线性问题,引入了该方法.在CUbiCFacePix数据库上的实验验证了这两种算法的有效性. 展开更多
关键词 典型相关分析 核典型相关分析 人脸姿态估计 线性回归
下载PDF
基于带有噪声输入的稀疏高斯过程的人体姿态估计 被引量:6
20
作者 夏嘉欣 陈曦 +2 位作者 林金星 李伟鹏 吴奇 《自动化学报》 EI CSCD 北大核心 2019年第4期693-705,共13页
高斯过程回归(Gaussian process regression, GPR)是一种广泛应用的回归方法,可以用于解决输入输出均为多元变量的人体姿态估计问题.计算复杂度是高斯过程回归的一个重要考虑因素,而常用的降低计算复杂度的方法为稀疏表示算法.在稀疏算... 高斯过程回归(Gaussian process regression, GPR)是一种广泛应用的回归方法,可以用于解决输入输出均为多元变量的人体姿态估计问题.计算复杂度是高斯过程回归的一个重要考虑因素,而常用的降低计算复杂度的方法为稀疏表示算法.在稀疏算法中,完全独立训练条件(Fully independent training conditional, FITC)法是一种较为先进的算法,多用于解决输入变量彼此之间完全独立的回归问题.另外,输入变量的噪声问题是高斯过程回归的另一个需要考虑的重要因素.对于测试的输入变量噪声,可以通过矩匹配的方法进行解决,而训练输入样本的噪声则可通过将其转换为输出噪声的方法进行解决,从而得到更高的计算精度.本文基于以上算法,提出一种基于噪声输入的稀疏高斯算法,同时将其应用于解决人体姿态估计问题.本文实验中的数据集来源于之前的众多研究人员,其输入为从视频序列中截取的图像或通过特征提取得到的图像信息,输出为三维的人体姿态.与其他算法相比,本文的算法在准确性,运行时间与算法稳定性方面均达到了令人满意的效果. 展开更多
关键词 姿态估计 回归分析 稀疏高斯过程 噪声输入 视频处理
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部