针对一般手势识别算法的参数量、计算量和精度难以平衡的问题,提出一种轻量化篮球裁判手势识别算法。该算法在YOLOV5s(You Only Look Once Version 5s)算法的基础上进行重构:首先,用Involution算子替代CSP1_1的卷积算子,以扩大上下文信...针对一般手势识别算法的参数量、计算量和精度难以平衡的问题,提出一种轻量化篮球裁判手势识别算法。该算法在YOLOV5s(You Only Look Once Version 5s)算法的基础上进行重构:首先,用Involution算子替代CSP1_1的卷积算子,以扩大上下文信息捕获范围并减少核冗余;其次,在C3模块后加入协同注意力(CA)机制,以得到更强的手势特征提取能力;然后,用轻量化内容感知上采样算子改进原始上采样模块,并将采样点集中在目标区域而忽略背景部分;最后,利用以SiLU作为激活函数的Ghost-Net进行轻量化剪枝。在自制的篮球裁判手势数据集上的实验结果表明,该轻量化篮球裁判手势识别算法的计算量、参数量和模型大小分别为3.3 GFLOPs、4.0×10^(6)和8.5 MB,与YOLOV5s算法相比,分别减少了79%、44%和40%,mAP@0.5为91.7%,在分辨率为1920×1280的比赛视频上的检测帧率达到89.3 frame/s,证明该算法能满足低误差、高帧率和轻量化的要求。展开更多
针对从视频中恢复三维人体模型运动序列时,由于图像特征提取能力有限而导致三维人体模型运动序列重建效果不佳的问题,提出了一种基于Involution卷积的三维人体重建方法。首先为了引入自注意力机制,在ResNet50网络结构中加入Involution算...针对从视频中恢复三维人体模型运动序列时,由于图像特征提取能力有限而导致三维人体模型运动序列重建效果不佳的问题,提出了一种基于Involution卷积的三维人体重建方法。首先为了引入自注意力机制,在ResNet50网络结构中加入Involution算子,获取视频图像帧的特征向量,然后使用姿态估计网络和形状估计网络获取人体姿势以及形状参数,最后使用蒙皮多人线性模型(skinned multi-person linear model, SMPL)生成三维人体模型的运动序列。在三维姿态户外数据集(3D pose in the wild, 3DPW)上与视频人体姿态形状估计推理(video inference for body pose and shape estimation, VIBE)方法以及时间一致性网格恢复(temporally consistent mesh recovery, TCMR)方法进行对比实验,平均精度相比于VIBE、TCMR分别提升了3.1%、0.7%,能够为运动捕捉、三维人体动画制作等工作提供更为准确的三维人体模型。展开更多
Tomita-Takesaki theory in the real case is considered. The author introduces the conception of a nondegenerate pair of closed subspaces in a real Hilbert space. Then a satisfactory real Tomita-Taksaki theory is obtain...Tomita-Takesaki theory in the real case is considered. The author introduces the conception of a nondegenerate pair of closed subspaces in a real Hilbert space. Then a satisfactory real Tomita-Taksaki theory is obtained, and it seems to be a special result of the complex case.展开更多
文摘针对一般手势识别算法的参数量、计算量和精度难以平衡的问题,提出一种轻量化篮球裁判手势识别算法。该算法在YOLOV5s(You Only Look Once Version 5s)算法的基础上进行重构:首先,用Involution算子替代CSP1_1的卷积算子,以扩大上下文信息捕获范围并减少核冗余;其次,在C3模块后加入协同注意力(CA)机制,以得到更强的手势特征提取能力;然后,用轻量化内容感知上采样算子改进原始上采样模块,并将采样点集中在目标区域而忽略背景部分;最后,利用以SiLU作为激活函数的Ghost-Net进行轻量化剪枝。在自制的篮球裁判手势数据集上的实验结果表明,该轻量化篮球裁判手势识别算法的计算量、参数量和模型大小分别为3.3 GFLOPs、4.0×10^(6)和8.5 MB,与YOLOV5s算法相比,分别减少了79%、44%和40%,mAP@0.5为91.7%,在分辨率为1920×1280的比赛视频上的检测帧率达到89.3 frame/s,证明该算法能满足低误差、高帧率和轻量化的要求。
文摘针对从视频中恢复三维人体模型运动序列时,由于图像特征提取能力有限而导致三维人体模型运动序列重建效果不佳的问题,提出了一种基于Involution卷积的三维人体重建方法。首先为了引入自注意力机制,在ResNet50网络结构中加入Involution算子,获取视频图像帧的特征向量,然后使用姿态估计网络和形状估计网络获取人体姿势以及形状参数,最后使用蒙皮多人线性模型(skinned multi-person linear model, SMPL)生成三维人体模型的运动序列。在三维姿态户外数据集(3D pose in the wild, 3DPW)上与视频人体姿态形状估计推理(video inference for body pose and shape estimation, VIBE)方法以及时间一致性网格恢复(temporally consistent mesh recovery, TCMR)方法进行对比实验,平均精度相比于VIBE、TCMR分别提升了3.1%、0.7%,能够为运动捕捉、三维人体动画制作等工作提供更为准确的三维人体模型。
文摘Tomita-Takesaki theory in the real case is considered. The author introduces the conception of a nondegenerate pair of closed subspaces in a real Hilbert space. Then a satisfactory real Tomita-Taksaki theory is obtained, and it seems to be a special result of the complex case.