-
题名基于人体姿态估计的泳池溺水检测算法
被引量:1
- 1
-
-
作者
于中阳
杨文辉
-
机构
上海旺链信息科技有限公司
-
出处
《科技创新与应用》
2023年第23期66-70,74,共6页
-
文摘
泳池溺水事故频发,基于计算机视觉的泳池防溺水技术可以有效预防溺水事故的发生。当前的基于计算机视觉的泳池防溺水技术大多利用目标检测算法研究游泳者的头部、人体与水面的位置关系,人为设置溺水判定规则,主观因素太强,模型参数过多且难以确定,准确率有待提高。该文提出一种基于人体姿态估计的泳池溺水检测算法,利用人体姿态估计模型OpenPose对游泳者的图像进行人体关键点标记,构建人体关键点距离向量集合,通过比较游泳者的关键点距离向量与溺水状态的关键点距离向量的相似性判断溺水行为。实验结果表明,该文提出的基于人体姿态估计的泳池溺水检测算法的准确率为95%,精确率为85%,召回率为89.47%,可以有效地检测出溺水游泳者。
-
关键词
溺水检测
姿态估计
OpenPose
关键点距离
相似性
-
Keywords
drowning detection
pose estimation
OpenPose
key point distance
similarity
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于边界框关键点距离的框回归算法
被引量:2
- 2
-
-
作者
聂志勇
阴宇薇
汤佳欣
涂志刚
-
机构
国能网信科技(北京)有限公司综合自动化部
武汉大学测绘遥感信息工程国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第7期65-75,共11页
-
基金
国家自然科学基金(62106177)。
-
文摘
针对目前基于交并比(IoU)的框回归方法在实际应用中存在的检测精度不高、收敛速度较慢等问题,提出一种基于关键点距离交并比(KIoU)的框回归方法。从几何知识入手,将矩形的3个顶点和1个中心点作为关键点,通过计算对应点之间的距离来判断预测框与真实框的位置以及形态差异。构建基于关键点交并比损失的新型损失函数,计算实际情况与理想情况下预测框与真实框的关键点交并比之差,将关键对应点的距离作为IoU的惩罚项以加速模型收敛过程,利用关键点信息在定位上的高效性和准确性来提高目标检测精度。以单阶段目标检测算法SSD和两阶段目标检测算法Faster R-CNN为基准算法,在PASCAL VOC和COCO数据集上将KIoU与IoU、GIoU、DIoU、CIoU等4种交并比方法进行实验对比,结果表明:在检测精度方面,在Faster R-CNN上KIoU相较IoU提升了2.91%,相较目前表现较好的DIoU提升了0.11%,在SSD上KIoU相较IoU与DIoU分别提升了0.96%与0.06%;在目标检测视觉效果方面,KIoU方法对目标的定位更加准确,且在一定程度上能够减少目标漏检的情况。
-
关键词
目标检测
边界框回归
交并比
关键点距离交并比
关键对应点
-
Keywords
object detection
boundary box regression
Intersection-over-Union(IoU)
Key point distance based Intersection-over-Union(KIoU)
key corresponding point
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于关键点距离表征网络的物体位姿估计方法
被引量:1
- 3
-
-
作者
夏梦
杜弘志
林嘉睿
孙岩标
邾继贵
-
机构
天津大学精密测试技术及仪器国家重点实验室
-
出处
《激光与光电子学进展》
CSCD
北大核心
2023年第16期306-314,共9页
-
基金
国家自然科学基金(52075382)。
-
文摘
提出一种新型的关键点距离表征学习网络,该网络利用位姿变换过程的几何不变性信息,在网络中引入距离量的估计,进而推导出稳健关键点,以此来提升基于深度学习的六自由度物体位姿估计方法的精度。所提方法包含两个阶段。首先,设计了关键点距离表征网络,通过一种骨干网络模块和特征融合结构实现RGB-D图像特征提取,并结合多层感知机预测物体逐点相对于关键点的距离量、语义和置信度。其次,根据可视点投票法及四点距离定位法,利用网络输出的多维信息推理计算关键点坐标,并最终通过最小二乘拟合算法得到物体位姿。为了证明所提方法的有效性,在公开数据集LineMOD和YCB-Video上进行了测试,实验结果表明,所提方法相比于原PSPNet框架中的ResNet参数量减少一半且精度有所提升,在两个数据集上精度分别提升了1.1个百分点和5.8个百分点。
-
关键词
机器视觉
六自由度位姿估计
深度学习
关键点距离表征网络
特征提取
-
Keywords
machine vision
six degrees of freedom pose estimation
deep learning
keypoint distance network
feature extraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-