The irregular domain and lack of ordering make it challenging to design deep neural networks for point cloud processing.This paper presents a novel framework named Point Cloud Transformer(PCT)for point cloud learning....The irregular domain and lack of ordering make it challenging to design deep neural networks for point cloud processing.This paper presents a novel framework named Point Cloud Transformer(PCT)for point cloud learning.PCT is based on Transformer,which achieves huge success in natural language processing and displays great potential in image processing.It is inherently permutation invariant for processing a sequence of points,making it well-suited for point cloud learning.To better capture local context within the point cloud,we enhance input embedding with the support of farthest point sampling and nearest neighbor search.Extensive experiments demonstrate that the PCT achieves the state-of-the-art performance on shape classification,part segmentation,semantic segmentation,and normal estimation tasks.展开更多
三维重建在视觉方面具有很高的研究价值,在机器人视觉导航、智能车环境感知系统以及虚拟现实中被广泛应用.本文对近年来国内外基于视觉的三维重建方法的研究工作进行了总结和分析,主要介绍了基于主动视觉下的激光扫描法、结构光法、阴...三维重建在视觉方面具有很高的研究价值,在机器人视觉导航、智能车环境感知系统以及虚拟现实中被广泛应用.本文对近年来国内外基于视觉的三维重建方法的研究工作进行了总结和分析,主要介绍了基于主动视觉下的激光扫描法、结构光法、阴影法以及TOF (Time of flight)技术、雷达技术、Kinect技术和被动视觉下的单目视觉、双目视觉、多目视觉以及其他被动视觉法的三维重建技术,并比较和分析这些方法的优点和不足.最后对三维重建的未来发展作了几点展望.展开更多
针对YOLOv3算法在检测公路车道线时存在准确率低和漏检概率高的问题,提出一种改进YOLOv3网络结构的公路车道线检测方法.该方法首先将图像划分为多个网格,利用K-means++聚类算法,根据公路车道线宽高固有特点,确定目标先验框数量和对应宽...针对YOLOv3算法在检测公路车道线时存在准确率低和漏检概率高的问题,提出一种改进YOLOv3网络结构的公路车道线检测方法.该方法首先将图像划分为多个网格,利用K-means++聚类算法,根据公路车道线宽高固有特点,确定目标先验框数量和对应宽高值;其次根据聚类结果优化网络Anchor参数,使训练网络在车道线检测方面具有一定的针对性;最后将经过Darknet-53网络提取的特征进行拼接,改进YOLOv3算法卷积层结构,使用GPU进行多尺度训练得到最优的权重模型,从而对图像中的车道线目标进行检测,并选取置信度最高的边界框进行标记.使用Caltech Lanes数据库中的图像信息进行对比试验,实验结果表明,改进的YOLOv3算法在公路车道线检测中平均准确率(Mean average precision, mAP)为95%,检测速度可达50帧/s,较YOLOv3原始算法mAP值提升了11%,且明显高于其他车道线检测方法.展开更多
随着深度学习的不断发展与广泛运用,基于深度学习的目标检测算法已成为新的主流。为了进一步提高卷积神经网络YOLO v3(You only look once v3)的检测精度,在原算法的网络结构上添加卷积层模块对样本进行目标背景分类,并粗略调整特征图...随着深度学习的不断发展与广泛运用,基于深度学习的目标检测算法已成为新的主流。为了进一步提高卷积神经网络YOLO v3(You only look once v3)的检测精度,在原算法的网络结构上添加卷积层模块对样本进行目标背景分类,并粗略调整特征图上的锚框大小。该模块输出目标背景概率后,过滤掉背景概率值低于设定阈值的样本,从而解决原算法中存在的正负样本比例失衡的问题。使用调整过的锚框替代原算法中直接由聚类生成固定大小的锚框,该过程为边界框的预测提供更优的初始值。在VOC数据集上的实验结果表明,相较于原算法,改进的YOLO v3具有更高的检测精度。展开更多
基金supported by the National Natural Science Foundation of China(Project Number 61521002)the Joint NSFC–DFG Research Program(Project Number 61761136018).
文摘The irregular domain and lack of ordering make it challenging to design deep neural networks for point cloud processing.This paper presents a novel framework named Point Cloud Transformer(PCT)for point cloud learning.PCT is based on Transformer,which achieves huge success in natural language processing and displays great potential in image processing.It is inherently permutation invariant for processing a sequence of points,making it well-suited for point cloud learning.To better capture local context within the point cloud,we enhance input embedding with the support of farthest point sampling and nearest neighbor search.Extensive experiments demonstrate that the PCT achieves the state-of-the-art performance on shape classification,part segmentation,semantic segmentation,and normal estimation tasks.
文摘三维重建在视觉方面具有很高的研究价值,在机器人视觉导航、智能车环境感知系统以及虚拟现实中被广泛应用.本文对近年来国内外基于视觉的三维重建方法的研究工作进行了总结和分析,主要介绍了基于主动视觉下的激光扫描法、结构光法、阴影法以及TOF (Time of flight)技术、雷达技术、Kinect技术和被动视觉下的单目视觉、双目视觉、多目视觉以及其他被动视觉法的三维重建技术,并比较和分析这些方法的优点和不足.最后对三维重建的未来发展作了几点展望.
文摘针对YOLOv3算法在检测公路车道线时存在准确率低和漏检概率高的问题,提出一种改进YOLOv3网络结构的公路车道线检测方法.该方法首先将图像划分为多个网格,利用K-means++聚类算法,根据公路车道线宽高固有特点,确定目标先验框数量和对应宽高值;其次根据聚类结果优化网络Anchor参数,使训练网络在车道线检测方面具有一定的针对性;最后将经过Darknet-53网络提取的特征进行拼接,改进YOLOv3算法卷积层结构,使用GPU进行多尺度训练得到最优的权重模型,从而对图像中的车道线目标进行检测,并选取置信度最高的边界框进行标记.使用Caltech Lanes数据库中的图像信息进行对比试验,实验结果表明,改进的YOLOv3算法在公路车道线检测中平均准确率(Mean average precision, mAP)为95%,检测速度可达50帧/s,较YOLOv3原始算法mAP值提升了11%,且明显高于其他车道线检测方法.
文摘随着深度学习的不断发展与广泛运用,基于深度学习的目标检测算法已成为新的主流。为了进一步提高卷积神经网络YOLO v3(You only look once v3)的检测精度,在原算法的网络结构上添加卷积层模块对样本进行目标背景分类,并粗略调整特征图上的锚框大小。该模块输出目标背景概率后,过滤掉背景概率值低于设定阈值的样本,从而解决原算法中存在的正负样本比例失衡的问题。使用调整过的锚框替代原算法中直接由聚类生成固定大小的锚框,该过程为边界框的预测提供更优的初始值。在VOC数据集上的实验结果表明,相较于原算法,改进的YOLO v3具有更高的检测精度。