期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于无人机高光谱遥感和3D-ResNet的荒漠草原地物分类 被引量:7
1
作者 张燕斌 杜健民 +2 位作者 王圆 皮伟强 高新超 《中国农机化学报》 北大核心 2022年第4期66-73,共8页
荒漠草原生态信息调查与统计的瓶颈是效率与精度,传统的人工地面调查效率低,航天航空遥感调查受空间分辨率限制,精度难以满足要求。建立的无人机高光谱遥感系统兼具高光谱分辨率、高空间分辨率和高效性等优势,为基于遥感的高精度荒漠草... 荒漠草原生态信息调查与统计的瓶颈是效率与精度,传统的人工地面调查效率低,航天航空遥感调查受空间分辨率限制,精度难以满足要求。建立的无人机高光谱遥感系统兼具高光谱分辨率、高空间分辨率和高效性等优势,为基于遥感的高精度荒漠草原生态信息调查与统计提供硬件基础。利用深度学习经典网络模型VGG16与ResNet18和改进为3D卷积核的不同卷积核数量的3D-ResNet18-A、3D-ResNet18-B和3D-ResNet18-C模型对采集到的荒漠草原高光谱数据进行地物分类。结果表明,两种经典模型对荒漠草原中植被、裸土展现出较好的分类效果,而改进为3D卷积核的3D-ResNet模型具备更佳的分类效果,同时对小样本地物具备更强分类性能,其中3D-ResNet18-B的分类性能最好,对植被、土壤、阴影和其他四种地物的总体分类精度达到97.73%。无人机高光谱遥感系统和3D-ResNet模型的深度融合为地物精细分类与统计奠定基础。 展开更多
关键词 无人机 高光谱 荒漠草原 深度学习 地物分类 3D-resnet
下载PDF
基于计算机视觉的健身指导系统设计 被引量:1
2
作者 文鹏 袁小艳 +1 位作者 王一丹 王莉洪 《电子设计工程》 2023年第18期59-64,共6页
随着国务院《全民健身计划》的印发,健身被推向了新的高度,但健身爱好者存在没有专业健身教练指导、健身房费用高昂、无法利用碎片时间高效健身等问题。该文针对此类问题设计出一款基于计算机视觉技术的健身动作指导系统,通过3D-ResNet... 随着国务院《全民健身计划》的印发,健身被推向了新的高度,但健身爱好者存在没有专业健身教练指导、健身房费用高昂、无法利用碎片时间高效健身等问题。该文针对此类问题设计出一款基于计算机视觉技术的健身动作指导系统,通过3D-ResNet模型对健身动作识别,将其与笔者构建的专业动作数据进行对比,并实时反馈动作纠正意见。该系统帮助了想利用零碎时间来进行健身的人群,使其可以得到正确指导,可以更好地锻炼目标肌群,避免因动作错误而造成的运动损伤。 展开更多
关键词 健身 计算机视觉 3D-resnet 动作识别 动作纠正
下载PDF
乘务员值乘状态监测技术研究
3
作者 李干涛 朱岸平 李火星 《电视技术》 2022年第12期51-55,共5页
利用多维度视频融合感知技术对机车乘务员值乘状态进行实时分析,通过乘务员前方图像采集设备和后上方图像采集设备实时获取视频,先对视频图像进行动态自适应校正,再利用mobilenet-yolov3轻量级网络检测视频中乘务员的人脸多维特征信息... 利用多维度视频融合感知技术对机车乘务员值乘状态进行实时分析,通过乘务员前方图像采集设备和后上方图像采集设备实时获取视频,先对视频图像进行动态自适应校正,再利用mobilenet-yolov3轻量级网络检测视频中乘务员的人脸多维特征信息、玩手机以及驾驶室车门开闭等特征,采用Hu矩不变量特征辅助分析乘务员的盹睡状态,从而及时提醒司机规范驾驶行为,实时预警,对保障行车安全具有重大意义。 展开更多
关键词 多维度视频融合 轻量级网络 Hu矩不变量 3D-resnet
下载PDF
结合残差网络及目标掩膜的人脸微表情识别 被引量:9
4
作者 方明 陈文强 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2021年第1期303-313,共11页
微表情是一种能反映隐藏在人内心最真实情感状态的面部特征,现有的微表情识别技术经常会提取一些与微表情无关的运动特征信息干扰情感的真实性识别。为解决上述问题,提出一种结合残差网络及目标掩膜的特征提取方法。本文首先对原始的微... 微表情是一种能反映隐藏在人内心最真实情感状态的面部特征,现有的微表情识别技术经常会提取一些与微表情无关的运动特征信息干扰情感的真实性识别。为解决上述问题,提出一种结合残差网络及目标掩膜的特征提取方法。本文首先对原始的微表情序列进行一系列预处理,定位人眼的关键区域,对眼部区域进行图像掩膜,进而减少眨眼动作对微表情特征提取造成的干扰,然后使用欧拉视频放大算法对人脸微表情变化的关键区域进行放大,使得微表情变化更为明显,最后通过3D ResNet网络对连续的微表情序列进行训练和识别。本文方法在CASME Ⅱ和SMIC数据集上进行了测试,准确率分别达到77.3%和72.4%,与最新方法DSSN、CNN+LSTM等相比,准确率至少提高5%。 展开更多
关键词 计算机应用 微表情 3D resnet 目标掩膜 欧拉视频放大 情感识别
原文传递
3D多重注意力机制下的行为识别 被引量:5
5
作者 吴丽君 李斌斌 +2 位作者 陈志聪 林培杰 程树英 《福州大学学报(自然科学版)》 CAS 北大核心 2022年第1期47-53,共7页
为解决传统3D卷积中难以提取时空信息的缺点,提出一种适用于3D卷积网络的多重注意力机制模块.该模块是由通道结合时间子模块和空间子模块组成的多维度特征调整模块.在通道结合时间模块中,通过调整池化层和卷积层的顺序,保留更多的有效... 为解决传统3D卷积中难以提取时空信息的缺点,提出一种适用于3D卷积网络的多重注意力机制模块.该模块是由通道结合时间子模块和空间子模块组成的多维度特征调整模块.在通道结合时间模块中,通过调整池化层和卷积层的顺序,保留更多的有效通道信息和时间信息;在空间模块中,压缩冗余时间信息以减少计算量.该模块的整体计算量较少,可嵌入到各3D卷积网络中.为验证多重注意力机制模块的性能,基于3D ResNet网络设计部署了该多重注意力机制模块,并在UCF-101和HMDB-51两个行为识别数据集上分别进行训练.结果表明,改进后的3D ResNet在UCF-101上可提升1.50%的精度,在HMDB-51可提升1.24%的精度,而参数量只增加0.24%. 展开更多
关键词 3D卷积网络 注意力机制 行为识别 3D resnet
下载PDF
基于改进3D ResNet的视频人体行为识别方法研究
6
作者 牛为华 翟瑞冰 《计算机工程与科学》 CSCD 北大核心 2023年第10期1814-1821,共8页
针对人体行为在视频中呈现的时序性特点,提出了一种融合非对称卷积和CBR模块的视频人体行为识别方法。该方法使用3D ResNet-50作为主干网络。首先,将网络中较大的卷积核拆分为2个非对称3D卷积核的串联,加深卷积层在水平和竖直方向上的... 针对人体行为在视频中呈现的时序性特点,提出了一种融合非对称卷积和CBR模块的视频人体行为识别方法。该方法使用3D ResNet-50作为主干网络。首先,将网络中较大的卷积核拆分为2个非对称3D卷积核的串联,加深卷积层在水平和竖直方向上的局部关键特征提取;其次,加入了CBR模块,以增加网络层数。该网络对连续的视频帧序列进行图像和时序的多角度特征提取,并根据特征数据对其进行分类,最后输出识别结果。在基准数据集UCF101上的大量实验结果表明,所提方法的Top1准确率和Top5准确率与原始3D ResNet网络相比分别提升了4.03%和4.99%,且该方法的识别准确率也优于其他主流方法的识别准确率。 展开更多
关键词 人体行为识别 3D卷积 3D resnet网络 非对称卷积 UCF101数据集
下载PDF
低照度环境乡村公路行人穿越行为识别
7
作者 唐鹏 陈鹏 +1 位作者 闫伟曦 孙秋月 《公路》 北大核心 2022年第12期252-258,共7页
为提高低照度环境下乡村公路行人穿越安全水平,提出了一种基于车载远红外视频的夜间行人穿越行为识别系统,该系统主要是利用YOLOv4和DeepSort对远红外视频中的行人进行检测跟踪,然后考虑到行人与路边缘的相对位置关系和行人的运动状态... 为提高低照度环境下乡村公路行人穿越安全水平,提出了一种基于车载远红外视频的夜间行人穿越行为识别系统,该系统主要是利用YOLOv4和DeepSort对远红外视频中的行人进行检测跟踪,然后考虑到行人与路边缘的相对位置关系和行人的运动状态这两个因素与行人穿越行为的联系,进行车道线检测和行人运动光流检测,最后利用3D ResNet模型对检测处理后的行人进行过街行为识别。研究结果表明:所提方法对夜间行人穿越行为识别的准确率高达88.42%,同R(2+1)D、DenseNet等动作识别网络相比,分别提高了3.07%、7.01%。所提识别模型性能较好,可为后续的乡村公路行人穿越安全研究奠定基础。 展开更多
关键词 乡村公路 行人穿越行为识别 车载远红外视频 行人检测跟踪 3D resnet
原文传递
深度学习与机器学习预测NSCLC的N分期
8
作者 王甘霖 靳明明 黄钢 《智能计算机与应用》 2024年第4期184-189,共6页
本文利用深度学习和机器学习技术,提出一种基于PET和CT图像的非小细胞肺癌(Non-Small Cell Lung Cancer,NSCLC)肿瘤N分期预测方法,以提高N分期的准确率和稳定性。使用深度学习残差神经网络3D Resnet50提取NSCLC的CT与PET影像特征,并将... 本文利用深度学习和机器学习技术,提出一种基于PET和CT图像的非小细胞肺癌(Non-Small Cell Lung Cancer,NSCLC)肿瘤N分期预测方法,以提高N分期的准确率和稳定性。使用深度学习残差神经网络3D Resnet50提取NSCLC的CT与PET影像特征,并将特征降维到32维;将多模态特征进行拼接,输入机器学习模型进行NSCLC的N分期预测。最终,本文所提出的基于深度学习和机器学习预测NSCLC肿瘤分期预测方法的预测准确率在训练集达到了1.0,测试集上达到了0.852,平均受试者工作特征曲线下面积(Receiver Operating Characteristic,ROC)超过了0.91。实验表明,基于深度学习和机器学习的NSCLC肿瘤预测方法可以提高非小细胞肺癌N分期的准确率和稳定性,具有良好的应用前景和实际应用价值。 展开更多
关键词 3D resnet50 多模态 NSCLC N分期
下载PDF
基于3D金字塔残差网络的高光谱图像分类方法
9
作者 李明天 佘海龙 +3 位作者 张衍爽 徐人杰 邹静洁 解山娟 《杭州师范大学学报(自然科学版)》 CAS 2022年第6期664-672,共9页
鉴于提取高光谱图像深层次特征时,深度学习网络面临的网络层数加深、特征图数量增多、计算量增大、梯度消失等问题,提出了一种3D金字塔残差卷积神经网络,通过将3D卷积块引入金字塔残差模型中,实现了高光谱图像空谱特征的同时提取,并利... 鉴于提取高光谱图像深层次特征时,深度学习网络面临的网络层数加深、特征图数量增多、计算量增大、梯度消失等问题,提出了一种3D金字塔残差卷积神经网络,通过将3D卷积块引入金字塔残差模型中,实现了高光谱图像空谱特征的同时提取,并利用金字塔残差网络逐级增加特征图维度,大大降低了模型的参数量.Pavia University和Salinas数据集测试结果显示,该方法分别取得了99.936%和99.879%的总体分类精度,分类效果优于SVM、3D-CNN、ResNet18等3D卷积模型,且网络参数仅为ResNet18等模型的1%.可见,该方法达到了网络参数和图像分类精度的双优表现,是一种有效的高光谱遥感影像分类方法. 展开更多
关键词 高光谱图像分类 深度学习 小样本 特征提取 3D金字塔残差网络模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部