期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
深度学习模型压缩与加速综述 被引量:59
1
作者 高晗 田育龙 +1 位作者 许封元 仲盛 《软件学报》 EI CSCD 北大核心 2021年第1期68-92,共25页
随着训练可用数据量的增长与计算平台处理能力的增强,基于深度学习的智能模型能够完成越来越复杂的任务,其在计算机视觉、自然语言处理等人工智能领域已经取得重大的突破.然而,这些深度模型具有庞大的参数规模,与此相伴的可畏的计算开... 随着训练可用数据量的增长与计算平台处理能力的增强,基于深度学习的智能模型能够完成越来越复杂的任务,其在计算机视觉、自然语言处理等人工智能领域已经取得重大的突破.然而,这些深度模型具有庞大的参数规模,与此相伴的可畏的计算开销与内存需求使其在计算能力受限平台(例如移动嵌入式设备)的部署中遇到了巨大的困难与挑战.因此,如何在不影响深度学习模型性能的情况下进行模型压缩与加速成为研究热点.首先对国内外学者提出的经典深度学习模型压缩与加速方法进行分析,从参数剪枝、参数量化、紧凑网络、知识蒸馏、低秩分解、参数共享和混合方式这7个方面分类总结;其次,总结对比几种主流技术的代表性方法在多个公开模型上的压缩与加速效果;最后,对于模型压缩与加速领域的未来研究方向加以展望. 展开更多
关键词 深度学习 模型压缩 模型加速 参数剪枝 参数量化 紧凑网络
下载PDF
基于张量虚拟机的深度神经网络模型加速方法 被引量:1
2
作者 申云飞 申飞 +1 位作者 李芳 张俊 《计算机应用》 CSCD 北大核心 2023年第9期2836-2844,共9页
随着人工智能(AI)技术的蓬勃发展,深度神经网络(DNN)模型被大规模应用到各类移动端与边缘端。然而,边缘端算力低、内存容量小,且实现模型加速需要深入掌握边缘端硬件知识,这增加了模型的部署难度,也限制了模型的推广应用。因此,基于张... 随着人工智能(AI)技术的蓬勃发展,深度神经网络(DNN)模型被大规模应用到各类移动端与边缘端。然而,边缘端算力低、内存容量小,且实现模型加速需要深入掌握边缘端硬件知识,这增加了模型的部署难度,也限制了模型的推广应用。因此,基于张量虚拟机(TVM)提出一种DNN加速与部署方法,从而实现卷积神经网络(CNN)模型在现场可编程门阵列(FPGA)上的加速,并在分心驾驶分类应用场景下验证了所提方法的可行性。通过计算图优化方法减小了模型的访存和计算开销,通过模型量化方法减小了模型尺寸,通过计算图打包方法将卷积计算卸载到FPGA上执行以提高模型推理速度。与微处理器(MPU)相比,所提方法可使ResNet50和ResNet18在MPU+FPGA上的推理时间分别减少88.63%和77.53%;而在AUC(American University in Cairo)数据集上,相较于MPU,两个模型在MPU+FPGA上的top1推理精度仅下降了0.26和0.16个百分点。可见,所提方法可以降低不同模型在FPGA上的部署难度。 展开更多
关键词 张量虚拟机 深度神经网络 现场可编程门阵列 边缘设备 模型部署 模型加速
下载PDF
煤矿副井矿车装载物智能识别方法 被引量:4
3
作者 靳舒凯 魏冠楠 +3 位作者 王春明 王统海 吴忠伦 杨克虎 《工矿自动化》 北大核心 2022年第4期14-19,30,共7页
基于卷积神经网络实现煤矿副井矿车装载物自动分类在实际应用中因触发条件简易导致误判与漏判情况,且非矿车物体经过检测区域时会引起司控道岔误动作。针对该问题,提出了基于目标检测模型的煤矿副井矿车装载物智能识别方法。在煤矿副井... 基于卷积神经网络实现煤矿副井矿车装载物自动分类在实际应用中因触发条件简易导致误判与漏判情况,且非矿车物体经过检测区域时会引起司控道岔误动作。针对该问题,提出了基于目标检测模型的煤矿副井矿车装载物智能识别方法。在煤矿副井井口安装工业相机采集矿车装载物图像并进行人工标注,构建矿车识别数据集,对Faster R-CNN,YOLOv4,SSD 3种目标检测模型的识别准确率与实时性进行评估,根据评估结果,得出YOLOv4模型更适用于矿车装载物识别任务的结论;为降低模型大小,提高识别速度,对YOLOv4模型进行改进,采用轻量级网络MobileNet替换原有主干特征提取网络CSPDarknet53,构建MobileNetv3-YOLOv4模型,测试结果表明MobileNetv3-YOLOv4模型的平均精度均值(mAP)为95.03%,识别速度为44帧/s,较YOLOv4模型分别提高了0.77%,27帧/s;为方便现场应用和部署,提高矿车装载物识别模型在嵌入式平台上的性能,提出了基于层间融合和模型量化的模型加速方法,并将加速前后的MobileNetv3-YOLOv4模型移植到Jetson TX2进行矿车装载物识别现场试验,结果表明识别速度由MobileNetv3-YOLOv4模型加速前的18.3帧/s提升至35.42帧/s,mAP为94.68%,满足现场实时、精确检测需求,且仅在矿车经过检测区域时启动检测任务,避免了因其他物体引起的司控道岔误动作现象。 展开更多
关键词 煤矿智能化 副井轨道分运 矿车装载物识别 目标检测模型 YOLOv4 模型加速
下载PDF
基于YOLO v2的莲蓬快速识别研究 被引量:5
4
作者 黄小杭 梁智豪 +2 位作者 何子俊 黄晨华 李湘勤 《现代农业科技》 2018年第13期164-167,169,共5页
受莲蓬形状外观和生长环境影响,传统计算机视觉算法识别莲蓬存在效率与精度不佳的问题。本文研究采用YOLO v2算法进行莲蓬识别的方式,通过扩充莲蓬检测数据集、K-means维度聚类、深度可分离卷积网络结构和多分辨率图像对模型微调等方法... 受莲蓬形状外观和生长环境影响,传统计算机视觉算法识别莲蓬存在效率与精度不佳的问题。本文研究采用YOLO v2算法进行莲蓬识别的方式,通过扩充莲蓬检测数据集、K-means维度聚类、深度可分离卷积网络结构和多分辨率图像对模型微调等方法实现提高识别精度、鲁棒性与识别速度。对比Darknet-19、Tiny Darknet与DS Tiny Darknet算法,结果表明,本文研究的识别方式可以达到102.1 fps的识别速率,可实现在复杂环境下对莲蓬的快速识别,满足莲蓬采摘机器人在采摘过程中对实时视觉信息的需求。 展开更多
关键词 莲蓬 识别 YOLO V2 深度学习 目标检测 模型加速
下载PDF
基于信息融合策略的卷积神经网络剪枝方法 被引量:3
5
作者 曲海成 张雪聪 王宇萍 《计算机工程与应用》 CSCD 北大核心 2022年第24期125-133,共9页
针对现有结构化剪枝方法过度依赖预训练模型和直接丢弃不重要卷积核的信息造成了明显的性能下降的问题,提出一种基于信息融合策略的卷积神经网络剪枝方法(APBM),以较小精度损失降低模型复杂度、实现模型加速。首先APBM方法引入信息熵概... 针对现有结构化剪枝方法过度依赖预训练模型和直接丢弃不重要卷积核的信息造成了明显的性能下降的问题,提出一种基于信息融合策略的卷积神经网络剪枝方法(APBM),以较小精度损失降低模型复杂度、实现模型加速。首先APBM方法引入信息熵概念以表示卷积核的相似度分布,并使用分布之间的相对熵动态衡量卷积核的重要程度;同时在训练的前向传播中采用信息融合策略:融合非重要卷积核信息与重要卷积核信息,以减少剪枝过程中的信息损失和提高剪枝的容错性。在CIFAR10和CIFAR100数据集上进行验证和对比实验。实验结果表明:相对于HRank、Polarization、SWP等剪枝算法,APBM方法训练时间更少、模型压缩率更高,精度保持最佳。在基于CIFAR10的剪枝任务中,对VGG16和ResNet56分别剪掉92.74%和48.84%的参数量;在基于CIFAR100的剪枝任务中,对VGG16和ResNet56分别剪掉72.91%和44.18%的参数量。 展开更多
关键词 结构化剪枝 信息熵 模型复杂度 模型加速 信息融合
下载PDF
“双碳”目标下绿色人工智能技术研究综述
6
作者 卢毓东 陈益 《浙江电力》 2023年第10期45-56,共12页
人工智能大规模训练导致了计算资源需求、能源需求及碳排放量的急剧攀升,不仅使人工智能技术自身实现“双碳”目标受到了严峻挑战,也限制了人工智能在电力巡检机器人、无人机等的边缘设备中的应用。在“双碳”目标下的电网数字化转型期... 人工智能大规模训练导致了计算资源需求、能源需求及碳排放量的急剧攀升,不仅使人工智能技术自身实现“双碳”目标受到了严峻挑战,也限制了人工智能在电力巡检机器人、无人机等的边缘设备中的应用。在“双碳”目标下的电网数字化转型期,研究绿色人工智能技术,实现节能减碳,对促进新型电力系统建设和人工智能技术进步具有重要意义。首先介绍了绿色人工智能的由来、定义及影响模型能耗的关键因素;接着探讨了绿色人工智能模型技术的发展现状、关键问题、改进方法和效果;然后讨论了高效硬件基础设施节能减碳的措施;最后对绿色人工智能技术的未来发展提出相关建议和展望。 展开更多
关键词 绿色人工智能 新型电力系统 节能 碳排放 模型加速
下载PDF
基于改进SOLO的列车主动避障视觉算法研究 被引量:3
7
作者 姚巍巍 田野 李晨 《电子测量技术》 北大核心 2022年第9期133-139,共7页
随着我国经济的高速全面发展,人民生活水平的日益提高,我国对于交通运输方面的需求越来越大。为了满足列车安全运行的需求,本文提出铁路场景下基于单阶段实例分割的列车主动避障视觉算法,针对铁路场景中侵线情况下检测物体多重叠的特点... 随着我国经济的高速全面发展,人民生活水平的日益提高,我国对于交通运输方面的需求越来越大。为了满足列车安全运行的需求,本文提出铁路场景下基于单阶段实例分割的列车主动避障视觉算法,针对铁路场景中侵线情况下检测物体多重叠的特点对算法模型进行了优化,改进主干网络和多尺度融合方法提高了模型的精度,利用TensorRT半精度加速和CUDA重构对模型进行了加速,并对本文方法和其他方法进行性能评价与对比试验。最终,本文方法在嵌入式平台Xavier上实现了71.2MAP和108 ms的速度,实现了车载部署下列车前方环境的高效高精度检测。 展开更多
关键词 深度学习 实例分割 标签分配 模型加速
下载PDF
基于深度学习的滤光片检测与精准定位研究
8
作者 张安 伍世虔 黄建龙 《机械制造与自动化》 2023年第4期12-15,共4页
针对滤光片产品定位检测准确率低、实时性差的问题,提出改进的YOLOv4检测算法,并提出强定位非极大值抑制方法,改善YOLOv4算法中传统非极大值抑制法的预测框处理过程,解决预测框定位偏差的问题;设计一种静态模型滤波器融合方法,对静态YOL... 针对滤光片产品定位检测准确率低、实时性差的问题,提出改进的YOLOv4检测算法,并提出强定位非极大值抑制方法,改善YOLOv4算法中传统非极大值抑制法的预测框处理过程,解决预测框定位偏差的问题;设计一种静态模型滤波器融合方法,对静态YOLOv4主干特征提取网络中的卷积、池化等耗时运算进行线性融合,解决网络检测实时性差的问题。实验结果表明:改进后的YOLOv4定位准确率达到99.41%,实时性比原始YOLOv4提高14帧/s。 展开更多
关键词 深度学习 YOLOv4 精准定位 非极大值抑制 模型加速
下载PDF
深度学习推理侧模型优化架构探索 被引量:3
9
作者 孟伟 袁丽雅 +1 位作者 韩炳涛 刘涛 《信息通信技术与政策》 2020年第9期42-47,共6页
论述了深度学习推理侧模型优化的历史起源,阐述了模型优化加速的整体架构和创新应用,提出了推理侧模型优化业务的发展建议。
关键词 模型优化 人工智能 模型加速
下载PDF
基于轻量级网络的钢铁表面缺陷分类 被引量:3
10
作者 史杨潇 章军 +1 位作者 陈鹏 王兵 《计算机应用》 CSCD 北大核心 2021年第6期1836-1841,共6页
缺陷分类是钢铁表面缺陷检测的重要内容。在卷积神经网络(CNN)取得良好效果的同时,网络日益增长的参数量耗费了大量计算成本,为缺陷分类任务在个人计算机或低算力设备上的部署带来了巨大的挑战。针对上述问题,提出了一种新颖的轻量级网... 缺陷分类是钢铁表面缺陷检测的重要内容。在卷积神经网络(CNN)取得良好效果的同时,网络日益增长的参数量耗费了大量计算成本,为缺陷分类任务在个人计算机或低算力设备上的部署带来了巨大的挑战。针对上述问题,提出了一种新颖的轻量级网络模型Mix-Fusion。首先,通过组卷积和通道洗牌两种操作,在保持精度的同时有效降低计算成本;其次,利用一个狭窄的特征映射对组间信息进行融合编码,并将生成的特征与原始网络结合,从而有效解决了"稀疏连接"卷积阻碍组间信息交换的问题;最后,用一种新型的混合卷积(Mix Conv)替代了传统的深度卷积(DWConv),以进一步提高模型的性能。在NEU-CLS数据集上的实验结果表明,Mix-Fusion网络在缺陷分类任务中的浮点运算次数和分类准确率分别为43.4 MFLOPs和98.61%。相较于Shuffle Net V2和Mobile Net V2网络,Mix-Fusion网络不仅降低了模型参数,压缩了模型大小,同时还得到了更好的分类精度。 展开更多
关键词 表面缺陷检测 缺陷分类 模型加速 深度学习 轻量级网络
下载PDF
基于嵌入式平台的卷积神经网络压缩加速方法 被引量:2
11
作者 贺彦钧 张旭博 《通信技术》 2022年第12期1636-1641,共6页
针对一般无人车或无人机平台算力较低,无法运行较大的深度神经网络目标检测模型,或者即使能运行也无法达到实时目标检测的问题,提出了基于特定嵌入式平台的轻量级卷积神经网络压缩加速方法,在结构中引入attention机制,采用分组卷积与快... 针对一般无人车或无人机平台算力较低,无法运行较大的深度神经网络目标检测模型,或者即使能运行也无法达到实时目标检测的问题,提出了基于特定嵌入式平台的轻量级卷积神经网络压缩加速方法,在结构中引入attention机制,采用分组卷积与快速卷积结构使模型推理速度加快,并通过知识蒸馏学习当前SOTA目标检测模型Fast的目标检测能力,最后通过后统计量化方法将推理模型进一步压缩提速,让模型在保持大型目标检测网络检测精度的同时,在嵌入式平台上也达到高精度实时运行的能力。在Nano无人车平台上,使用PASCAL VOC、ImageNet数据集对压缩后的目标检测模型进行实验验证。结果表明,模型参数量减少40%,平均精度均值(mean Average Precision,mAP)仅损失0.7%,每秒帧数(Frame Per Second,FPS)提升45%,并可在无人车上实时运行。 展开更多
关键词 模型加速 知识蒸馏 目标检测 attention机制
下载PDF
基于网络剪枝的轻量化道路损坏检测模型研究 被引量:1
12
作者 范良辰 夏颖慧 +1 位作者 李雨诗 陈绪君 《信息技术》 2022年第3期96-102,108,共8页
为了解决目标检测模型参数冗余大、终端部署检测实时性差等问题,文中引入一种基于网络通道剪枝的模型压缩算法。针对轻量级YOLOv4-MobileNet检测模型存在的通道冗余问题,提出了被动式剪枝和主动式剪枝两种优化方案。剪枝后模型Pruned_Mo... 为了解决目标检测模型参数冗余大、终端部署检测实时性差等问题,文中引入一种基于网络通道剪枝的模型压缩算法。针对轻量级YOLOv4-MobileNet检测模型存在的通道冗余问题,提出了被动式剪枝和主动式剪枝两种优化方案。剪枝后模型Pruned_Model参数量仅5.9M,推理速度达到324.8FPS,较原始模型压缩过5倍,加速近3倍,总体精度损失仅2.1%。结果表明,剪枝方案在道路损坏检测任务上以极小的精度损失换取了大规模的模型压缩。 展开更多
关键词 道路损坏检测 YOLOv4算法 网络剪枝 模型压缩 模型加速
下载PDF
基于灰色关联分析的卷积神经网络模型裁剪方法 被引量:2
13
作者 黄世青 白瑞林 覃高鄂 《激光与光电子学进展》 CSCD 北大核心 2020年第4期127-133,共7页
针对卷积神经网络巨大的计算量和存储量导致其难以应用于嵌入式终端设备的难题,提出了一种基于灰色关联分析的模型裁剪方法。利用基于灰色关联分析的裁剪方法处理经过数据训练后的权重模型文件,获得每个卷积核重要性的量化表示;每次裁... 针对卷积神经网络巨大的计算量和存储量导致其难以应用于嵌入式终端设备的难题,提出了一种基于灰色关联分析的模型裁剪方法。利用基于灰色关联分析的裁剪方法处理经过数据训练后的权重模型文件,获得每个卷积核重要性的量化表示;每次裁剪从模型中删除量化结果值最小的卷积核,从而减少计算量,加快推理速度;对于新产生的模型,通过迭代训练来弥补其性能上的损失。实验结果表明,相比APoZ法、L1法,所提方法在同一推理速度提升下精度提高了5.3%和10.4%,在VGG-16模型上取得了相对于初始模型2.7倍的加速效果,存储量压缩为原来的1/13.5。 展开更多
关键词 图像处理 模型裁剪 深度学习 卷积神经网络 灰色关联分析 模型加速
原文传递
基于DSD和剪枝的模型压缩与加速 被引量:1
14
作者 褚莹 凌力 《微型电脑应用》 2018年第11期54-56,共3页
针对现有模型压缩与加速方案难以兼顾压缩和速度的不足,设计了一种结合卷积核剪枝和DSD训练方法的新方案。将卷积核剪枝策略融入DSD训练方法,结合卷积核剪枝加速模型运行和DSD训练提高正确率的优点,提升加速效果,减小模型体积。与传统... 针对现有模型压缩与加速方案难以兼顾压缩和速度的不足,设计了一种结合卷积核剪枝和DSD训练方法的新方案。将卷积核剪枝策略融入DSD训练方法,结合卷积核剪枝加速模型运行和DSD训练提高正确率的优点,提升加速效果,减小模型体积。与传统方案相比,能够兼顾运行速度和模型大小的优化,是更为实用的方案。 展开更多
关键词 模型压缩 模型加速 剪枝策略 DSD
下载PDF
面向车规级芯片的对象检测模型优化方法 被引量:1
15
作者 宫大汉 于龙龙 +3 位作者 陈辉 杨帆 骆沛 丁贵广 《智能系统学报》 CSCD 北大核心 2021年第5期899-907,共9页
卷积神经网络复杂的网络结构使得模型计算复杂度高,限制了其在自动驾驶等实际终端场景中的应用。针对终端场景下的计算资源受限的问题,本文从轻量化深度模型设计和车规级芯片模型部署验证两方面进行研究。针对深度模型计算效率和检测精... 卷积神经网络复杂的网络结构使得模型计算复杂度高,限制了其在自动驾驶等实际终端场景中的应用。针对终端场景下的计算资源受限的问题,本文从轻量化深度模型设计和车规级芯片模型部署验证两方面进行研究。针对深度模型计算效率和检测精度的矛盾,本文设计了基于中心卷积的轻量化对象检测模型,实现功耗低且精度高的模型性能。进一步,本文基于量化感知训练的模型加速部署方法在车规级芯片上开展了系统级部署验证,在车规级芯片tda4上成功实现了高效的对象检测模型,在自动驾驶场景中取得了良好的性能。 展开更多
关键词 人工智能 计算机视觉 对象检测 终端设备 车规级芯片 卷积神经网络 模型加速 模型量化
下载PDF
在轨高效目标检测加速技术
16
作者 呼延烺 李映 +4 位作者 蒋冬梅 张艳宁 周诠 魏佳圆 刘娟妮 《宇航学报》 EI CAS CSCD 北大核心 2022年第11期1544-1556,共13页
针对深度卷积网络目标检测算法参数量大、计算量大以及受星上计算资源、存储资源及功耗的限制,难以实现在轨部署的问题,提出了一种在轨高效目标检测算法加速框架与实现方法。首先,设计了一种可以同时兼容三种卷积算子的计算引擎,有效提... 针对深度卷积网络目标检测算法参数量大、计算量大以及受星上计算资源、存储资源及功耗的限制,难以实现在轨部署的问题,提出了一种在轨高效目标检测算法加速框架与实现方法。首先,设计了一种可以同时兼容三种卷积算子的计算引擎,有效提高了资源利用率;其次,从通道和卷积核两个维度将目标检测算法模型展开,实现了加速器的高度并行化和可扩展性;最后,在多种FPGA平台上实现了该加速器并对其性能进行了评估。实验结果表明:所提出的加速器计算性能可以达到1843.2 GFLOPs(每秒千兆次浮点运算),推理时间为0.22 ms。与同类加速器方案相比,所提出的加速器框架在性能、功耗、能效比及推理时间方面具有很大优势,适合部署在资源受限环境中,具有良好的星上应用前景和价值。 展开更多
关键词 目标检测 模型量化 模型加速 计算强度 卷积神经网络
下载PDF
基于嵌入式GPU平台的列车运行环境检测算法 被引量:1
17
作者 熊敏君 李晨 +2 位作者 张慧源 彭联贴 苏震 《控制与信息技术》 2021年第4期72-77,共6页
列车运行环境的实时检测是实现列车自动驾驶的重要前提。针对传统列车运行环境检测算法存在的效率低、精度差、鲁棒性弱等问题,文章提出了一种基于图像实例分割的列车运行环境实时检测算法。其通过车载摄像头获取列车运行环境的图像数据... 列车运行环境的实时检测是实现列车自动驾驶的重要前提。针对传统列车运行环境检测算法存在的效率低、精度差、鲁棒性弱等问题,文章提出了一种基于图像实例分割的列车运行环境实时检测算法。其通过车载摄像头获取列车运行环境的图像数据,进行样本标注、图像增强等预处理工作;采用改进的实例分割网络MaskRCNN进行模型训练,并基于TensorRT实现模型优化加速。最后,在嵌入式GPU平台NVIDIA-Xavier上进行模型的性能验证,优化后模型在验证集下的目标检测精度达到94.75%,模型推理速度约为原来的6倍,满足列车自动驾驶运行环境的实时检测需求。 展开更多
关键词 实例分割 列车运行环境 空洞卷积 模型加速 嵌入式平台 列车自动驾驶
下载PDF
视频质量增强模型加速算法 被引量:1
18
作者 杨文哲 徐迈 白琳 《中兴通讯技术》 2021年第1期21-26,共6页
提出了一种应用于视频质量增强算法的动态结构性剪裁算法Maskcut,它可以有效提高基于深度学习的视频质量增强算法的运行速度。Maskcut是一种通用的剪裁思路,支持绝大多数的基于卷积神经网络(CNN)深度学习网络模型的剪裁加速。基于原模... 提出了一种应用于视频质量增强算法的动态结构性剪裁算法Maskcut,它可以有效提高基于深度学习的视频质量增强算法的运行速度。Maskcut是一种通用的剪裁思路,支持绝大多数的基于卷积神经网络(CNN)深度学习网络模型的剪裁加速。基于原模型中已经训练好的参数数据,Maskcut使用一种针对剪裁加速的二次训练策略来进一步微调参数,从而在保证模型有效性损失不大的同时,缩短模型运行时间。以一种先进的视频质量增强算法——多帧质量增强2.0(MFQE 2.0)为目标,Maskcut剪裁后可以快速达到峰值信噪比(PSNR)指标损失低于1%、时间缩短10%以上的加速指标。 展开更多
关键词 模型加速 图像质量增强 结构性剪裁
下载PDF
基于Bottleneck的目标检测网络模型加速研究
19
作者 徐小成 万海斌 +1 位作者 蒋家基 覃团发 《广西大学学报(自然科学版)》 CAS 北大核心 2022年第5期1306-1313,共8页
针对YOLOv5的网络结构能降低模型复杂度,并解决数据不均衡问题,根据YOLOv5的结构特点,采取5种Bottleneck的替代方案,即IBN层、融合IBN层、Tucker卷积层、SPBottleneck和SEGBottleneck。实验基于COCO数据集,实验结果表明与改进前的Bottle... 针对YOLOv5的网络结构能降低模型复杂度,并解决数据不均衡问题,根据YOLOv5的结构特点,采取5种Bottleneck的替代方案,即IBN层、融合IBN层、Tucker卷积层、SPBottleneck和SEGBottleneck。实验基于COCO数据集,实验结果表明与改进前的Bottleneck相比,所提的IBN层、Tucker卷积层以及SEGBottleneck对模型的复杂度都有明显降低。模型规模分别减小了24.5%、22.5%和20.0%,模型运行速度分别提升了3.0%、3.8%和1.5%。基于Traffic数据集数据不均衡实验的结果表明:空间不均衡问题可以通过引入Focal EIoU解决;选择合适超参数能够加速模型的收敛,解决类别不均衡问题。 展开更多
关键词 模型加速 瓶颈 数据均衡 COCO数据集
下载PDF
基于视觉的嵌入式路面标识检测算法研究
20
作者 许大展 吴晓雨 《中国传媒大学学报(自然科学版)》 2021年第4期55-62,共8页
路面标识为无人驾驶提供重要的道路视觉信息,路面标识的正确识别是行车安全的前提。由于实际道路场景的复杂多变性,传统路面标识检测方法在嵌入式平台下算法鲁棒性和实时性方面仍面临着一些挑战。本文提出了嵌入式平台Jetson TX2下路面... 路面标识为无人驾驶提供重要的道路视觉信息,路面标识的正确识别是行车安全的前提。由于实际道路场景的复杂多变性,传统路面标识检测方法在嵌入式平台下算法鲁棒性和实时性方面仍面临着一些挑战。本文提出了嵌入式平台Jetson TX2下路面标识检测网络模型及优化算法:首先给出了基于层合并的区域全卷积网络R-FCN(Region-based Fully Convolutional Networks)的简化模型,实现了路面标识的高精度检测;接着,为了满足实际应用中实时推理需求,将简化的R-FCN网络模型部署在嵌入式平台NVIDIA Jetson TX2上,构建了基于TensorRT的模型推理优化加速方法,在嵌入式平台上实现了快速准确路面标识算法。该算法在自建路面标识库和相应的公开数据库进行了测试,实验结果验证了算法的有效性。 展开更多
关键词 路面标识检测 模型加速 嵌入式平台TX2 TensorRT
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部