面向AI芯片的轻量级目标检测算法研究

Research on lightweight target detection algorithm for AI chip

下载PDF

导出

摘要目标检测网络层数越多、参数规模越大,其精度越高,但对于低算力的边缘端AI芯片来说,部署超大规模参数量的网络,无法达到实时性的要求。为此,文中基于YOLOv5,提出一种面向AI芯片的轻量化的YOLOv5_RepVGG目标检测算法。首先对YOLOv5的骨干网络进行改进,设计RepVGG_X模块结构,在训练时通过3×3卷积、1×1卷积和直连三种分支结构提取图像特征;在网络推理时通过结构重参数化将1×1卷积和直连与3×3卷积进行融合,最终形成一个3×3的单分支结构。然后对YOLOv5的输出层进行改进,充分利用骨干网络中6次降采样的多尺度信息,输出4种尺度的特征图。最后将设计的轻量化网络部署在国产AI芯片Hi3559AV100上并进行验证。实验结果表明,与传统YOLOv5相比,当网络精度仅下降3个点时,所提算法在AI芯片上的推理时间降到18.6 ms,速度提升近1倍,可满足日益增长的边缘场景AI计算任务实时性的要求。 The more layers of target detection network and the larger the parameter scale,the higher the accuracy will be.However,for the edge AI chip with low computing power,the network with a large number of parameters cannot meet the real⁃time requirements.Therefore,a lightweight YOLOv5_RepVGG target detection algorithm for AI chip is proposed based on YOLOv5.The backbone network of YOLOv5 is improved,and the RepVGG_X module structure is designed.During training,image features are extracted by means of three branch structures:3×3 convolution,1×1 convolution and direct connection.During network reasoning,1×1 convolution and direct connection are fused with 3×3 convolution by means of structural reparameterization to form a 3×3 single branch structure.The output layer of YOLOv5 is improved to make full use of the multi⁃scale information of 6 downsamplinies in the backbone network,and the feature maps with 4 scales are output.The designed lightweight network is deployed and verified on the domestic AI chip Hi3559AV100.The experimental results show that in comparison with the traditional YOLOv5,the reasoning time of the proposed algorithm on the AI chip is reduced to 18.6 ms,and the speed is nearly doubled,which can meet the growing demand of real⁃time AI computing tasks in edge scenes.

作者曹朋军傅哲 CAO Pengjun;FU Zhe(Institute of Automatic Control,Xi’an Jiaotong University,Xi’an 710000,China)

机构地区西安交通大学自动控制研究所

出处《现代电子技术》 2023年第6期169-174,共6页 Modern Electronics Technique

关键词目标检测 AI芯片骨干网络 Hi3559AV100 轻量化模型边缘计算单分支结构结构重参数化 target detection AI chips backbone network Hi3559AV100 lightweight model edge calculation single branch structure structure reparameterization

分类号 TN911.23-34 [电子电信—通信与信息系统] TP391.4 [电子电信—信息与通信工程]

引文网络
相关文献

参考文献5

1尹首一,郭珩,魏少军.人工智能芯片发展的现状及趋势[J].科技导报,2018,36(17):45-51. 被引量：34
2陈桂林,马胜,郭阳.硬件加速神经网络综述[J].计算机研究与发展,2019,56(2):240-253. 被引量：17
3陈云霁..智能计算系统[M].北京:机械工业出版社,2020.
4葛道辉,李洪升,张亮,刘如意,沈沛意,苗启广.轻量级神经网络架构综述[J].软件学报,2020(9):2627-2653. 被引量：50
5许柯..深度神经网络加速器软硬件协同设计方法研究[D].北京交通大学,2021:

二级参考文献6

1Tom R.Halfhill,马志强.XMOS重新定义晶圆——软件定义芯片挑战ASIC、ASSP以及FPGA[J].电子产品世界,2007,14(10):80-80. 被引量：1
2韩俊刚,刘有耀,张晓.图形处理器的历史现状和发展趋势[J].西安邮电学院学报,2011,16(3):61-64. 被引量：24
3Zhen LI,Yuqing WANG,Tian ZHI,Tianshi CHEN.A survey of neural network accelerators[J].Frontiers of Computer Science,2017,11(5):746-761. 被引量：4
4Jeff Dorsch.现场可编程门阵列FPGA芯片及其应用[J].集成电路应用,2018,35(1):77-79. 被引量：9
5孙永杰.地平线:架构创新BPU 算法+芯片+云一体化[J].通信世界,2018,0(13):29-29. 被引量：2
6李楚曦,樊晓桠,赵昌和,张盛兵,王党辉,安建峰,张萌.基于忆阻器的PIM结构实现深度卷积神经网络近似计算[J].计算机研究与发展,2017,54(6):1367-1380. 被引量：2

共引文献98

1张政馗,庞为光,谢文静,吕鸣松,王义.面向实时应用的深度学习研究综述[J].软件学报,2020(9):2654-2677. 被引量：35
2安宝磊.AI芯片的落地场景和关键技术分析[J].微纳电子与智能制造,2021,3(4):87-91.
3尹首一.人工智能芯片概述[J].微纳电子与智能制造,2019,1(2):7-11. 被引量：16
4潘婷婷,陈文佳,谌凯,仇秋飞.基于专利分析和文献计量的我国神经网络芯片发展研究[J].科技通报,2021,37(10):120-127. 被引量：4
5褚世旋.人工智能芯片及其应用技术分析[J].中国新通信,2019,21(2):5-6. 被引量：1
6缪希辰.人工智能芯片分类及反思[J].科技传播,2019,11(5):135-137. 被引量：2
7向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿.基于细粒度数据流架构的稀疏神经网络全连接层加速[J].计算机研究与发展,2019,56(6):1192-1204. 被引量：11
8华一村,曹源,张义红,邓开连,李楠.应用型创新人才培养的FPGA实验教学研究[J].实验室研究与探索,2019,38(8):184-188. 被引量：13
9袁鑫.人工智能芯片植入人体应用及发展研究[J].数码设计,2019,8(10):6-6.
10任延武,王文博.明确人工智能民事主体地位或权利的可行性分析[J].珠江论丛,2019,0(2):27-46. 被引量：4

1高静,段中兴,何宇超.多尺度特征融合的轻量型垃圾分类方法[J].小型微型计算机系统,2023,44(2):376-382. 被引量：1
2沈艾娥,王力.互动仪式链视角下网络推理类综艺的普法分析[J].全球传媒学刊,2022,9(4):45-60. 被引量：3
3王浩,尹增山,刘国华,胡登辉,高爽.轻量化的光学遥感影像目标检测方法[J].激光与光电子学进展,2022,59(22):102-113. 被引量：4
4魏颖,林子涵,齐林,李伯群.基于空间自注意力机制和深度特征重建的脑MR图像分割方法[J].东北大学学报（自然科学版）,2023,44(2):177-185. 被引量：4
5Wang Chengcheng,Li He,Cao Yanpeng,Song Changjun,Yu Feng,Tang Yongming.WinoNet:Reconfigurable look-up table-based Winograd accelerator for arbitrary precision convolutional neural network inference[J].Journal of Southeast University(English Edition),2022,38(4):332-339.
6朱世松,马婉丽,赵理山,郑艳梅,郑先波,芦碧波.基于改进的LinkNet的苹果叶片图像分割算法[J].浙江农业学报,2023,35(1):202-214. 被引量：2
7陆健强,梁效,余超然,兰玉彬,邱洪斌,黄捷伟,尹梓濠,陈慧洁,郑胜杰.基于坐标注意力机制与高效边界框回归损失的线虫快速识别[J].农业工程学报,2022,38(22):123-132. 被引量：6

现代电子技术

2023年第6期

浏览历史

内容加载中请稍等...

面向AI芯片的轻量级目标检测算法研究

参考文献5

二级参考文献6

共引文献98

相关作者

相关机构

相关主题

浏览历史