-
题名多尺度融合的双分支特征提取人群计数算法
- 1
-
-
作者
曾芸芸
张红英
袁明东
-
机构
西南科技大学信息工程学院
西南科技大学特殊环境机器人技术四川省重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第20期224-232,共9页
-
基金
国家自然科学基金(61872304)。
-
文摘
人群计数在公共安全管理、公共空间设计以及其他视觉任务如行为分析、拥塞分析等方面具有重要的应用。然而复杂的背景和人头尺度大小不一导致人群计数的效果并不理想。针对静态图像中尺度变化和背景干扰问题,提出了一种基于双分支中间特征提取的人群计数网络——DBFE_MFNet。该网络沿用编码-解码器结构,在编码阶段使用VGG19卷积神经网络的前16层,为了更好融合多尺度信息,将VGG19卷积神经网络的前16层的后4层卷积替换成空洞率为2的膨胀卷积,解码部分采用抑制背景干扰的残差卷积注意力模块(residual convolutional attention module,RCAM),在编码-解码器结构中间插入双分支中间特征提取模块(dual branch intermediate feature extraction module,DBFE),分支1采用金字塔结构并融合位置注意力模块提取多尺度上下文信息,分支2沿用金字塔结构融合双通道注意力机制使模型关注不同大小人头信息,最后使用1×1卷积生成密度图。实验方面,在ShanghaiTech PartA、ShanghaiTech PartB、Mall数据集上进行了算法对比实验,DBFE_MFNet模型在上述数据集的平均绝对误差和均方根误差分别为63.2、7.1、1.80和99.2、11.8、2.28,经对比实验分析,DBFE_MFNet模型具有不错的计数性能和稳定性能;在ShanghaiTech PartB进行了消融实验,实验验证了模型各模块的有效性。
-
关键词
人群计数
VGG19
编码-解码器
残差卷积注意力模块
双分支中间特征提取模块
-
Keywords
crowd counting
VGG19
encoder decoder
residual convolutional attention module(RCAM)
dual branch intermediate feature extraction module(DBFE)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-