-
题名基于图像增强与样本平衡优化的行人属性识别
被引量:1
- 1
-
-
作者
韦学艳
吴春雷
王雷全
吴杰
李阳
-
机构
中国石油大学(华东)计算机科学与技术学院
-
出处
《计算机系统应用》
2022年第6期202-209,共8页
-
基金
山东省自然科学基金(ZR2020MF136)
国家自然科学基金(62072469)。
-
文摘
由于采用的监控图像尺寸较小、分辨率低等原因,行人属性识别一直是一个极具挑战性的任务,而低分辨率的图像往往又导致数据集存在识别行人主体区域不突出、背景噪音干扰严重等问题.之前的方法大多将未作处理的原始图像作为输入,使得属性识别效果一直不够理想,并且,属性识别的主流数据集通常存在正负样本不平衡的问题,例如,许多行人的服装属性分布有着季节性或习俗性的偏差.因此,本文提出一个新的深度学习网络——图像增强与样本平衡优化模型IEBO (image enhancement and sample balance optimization).该模型通过色彩增强与提取行人主体区域的噪音抑制方法,在突出行人核心特征的同时消除无用背景信息,防止其对属性识别造成干扰.另外模型通过权重调节针对样本不平衡的属性进行优化,提高不平衡属性的识别能力.实验最终表明,新的行人属性识别模型在Market-1501-attribute数据集中取得了较好的性能.
-
关键词
行人属性识别
图像增强
色彩增强
背景噪音抑制
样本平衡优化
深度学习
-
Keywords
pedestrian attribute recognition
image enhancement
color enhancement
background noise suppression
sample balance optimization
deep learning
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于访问控制模块与原始信息注入的图像描述
- 2
-
-
作者
李阳
路静
郝宇钦
韦学艳
吴春雷
-
机构
中国石油大学(华东)计算机科学与技术学院
-
出处
《计算机系统应用》
2022年第7期106-112,共7页
-
基金
山东省自然科学基金(ZR2020MF136)
中央高校自主创新科研计划(20CX05018A)。
-
文摘
近年来在图像描述领域对于应用场景图生成描述的研究越来越广泛.然而,当前基于场景图的图像描述模型并未考虑到长短期记忆神经网络(LSTM)对于先前输入的细节信息的保留,这可能会导致细节信息的丢失.针对这个问题,本文提出基于原始信息注入的图像描述网络,该网络对基线模型中语言LSTM的输入变量做了改进,目的是尽可能多地保留原始输入信息,减少输入信息在计算过程中的损失.另外,本文还认为当前的场景图更新机制中存在结点更新程度过大的问题,因此本文设计了一个访问控制模块更新已访问过的结点权重,避免引起结点信息丢失的问题.同时,本文设计一个图更新系数(GUF)来指导图更新,以确定更新程度的大小.本文在官方数据集MSCOCO上进行了实验,各种评估机制的实验结果表明,基于访问控制模块与原始信息注入的图像描述模型与基线模型对比,取得了更有竞争力的结果,表现出明显的优越性.
-
关键词
图像描述
场景图
访问控制
长短期记忆网络
原始信息注入
-
Keywords
image captioning
scene graph
visiting control
LSTM network
original information injection
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-