-
题名一种融合运动特征嵌入的多目标分割跟踪算法
被引量:2
- 1
-
-
作者
许营坤
陈天阳
陈胜勇
徐新黎
-
机构
浙江工业大学计算机科学与技术学院
天津理工大学计算机科学与工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2023年第6期1304-1310,共7页
-
基金
国家自然科学基金项目(62020106004,92048301)资助
浙江省自然科学基金项目(LY20F020029)资助
浙江省科技计划公益项目(LGG20F020017)资助.
-
文摘
针对现有多目标跟踪算法中存在目标运动模糊和相互遮挡的难点,在单阶段和无锚框的实例分割框架下,提出了一种融合运动特征嵌入的多目标分割跟踪算法.首先,提取当前帧与前后两帧光流场中的运动信息对表观特征进行运动补偿,再利用特征金字塔网络融合含有运动信息的多尺度特征,提高了目标检测性能.其次,通过两个用于提升网络预测性能的损失函数的设计和使用,进一步减少了由于检测器失效和目标遮挡而导致的漏检.最后,关联网络提取目标的外观特征,并通过预测并关联的更新轨迹策略将可靠的跟踪结果合并至轨迹.实验结果表明,本文提出的算法在MOTS20训练集上跟踪准确度达到了66.0%,测试集上达到了63.1%,与同类算法相比,本文算法表现出更好的有效性.
-
关键词
多目标跟踪
目标检测
目标分割
特征嵌入
-
Keywords
multi-object tracking
object detection
object segmentation
feature fusion
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名局部最近邻密度和颜色特征加权的超像素生成
被引量:1
- 2
-
-
作者
徐新黎
邢少恒
王凯栋
许营坤
管秋
王万良
-
机构
浙江工业大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2023年第1期117-123,共7页
-
基金
国家自然科学基金项目(61873240)资助
浙江省公益科技计划项目(LGG20F020017)资助
浙江省自然科学基金项目(LY20F020029,LY21F020027)资助。
-
文摘
作为计算机视觉领域的重要预处理步骤,超像素生成算法近年来受到广泛关注与研究.为了快速、高效地生成高质量的超像素,提出一种基于局部最近邻密度和颜色特征加权的超像素生成算法(NDPCS).算法分为两个阶段:1)结合图像中像素点最近邻居信息,计算各像素点的局部密度和局部密度最大值点决策值,选择拥有大决策值的像素点作为聚类中心,并根据颜色特征加权距离归类其他像素点,生成初始超像素;2)采用启发式合并策略,在保留边缘贴合度的前提下合并过小和孤立的初始超像素,保证超像素的连通性和一致性.实验在Berkeley数据集BSDS500上进行验证,本文所提方法在边缘召回率、欠分割误差和可达分割精度这些通用的评价指标上表现优良,可以为任意彩色图像快速生成高质量的超像素.
-
关键词
超像素分割
密度峰值
像素聚类
局部密度
图像处理
-
Keywords
superpixel segmentation
density peak
pixel clustering
local density
image processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于锚框稀疏图像金字塔的MTCNN人脸检测方法
被引量:1
- 3
-
-
作者
李丽平
许营坤
王嘉航
-
机构
浙江商业职业技术学院财会金融学院
浙江工业大学计算机科学与技术学院
-
出处
《浙江工业大学学报》
CAS
北大核心
2023年第3期298-304,318,共8页
-
基金
浙江省自然科学基金资助项目(LY20F020029)。
-
文摘
针对MTCNN 3层级联网络结构中P-Net和R-Net耗时较多的问题,提出一种改进的MTCNN人脸检测方法。采用锚框的思路增加生成框的密度,减少图像金字塔层数,构建基于锚框的稀疏图像金字塔,提高P-Net检测速度;采用深度可分离卷积的思路来改进R-Net网络结构,去掉池化层,修改前2个卷积层的步幅,修改第3个卷积层为可分离卷积,降低R-Net模型的参数计算量,提高R-Net检测速度;在P-Net检测前进行一次中值滤波,以减少图像中的噪点,降低P-Net误检率。实验结果表明:改进MTCNN在检测精度略有提升的情况下,在Windows和Android平台上的检测速度均可提升近一倍,在工业界有重要的应用价值。
-
关键词
人脸检测
MTCNN
基于锚框的稀疏图像金字塔
深度可分离卷积
-
Keywords
face detection
MTCNN
sparse image pyramid based on anchor box
depth separable convolution
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于内容的图像检索系统的设计与实现
被引量:2
- 4
-
-
作者
许营坤
王崇骏
杨育彬
陈世福
-
机构
南京大学计算机软件新技术国家重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2004年第2期139-141,共3页
-
基金
江苏省应用基础研究的资助(BJ200109)
-
文摘
本文描述了基于内容的图像检索系统@IMAGE的设计和实现。该系统综合运用了多媒体、媒体存储、数据组织和表示方法、图像检索技术等。也介绍了基于图像颜色、形状和纹理的检索算法。给出了@IMAGER系统结构、实现技术和功能。
-
关键词
图像检索系统
图像标识
图像匹配算法
图像处理
图像识别
多媒体
-
Keywords
Image retrieval,Content based image retrieval,Image database,Feature extraction
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TN911.73
[自动化与计算机技术—计算机科学与技术]
-
-
题名FPD-ViT:面部疼痛检测视觉转换器
- 5
-
-
作者
潘家航
王嘉航
施展
许营坤
许永安
黄晓霞
-
机构
浙江工业大学土木工程学院
浙江工业大学计算机科学与技术学院
浙江大学医学院附属第二医院急诊医学科
-
出处
《计算机应用》
CSCD
北大核心
2023年第S02期77-82,共6页
-
基金
浙江省自然科学基金资助项目(LY20F020029)。
-
文摘
在临床医学中,危重患者的疼痛表现是医护人员判断是否对其使用止痛、镇静药物的重要指标。在真实监护场景下,病患面部的大量遮挡物严重影响了基于深度学习的面部疼痛检测算法的判别能力。针对以上问题,将卷积神经网络(CNN)与ViT(Vision Transformer)相结合,优化Res2Net块和Transformer块,并通过基于通道分割的卷积和残差连接构建了一种网络结构——面部疼痛检测视觉转换器(FPD-ViT)。FPD-ViT具有强大的多尺度特征提取能力,它的注意力机制能有效捕获人脸运动单元特征。在公共数据集UNBC-McMaster和浙江大学医学院附属第二医院急诊科的实际数据集上的实验结果表明,FPD-ViT的面部疼痛检测准确率分别达到99.14%和97.63%,相较于ViT提高了0.96和2.44个百分点;参数量和模型大小比ViT降低了36.03%和21.12%,计算成本和数据需求显著降低。
-
关键词
计算机视觉
自注意力
卷积神经网络
疼痛表现
疼痛检测
-
Keywords
computer vision
self-attention
Convolutional Neural Network(CNN)
pain manifestation
pain detection
-
分类号
TP389.1
[自动化与计算机技术—计算机系统结构]
-
-
题名利用社区选举和链路预测的分类方法
- 6
-
-
作者
杨旭华
陈孝则
王磊
许营坤
叶蕾
毛剑飞
-
机构
浙江工业大学计算机科学与技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第8期1569-1576,共8页
-
基金
国家自然科学基金面上项目(61773348)资助
浙江省自然科学基金项目(LY20F020029)资助.
-
文摘
分类方法通过比较数据之间的相似性,把不同特征或属性的数据分别归属到不同的类别,在金融、医学和生物等领域有着广泛的应用.本文首次提出了一种利用社区选举和链路预测的分类方法(CCELP),该方法首先用k近邻算法将数据集转化成一个稀疏网络,接着使用社区检测算法把网络划分为多个社区,并通过投票选举得到每个社区的代表节点,移除不符合“过半数原则”的部分代表节点,将剩余代表节点同社区内节点相连得到新网络;接着提出了考虑二级共同邻居的分类链路预测(CLP)指标,在新网络中按照节点和代表节点间的CLP指标把节点归属到不同的类别中去,从而完成数据分类.在16个数据集上,CCELP与8种知名分类方法进行了比较,实验结果表明CCELP具有优异的分类效果.
-
关键词
社区检测
链路预测
机器学习
社区选举
分类算法
-
Keywords
community detection
link prediction
machine learning
community election
classification algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于全局注意力机制的属性网络表示学习
- 7
-
-
作者
许营坤
马放南
杨旭华
叶蕾
-
机构
浙江工业大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2021年第12期188-194,共7页
-
基金
国家自然科学基金项目(61773348)
浙江省自然科学基金(LY20F020029)。
-
文摘
属性网络不仅具有复杂的拓扑结构,其节点还包含丰富的属性信息。属性网络表示学习方法同时提取网络拓扑结构和节点的属性信息来学习大型属性网络的低维向量表示,在节点分类、链路预测和社区识别等网络分析技术方面具有非常重要和广泛的应用。文中首先根据属性网络的拓扑结构得到网络的结构嵌入向量;接着通过全局注意力机制来学习相邻节点的属性信息,先用卷积神经网络对节点的属性信息作卷积操作得到隐藏向量,再对卷积的隐藏向量生成全局注意力的权重向量和相关性矩阵,进而得到节点的属性嵌入向量;最后将结构嵌入向量和属性嵌入向量连接得到同时反映网络结构和节点属性的联合嵌入向量。在3个真实数据集上,将提出的新算法与当前的8种知名网络表示学习模型在链路预测和节点分类等任务上进行比较,实验结果表明新算法具有良好的属性网络表示效果。
-
关键词
全局注意力
卷积神经网络
结构嵌入
属性嵌入
联合嵌入
-
Keywords
Global attention mechanism
Convolutional neural network
Structure embedding
Attribute embedding
Joint embedding
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-