期刊文献+
共找到98篇文章
< 1 2 5 >
每页显示 20 50 100
基于多尺度特征增强与全局-局部特征聚合的视频目标分割算法
1
作者 侯志强 董佳乐 +3 位作者 马素刚 王晨旭 杨小宝 王昀琛 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第11期4198-4207,共10页
针对记忆网络算法中多尺度特征表达能力不足和浅层特征没有充分利用的问题,该文提出一种多尺度特征增强与全局-局部特征聚合的视频目标分割(VOS)算法。首先,通过多尺度特征增强模块融合可参考掩码分支和可参考RGB分支的不同尺度特征信息... 针对记忆网络算法中多尺度特征表达能力不足和浅层特征没有充分利用的问题,该文提出一种多尺度特征增强与全局-局部特征聚合的视频目标分割(VOS)算法。首先,通过多尺度特征增强模块融合可参考掩码分支和可参考RGB分支的不同尺度特征信息,增强多尺度特征的表达能力;同时,建立了全局-局部特征聚合模块,利用不同大小感受野的卷积操作来提取特征,并通过特征聚合模块来自适应地融合全局区域和局部区域的特征,这种融合方式可以更好地捕捉目标的全局特征和细节信息,提高分割的准确性;最后,设计了跨层融合模块,利用浅层特征的空间细节信息来提升分割掩码的精度,通过将浅层特征与深层特征融合,能更好地捕捉目标的细节和边缘信息。实验结果表明,在公开数据集DAVIS2016,DAVIS2017和YouTube-2018上,该文算法的综合性能分别达到91.8%、84.5%和83.0%,在单目标和多目标分割任务上都能实时运行。 展开更多
关键词 视频目标分割 记忆网络 孪生网络 特征融合 掩码细化
下载PDF
主题爬虫技术研究综述 被引量:44
2
作者 潘晓英 陈柳 +2 位作者 余慧敏 赵逸喆 肖康泞 《计算机应用研究》 CSCD 北大核心 2020年第4期961-965,972,共6页
随着移动互联网的普及以及网络信息指数的增长,如何有效地提取和利用这些信息面临巨大挑战。介绍了主题爬虫的工作原理、分类;回顾了近年来国内外关于主题爬虫的研究状况,分析了各种主题相似度的方法以及搜索策略,得出相比于普通的爬虫... 随着移动互联网的普及以及网络信息指数的增长,如何有效地提取和利用这些信息面临巨大挑战。介绍了主题爬虫的工作原理、分类;回顾了近年来国内外关于主题爬虫的研究状况,分析了各种主题相似度的方法以及搜索策略,得出相比于普通的爬虫系统,基于网页内容和基于链接分析的爬虫系统的查准率、查全率都大幅提升;最后分析比较了主题网络爬虫两种动态搜索策略并指出了未来研究方向。 展开更多
关键词 网络爬虫 主题爬虫 相似度 网页内容 链接分析
下载PDF
大学计算机基础课程多元化立体思政体系建设 被引量:36
3
作者 李培 刘擎 白琳 《计算机教育》 2021年第1期93-96,共4页
在大力推进高校课程思政的背景下,针对大学计算机基础课程的教学实际,系统分析大学计算机基础课程的教学内容、授课对象、教学特色及教学资源,深入挖掘多元化课程思政元素,提出构建涵盖线上慕课、线下课程、线下课堂翻转、线下课程竞赛... 在大力推进高校课程思政的背景下,针对大学计算机基础课程的教学实际,系统分析大学计算机基础课程的教学内容、授课对象、教学特色及教学资源,深入挖掘多元化课程思政元素,提出构建涵盖线上慕课、线下课程、线下课堂翻转、线下课程竞赛的立体思政体系,介绍具体体系建设过程。 展开更多
关键词 大学计算机基础 课程思政 立体思政
下载PDF
边缘计算:发展与挑战 被引量:23
4
作者 高聪 陈煜喆 +3 位作者 张擎 陈彦萍 王忠民 杨怡娜 《西安邮电大学学报》 2021年第4期7-19,共13页
通过对边缘计算的特征、整体架构及其独特优点的全面梳理,系统分析和阐述了边缘计算的典型应用场景,在此基础上剖析边缘计算关键技术的发展现状、发展趋势及面临的技术难题。同时,指出现有标准与法律法规的不足。针对边缘计算领域的发... 通过对边缘计算的特征、整体架构及其独特优点的全面梳理,系统分析和阐述了边缘计算的典型应用场景,在此基础上剖析边缘计算关键技术的发展现状、发展趋势及面临的技术难题。同时,指出现有标准与法律法规的不足。针对边缘计算领域的发展前景,从推动因素、技术的难点以及外部挑战3个方面进行总结,展望了边缘计算的发展方向及未来需要重点攻克的安全与隐私、服务发现和用户切换等6个方面的关键技术问题。 展开更多
关键词 第五代移动通信技术 边缘计算 云计算 工业物联网 车联网
下载PDF
YOLOv8-VSC:一种轻量级的带钢表面缺陷检测算法 被引量:19
5
作者 王春梅 刘欢 《计算机科学与探索》 CSCD 北大核心 2024年第1期151-160,共10页
目前在带钢表面缺陷检测领域,通用的目标检测算法复杂度高、计算量庞大,而一些中小型企业负责检测的终端设备通常不具备较强的计算能力,计算资源有限,从而导致检测算法部署困难。为解决该问题,基于YOLOv8n目标检测框架,提出一种轻量级... 目前在带钢表面缺陷检测领域,通用的目标检测算法复杂度高、计算量庞大,而一些中小型企业负责检测的终端设备通常不具备较强的计算能力,计算资源有限,从而导致检测算法部署困难。为解决该问题,基于YOLOv8n目标检测框架,提出一种轻量级的带钢表面缺陷检测模型YOLOv8-VSC。该模型使用轻量级的VanillaNet网络作为骨干特征提取网络,通过减少不必要的分支结构降低模型的复杂度。同时,引入SPD模块在减少网络层数的同时加快模型的推理速度。为了进一步提升检测精度,在特征融合网络中,使用轻量级的上采样算子CARAFE,提高融合特征的质量和丰富度。最后,在NEU-DET数据集上进行大量实验,得到模型的参数量与计算量为1.96×106和6.0 GFLOPs,仅为基线的65.1%和74.1%,mAP达到80.8%,较基线提升1.8个百分点。此外,在铝材表面缺陷数据集和VOC2012数据集上的实验结果表明所提算法具有良好的鲁棒性。与先进的目标检测算法相比,所提算法在保证高检测精度的前提下需要的计算资源更少。 展开更多
关键词 缺陷检测 带钢表面缺陷 YOLOv8 轻量级网络 VanillaNet
下载PDF
基于可见光图像和红外图像决策级融合的目标检测算法 被引量:21
6
作者 白玉 侯志强 +3 位作者 刘晓义 马素刚 余旺盛 蒲磊 《空军工程大学学报(自然科学版)》 CSCD 北大核心 2020年第6期53-59,100,共8页
针对可见光图像和红外图像的融合目标检测问题,提出了一种基于决策级融合的目标检测算法。通过建立带标注的数据集对YOLOv3网络进行重新训练,并在融合之前,利用训练好的YOLOv3网络对可见光图像和红外图像分别进行检测。在融合过程中,提... 针对可见光图像和红外图像的融合目标检测问题,提出了一种基于决策级融合的目标检测算法。通过建立带标注的数据集对YOLOv3网络进行重新训练,并在融合之前,利用训练好的YOLOv3网络对可见光图像和红外图像分别进行检测。在融合过程中,提出了一种新颖的检测融合算法,首先,保留只在可见光图像或只在红外图像中检测到的目标的准确结果;然后,对在可见光图像和红外图像中同时检测到的同一目标的准确结果进行加权融合;最后,将所得的检测结果进行合并,作为融合图像中所有对应目标的检测结果,进而实现基于决策级融合的快速目标检测。实验结果表明:各项指标在建立的数据集上均有较好的表现。所提算法的检测精度达到了84.07%,与单独检测可见光图像和红外图像的算法相比,检测精度分别提升了2.44%和21.89%,可以检测到更多的目标并且减少了误检目标的情况;与3种基于特征级图像融合的检测算法相比,算法的检测精度分别提升了4.5%,1.74%和3.42%。 展开更多
关键词 目标检测 YOLOv3网络 决策级融合 加权融合
下载PDF
改进DeepLabv3+网络的肠道息肉分割方法 被引量:21
7
作者 王亚刚 郗怡媛 潘晓英 《计算机科学与探索》 CSCD 北大核心 2020年第7期1243-1250,共8页
为了提高结肠镜下肠道息肉检测率,提出了一种改进DeepLabv3+网络的肠道息肉分割方法。在数据预处理阶段,利用中值滤波的非线性滤波特性去除掉图像反光区域,并结合Grab Cut算法对息肉区域进行预提取,得到息肉位置的粗分割结果,将其与原... 为了提高结肠镜下肠道息肉检测率,提出了一种改进DeepLabv3+网络的肠道息肉分割方法。在数据预处理阶段,利用中值滤波的非线性滤波特性去除掉图像反光区域,并结合Grab Cut算法对息肉区域进行预提取,得到息肉位置的粗分割结果,将其与原图叠加以增强息肉位置的信号强度。在网络结构上,将通过神经架构搜索得到的最优密集预测单元引入DeepLabv3+网络,并在解码器部分采用3层深度可分离卷积逐步获取分割结果,减少分割过程中不完全分割的情况。实验通过对CVC-ClinicDB数据集进行训练和测试,以平均交并比、Dice系数、敏感度、精确率以及F1值作为评判标准,其中平均交并比达到0.947,其余4项指标也均高于0.935。实验结果表明提出的方法与现有方法相比,对肠道息肉图像分割在精度上有一定提升,对深度学习在肠道息肉图像的处理和分析具有借鉴意义。 展开更多
关键词 改进DeepLabv3+ 肠道息肉 神经架构搜索 不完全分割
下载PDF
融合卷积神经网络与支持向量机的表情识别 被引量:20
8
作者 王忠民 李和娜 +1 位作者 张荣 衡霞 《计算机工程与设计》 北大核心 2019年第12期3594-3600,共7页
针对表情识别方法存在识别准确率不高和手工设计的特征不能全面表征面部表情特征的问题,提出一种融合卷积神经网络(CNN)的深度学习特征和支持向量机(SVM)的人脸表情识别方法。采用Viola-Jones算法进行人脸检测和对齐,提取面部表情感兴... 针对表情识别方法存在识别准确率不高和手工设计的特征不能全面表征面部表情特征的问题,提出一种融合卷积神经网络(CNN)的深度学习特征和支持向量机(SVM)的人脸表情识别方法。采用Viola-Jones算法进行人脸检测和对齐,提取面部表情感兴趣区域的图像,输入到CNN模型以提取显著的表情特征信息,对得到的特征向量采用SVM进行分类,将表情分类结果输出。使用该方法在Fer-2013数据集和CK数据集上进行实验,识别率分别为93.46%、92.06%。实验结果表明,该方法能够明显提高表情识别的准确率。 展开更多
关键词 卷积神经网络 支持向量机 表情识别 深度学习 特征提取
下载PDF
基于多核学习特征融合的语音情感识别方法 被引量:17
9
作者 王忠民 刘戈 宋辉 《计算机工程》 CAS CSCD 北大核心 2019年第8期248-254,共7页
在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基... 在语音情感识别中提取梅尔频率倒谱系数(MFCC)会丢失谱特征信息,导致情感识别准确率较低。为此,提出一种结合MFCC和语谱图特征的语音情感识别方法。从音频信号中提取MFCC特征,将信号转换为语谱图,利用卷积神经网络提取图像特征。在此基础上,使用多核学习算法融合音频特征,并将生成的核函数应用于支持向量机进行情感分类。在2种语音情感数据集上的实验结果表明,与单一特征的分类器相比,该方法的语音情感识别准确率高达96 %。 展开更多
关键词 语音情感识别 多核学习 卷积神经网络 梅尔频率倒谱系数 语谱图
下载PDF
一种基于环签名的区块链隐私保护算法 被引量:16
10
作者 陈思吉 翟社平 汪一景 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2020年第5期86-93,共8页
针对用户在区块链上进行交易或数据存储时的隐私保护问题,提出一种可应用于区块链系统的环签名算法。首先对传统环签名算法进行改进,使改进算法基于多私钥生成中心生成密钥,符合区块链分布式信任环境需求;其次对区块链中的节点分配不同... 针对用户在区块链上进行交易或数据存储时的隐私保护问题,提出一种可应用于区块链系统的环签名算法。首先对传统环签名算法进行改进,使改进算法基于多私钥生成中心生成密钥,符合区块链分布式信任环境需求;其次对区块链中的节点分配不同角色,使用智能合约技术控制签名的生成与验证过程;最后对改进算法进行相关实验。分析与实验结果表明,所提算法能保护区块链中节点的身份隐私,在保证效率的前提下具有良好的容错性,能在部分节点失效的情况下正常运作。 展开更多
关键词 区块链 环签名 隐私 身份验证
下载PDF
基于SLIC与分水岭算法的彩色图像分割 被引量:14
11
作者 侯志强 赵梦琦 +2 位作者 余旺盛 李宥谋 马素刚 《光电工程》 CAS CSCD 北大核心 2019年第6期73-81,共9页
为了克服传统分水岭算法引起的过分割问题,提出了一种基于简单线性迭代聚类(SLIC)与分水岭算法相结合的彩色图像分割算法,以获得更理想的分割效果。该算法首先利用图像复杂度计算预分割的超像素个数,并利用SLIC对原始图像进行超像素分... 为了克服传统分水岭算法引起的过分割问题,提出了一种基于简单线性迭代聚类(SLIC)与分水岭算法相结合的彩色图像分割算法,以获得更理想的分割效果。该算法首先利用图像复杂度计算预分割的超像素个数,并利用SLIC对原始图像进行超像素分割预处理,以减少后续处理中的冗余信息;然后,提出了一种自适应计算阈值的方法对预处理图像的梯度图像进行阈值处理,以有效去除噪声,获得较完整的轮廓信息;最后,利用分水岭分割算法对进行极小值标记提取后的图像进行分割。通过对大量图片进行实验表明,本文算法可以有效地抑制传统分水岭算法所产生的过分割问题,在LCE和GCE的对比上优于传统算法,分割质量有所提高。 展开更多
关键词 超像素 分水岭 图像分割 图像复杂度
下载PDF
多特征融合的句子语义相似度计算方法 被引量:14
12
作者 翟社平 李兆兆 +2 位作者 段宏宇 李婧 董迪迪 《计算机工程与设计》 北大核心 2019年第10期2867-2873,2884,共8页
针对句子语义相似度计算问题,综合考虑句子的结构信息与语义信息,提出一种多特征融合的句子语义相似度计算方法。提取句子的词形特征、词序特征及句长特征,使用层次分析法进行权重分配,计算结构相似度;利用本体图中最短路径定义语义距离... 针对句子语义相似度计算问题,综合考虑句子的结构信息与语义信息,提出一种多特征融合的句子语义相似度计算方法。提取句子的词形特征、词序特征及句长特征,使用层次分析法进行权重分配,计算结构相似度;利用本体图中最短路径定义语义距离,基于语义距离计算句子语义相似度;对结构相似度和语义相似度进行特征加权,构建多特征融合的句子语义相似度计算方法。实验结果表明,该方法取得了72.5%的F-度量值,与传统余弦相似度和基于关键词的相似度算法相比提高了12%。 展开更多
关键词 句子相似度 结构相似度 语义相似度 本体 层次分析法
下载PDF
多尺度融合残差编解码器的低照度图像增强方法 被引量:13
13
作者 潘晓英 魏苗 +1 位作者 王昊 贾丰竹 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2022年第1期104-112,共9页
在低光照环境下,由于光子数极少且噪声较大,线阵相机的感光源不能充分曝光,从而导致图像的质量下降.为此,提出一种多尺度融合的残差编解码器的低照度图像增强方法,直接学习原始传感器RAW明暗图像之间的端到端映射,在完全恢复原始图像细... 在低光照环境下,由于光子数极少且噪声较大,线阵相机的感光源不能充分曝光,从而导致图像的质量下降.为此,提出一种多尺度融合的残差编解码器的低照度图像增强方法,直接学习原始传感器RAW明暗图像之间的端到端映射,在完全恢复原始图像细节和色彩的同时有效增强图像的亮度;为了增加特征多样性并加快网络训练速度,在网络结构中加入残差块;为了聚合上下文的全局多尺度特征,设计一个密集上下文特征聚合模块,以弥补网络深层缺失的空间信息.基于SID数据集,与其他10种方法进行对比实验,结果表明,所提方法在视觉效果、定量评价(PSNR和SSIM)方面都明显优于其他大部分方法,可以在恢复图像亮度的同时,有效地表示图像的边缘和色彩等,并在弱光增强下获得令人满意的视觉质量. 展开更多
关键词 图像增强 低照度 特征融合 残差网络
下载PDF
基于双阈值-非极大值抑制的Faster R-CNN改进算法 被引量:12
14
作者 侯志强 刘晓义 +1 位作者 余旺盛 马素刚 《光电工程》 CAS CSCD 北大核心 2019年第12期80-90,共11页
根据目标检测算法中出现的目标漏检和重复检测问题,本文提出了一种基于双阈值-非极大值抑制的Faster R-CNN改进算法。算法首先利用深层卷积网络架构提取目标的多层卷积特征,然后通过提出的双阈值-非极大值抑制(DT-NMS)算法在RPN阶段提... 根据目标检测算法中出现的目标漏检和重复检测问题,本文提出了一种基于双阈值-非极大值抑制的Faster R-CNN改进算法。算法首先利用深层卷积网络架构提取目标的多层卷积特征,然后通过提出的双阈值-非极大值抑制(DT-NMS)算法在RPN阶段提取目标候选区域的深层信息,最后使用了双线性插值方法来改进原Ro I pooling层中的最近邻插值法,使算法在检测数据集上对目标的定位更加准确。实验结果表明,DT-NMS算法既有效地平衡了单阈值算法对目标漏检问题和目标误检问题的关系,又针对性地减小了同一目标被多次检测的概率。与soft-NMS算法相比,本文算法在PASCAL VOC2007上的重复检测率降低了2.4%,多次检测的目标错分率降低了2%。与Faster R-CNN算法相比,本文算法在PASCAL VOC2007上检测精度达到74.7%,性能提升了1.5%。在MSCOCO数据集上性能提升了1.4%。同时本文算法具有较快的检测速度,达到16 FPS。 展开更多
关键词 计算机视觉 目标检测 非极大值抑制 卷积神经网络
下载PDF
融合YOLO检测与均值漂移的目标跟踪算法 被引量:12
15
作者 王忠民 段娜 范琳 《计算机工程与应用》 CSCD 北大核心 2019年第10期186-192,212,共8页
针对视频目标跟踪算法中物体快速移动以及均值漂移算法误差累积造成的目标漂移问题,提出了一种融合YOLO(You Only Look Once)与均值漂移的目标跟踪算法。采用图像增强机制对视频帧进行预处理,在保持图像信息的同时去除光照强度的干扰;... 针对视频目标跟踪算法中物体快速移动以及均值漂移算法误差累积造成的目标漂移问题,提出了一种融合YOLO(You Only Look Once)与均值漂移的目标跟踪算法。采用图像增强机制对视频帧进行预处理,在保持图像信息的同时去除光照强度的干扰;为了降低YOLO算法的计算复杂度,使用二分类器区分目标和背景进行物体的快速检测。根据目标物体的位置信息,使用均值漂移处理后续图像序列,并对目标物体进行检测更新,避免物体快速移动造成目标漂移问题,从而进行有效的检测跟踪。实验结果表明,该算法与DLT(Deep Learning Tracker)算法相比,运算效率提高了12.56%,跟踪精度提高了10.2%,能够较好地适应物体快速移动,具有较强的鲁棒性和实时性。 展开更多
关键词 快速移动 YOLO算法 均值漂移 图像增强 二分类器
下载PDF
基于双模板Siamese网络的鲁棒视觉跟踪算法 被引量:11
16
作者 侯志强 陈立琳 +2 位作者 余旺盛 马素刚 范九伦 《电子与信息学报》 EI CSCD 北大核心 2019年第9期2247-2255,共9页
近年来,Siamese网络由于其良好的跟踪精度和较快的跟踪速度,在视觉跟踪领域引起极大关注,但大多数Siamese网络并未考虑模型更新,从而引起跟踪错误。针对这一不足,该文提出一种基于双模板Siamese网络的视觉跟踪算法。首先,保留响应图中... 近年来,Siamese网络由于其良好的跟踪精度和较快的跟踪速度,在视觉跟踪领域引起极大关注,但大多数Siamese网络并未考虑模型更新,从而引起跟踪错误。针对这一不足,该文提出一种基于双模板Siamese网络的视觉跟踪算法。首先,保留响应图中响应值稳定的初始帧作为基准模板R,同时使用改进的APCEs模型更新策略确定动态模板T。然后,通过对候选目标区域与2个模板匹配度结果的综合分析,对结果响应图进行融合,以得到更加准确的跟踪结果。在OTB2013和OTB2015数据集上的实验结果表明,与当前5种主流跟踪算法相比,该文算法的跟踪精度和成功率具有明显优势,不仅在尺度变化、平面内旋转、平面外旋转、遮挡、光照变化情况下具有较好的跟踪效果,而且达到了46帧/s的跟踪速度。 展开更多
关键词 Siamese网络 目标跟踪 双模板 模板更新
下载PDF
机器学习在医疗大数据中的应用 被引量:11
17
作者 潘晓英 王佳 +3 位作者 刘妮 刘星星 余慧敏 许康玲 《西安邮电大学学报》 2020年第1期21-33,共13页
以医疗健康大数据为切入点,阐述了医疗健康大数据概念、特性及来源,介绍了机器学习及其用于医疗大数据在临床及医生决策中的应用研究现状,分析并探讨了目前机器学习在临床医疗应用中的局限性和面临的挑战,提出了若干建议,以期为医院智... 以医疗健康大数据为切入点,阐述了医疗健康大数据概念、特性及来源,介绍了机器学习及其用于医疗大数据在临床及医生决策中的应用研究现状,分析并探讨了目前机器学习在临床医疗应用中的局限性和面临的挑战,提出了若干建议,以期为医院智能化数据化提供参考。 展开更多
关键词 医疗大数据 机器学习 辅助决策 神经网络
下载PDF
基于区块链的数字版权存证系统模型研究 被引量:11
18
作者 翟社平 陈思吉 汪一景 《计算机工程与应用》 CSCD 北大核心 2020年第19期13-21,共9页
传统基于第三方中心机构的版权登记存在效率低、成本高和隐私保护性差等问题,针对这些问题,将区块链与环签名技术运用于版权保护领域,提出一种基于区块链的数字版权存证系统模型。构建了基于联盟链的数字版权存证系统架构,利用区块链的... 传统基于第三方中心机构的版权登记存在效率低、成本高和隐私保护性差等问题,针对这些问题,将区块链与环签名技术运用于版权保护领域,提出一种基于区块链的数字版权存证系统模型。构建了基于联盟链的数字版权存证系统架构,利用区块链的去中心化、不可篡改和可追溯等特性保证存证的信息真实可信;对环签名技术进行改进,并利用改进的环签名技术保护创作者身份隐私;对PBFT算法进行改进,提升系统效率和可靠性。经分析与实验表明,该模型能降低版权登记经济成本,防止用户身份信息被非法获取,且具有良好的性能与安全性。 展开更多
关键词 区块链 数字版权 环签名 智能合约 实用拜占庭容错算法(PBFT)
下载PDF
疫情防控背景下结合慕课平台的C语言课程线上教学组织 被引量:11
19
作者 李培 《计算机教育》 2020年第7期23-27,共5页
针对疫情背景下的课程线上组织问题,以C语言课程为例,分析线上课程开展的需求和特点,阐述如何结合现有优质慕课平台资源,在由浅入深、由简入繁和以学生为中心这两大原则基础上设计教学的各个阶段,介绍开展线上教学组织的过程及反馈。
关键词 疫情防控 慕课平台 C语言课程 线上教学组织
下载PDF
一种基于ResNet网络特征的视觉目标跟踪算法 被引量:9
20
作者 马素刚 赵祥模 +2 位作者 侯志强 王忠民 孙韩林 《北京邮电大学学报》 EI CAS CSCD 北大核心 2020年第2期129-134,共6页
针对复杂场景下目标容易丢失的问题,提出了一种基于深度残差网络(ResNet)特征的尺度自适应视觉目标跟踪算法.首先,通过ResNet提取图像感兴趣区域的多层深度特征,考虑到修正线性单元(ReLU)激活函数对目标特征的抑制作用,在ReLU函数之前... 针对复杂场景下目标容易丢失的问题,提出了一种基于深度残差网络(ResNet)特征的尺度自适应视觉目标跟踪算法.首先,通过ResNet提取图像感兴趣区域的多层深度特征,考虑到修正线性单元(ReLU)激活函数对目标特征的抑制作用,在ReLU函数之前选取用于提取目标特征的卷积层;然后,在提取的多层特征上分别构建基于核相关滤波的位置滤波器,并对得到的多个响应图进行加权融合,选取响应值最大的点即为目标中心位置.目标位置确定后,对目标进行多个尺度采样,分别提取不同尺度图像的方向梯度直方图(fHOG)特征,在此基础上构建尺度相关滤波器,从而实现对目标尺度的准确估计.在视频集OTB100中与其他6种相关算法进行了比较,实验结果表明,所提算法取得了较高的跟踪成功率和精确度,能够较好地适应目标的尺度变化、背景干扰等复杂场景. 展开更多
关键词 视觉目标跟踪 深度残差网络 核相关滤波 深度学习 尺度估计
原文传递
上一页 1 2 5 下一页 到第
使用帮助 返回顶部