期刊文献+
共找到267篇文章
< 1 2 14 >
每页显示 20 50 100
基于R-MI-rényi测度的可见光与红外图像配准 被引量:10
1
作者 陈震 杨小平 +1 位作者 张聪炫 段兴旺 《电子测量与仪器学报》 CSCD 北大核心 2018年第1期1-8,共8页
针对红外与可见光图像配准的准确性与鲁棒性问题,提出一种基于R-MI-rényi测度的由粗到精红外与可见光图像配准方法。首先通过分析红外与可见光传感器的成像原理,确定红外与可见光传感器在相对位置固定时的配准变换参数;然后采用Ho... 针对红外与可见光图像配准的准确性与鲁棒性问题,提出一种基于R-MI-rényi测度的由粗到精红外与可见光图像配准方法。首先通过分析红外与可见光传感器的成像原理,确定红外与可见光传感器在相对位置固定时的配准变换参数;然后采用Hough变换检测模板图像的直线特征,并利用待配准图像对应直线段的长度和斜率确定粗配准参数;根据粗配准参数确定搜索区域与匹配窗口尺寸,利用rényi互信息与Harris角点函数相结合的R-MI-rényi匹配测度在粗配准对应区域内搜索匹配点对;最后使用RANSAC方法完成图像的精确配准并求解图像转换参数矩阵。分别选取标准测试图像集和真实测试图像集对本文方法和现有代表方法进行综合对比,实验结果表明,方法在像素误差、标准差以及时间消耗等方面均优于其他对比方法,说明方法具有较高的配准精度和效率、较好的鲁棒性,综合性能最优。 展开更多
关键词 红外图像 可见光图像 图像配准 由粗到精 R-MI-rényi测度
下载PDF
基于残差单发多框检测器模型的交通标志检测与识别 被引量:9
2
作者 张淑芳 朱彤 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第5期940-949,共10页
针对现有目标检测方法仅适用于大尺寸、少量特定种类交通标志的检测,且对复杂交通场景图像检测效果不佳的问题,以抗退化性能较强的ResNet101为基础网络,增加若干卷积层构建残差单发多框检测器(SSD)模型,对高分辨率的交通图像进行多尺度... 针对现有目标检测方法仅适用于大尺寸、少量特定种类交通标志的检测,且对复杂交通场景图像检测效果不佳的问题,以抗退化性能较强的ResNet101为基础网络,增加若干卷积层构建残差单发多框检测器(SSD)模型,对高分辨率的交通图像进行多尺度分块检测。为了加快检测速度,采取由粗到精的策略,省略对纯背景图像块的预测.利用中等尺度图像块的初检结果缩小目标范围;对目标范围内的其他图像块进行检测;将所有图像块结果映射回原图像,并结合非极大值抑制实现精准识别。实验结果表明,该模型在公开的交通标志数据集Tsinghua-Tencent 100K上取得了94%的总体准确率和95%的总体召回率,对多分辨率图像中不同大小和形态的交通标志都具有良好的检测能力,鲁棒性较强。 展开更多
关键词 交通标志 残差单发多框检测器(SSD)模型 多尺度分块 检测 由粗到精
下载PDF
基于SIFT的全自动遥感图像配准算法 被引量:8
3
作者 余婷 厉小润 《机电工程》 CAS 2013年第1期111-115,共5页
针对仿射变换的光学图像自动配准精度不高的问题,提出了一种基于特征的由粗到细的遥感图像自动配准算法。首先采用SIFT特征进行了特征点的粗匹配,将输入图像映射为一个具有平移、缩放、旋转不变性的局部特征向量集,采用特征向量的欧氏... 针对仿射变换的光学图像自动配准精度不高的问题,提出了一种基于特征的由粗到细的遥感图像自动配准算法。首先采用SIFT特征进行了特征点的粗匹配,将输入图像映射为一个具有平移、缩放、旋转不变性的局部特征向量集,采用特征向量的欧氏距离作为相似性判定度量,通过两两比较找出匹配的若干对特征点对作为初始配准点对,以完成输入图像的粗匹配;其次,以互信息作为相似性测度,基于位置控制的搜索策略,确定了更多的特征点的对应关系;然后,利用控制点结合加权最小二乘优化仿射变换的模型参数,完成了图像间的精细配准;最后引入了联合直方图,以其作为配准精度的评价标准来检验配准效果。研究结果表明,该算法对于高光谱遥感图像具有较高的配准精度,速度快、可靠性高。 展开更多
关键词 遥感图像 尺度不变特征转换 图像配准 位置控制 互信息 由粗到细
下载PDF
从粗粒度到细粒度的神经机器翻译系统推断加速方法 被引量:7
4
作者 张裕浩 许诺 +2 位作者 李垠桥 肖桐 朱靖波 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第2期175-184,共10页
近年来,Transformer模型中多层注意力网络的使用有效提升了翻译模型的译文质量,但同时大量注意力操作的使用也导致模型整体的推断效率相对较低.基于此,提出了从粗粒度到细粒度(coarse-to-fine,CTF)的方法,根据注意力权重中的信息量差异... 近年来,Transformer模型中多层注意力网络的使用有效提升了翻译模型的译文质量,但同时大量注意力操作的使用也导致模型整体的推断效率相对较低.基于此,提出了从粗粒度到细粒度(coarse-to-fine,CTF)的方法,根据注意力权重中的信息量差异对信息表示进行细粒度压缩,最终达到加速推断的目的.实验发现,在NIST中英和WMT英德翻译任务上,该方法在保证模型性能的同时,推断速度分别提升了13.9%和12.8%.此外,还进一步分析了注意力操作在不同表示粒度下的信息量差异,对该方法的合理性提供支持. 展开更多
关键词 神经机器翻译 模型加速 从粗粒度到细粒度
下载PDF
基于多尺度特征融合的由粗到精点云形状补全
5
作者 张德军 王杨 +3 位作者 谭雪峰 吴亦奇 陈壹林 何发智 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第4期523-532,共10页
为了以由粗到精的方式实现点云形状补全,提出一个端到端的两阶段多尺度特征融合网络,其中的每个阶段都是由一个编码器-解码器构成.第1阶段中,首先利用点集抽取模块提取残缺点云的全局特征,在获取不同分辨率点特征的同时能关注更多的局... 为了以由粗到精的方式实现点云形状补全,提出一个端到端的两阶段多尺度特征融合网络,其中的每个阶段都是由一个编码器-解码器构成.第1阶段中,首先利用点集抽取模块提取残缺点云的全局特征,在获取不同分辨率点特征的同时能关注更多的局部邻域特征,然后使用多层感知机作为解码器生成粗糙的点云骨架;第2阶段中,利用点云骨架和残缺点云提取多尺度局部特征,并通过注意力机制与第1阶段中的多尺度全局特征相互融合,使得每个点都包含全局和局部几何信息;最后将第2阶段中的全局特征和多尺度局部特征逐步进行上采样,并通过多层感知机生成精细的完整点云.采用倒角距离作为评价标准,在ShapeNet,MVP和Completion3D数据集上进行点云补全实验的结果表明,误差分别比基准网络降低17.1%,3.9%和13.9%,验证了所提网络的有效性. 展开更多
关键词 点云补全 多尺度特征融合 由粗到精 编码器-解码器
下载PDF
多阶段优化的小目标聚焦检测 被引量:6
6
作者 周立旺 潘天翔 +1 位作者 杨泽曦 王斌 《图学学报》 CSCD 北大核心 2020年第1期93-99,共7页
目标检测是深度学习领域重要的基础问题之一,目前已经有相当多且较为成熟的研究。无人冰柜是人工智能在零售产业的一个应用场景。其通过冰柜内设置的摄像头捕捉图像,利用目标检测方法检测出顾客手中抓取的商品,然后进行后续的商品分类... 目标检测是深度学习领域重要的基础问题之一,目前已经有相当多且较为成熟的研究。无人冰柜是人工智能在零售产业的一个应用场景。其通过冰柜内设置的摄像头捕捉图像,利用目标检测方法检测出顾客手中抓取的商品,然后进行后续的商品分类等任务的工作。而由于场景及硬件的限制,无人冰柜中只能使用速度快但精度较低的深度模型,而这些模型往往在小目标的检测上精度相对更低。针对无人冰柜场景数据的背景单一、目标范围小等特殊性,改进了主流的目标检测方法,提出了一种基于聚焦的由粗到精的2阶段检测网络结构FocusNet,提升了该场景下的小目标检测效果。该方法相比先前的模型在小目标检测上的平均准确率提升了8.3%,总体检测平均准确率提升了3.5%。 展开更多
关键词 目标检测 小目标检测 由粗到精 无人冰柜 深度学习
下载PDF
一种基于级联神经网络的飞机检测方法 被引量:6
7
作者 王晓林 苏松志 +2 位作者 刘晓颖 蔡国榕 李绍滋 《智能系统学报》 CSCD 北大核心 2020年第4期697-704,共8页
由于旋转角度多样性、极端的尺度差异的影响,遥感图像中的飞机检测目前仍存在挑战。为了解决旋转和尺度的问题,目前的策略是将现有的自然场景下的目标检测算法(如Faster R-CNN、SSD等)直接迁移到遥感图像中。这些算法的主干网络复杂,模... 由于旋转角度多样性、极端的尺度差异的影响,遥感图像中的飞机检测目前仍存在挑战。为了解决旋转和尺度的问题,目前的策略是将现有的自然场景下的目标检测算法(如Faster R-CNN、SSD等)直接迁移到遥感图像中。这些算法的主干网络复杂,模型占用空间大,难以应用到低功耗和嵌入式设备中。为了在准确率不降低的情况下提高检测速度,本文提出了一个仅包含9层的卷积神经网络来解决飞机检测问题。该网络采用了由粗到细的策略,通过级联两个网络的方式减少计算开销。为了评估方法的有效性,我们建立了一个针对飞机检测的遥感数据集。实验结果表明,该方法超越了VGG16等复杂的主干网络,达到了接近主流检测方法的性能表现,同时显著降低了参数量并使检测速度提高了2倍以上。 展开更多
关键词 飞机检测 遥感图像 级联 深度学习 卷积神经网络 两阶段 由粗到细 嵌入式设备
下载PDF
基于多阶段空间视觉线索和主动定位偏移的胰腺分割框架 被引量:1
8
作者 李嘉铭 折娇 +3 位作者 任书敏 姬明昊 句建国 王和旭 《陕西科技大学学报》 北大核心 2023年第6期193-200,共8页
从CT图像中准确的分割出胰腺或胰腺肿瘤,为医生进行诊断和制定手术计划起着重要的作用,尽管深度神经网络在智能器官分割方面取得了一定的进步,但在解决胰腺分割问题上仍有不足.为了解决胰腺及胰腺肿瘤因区域小、背景复杂导致的分割困难... 从CT图像中准确的分割出胰腺或胰腺肿瘤,为医生进行诊断和制定手术计划起着重要的作用,尽管深度神经网络在智能器官分割方面取得了一定的进步,但在解决胰腺分割问题上仍有不足.为了解决胰腺及胰腺肿瘤因区域小、背景复杂导致的分割困难的问题,本文提出一种基于转换函数和主动定位偏移(active localization offset,ALOT,)的由粗到细的分割框架.具体的,首先将CT切片输入到粗分割网络,之后通过转换函数将粗分割网络获得的视觉线索转换为空间权重.同时,在粗分割网络迭代执行过程中,ALOT模块会动态调整对前景目标的定位,获得前景目标周围语义信息更加丰富的裁剪区域输入到细分割网络.最终由细分割网络输出更精细的分割结果.在NIH胰腺分割数据集和MSD胰腺肿瘤分割数据集的实证表明,该框架在NIH和MSD数据集上分别达到85.15%、63.36%(DSC),比之前最优秀的结果分别提高了0.25%、0.5%,但计算时间和计算量大约均只为最佳方法的1/3.代码将在作者github主页发布. 展开更多
关键词 胰腺分割 由粗到细 主动学习 空间上下文 医学图像处理
下载PDF
卡尔曼粒子滤波中基于精确运动模型的局部区域估计(英文) 被引量:4
9
作者 徐超 高敏 杨耀 《红外与激光工程》 EI CSCD 北大核心 2015年第11期3475-3482,共8页
粒子滤波广泛应用于对精度和稳定性要求较高的目标跟踪,但其计算量大,并且计算复杂度随着状态量和粒子数目增长迅速增加。将目标跟踪转化为由粗到精的搜索过程,提出了一种基于精确运动模型的改进分层卡尔曼粒子滤波算法。该方法利用加... 粒子滤波广泛应用于对精度和稳定性要求较高的目标跟踪,但其计算量大,并且计算复杂度随着状态量和粒子数目增长迅速增加。将目标跟踪转化为由粗到精的搜索过程,提出了一种基于精确运动模型的改进分层卡尔曼粒子滤波算法。该方法利用加速度的运动模型在真实目标位置的周围估计目标的散布范围,并在该范围内随机生成粒子,寻找精确的目标位置。文中引入加加速度模型主要是由于现有方法的状态量阶数不足,导致模型精确度较低,无法应对大机动目标的跟踪。因此,引入了高阶状态变量加加速度,并将其用于改进分层卡尔曼粒子滤波的运动模型。利用分层卡尔曼粒子滤波、粒子滤波以及提出的方法进行了跟踪试验,结果表明,基于精确运动模型的改进分层卡尔曼粒子滤波模型的跟踪方法能够提高线性运动的预测精度,实现复杂环境下精确稳定的跟踪。 展开更多
关键词 改进分层卡尔曼粒子滤波 由粗到精搜索策略 区域估计 JERK模型
下载PDF
基于相位相关与Keren算法的图像配准 被引量:4
10
作者 李相国 马晓川 《微计算机应用》 2009年第11期19-23,共5页
提出了一个由粗到精的图像配准算法,它是基于相位相关法和Keren算法的两步实现法,即利用相位相关法完成大旋转角度及大平移的粗略估计,根据估计结果补偿后再应用Keren算法进行精细估计。该算法结合了相位相关法在大旋转角度大平移和Kere... 提出了一个由粗到精的图像配准算法,它是基于相位相关法和Keren算法的两步实现法,即利用相位相关法完成大旋转角度及大平移的粗略估计,根据估计结果补偿后再应用Keren算法进行精细估计。该算法结合了相位相关法在大旋转角度大平移和Keren算法在小旋转角度小平移估计上的长处,且避开了各自的局限性及不足。仿真实验结果表明,该算法在大旋转角度大平移情形下仍可以获得高精度亚像素估计结果。 展开更多
关键词 图像配准 相位相关 Keren算法 由粗到精
下载PDF
Pancreas Segmentation Optimization Based on Coarse-to-Fine Scheme
11
作者 Xu Yao Chengjian Qiu +1 位作者 Yuqing Song Zhe Liu 《Intelligent Automation & Soft Computing》 SCIE 2023年第9期2583-2594,共12页
As the pancreas only occupies a small region in the whole abdominal computed tomography(CT)scans and has high variability in shape,location and size,deep neural networks in automatic pancreas segmentation task can be ... As the pancreas only occupies a small region in the whole abdominal computed tomography(CT)scans and has high variability in shape,location and size,deep neural networks in automatic pancreas segmentation task can be easily confused by the complex and variable background.To alleviate these issues,this paper proposes a novel pancreas segmentation optimization based on the coarse-to-fine structure,in which the coarse stage is responsible for increasing the proportion of the target region in the input image through the minimum bounding box,and the fine is for improving the accuracy of pancreas segmentation by enhancing the data diversity and by introducing a new segmentation model,and reducing the running time by adding a total weights constraint.This optimization is evaluated on the public pancreas segmentation dataset and achieves 87.87%average Dice-Sørensen coefficient(DSC)accuracy,which is 0.94%higher than 86.93%,result of the state-of-the-art pancreas segmentation methods.Moreover,this method has strong generalization that it can be easily applied to other coarse-to-fine or one step organ segmentation tasks. 展开更多
关键词 Pancreas segmentation coarse-to-fine U-net constraint loss function
下载PDF
由粗到精的机载点云建筑物屋面分割 被引量:4
12
作者 舒敏 刘科 《激光与红外》 CAS CSCD 北大核心 2019年第12期1414-1420,共7页
机载激光雷达技术在城市三维建模中得到越来越广泛的应用,建筑物屋面分割在三维建模中是一项至关重要的环节,提出一种由粗到精的建筑物屋面分割算法。首先使用具有先验知识的低秩子空间聚类框架的法向量估算方法估算每点的法向量及平面... 机载激光雷达技术在城市三维建模中得到越来越广泛的应用,建筑物屋面分割在三维建模中是一项至关重要的环节,提出一种由粗到精的建筑物屋面分割算法。首先使用具有先验知识的低秩子空间聚类框架的法向量估算方法估算每点的法向量及平面方程;再依据法向量一致性以及点到面的距离进行约束实现屋面粗分割;选取粗分割中包含点数最多的一簇点集拟合平面,从未精分割的点集中提取所有满足该平面方程的点集,再将点集投影到该点集拟合的平面上,在投影平面上实现对屋面的精分割。对剩余未分割的点集重复粗分割与精分割步骤,直至将所有屋面提取完毕。使用多种结构不同的建筑物屋面验证本文方法,同时与其他三种算法进行比较,结果表明相比较于其他三种算法,本文算法均能精确、完整地分割出建筑物各屋面,不存在错分割、漏分割的现象。该方法可以精确提取结构不同的建筑物屋面,为后续建筑物建模提供准确的面片。 展开更多
关键词 由粗到精 法向量估算 法向量一致性 投影 屋面分割 二值图像
下载PDF
一种快速的两步骤图像匹配新算法 被引量:4
13
作者 邱丽君 唐加山 《计算机技术与发展》 2015年第8期67-70,共4页
图像匹配时间包括特征提取时间和特征点匹配时间,减少特征提取时间,能够大大提高图像匹配效率。目前,普遍的匹配算法对整幅图像进行特征提取,当图像较大时,特征提取时间长,影响匹配效率。文中提出一种由粗到细的两步骤快速图像匹配新算... 图像匹配时间包括特征提取时间和特征点匹配时间,减少特征提取时间,能够大大提高图像匹配效率。目前,普遍的匹配算法对整幅图像进行特征提取,当图像较大时,特征提取时间长,影响匹配效率。文中提出一种由粗到细的两步骤快速图像匹配新算法,这种算法在特征提取时间上作了改进。粗匹配阶段,用双直方图(TCH)哈希算法进行模板匹配,找到与模板最相似的图像区域,缩小ORB特征提取的范围。细匹配阶段,在找到的最相似区域,用高速的ORB算子提取和描述特征点。最后,用欧氏距离法进行特征向量的匹配。由于特征提取的范围被缩小到一个很小的区域,总匹配时间大大减少。实验结果表明,文中提出的图像匹配算法,在保持高匹配鲁棒性的前提下,与SIFT、SURF和ORB算法相比,匹配速度有了很大提高。 展开更多
关键词 由粗到细 快速图像匹配 双直方图哈希算法 ORB算子
下载PDF
Face image retrieval based on shape and texture feature fusion 被引量:2
14
作者 Zongguang Lu Jing Yang Qingshan Liu 《Computational Visual Media》 CSCD 2017年第4期359-368,共10页
Humongous amounts of data bring various challenges to face image retrieval. This paper proposes an efficient method to solve those problems. Firstly,we use accurate facial landmark locations as shape features. Secondl... Humongous amounts of data bring various challenges to face image retrieval. This paper proposes an efficient method to solve those problems. Firstly,we use accurate facial landmark locations as shape features. Secondly, we utilise shape priors to provide discriminative texture features for convolutional neural networks. These shape and texture features are fused to make the learned representation more robust.Finally, in order to increase efficiency, a coarse-tofine search mechanism is exploited to efficiently find similar objects. Extensive experiments on the CASIAWeb Face, MSRA-CFW, and LFW datasets illustrate the superiority of our method. 展开更多
关键词 face retrieval convolutional neural networks(CNNs) coarse-to-fine
原文传递
一种由粗到细的头发分割方法 被引量:3
15
作者 王丹 山世光 +2 位作者 张洪明 曾炜 陈熙霖 《软件学报》 EI CSCD 北大核心 2013年第10期2391-2404,共14页
从图像中提取出头发区域,能够为头发分析、发型趋势预测等任务提供有利的线索.但是,头发的类内模式非常复杂,并且它与其他物体类间也常因光照复杂、表观特征相似等因素而难以分离.因此,头发分割是一个非常具有挑战性的问题.为了一定程... 从图像中提取出头发区域,能够为头发分析、发型趋势预测等任务提供有利的线索.但是,头发的类内模式非常复杂,并且它与其他物体类间也常因光照复杂、表观特征相似等因素而难以分离.因此,头发分割是一个非常具有挑战性的问题.为了一定程度地解决这些问题,提出了一种由粗到细的头发分割方法.首先,该方法利用最新提出的利用视点进行主动分割(active segmentation with fixation,简称ASF)的方法,粗略提取头发分割的候选范围,保证头发区域的高召回率(准确率也许较低),并由此排除大部分与头发区域难以分离的背景区域;然后,利用特定于当前图像的头发类别信息,使用图割(graph cuts,简称GC)法在限定的范围内进行更加精细的分割.具体地,采用均值漂移(mean shift,简称MS)方法对输入图像进行区域的过分割;然后,利用贝叶斯方法选择一些可靠的、有较大概率属于头发或背景的"种子区域",针对头发和背景的种子区域,采用支持向量机(support vector machine,简称SVM)在线学习头发和背景的分类器,并将其用于预测每个像素或区域属于头发或背景的概率;最后,将得到的概率用以Graph Cuts的初始化,求解得到最终的头发分割结果.实验结果表明,所提出的头发分割方法能够超越当前提出的头发分割方法.为了验证方法的可推广性,对其进行了一定扩展,并在马、汽车、飞机这3个类别的公开数据库上作了评测,取得了较好的性能. 展开更多
关键词 头发分割 由粗到细 图割 支持向量机
下载PDF
基于双目视觉的车辆检测及测距 被引量:3
16
作者 陈攀 《现代计算机》 2019年第5期60-64,78,共6页
汽车测距系统在驾驶辅助系统中越来越重要,基于视觉的测距系统成本低实现简单,但精度易受算法本身的影响。提出一种基于双目视觉的实时车辆检测和车距计算的算法,算法利用类Haar特征和AdaBoost算法训练分类器进行车辆检测,提取车辆候选... 汽车测距系统在驾驶辅助系统中越来越重要,基于视觉的测距系统成本低实现简单,但精度易受算法本身的影响。提出一种基于双目视觉的实时车辆检测和车距计算的算法,算法利用类Haar特征和AdaBoost算法训练分类器进行车辆检测,提取车辆候选区域。同时,该算法提出一种基于双目系统的交叉再检测的方法降低误检。立体匹配算法方面采用一种由粗到精的匹配策略,提高双目测距算法的精度和性能。实验结果表明该方法具有精度高、鲁棒性强的优点。 展开更多
关键词 汽车测距 双目视觉 类HAAR特征 交叉再检测 由粗到精
下载PDF
一种由粗到精的边坡形变检测方法 被引量:3
17
作者 荣延祥 龚正 +1 位作者 陈泽权 杨必胜 《测绘通报》 CSCD 北大核心 2021年第6期93-97,共5页
现代化工程建设的过程会形成很多边坡,而这些边坡一旦遭到意外破坏,会对人民的生命财产安全造成巨大威胁。因此,对边坡进行持续的形变检测至关重要。地面激光扫描技术(TLS)是一种现代化的边坡检测手段。基于此,本文提出了一种由粗到精... 现代化工程建设的过程会形成很多边坡,而这些边坡一旦遭到意外破坏,会对人民的生命财产安全造成巨大威胁。因此,对边坡进行持续的形变检测至关重要。地面激光扫描技术(TLS)是一种现代化的边坡检测手段。基于此,本文提出了一种由粗到精的边坡形变检测方法。对于经过良好配准的两期边坡点云,该方法首先计算两期点云的最近匹配点距离,并进行粗检测。在精检测阶段,首先估计出形变的大致方向;然后依据该方向向量搜寻快速点特征直方图(FPFH)最相似的点作为对应点;最后计算点到对应点所在平面的距离值作为形变量。试验表明,本文方法可以有效计算出边坡实际的形变量,具有实用价值。 展开更多
关键词 边坡 TLS点云 形变检测 FPFH 由粗到精
下载PDF
基于Coarse-to-fine注意力机制的指针式仪表读数识别
18
作者 王进 简丽娜 +3 位作者 孙涛 李磊 邱昌龙 王柳 《工业控制计算机》 2022年第12期1-3,6,共4页
为了解决变电站指针式仪表读数识别过程中所涉及到待检测目标尺度分布范围广泛,而导致特征金字塔在不同尺度上不一致性的问题,提出一种基于注意力机制的特征融合的改进的YOLOv3算法。通过利用注意力机制自动调整各尺度特征映射融合的空... 为了解决变电站指针式仪表读数识别过程中所涉及到待检测目标尺度分布范围广泛,而导致特征金字塔在不同尺度上不一致性的问题,提出一种基于注意力机制的特征融合的改进的YOLOv3算法。通过利用注意力机制自动调整各尺度特征映射融合的空间权重,该模块包括两步:同比例放缩和基于注意力机制的特征融合。采用改进后的YOLOv3算法检测图片中仪表的表盘位置,然后根据Coarse-to-fine的思想,使用Mask R-CNN对表盘指针采取实例分割操作,并使用简单线性回归对仪表中的指针进行线性拟合,计算出指针斜率,最终计算仪表读数。实验结果表明,改进后的YOLOv3算法对指针式仪表的识别精度达到了91.85%,对小目标检测效果有较高的提升,使模型具有更好的鲁棒性。同时,实例分割算法与线性回归模型的结合也为指针式仪表读数的自动识别提供了新思路。 展开更多
关键词 指针式仪表 YOLOv3 注意力机制 特征融合 coarse-to-fine
下载PDF
Two-dimensional entropy model for video shot partitioning 被引量:1
19
作者 ZHU SongHao LIU YunCai 《Science in China(Series F)》 2009年第2期183-194,共12页
A shot presents a contiguous action recorded by an uninterrupted camera operation and frames within a shot keep spatio-temporal coherence. Segmenting a serial video stream file into meaningful shots is the first pass ... A shot presents a contiguous action recorded by an uninterrupted camera operation and frames within a shot keep spatio-temporal coherence. Segmenting a serial video stream file into meaningful shots is the first pass for the task of video analysis, content-based video understanding. In this paper, a novel scheme based on improved two-dimensional entropy is proposed to complete the partition of video shots. Firstly, shot transition candidates are detected using a two-pass algorithm: a coarse searching pass and a fine searching pass. Secondly, with the character of two-dimensional entropy of the image, correctly detected transition candidates are further classified into different transition types whereas those falsely detected shot breaks are distinguished and removed. Finally, the boundary of gradual transition can be precisely located by merging the characters of two-dimensional entropy of the image into the gradual transition. A large number of video sequences are used to test our system performance and promising results are obtained. 展开更多
关键词 video shot segmentation two-dimensional entropy model coarse-to-fine algorithm content-based indexing and retrieval
原文传递
基于孪生网络快速运动弱目标实时跟踪 被引量:1
20
作者 郑军松 郭浩 +1 位作者 李阿标 安居白 《激光与光电子学进展》 CSCD 北大核心 2022年第4期153-161,共9页
针对现有目标跟踪算法对快速运动弱目标跟踪效果不佳的问题,提出了一种时空连续的多特征融合孪生网络算法。首先以全卷积孪生网络为基本框架;其次设计了一种从粗到细结合空间信息和语义信息的鲁棒性特征来表达快速运动弱目标,并添加了... 针对现有目标跟踪算法对快速运动弱目标跟踪效果不佳的问题,提出了一种时空连续的多特征融合孪生网络算法。首先以全卷积孪生网络为基本框架;其次设计了一种从粗到细结合空间信息和语义信息的鲁棒性特征来表达快速运动弱目标,并添加了特征注意力;最后采用时空信息连续性模型对整体信息进行有效的更新,从而选定最佳跟踪目标。在快速运动弱目标跟踪序列中,与5种不同的特征选择及更新方式的算法进行对比,所提算法表现出良好的实时跟踪效果;并将所提算法与9种不同类算法和5种同类孪生网络算法进行了对比,所提算法综合性能表现优异。实验结果表明,所提算法具有较好的鲁棒性及实时性,能有效地对快速运动弱目标进行跟踪。 展开更多
关键词 图像处理 目标跟踪 弱目标 孪生网络 粗到细 时空信息
原文传递
上一页 1 2 14 下一页 到第
使用帮助 返回顶部