题名 基于可变形卷积神经网络的数字仪表识别方法
被引量:10
1
作者
郭兰英
韩睿之
程鑫
机构
长安大学信息工程学院
出处
《计算机科学》
CSCD
北大核心
2020年第10期187-193,共7页
基金
陕西省重点研发计划(2019NY-163)
陕西省交通科技项目(14-23K)
中央高校基本科研业务费专项资金项目(300102329101,310824175004)。
文摘
目前,对于数显仪表的识别,多采用传统的图像处理及机器学习等方法,在复杂多变的应用场景中,其对字符、数字的识别准确率低,难以满足实时应用的要求。针对以上问题,将传统图像处理技术与深度学习方法相结合,提出了一种基于可变形卷积神经网络的数显仪表示数分割与识别方法。该方法包含图像预处理、字符分割与识别等步骤。首先,使用GrayWorld算法对待识别图像进行亮度均衡,并通过彩色分割提取屏幕区域;其次,对图像进行形态学操作,以便使用投影直方图法完成字符与对应小数点的整体分割;最后,设计并训练了一种可变形卷积神经网络对字符进行识别,优化了卷积神经网络感受野几何结构固定的内在问题。实验结果表明,加入可变形卷积有效提高了图像的识别准确率和网络的收敛速度;该方法的整体识别准确率达到99.45%,检测速度为10FPS,能够满足实际应用需求。
关键词
图像处理
字符识别
可变形卷积神经网络
投影直方图
Keywords
Image processing
Character recognition
deformable convolutional neural network
Projection histogram
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 复杂背景下SAR图像近岸舰船目标检测
被引量:8
2
作者
李永刚
朱卫纲
黄琼男
李云涛
何永华
机构
航天工程大学电子光学工程系
电子信息系统复杂电磁环境效应国家重点实验室
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2022年第10期3096-3103,共8页
基金
复杂电磁环境效应国家重点实验室项目(CEMEE2020Z0203B)资助课题。
文摘
针对合成孔径雷达(synthetic aperture radar,SAR)图像近岸舰船目标易受背景杂波的影响,造成SAR图像近岸舰船目标检测检测率低、虚警率和漏检率高的问题,提出一种适用于复杂背景下SAR图像近岸舰船目标检测的DFF-Yolov5(deformable feature fusion you only look once 5)算法。构建了一个专门用于SAR图像复杂背景近岸舰船目标检测的数据集,基于Yolov5目标检测算法,在特征提取网络中进行特征细化和多特征融合两个方面的改进。在特征提取网络中利用可变形卷积神经网络改变卷积对目标采样点的位置,增强目标的特征提取能力,提高复杂背景下SAR图像舰船目标的检测率。在多特征融合网络结构中采用级联和并列金字塔,进行不同层级的特征融合。同时,使用空洞卷积扩大特征提取的视觉感受野,增强网络对复杂背景近岸多尺度舰船目标的适应性,降低复杂背景下SAR图像舰船目标检测的虚警率。通过在构建的复杂背景近岸舰船检测数据集上的测试实验,结果表明:DFF-Yolov5的平均准确率为85.99%,相比于原始的Yolov5,所提方法平均准确率提高了5.09%,精度提高了1.4%。
关键词
合成孔径雷达
目标检测
近岸舰船目标
多特征融合
可变形卷积神经网络
Keywords
synthetic aperture radar(SAR)
target detection
near-shore ship target
multi-feature fusion
deformable convolutional neural network
分类号
TN95
[电子电信—信号与信息处理]
题名 C-3D可变形卷积神经网络模型的肺结节检测
被引量:7
3
作者
阮宏洋
陈志澜
程英升
杨凯
机构
上海海洋大学工程学院
上海建桥学院机电学院
上海市第六人民医院东院放射介入科
出处
《激光与光电子学进展》
CSCD
北大核心
2020年第4期144-154,共11页
基金
上海市教委“工业机器人应用学位点建设与研究”项目(230001-17-13)。
文摘
在C-3D卷积神经网络模型基础上,提出了一种三维可变形卷积神经网络以实现肺结节的检测。在模型的主体结构上,采用了三维可变形卷积和三维可变形池化的操作,解决了传统的方块卷积与池化在应对不规则的肺结节时,无法高效率地收集到肺结节像素点的问题。在模型的输入上,通过调整三维卷积神经网络的输入,实现了卷积神经网络对样本图片的32×32×32像素逐步扫描和识别,在扫描识别的同时进行定位,解决了肺结节定位问题。在模型的输出上,借鉴了全卷积神经网络的思想,将C-3D网络的第一层全连接层改为卷积层,解决训练时内存会溢出的问题。在模型参数上,提出了三种不同学习率和三种优化函数进行精确的实验对比,绘制了不同学习率和优化函数的参数对比图,根据实验结果找到最优的卷积神经网络模型学习率和优化函数参数。对实验结果的分析表明,该方法在受试者工作曲线下面积、分类准确率、召回率、F1值均取得了显著的提高。
关键词
图像处理
可变形卷积神经网络
肺结节
池化层
Keywords
image processing
deformable convolutional neural network
pulmonary nodules
pooling layer
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 以改进机器视觉算法构建纸张图像识别模型
4
作者
牟海荣
陆蕊
机构
广州城建职业学院
出处
《造纸科学与技术》
2024年第2期60-62,81,共4页
基金
广东省普通高校特色创新类项目(2022KTSCX377)。
文摘
为保障纸张生产加工质量,精准获取与识别纸张缺陷,以改进机器视觉算法构建了纸张图像识别模型。首先以由线阵CCD相机与双光源等构成的图像采集装备采集纸张缺陷图像,其次以改进机器视觉方法对纸张缺陷图像进行预处理分析,然后将预处理后图案以可变形卷积神经网络输入进行训练,以此检测识别纸张所存在的缺陷类型。实验测试结果表明,基于改进机器视觉算法的纸张图像识别模型可高效且精准识别缺陷,准确率高达98.4%,拥有较高识别度,可广泛推广以投入实际运用。
关键词
机器视觉
可变形卷积神经网络
纸张缺陷
图像识别
模型构建
Keywords
machine vision
deformable convolutional neural network
paper defects
image recognition
model building
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于YOLOX-S的车窗状态识别算法
被引量:1
5
作者
黄键
徐伟峰
苏攀
王洪涛
李真真
机构
华北电力大学(保定)计算机系
河北省能源电力知识计算重点实验室
出处
《吉林大学学报(理学版)》
CAS
北大核心
2023年第4期875-882,共8页
基金
国家自然科学基金(批准号:61802124)
全国高等院校计算机基础教育研究会项目(批准号:2019-AFCEC-125)
中央高校基本科研业务费专项基金(批准号:2021MS089).
文摘
通过对YOLOX-S模型引入可变形卷积神经网络和焦点损失函数(Focal loss),解决原YOLOX-S模型车窗识别准确率较低的问题.首先,通过在YO LOX-S模型的主干特征提取网络中引入可变形卷积神经网络,对卷积核中的各采样点引入偏移量,以便在原始图像中提取到更具有表征的信息,从而提高车窗识别的精准度;其次,使用Focal loss替代原模型中的二元交叉熵损失函数,Focal loss能缓解正负样本不平衡对训练的影响,其在训练过程中更关注难样本,从而提高了模型对车窗目标的识别性能;最后,为验证改进算法的性能,实验收集并标注15627张图片进行训练和验证.实验结果表明,改进后的车窗识别算法的平均目标精度提高了3.88%.
关键词
车窗识别
YOLOX-S模型
可变形卷积神经网络
焦点损失
Keywords
car window recognition
YOLOX-S model
deformable convolutional neural network
Focal loss
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于可变形卷积神经网络的肺结节假阳性识别
被引量:1
6
作者
王梦南
赵涓涓
肖宁
郝瑞
机构
太原理工大学信息与计算机学院
山西财经大学信息学院
出处
《计算机工程与设计》
北大核心
2022年第6期1732-1739,共8页
基金
国家自然科学基金项目(61972274)
中国博士后科学基金项目(2018M631774)。
文摘
针对肺结节检测中假阳性高的问题,提出一种基于可变形卷积神经网络的肺结节假阳性降低框架。使用多尺度候选结节作为输入,使用可变形卷积神经网络提取候选结节的多层次上下文特征,渐进融合不同输入顺序的候选结节特征信息。通过端到端的学习方式集成多流渐进特征信息得到最终的分类结果。在LUNA16数据集和合作医院临床数据集上,所提框架CPM评分优于已有方法,检测出的结节数量最多,假阳性结节数量最少,有很好的泛化能力,能有效降低结节假阳性,适用于真实的临床数据。
关键词
渐进特征提取
可变形卷积神经网络
多流特征集成
假阳性降低
临床数据
Keywords
gradual feature extraction
deformable convolutional neural network
multi-stream feature integration
false positive reduction
clinical data
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于增强可逆性插值滤波器设计的编码方法
7
作者
张秋阳
黄晓峰
殷海兵
机构
杭州电子科技大学通信工程学院
出处
《杭州电子科技大学学报(自然科学版)》
2022年第2期14-20,55,共8页
基金
国家自然科学基金资助项目(61901150)。
文摘
可逆性分像素插值滤波器可以解决插值没有真实样本的难点,但是,存在传统卷积核形状固定、正则项损失函数冲突等不足。为此,提出一种增强的可逆性插值滤波器设计优化方案。首先,引入可变形卷积层,改变卷积核的形状和不同位置的像素参与卷积的权重,增大了感受野,提高了网络的适应性;然后,在正则项设计中,引入生成对抗网络,提升了网络的收敛能力;最后,使用基于运动模糊方法生成的训练样本来替代原本的基于离散余弦变换生成的样本,达到更逼近真实运动的效果。实验结果表明,和H.265相比,改进方案的BD-rate指标提升了2.56%。
关键词
视频编码
帧间预测
分像素插值
可变形卷积神经网络
Keywords
video coding
inter-frame prediction
fractional interpolation
deformable convolutional neural network
分类号
TN919.81
[电子电信—通信与信息系统]