-
题名基于双线性插值的单目标检测算法
被引量:1
- 1
-
-
作者
吕艳辉
方亮
-
机构
沈阳理工大学
-
出处
《火力与指挥控制》
CSCD
北大核心
2024年第1期73-79,86,共8页
-
基金
辽宁省教育厅基金资助项目(LJKZ0241)。
-
文摘
针对已有算法对于空中小目标检测效果差、精度低、漏检等问题,提出一种基于双线性插值的单目标检测算法。对主干网络进行设计,再根据特征图的特点,使用不同的方法进行特征融合。在特征融合的过程中使用双线性插值算法进行上采样。对算法的先验框进行设计,使算法的先验框尺寸与数据集目标框尺寸更加契合。实验结果表明,提出算法的平均检测精度对比SSD提升了10.29%,算法计算量对比Faster-RCNN减少了82.18%。
-
关键词
空中小目标检测
双线性插值
特征融合
先验框
-
Keywords
air small target detection
bilinear interpolation
feature fusion
priori box
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多尺度分层双线性池化网络的细粒度表情识别模型
被引量:5
- 2
-
-
作者
苏志明
王烈
蓝峥杰
-
机构
广西大学计算机与电子信息学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第12期299-307,315,共10页
-
基金
广西自然科学基金(2013GXNSFAA0019339)。
-
文摘
人脸表情细微的类间差异和显著的类内变化增加了人脸表情识别难度。构建一个基于多尺度双线性池化神经网络的识别模型。设计3种不同尺度网络提取人脸表情全局特征,并引入分层双线性池化层,集成多个同一网络及不同网络的多尺度跨层双线性特征以捕获不同层级间的部分特征关系,从而增强模型对面部表情细微特征的表征及判别能力。同时,使用逐层反卷积融合多层特征信息,解决神经网络通过多层卷积层、池化层提取特征时丢失部分关键特征的问题。实验结果表明,该模型在FER2013和CK+公开数据集上的识别率分别为73.725%、98.28%,优于SLPM、CL、JNS等人脸表情识别模型。
-
关键词
卷积神经网络
细粒度表情识别
多尺度网络
分层双线性池化
多层特征融合
-
Keywords
Convolution Neural Network(CNN)
fine-grained expression recognition
multiple-scale network
hierarchical bilinear pooling
multilayer feature fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合注意力的纺织品瑕疵检测方法研究
- 3
-
-
作者
周在雍
狄岚
-
机构
江南大学人工智能与计算机学院
江南大学数字媒体学院
-
出处
《智能系统学报》
CSCD
北大核心
2024年第4期827-838,共12页
-
基金
国家自然科学基金项目(71971031).
-
文摘
本文阐述了一种名为SAAM-YOLOX的基于改进YOLOX的纺织品瑕疵检测模型,旨在解决纺织品瑕疵检测中针对犬牙花纹与格纹背景中出现的误检和漏检问题,以及整体检测精度不高的问题。在特征提取阶段,该模型引入了离散余弦变换所构建的多分支离散余弦注意力机制(multi-branch discrete cosine attention,MDCA),能够解决模型在犬牙花纹与格纹背景中出现的误检和漏检问题,并且在检测精度上有一定的提高;在特征融合阶段,为了聚集和加强不同尺度的语义特征,SAAM-YOLOX模型采用了尺度聚合技术和注意力机制来构建尺度聚合注意力模块(scale aggregation attention module,SAAM)。在SAAM的上采样过程中,使用双线性插值结合自注意力机制来增强特征信息的有效性,从而进一步提高检测的精度。在完成尺度聚合后,加入注意力模块来增强混合尺度的特征表示,最终实现提高检测效果的目的。实验结果表明,本文检测模型解决了犬牙花纹与格纹背景中出现的误检和漏检问题,并且提高了瑕疵检测的精度。
-
关键词
注意力机制
尺度聚合
双线性插值
离散余弦变换
多尺度特征
特征融合
纺织品瑕疵检测
计算机视觉
-
Keywords
attention mechanism
scale aggregation
bilinear interpolation
discrete cosine transform
multi-scale feature
feature fusion
textile defect detection
computer vision
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于双线性池化引导特征融合的轴承故障诊断算法
- 4
-
-
作者
陈毅朋
吴飞
周凯东
-
机构
山西职业技术学院电气自动化工程系
郑州大学机械与动力工程学院
中国机械设备工程股份有限公司
-
出处
《航空发动机》
北大核心
2024年第5期145-152,共8页
-
基金
国家自然科学基金面上项目(52175153)资助。
-
文摘
为了深入优化滚动轴承在变负载驱动环境下特征提取不充分、轴承故障特征表征不足的问题,提出了基于双线性池化引导特征融合的轴承故障诊断算法。对读取到的原始信号数据进行预处理,通过去除直流分量、噪声滤波、抗混叠滤波、时域窗函数等操作,提高信号处理后的振动谱图质量;对预处理后的信号数据进行傅里叶变换,计算出变换后的幅值和频率数据,并绘制对应的振动谱图;利用通道注意力和空间注意力改进Res2Net网络,提取不同关注点下的视觉特征,并基于双线性池化方法进行多特征融合;利用全连接和softmax函数构建分类头,实现轴承故障分类。结果表明:所提出的方法在凯斯西储大学轴承数据集以及德国Paderborn数据集中的精确率分别为98.22%、97.94%,在轴承故障诊断中,所提算法不仅在理论上融合了自动化控制理论与控制工程原理,而且在实践中验证了其在轴承故障诊断中的有效性,为实现轴承故障的早期预警和智能诊断提供了新的技术途径。
-
关键词
滚动轴承
振动谱图
故障诊断
双线性池化
多特征融合
-
Keywords
rolling bearing
vibration spectrogram
fault diagnosis
bilinear pooling
multi-feature fusion
-
分类号
V299.2
[航空宇航科学技术]
-
-
题名基于双线性特征融合的皮肤病分类研究
- 5
-
-
作者
黄志伦
刘俊
郑萌
-
机构
武汉科技大学计算机科学与技术学院
智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学)
武汉理工大学计算机科学与技术学院
-
出处
《计算机技术与发展》
2023年第2期161-166,共6页
-
基金
教育部科技基础工作专项项目(2014FY110900)。
-
文摘
皮肤覆盖肌肉、骨骼和身体的每个部分,是人体中最大的器官。由于其暴露于外界,所以感染更容易发生在皮肤上。皮肤病作为一种常见疾病,利用计算机技术对其进行辅助诊断,有助于减轻医生负担。针对常规卷积神经网络应用于皮肤病图像分类时由于不同种皮肤病图像之间的类间相似性以及同种皮肤病图像之间具有类内差异性导致分类困难的问题,提出一种改进双线性特征融合模型。使用经过剪枝的Inception-ResNet-v1和v2版本作为特征提取器并行提取图像特征,对特征进行双线性融合,获取更多阶数的特征信息可以提高模型对图像细节的敏感度。然后添加额外的软注意力模块,通过加权和的方式进行过滤或者加强,给图像每个位置给予不同的权重以达到对模型的加强效果。在skin-cancer-classesisic数据集上的7种皮肤病图像上进行训练,与S-CNN、MobileNet和Incremental CNN的对比证明了该模型的有效性,在Precision、Recall和F1-Score指标上该模型均为最优。
-
关键词
皮肤病
深度学习
双线性特征融合
注意力机制
图像分类
-
Keywords
skin disease
deep learning
bilinear feature fusion
attention mechanism
image classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合用户社会关系的双线性扩散图推荐模型
- 6
-
-
作者
竺笈
肖晓丽
尹波
孙倩
谈东
-
机构
长沙理工大学计算机与通信工程学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2023年第4期826-836,共11页
-
基金
国家自然科学基金(61902040)。
-
文摘
为了解决传统协同过滤算法中用户行为数据的稀疏问题,在图卷积网络的基础上,提出了一个融合用户社会关系的双线性扩散图推荐模型,并设计了双线性扩散聚合器。该聚合器由两大核心部分组成:一是用来捕捉用户-邻居交互信息的扩散聚合部分,该部分通过建模用户社交影响的动态扩散过程,从社交图的局部邻域中聚合邻居信息到目标用户节点上,以此丰富目标用户表征;二是用来捕捉邻居-邻居交互信息的双线性聚合部分,该部分通过挖掘同阶用户邻居之间潜在的社会交互,并使用内积操作突出邻居社交信息中的共有特征,将其作为目标用户的辅助信息完善用户嵌入。为了验证该模型的有效性,在Yelp和Flickr数据集上进行推荐实验,并与现有的推荐模型进行实验对照分析。实验结果显示,该模型较现有的推荐模型有更高的命中率和归一化折损累计增益。因此,融合用户社会关系的双线性扩散图推荐模型能够有效缓解用户行为数据的稀疏问题,并使得推荐准确率有了较大提升。
-
关键词
社会化推荐
双线性网络
图卷积网络
特征融合
-
Keywords
social recommendation
bilinear network
graph convolutional network
feature fusion
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于双线性特征融合方法的畸变失真图像质量评价
- 7
-
-
作者
陆绮荣
丁昕
梁雅雯
-
机构
桂林理工大学信息科学与工程学院
广西嵌入式技术与智能系统重点实验室(桂林理工大学)
-
出处
《中国科技论文》
CAS
北大核心
2023年第3期259-264,291,共7页
-
基金
国家自然科学基金资助项目(62166012)。
-
文摘
针对畸变失真图像影响后续图像信息获取的问题,提出了一种基于双线性特征融合方法的畸变失真图像质量评价算法。首先基于人类视觉对图像结构特征敏感的特点提取结构图像,然后将原始图像和结构图像作为双流卷积网络的输入,将两支路网络输出的低层结构特征和高层语义特征通过双线性池化层进行特征融合,最后通过全连接层输出图像质量预测分数。为了验证算法的有效性,在4个公开的图像数据集LIVE、CSIQ、MLIVE与TID2013上进行实验。结果表明,所提算法与当前的失真图像质量评价算法相比,在LIVE、CSIQ和MLIVE数据集上斯皮尔曼等级相关系数(Spearman rank-order correlation coefficient,SROCC)和皮尔逊线性相关系数(Pearson linear correlation coefficient,PLCC)指标至少提升0.2%左右,在TID2013数据集上SROCC值至少提升0.5%左右。所提算法评价结果与人类视觉主观感知有较好的一致性,对多种失真图像质量评价可以取得不错的效果。
-
关键词
畸变失真图像
双流卷积网络
双线性池化
特征融合
-
Keywords
distorted images
two-stream convolutional network
bilinear pooling
feature fusion
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名面向智能仓储的特征融合物品检测算法
- 8
-
-
作者
白欢
袁庆霓
王晨
李恒
孙睿彤
衣君辉
-
机构
贵州大学现代制造技术教育部重点实验室
-
出处
《组合机床与自动化加工技术》
北大核心
2022年第10期55-58,63,共5页
-
基金
国家自然科学基金资助项目(51865004)
贵州省科技厅(黔科合基础-ZK[2022]一般40号)
+1 种基金
贵州大学研究生创新人才计划项目(2021)
横向课题科技项目:基于专利分析的工业机器人技术研究(K19-0204-001)。
-
文摘
针对现有的仓储货柜环境复杂,货柜物品检测效率低的问题,提出一种特征融合的物品检测算法。该算法在RFBNet网络的基础上通过双线性插值操作将语义信息丰富的深层特征融入到细节信息丰富的浅层特征中,以加深特征间的关联提取出更多的目标特征信息;在特征图后添加注意力机制,让网络调整不同通道中重要特征的权重,提高模型性能。实验结果表明,本文所提的网络模型的mAP值为87.47%,比RFBNet提高了8.42%。
-
关键词
目标检测
RFB模块
双线性插值
特征融合
注意力机制
-
Keywords
object detection
RFB module
bilinear interpolation
feature fusion
attention mechanism
-
分类号
TH165
[机械工程—机械制造及自动化]
TG502
[金属学及工艺—金属切削加工及机床]
-
-
题名基于3D和1D多特征融合的语音情感识别算法
被引量:9
- 9
-
-
作者
徐华南
周晓彦
姜万
李大鹏
-
机构
南京信息工程大学电子与信息工程学院
-
出处
《声学技术》
CSCD
北大核心
2021年第4期496-502,共7页
-
基金
国家自然基金(61902064、81971282)
中央基本科研业务费(2242018K3DN01)。
-
文摘
针对语音情感识别任务中特征提取单一、分类准确率低等问题,提出一种3D和1D多特征融合的情感识别方法,对特征提取算法进行改进。在3D网络,综合考虑空间特征学习和时间依赖性构造,利用双线性卷积神经网络(Bilinear Convolutional Neural Network,BCNN)提取空间特征,长短期记忆网络(Short-Term Memory Network,LSTM)和注意力(attention)机制提取显著的时间依赖特征。为降低说话者差异的影响,计算语音的对数梅尔特征(Log-Mel)和一阶差分、二阶差分特征合成3D Log-Mel特征集。在1D网络,利用一维卷积和LSTM的框架。最后3D和1D多特征融合得到判别性强的情感特征,利用softmax函数进行情感分类。在IEMOCAP和EMO-DB数据库上实验,平均识别率分别为61.22%和85.69%,同时与提取单一特征的3D和1D算法相比,多特征融合算法具有更好的识别性能。
-
关键词
语音情感识别
双线性卷积网络
长短期记忆网络
注意力(attention)
多特征融合
-
Keywords
speech emotion recognition
bilinear convolutional neural network(BCNN)
long short-term memory(LSTM)
attention mechanism
multi-feature fusion
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于跨层精简双线性网络的细粒度鸟类识别
被引量:9
- 10
-
-
作者
蓝洁
周欣
何小海
滕奇志
卿粼波
-
机构
四川大学电子信息学院
中国信息安全测评中心
-
出处
《科学技术与工程》
北大核心
2019年第36期240-246,共7页
-
基金
国家自然科学基金(61871278)
成都市产业集群协同创新项目(2016-XT00-00015-GX)
+1 种基金
四川省科技计划(2018HH0143)
四川省教育厅项目(18ZB0355)资助
-
文摘
细微的类间差异和显著的类内变化使得细粒度图像分类极具挑战性。为了对鸟类图像进行细粒度识别,提出一种基于跨层精简双线性池化的深度卷积神经网络模型。首先,根据Tensor Sketch算法计算出多组来自不同卷积层的精简双线性特征向量;其次,将归一化后的特征向量级联送至softmax分类器;最后,引入成对混淆对交叉熵损失函数进行正则化以优化网络。提出的模型无需额外的部件标注,可进行端到端的训练。结果表明,在公开的CUB-200—2011鸟类数据集上,该模型取得了较好的性能,识别正确率为86.6%,较BCNN提高2.5%。与多个先进细粒度分类算法的对比,验证了提出模型的有效性和优越性。
-
关键词
鸟类识别
精简双线性变换
跨层特征融合
成对混淆
细粒度图像分类
-
Keywords
bird species recognition
compact bilinear transformation
cross-layer feature fusion pairwise confusion
fine-grained image classification
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名复杂背景下远距离及小尺寸行人检测改进算法
被引量:5
- 11
-
-
作者
谢永明
王红蕾
-
机构
贵州大学电气工程学院
-
出处
《计算机工程与设计》
北大核心
2021年第5期1323-1330,共8页
-
基金
国家自然科学基金项目(61861007)
黔科合平台人才基金项目([2016]5103)。
-
文摘
针对远距离及小尺寸行人难以检测,极易受到复杂背景的干扰,且分辨率低、有效信息少等问题,提出一种在复杂背景下结合Faster R-CNN检测远距离及小尺寸行人的改进算法。运用混合高斯模型,解决复杂背景干扰的问题,及时去除视频的背景信息,提取视频图像的前景。为进一步解决分辨率低且有效信息少的问题,采用双线性二次插值方法增强图像的分辨率,采用多尺度特征融合弥补有效信息的不足。实验结果表明,不同场景下行人检测精度均有所提升,其中远距离及小尺寸行人的检测精度提升更为明显。
-
关键词
卷积神经网络
行人检测
混合高斯模型
双线性二次插值
多尺度特征融合
-
Keywords
convolutional neural network
pedestrian detection
mixed Gaussian model
bilinear quadratic interpolation
multi-scale feature fusion
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进B-CNN模型的羊绒与羊毛纤维识别
被引量:5
- 12
-
-
作者
朱耀麟
穆婉婉
王进美
李文雅
-
机构
西安工程大学电子信息学院
西北工业大学电子信息学院
西安工程大学纺织科学与工程学院
-
出处
《西安工程大学学报》
CAS
2021年第6期46-53,共8页
-
基金
陕西省教育厅2020重点研究计划产业用纺织品协同创新中心项目(20JY026)
榆林市科技局科创新城项目(2018-2-24)
榆林科技局科技计划(CXY-2020-052)。
-
文摘
由于物体本身较小的类间差异和因拍摄环境、背景等导致的较大的类内差异,羊绒和羊毛的图像识别一直是纺织领域的难题。为解决羊绒与羊毛纤维难以鉴别的问题,提出一种改进的双线性卷积神经网络(bilinear convolutional neural network,B-CNN)模型用于羊绒和羊毛纤维识别。该方法通过对两路网络进行改进,提取纤维原始样本图像和骨架图像不同层次特征向量,采用向量拼接方式融合2幅图像特征,实现信息互补,从而增强特征表达能力,最后使用迁移训练,解决纤维扫描电子显微镜(scanning electron microscope,SEM)图像小样本问题,提高分类精度和效率。实验结果表明:该模型与经典B-CNN模型相比,测试集准确率最高可达98.06%,说明该模型能够有效解决羊绒与羊毛纤维识别问题。
-
关键词
羊绒
羊毛
双线性卷积神经网络模型
特征融合
迁移训练
-
Keywords
cashmere
wool
bilinear convolutional neural network model
feature fusion
transfer training
-
分类号
TS102.3
[轻工技术与工程—纺织工程]
-
-
题名基于空-谱融合网络的高光谱图像分类方法
被引量:4
- 13
-
-
作者
欧阳宁
朱婷
林乐平
-
机构
认知无线电与信息处理省部共建教育部重点实验室(桂林电子科技大学)
桂林电子科技大学信息与通信学院
-
出处
《计算机应用》
CSCD
北大核心
2018年第7期1888-1892,共5页
-
基金
国家自然科学基金资助项目(61661017
61362021)
+9 种基金
广西自然科学基金资助项目(2017GXNSFBA198212
2014GXNSFDA118035
2016GXNSFAA38014)
广西科技创新能力与条件建设计划项目(桂科能1598025-21)
桂林科技开发项目(20150103-6)
中国博士后科学基金资助项目(2016M602923XB)
桂林电子科技大学研究生教育创新计划资助项目(2016YJCXB02)
认知无线电与信息处理重点实验室基金资助项目(CRKL160104
CRKL150103
2011KF11)~~
-
文摘
针对高光谱图像分类中提取的空-谱特征表达能力弱及维数较高的问题,提出一种基于空-谱融合网络(SSF-Net)的高光谱图像分类方法。首先,利用双通道卷积神经网络(Two-CNN)同时提取高光谱图像的光谱和空间特征;其次,使用多模态压缩双线性池化(MCB)将所提取的多模态特征向量的外积投射到低维空间,以此产生空-谱联合特征。该特征融合网络,既可以分析光谱特征和空间特征向量中元素之间的复杂关系,同时也避免对光谱和空间向量直接进行外积计算,造成维数过高、计算困难的问题。最终实验表明,与现有基于神经网络的分类方法相比,所提出的高光谱图像分类算法能够获得更高的像元分类精度,表明该网络所提取的空-谱联合向量对高光谱图像具有更强的特征表达能力。
-
关键词
空-谱融合网络
多模态压缩双线性池化
特征融合
外积
高光谱图像分类
-
Keywords
Spatial-Spectral fusion Network (SSF-Net)
multimodal compact bilinear pooling feature fusion outer product HyperSpectral Image (HSI)
classification
-
分类号
TP753
[自动化与计算机技术—检测技术与自动化装置]
TP18
[自动化与计算机技术—控制科学与工程]
-
-
题名基于特征融合的FL-BCNN鱼类识别算法研究
被引量:2
- 14
-
-
作者
葛艳
张亚婷
李海涛
-
机构
青岛科技大学信息科学技术学院
-
出处
《计算机应用与软件》
北大核心
2023年第8期174-179,186,共7页
-
基金
国家自然科学基金项目(61973180,61273180)
山东省重点研究计划项目(2018GGX101052)
山东省自然科学基金项目(ZR2019MF033)。
-
文摘
为了解决水下相机设备捕获的鱼类图像质量差、数据量不均匀等难以准确识别鱼类的问题,提出一种基于特征融合的FL-BCNN鱼类识别算法。对B-CNN算法进行改进,融合不同卷积层的特征,提高细粒度特征的表达能力,解决了图像质量差引起的特征不明显的问题。利用焦点损失函数(Focal Loss)解决样本数据不平衡的问题,提高水下鱼类图像的识别能力。利用F4K(15)数据集与四个已有算法进行鱼类识别对比实验。实验结果表明,FL-BCNN鱼类识别算法的识别精度较高,具有较好的识别速度,可以有效解决鱼类识别中样本不平衡的问题。
-
关键词
水下鱼类识别
细粒度图像
双线性卷积神经网络
特征融合
焦点损失
-
Keywords
Underwater fish recognition
Fine-grained image
bilinear convolutional neural network
feature fusion
Focus loss
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-