期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于创新实践能力培养的精准分层教学 被引量:53
1
作者 王永雄 丁德瑞 +1 位作者 宋燕 孙杰 《中国电化教育》 CSSCI 北大核心 2017年第12期109-114,共6页
创新实践能力培养是当今高等教育的重要目标,特别是机器人、人工智能等跨多专业的新工科的快速发展,对现有的教学和培养模式提出了更高的要求。精准教学是面向知识教学的精准、系统的评估方法。该文借助精准教学的精准评估策略和良好的... 创新实践能力培养是当今高等教育的重要目标,特别是机器人、人工智能等跨多专业的新工科的快速发展,对现有的教学和培养模式提出了更高的要求。精准教学是面向知识教学的精准、系统的评估方法。该文借助精准教学的精准评估策略和良好的教学效果,结合传统集中式高效的授课方式,将精准教学与传统的集中教学模式实现无缝对接,提出了"分组+阶段+模块"的分层精准教学模式,"分组"进行广度上的专业基础知识教学,"阶段"进行深度上的知识学习,"模块"实施功能导向式的培养。同时差异化分组策略可以激发学生的竞争意识,提升学习兴趣,有助于形成良好的学习和研究氛围,从而提高学生的解决问题和创新实践能力。 展开更多
关键词 精准教学 创新实践 分层教学 教学模式
下载PDF
一种基于关键帧的人体行为识别方法 被引量:12
2
作者 梅阳 王永雄 +2 位作者 秦琪 尹钟 孙杰 《光学技术》 CAS CSCD 北大核心 2017年第4期323-328,共6页
为了提高人体动作识别的准确率和实时性,提出了一种基于关键帧的人体行为识别新方法。用Kinect提取人体骨架信息(各关节点的3D坐标),将中心点(人体基准参考点)分别与其他各关节点作结构向量,根据空间不变性选取中心向量,计算各个结构向... 为了提高人体动作识别的准确率和实时性,提出了一种基于关键帧的人体行为识别新方法。用Kinect提取人体骨架信息(各关节点的3D坐标),将中心点(人体基准参考点)分别与其他各关节点作结构向量,根据空间不变性选取中心向量,计算各个结构向量和中心向量之间的夹角,并将夹角的角速度作为一种新的姿态描述特征,利用AP(Affinity Propagation)聚类算法提取关键帧,利用SVM将得到的关键帧进行动作序列的分类。在Cornell Activity Dataset-60(CAD-60)数据库实验结果表明,新方法具有良好的识别能力。 展开更多
关键词 人体行为识别 人体关节点 人体特征表示 AP聚类 SVM(Support VECTOR Machine)分类器
原文传递
融合视频时空域运动信息的3D CNN人体行为识别 被引量:11
3
作者 刘嘉莹 孙杰 《电子测量技术》 2018年第7期43-49,共7页
为更好地获取视频中人体行为的运动和时间序列信息,提出了一种新颖的融合时空域运动信息的3D卷积神经网络(3DCNN)用于视频的人体行为识别。该网络采用2个连续3D卷积层,再连接池化层,以获得更细致的特征描述,网络同时包含3个Dropout层... 为更好地获取视频中人体行为的运动和时间序列信息,提出了一种新颖的融合时空域运动信息的3D卷积神经网络(3DCNN)用于视频的人体行为识别。该网络采用2个连续3D卷积层,再连接池化层,以获得更细致的特征描述,网络同时包含3个Dropout层,防止网络的过拟合。利用Flatten层实现多维特征输入一维化,提高网络的通用性。使用Adam优化算法自主动态调整学习率和更新权值,并在网络输入层融合了人体运动的4种信息,分别是原始视频段、基于Farnebck的x和y方向光流场以及基于帧差法的视频帧差。3D CNN的多通道自动获取了人体行为视频中基于光流的运动信息和基于帧差的运动目标信息。在KTH和UCF101两个通用人体行为视频数据集的实验结果,验证了提出的融合运动信息通道和运动目标通道的新3D CNN与普通CNN、单通道的3D CNN相比,识别率明显的提高、训练速度明显加快,证明了附加的运动和姿态变化信息对人体行为识别效果有明显的提高。 展开更多
关键词 人体行为识别 3D CNN Farnebck光流 帧差法
下载PDF
基于改进的YOLOv3及其在遥感图像中的检测 被引量:8
4
作者 陈磊 孙杰 王永雄 《小型微型计算机系统》 CSCD 北大核心 2020年第11期2321-2324,共4页
为进一步提高遥感图像的小目标识别率,本文提出一种基于双向金字塔特征融合的卷积神经网络.首先将网络最后一层的卷积层特征输出与相邻上一层的卷积层特征输出相结合,构成自顶向下的金字塔特征层,还考虑将浅层的卷积层特征输出与相邻下... 为进一步提高遥感图像的小目标识别率,本文提出一种基于双向金字塔特征融合的卷积神经网络.首先将网络最后一层的卷积层特征输出与相邻上一层的卷积层特征输出相结合,构成自顶向下的金字塔特征层,还考虑将浅层的卷积层特征输出与相邻下一层的卷积层特征输出相结合,构成自底向上的金字塔特征层,融合双向结合的金字塔特征.其次为保留更多小目标空间位置信息,将网络的第一个降采样层改为两个3×3的卷积层.此外利用K-means++聚类算法对目标候选框的个数和宽高比进行聚类分析.最后采用1×1的卷积减小网络模型的维度,提高网络的检测速度.在VEDAI和NWPU VHR-10公开数据集的识别实验结果表明,改进后的YOLOv3识别准确率要高于原网络模型,且检测速度几乎保持不变. 展开更多
关键词 遥感图像 融合双向金字塔特征 卷积神经网络 K-means++
下载PDF
基于卷积神经网络的回环检测算法 被引量:8
5
作者 罗顺心 孙杰 《计算机与数字工程》 2019年第5期1020-1026,1048,共8页
论文主要针对于移动机器人在视觉定位和建图过程中的回环检测问题进行研究。回环检测是视觉SLAM中的一个至关重要的部分之一。在机器人移动过程中,机器人通过估算自身的位姿,以及感知周围的环境,实现定位和建图。由于机器人在估计位姿... 论文主要针对于移动机器人在视觉定位和建图过程中的回环检测问题进行研究。回环检测是视觉SLAM中的一个至关重要的部分之一。在机器人移动过程中,机器人通过估算自身的位姿,以及感知周围的环境,实现定位和建图。由于机器人在估计位姿时使用的是帧间位姿估计,因此位姿的估计回随着时间的增加而产生漂移。回环检测则是针对于解决位姿漂移问题。现在比较流行的方法就是使用人工建立的特征,使用视觉词袋的方法,来实现回环检测。论文提出了一种基于深度学习的卷积神经网络的回环检测方法。移动机器人通过传感器获取视觉图像的数据,将其输入到与训练好的卷积神经网络中,使用卷积特征作为图像的描述,然后对提取的特征进行处理,计算图像的相似度得分。最后在使用了本地的数据集和TUM数据集进行验证算法的有效性。 展开更多
关键词 视觉SLAM 回环检测 深度学习 位姿漂移 卷积神经网络
下载PDF
全尺度上下文融合网络用于医学细胞核分割
6
作者 周志 孙杰 晓玥 《控制工程》 CSCD 北大核心 2024年第6期1081-1090,共10页
针对细胞核图像边界模糊、对比度低,且细胞间易发生粘连等特点而导致难以准确分割的问题,本文提出了一种全尺度上下文融合网络用于细胞核的精准分割。首先,该模型结合全局上下文信息,设计了一个高级金字塔传导模块,用于对跳跃连接进行重... 针对细胞核图像边界模糊、对比度低,且细胞间易发生粘连等特点而导致难以准确分割的问题,本文提出了一种全尺度上下文融合网络用于细胞核的精准分割。首先,该模型结合全局上下文信息,设计了一个高级金字塔传导模块,用于对跳跃连接进行重构,为解码器提供全局信息传导流;其次,在编码器顶部创新性地加入了尺度聚合模块,该模块通过自学习可以动态地为不同尺度的目标选择合适的感受野,更好地融合多尺度上下文信息;同时,为了更好地利用最有用的特征通道,在上采样阶段加入了通道注意力机制;最后,使用改进的混合损失函数解决类不平衡的问题。在Data Science Bowl 2018和TCGA 2个数据集上进行实验,结果表明,所提出的算法能够提高对细胞核的分割性能。 展开更多
关键词 深度学习 细胞核分割 APC模块 注意力机制 尺度聚合
下载PDF
一种改进U型神经网络的医学细胞核图像分割方法 被引量:2
7
作者 周志 孙杰 晓玥 《小型微型计算机系统》 CSCD 北大核心 2023年第1期110-116,共7页
在细胞核分割任务中,存在细胞核的边缘轮廓信息模糊以及细胞核和背景的对比度低造成难以分割的问题.针对此问题,常规的U-Net模型通过跳跃连接在降采样和上采样过程中结合高低层次的信息,具有较好的分割效果.但是,在细胞核边界的分割上... 在细胞核分割任务中,存在细胞核的边缘轮廓信息模糊以及细胞核和背景的对比度低造成难以分割的问题.针对此问题,常规的U-Net模型通过跳跃连接在降采样和上采样过程中结合高低层次的信息,具有较好的分割效果.但是,在细胞核边界的分割上仍旧存在着一定程度的过分割、欠分割等缺陷.由此本文提出一种改进的U-Net网络模型.首先,该模型采用深度特征聚合结构和高级监督的学习方法,巧妙融合不同层级的信息,达到对目标的精准分割;其次在其架构上创新性的加入层次交融模块,该模块学习各个不同层次的重要性,将学到的权重加载到分割图上;同时在嵌套的卷积块中加入注意力机制,抑制冗余特征,使得细胞核和背景更好的分割开来;最后使用改进的混合损失函数解决类不平衡的问题.在dsb2018数据集上进行测试,本方法得到Dice系数为0.8719,交并比达到0.8853.结果表明本方法能够对细胞核进行更好的分割. 展开更多
关键词 深度学习 细胞核分割 自注意力机制 HBM模块 U-Net
下载PDF
基于多分支结构和注意力机制的实时语义分割网络
8
作者 曾永煌 孙杰 《智能计算机与应用》 2024年第5期107-114,共8页
在实时语义分割方法研究中,由于目标感受野有限,目前仍然存在大目标分割不准确和细节信息丢失的问题。针对这个问题,提出一种基于多分支结构和注意力机制的实时语义分割算法。首先,本文构建多分支结构的细节路径以保留多尺度细节信息,... 在实时语义分割方法研究中,由于目标感受野有限,目前仍然存在大目标分割不准确和细节信息丢失的问题。针对这个问题,提出一种基于多分支结构和注意力机制的实时语义分割算法。首先,本文构建多分支结构的细节路径以保留多尺度细节信息,减少小目标细节丢失;其次,设计空洞金字塔分支扩大感受野,以覆盖视野内大目标,进一步丰富上下文信息;最后,提出双边注意力特征融合模块,以增强特征融合时对关键特征的选择,弥补小目标信息的缺失。在Cityscapes测试集、CamVid测试集所提模型的平均交并比(mIoU)为74.6%与73.6%,每秒传输帧数(Frames Per Second,FPS)为94与74;较于BiSeNet,本文算法的mIoU分别提高了6.2、8.0个百分点。实验结果表明,本文算法在实时性和准确性方面获得了很好的平衡。 展开更多
关键词 实时语义分割 多分支结构 注意力机制 特征融合
下载PDF
融合类增强与多尺度自适应的小样本学习方法
9
作者 董驰静 孙杰 任涵 《数据采集与处理》 CSCD 北大核心 2024年第3期689-698,共10页
为了解决小样本学习存在特征信息提取不足、难以准确地捕获局部明显特征信息的问题,提出了一种融合类增强与多尺度自适应的小样本学习方法。首先在特征的层面上对图像进行类增强,通过将特征图的每次激活与其邻域相关联来编码丰富的语义... 为了解决小样本学习存在特征信息提取不足、难以准确地捕获局部明显特征信息的问题,提出了一种融合类增强与多尺度自适应的小样本学习方法。首先在特征的层面上对图像进行类增强,通过将特征图的每次激活与其邻域相关联来编码丰富的语义结构,使提取后的类内特征明显,更利于当前的分类任务。其次通过多尺度特征生成来提取不同尺度上图像特征的低层表示。最后对每个尺度上的语义相关矩阵进行权重分配与相似元素最大化计算查询图像与各支持集类别图像之间的语义相似度,多尺度信息进行融合后,对目标图像进行分类。在5-way 1-shot和5-way 5-shot设置中,该方法在miniImageNet数据集上的均值平均精度(mean Average precision,mAP)分别为56.83%和75.76%,在常用细粒度图像数据集Stanford Cars和CUB-200-2011分类基准上分别达到了79.33%和93.92%、66.33%和85.78%,均优于现有方法的最好结果。 展开更多
关键词 小样本学习 类增强 多尺度特征生成 自适应任务注意
下载PDF
基于感知推理和外部空间先验特征的图像修复
10
作者 吴鹏 孙杰 +2 位作者 王永雄 陈远峰 覃海旺 《数据采集与处理》 CSCD 北大核心 2024年第4期933-943,共11页
在基于深度学习的图像修复算法中,当存在大面积掩码时,由于缺乏合理的先验信息指导,修复结果往往会出现伪影和模糊纹理等现象。针对此问题,提出将先验特征与图像预测滤波相结合的图像修复算法。该算法包含两个分支:图像滤波核预测分支... 在基于深度学习的图像修复算法中,当存在大面积掩码时,由于缺乏合理的先验信息指导,修复结果往往会出现伪影和模糊纹理等现象。针对此问题,提出将先验特征与图像预测滤波相结合的图像修复算法。该算法包含两个分支:图像滤波核预测分支和特征推理与图像滤波分支。从图像滤波核预测分支的解码器部分提取特征,利用多尺度外部空间特征融合对掩码区域特征进行重建,并传递给另一分支的解码阶段作为先验特征,为图像修复提供更为丰富的语义信息。然后,在特征推理和图像滤波分支部分引入空间特征感知推理块,它能够过滤掉分散注意力的特征,同时捕捉信息丰富的远距离图像上下文进行推理。最后,使用图像预测滤波核进行过滤消除伪影。在CelebA和Places2数据集上与其他修复网络进行对比实验,证明了该方法在修复质量上的优越性。 展开更多
关键词 图像修复 先验特征 图像预测滤波 特征感知推理 外部空间特征融合
下载PDF
融合多尺度特征的工业缺陷检测模型 被引量:1
11
作者 何思锐 孙杰 王永雄 《小型微型计算机系统》 CSCD 北大核心 2023年第5期1029-1034,共6页
利用照相机成像对工业环境中的物体进行表面缺陷检测是自动检测的主要应用之一.近年来,生产规模的扩大对缺陷的快速检测提出了要求,传统方法难以达到较高的效率.同时,缺陷检测更注重对纹理特征的提取,通用的深度卷积网络不能直接应用于... 利用照相机成像对工业环境中的物体进行表面缺陷检测是自动检测的主要应用之一.近年来,生产规模的扩大对缺陷的快速检测提出了要求,传统方法难以达到较高的效率.同时,缺陷检测更注重对纹理特征的提取,通用的深度卷积网络不能直接应用于该任务.为了克服以上挑战,本文提出了一种基于单阶段目标检测算法的表面缺陷检测模型,通过更宽的骨干网络提取丰富的上下文信息,进行多尺度特征融合,针对不同的检测目标采用差异化的检测头部;同时引入注意力机制,提高特征利用率;为了验证所提出方法的有效性,在3个数据集上进行了实验,取得了较好的性能,并与其他模型进行比较,表明所提出的方法优于现有方法. 展开更多
关键词 卷积神经网络 缺陷检测 多尺度特征融合 注意力机制
下载PDF
基于CAFPN和细化双头解耦的遥感图像目标检测 被引量:1
12
作者 熊娟 孙杰 +1 位作者 阚亚亚 陈家豪 《应用科学学报》 CAS CSCD 北大核心 2023年第6期989-1003,共15页
针对遥感图像背景的复杂性和图中目标尺寸小、方向任意性导致漏检或错检的问题,提出了一种新颖的目标检测算法。首先,提出一种基于上下文信息增强的特征金字塔网络。在特征提取阶段,自适应融合不同感受野,获得具有丰富语义信息的特征,... 针对遥感图像背景的复杂性和图中目标尺寸小、方向任意性导致漏检或错检的问题,提出了一种新颖的目标检测算法。首先,提出一种基于上下文信息增强的特征金字塔网络。在特征提取阶段,自适应融合不同感受野,获得具有丰富语义信息的特征,减少小目标的信息流失。然后,在回归网络中,使用中心点偏移回归机制实现旋转框的检测,降低冗余锚框带来的计算复杂度。最后,结合双头网络将分类和回归特征解耦,通过注意力机制和极化函数引导的特征细化模块构建适应各自任务的重要特征,使网络能准确地检测目标。在遥感数据集DOTA、HRSC2016和UCAS_AOD上验证网络的有效性,对比于Faster RCNN算法,该算法在3个数据集上获得了8.48%、7.60%和3.10%的精度提升,实现了高性能的遥感图像目标检测。 展开更多
关键词 遥感图像 上下文信息增强 注意力机制 极化函数 特征细化
下载PDF
结合transformer多尺度实例交互的稀疏集目标检测
13
作者 阚亚亚 孙杰 +1 位作者 熊娟 祖奕 《应用科学学报》 CAS CSCD 北大核心 2023年第5期777-788,共12页
为改进稀疏集目标检测方法存在的特征图缺乏空间细节信息、目标特征没有做到全局上下文实例交互、全局语义信息没有得到充分学习等问题,设计了一种结合自适应特征增强和实例特征交互的稀疏集目标检测算法。自适应特征增强模块在特征提... 为改进稀疏集目标检测方法存在的特征图缺乏空间细节信息、目标特征没有做到全局上下文实例交互、全局语义信息没有得到充分学习等问题,设计了一种结合自适应特征增强和实例特征交互的稀疏集目标检测算法。自适应特征增强模块在特征提取过程中利用不同尺度的池化和卷积来丰富高级语义信息,减小低级语义信息背景噪声的干扰,降低目标错检率和漏检率。实例特征交互模块在边界框回归设计中结合transformer的多层注意力,并融合通道注意力和动态卷积网络对建议框的通道信息进行增强,改善了目标的边缘信息,提高了网络的实例特征交互效率。最后在COCO2017数据集与原始网络进行实验对比,平均精度提升了4.2%,其中在大目标上提升了4.6%,在PASCAL VOC数据集上提升了2.7%。 展开更多
关键词 稀疏集目标检测 多尺度特征 实例特征交互 TRANSFORMER
下载PDF
融合交互信息和能量特征的三维复杂人体行为识别 被引量:4
14
作者 王永雄 曾艳 +3 位作者 李璇 尹钟 孙杰 刘丽 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1828-1834,共7页
基于与人交互的物体对人体行为识别的重要作用,本文提出了融合交互物体和能量信息等特征的三维复杂人体识别方法.首先提取手持物体的Hu矩作为交互物体特征,然后根据人体行为的生物学和运动学特征,从人体运动的能量角度提取人体骨架动能... 基于与人交互的物体对人体行为识别的重要作用,本文提出了融合交互物体和能量信息等特征的三维复杂人体识别方法.首先提取手持物体的Hu矩作为交互物体特征,然后根据人体行为的生物学和运动学特征,从人体运动的能量角度提取人体骨架动能、姿态势能、关节点位置等构建了局部特征矩阵,并聚类为词袋(Bag Of Word,BOW),与交互物体特征构成最终的组合特征;为了自动分割交互物体,我们提出了基于Harris角点的种子区域生长法,快速完整地分割手持物体;最后利用RBFSVM方法进行人体行为识别.实验结果表明融合交互物体信息和能量特征的三维人体行为识别方法具有较高的识别率,尤其能够较大幅度降低易混淆复杂动作的误识别率. 展开更多
关键词 人体行为识别 HU矩 能量特征 词袋 SVM
下载PDF
基于深度学习的回环检测算法研究 被引量:4
15
作者 罗顺心 孙杰 《计算机与数字工程》 2019年第3期497-502,共6页
针对移动机器人定位和建图过程中产生的位姿漂移问题,研究了在整个视觉SLAM框架中产生位姿漂移的原因。在使用视觉传感器的移动机器人进行移动的过程中,通过相邻两帧的图片,计算机器人的位姿变化,随着时间的增加,图片帧数的增加,每次计... 针对移动机器人定位和建图过程中产生的位姿漂移问题,研究了在整个视觉SLAM框架中产生位姿漂移的原因。在使用视觉传感器的移动机器人进行移动的过程中,通过相邻两帧的图片,计算机器人的位姿变化,随着时间的增加,图片帧数的增加,每次计算的位姿都是基于前一张图片,因此机器人的位姿误差逐渐累加,产生漂移。而论文的目的是为了解决机器人运动过程中产生的漂移问题。论文中使用了深度学习的方法来实现回环检测功能解决机器人的位姿漂移问题,并且通过实验验证了方法的有效性。 展开更多
关键词 视觉SLAM 回环检测 深度学习 位姿漂移
下载PDF
基于模糊层次分析法的计算机教学与创新实践能力培养评价 被引量:3
16
作者 王永雄 孙杰 《软件导刊》 2017年第12期225-228,共4页
随着机器人、人工智能等跨多学科的新工科快速发展,创新实践能力培养的重要性更加突出。为了准确评价创新实践能力培养与教学成效,为创新实践培养提供帮助与指导,构建了一套与实际紧密结合的创新实践能力培养评价指标体系,提出了采用模... 随着机器人、人工智能等跨多学科的新工科快速发展,创新实践能力培养的重要性更加突出。为了准确评价创新实践能力培养与教学成效,为创新实践培养提供帮助与指导,构建了一套与实际紧密结合的创新实践能力培养评价指标体系,提出了采用模糊聚类与层次分析法相结合的机器学习方法,自动确定指标权重,运用提出的模糊层次分析方法对创新实践能力培养进行评价。结果表明,评价系统客观、简单、可操作性强,并能够根据评价体系得分给出相关教学改进建议。 展开更多
关键词 教学评价 创新实践 模糊聚类 层次分析法
下载PDF
翻转课堂模式C语言教学应用启示 被引量:3
17
作者 孙杰 王永雄 《软件导刊.教育技术》 2017年第11期71-73,共3页
互联网对高等院校教育资源、教学模式、学习模式等影响深刻,慕课、玩转课堂等网络化教学方式涌现。C语言程序教学创新有利于增进师生课内外互动,更能体现出"教学相长"教学理念。网络化时代,C语言教学创新需要平台、教师、学生... 互联网对高等院校教育资源、教学模式、学习模式等影响深刻,慕课、玩转课堂等网络化教学方式涌现。C语言程序教学创新有利于增进师生课内外互动,更能体现出"教学相长"教学理念。网络化时代,C语言教学创新需要平台、教师、学生3个方面共同努力:平台需要集合优质教学资源,构建人性化教学界面;教师需要强化学生课内教授与课外网络学习互通互联,提升网络化教学能力;学生需要培养自学能力,加强自我管理与网络互动交流能力。 展开更多
关键词 互联网 教学模式 C语言 翻转课堂
下载PDF
多特征融合与尺度自适应核相关滤波跟踪算法 被引量:1
18
作者 冯汉 王永雄 孙杰 《计算机与数字工程》 2019年第5期1125-1130,共6页
针对传统核相关滤波(Kernelized Correlation Filters,KCF)跟踪算法中利用单一特征描述目标的不完善性和目标尺度不变的局限性,论文提出了一种融合快速梯度直方图特征(Fast Histogram of Oriented Gradient,FHOG)和颜色属性特征(Color N... 针对传统核相关滤波(Kernelized Correlation Filters,KCF)跟踪算法中利用单一特征描述目标的不完善性和目标尺度不变的局限性,论文提出了一种融合快速梯度直方图特征(Fast Histogram of Oriented Gradient,FHOG)和颜色属性特征(Color Name,CN)的尺度自适应核相关滤波算法。利用主成分分析法(Principal component analysis,PCA)获得鉴别力强的颜色属性特征减少计算量,达到颜色自适应的目的,并设计尺度自适应滤波器动态调整目标尺度。尺度滤波器与平移滤波器分别单独训练、局部优化,在保证跟踪实时性的基础上提高了算法的鲁棒性。和原KCF以及其改进算法相比,该方法在外观变形、尺度变化、光照变化、背景相似干扰等情况下有很好的适应性。 展开更多
关键词 目标跟踪 核相关滤波 尺度自适应 特征融合
下载PDF
一种轻量级的因子分解非局部网络
19
作者 唐亮 孙杰 刘燕 《小型微型计算机系统》 CSCD 北大核心 2022年第6期1185-1190,共6页
在传统的非局部操作中,对各个位置点之间长距离依赖性的逐个计算导致了庞大的计算量,使得其并不能成为一种即插即用的有效模块.基于此问题,我们提出一种新型的轻量级非局部(Lightweight Factorized Non-local,LFN)模块.LFN模块利用捕捉... 在传统的非局部操作中,对各个位置点之间长距离依赖性的逐个计算导致了庞大的计算量,使得其并不能成为一种即插即用的有效模块.基于此问题,我们提出一种新型的轻量级非局部(Lightweight Factorized Non-local,LFN)模块.LFN模块利用捕捉全局依赖性的非局部操作来提升神经网络的性能并应用于计算机视觉领域.LFN模块是对传统非局部操作的因子分解,通过对水平和垂直两个方向进行分解,网络不仅可以捕捉到像素点之间的长距离依赖关系,而且分解后的非局部操作计算量大幅度下降.然后,通过结合LFN模块和残差模块,我们设计RLFN(Residual Lightweight Factorized Non-local)单元,并基于该单元设计两种改良网络结构分别应用于图像分类和语义分割.最后,本文算法在CIFAR-10和PASCAL VOC2012两个数据集上进行分类及语义分割任务,实验结果表现该算法取得十分优越的性能. 展开更多
关键词 非局部 神经网络 图像分类 语义分割
下载PDF
一种自适应感受野卷积神经网络模型
20
作者 金勇逸 孙杰 《小型微型计算机系统》 CSCD 北大核心 2022年第9期1953-1957,共5页
本文提出一种自适应感受野卷积神经网络结构,简称ARFN(Adaptive Receptive Field Network).通过卷积核的自主选择机制来实现感受野的动态调整,更大程度上获取残差网络低层特征的空间信息并与高层特征进行自适应融合,弥补高层特征空间信... 本文提出一种自适应感受野卷积神经网络结构,简称ARFN(Adaptive Receptive Field Network).通过卷积核的自主选择机制来实现感受野的动态调整,更大程度上获取残差网络低层特征的空间信息并与高层特征进行自适应融合,弥补高层特征空间信息不足的缺陷.同时,在残差块中加入一种轻量的新型注意力机制,通过一维空洞卷积实现特征通道间适当的非线性交互,有效地学习各通道特征的权重.相较于一些主流的注意力模块而言,在保证性能提升的同时大幅度缩减了参数量.通过在公开数据集上进行图像分类和目标检测实验验证网络的有效性,结果表明本文提出的网络结构在视觉任务上性能都有较大提升. 展开更多
关键词 自适应感受野 注意力机制 目标检测 图像分类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部