期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
改进U-Net网络的遥感影像道路提取方法研究 被引量:18
1
作者 宋廷强 刘童心 +3 位作者 宗达 蒋晓旭 黄腾杰 范海生 《计算机工程与应用》 CSCD 北大核心 2021年第14期209-216,共8页
从遥感影像中提取道路目标对智慧城市建设具有重要意义。由于遥感数据中道路及背景特征复杂多样,使用深度学习方法对道路进行提取的准确性仍然受到限制。基于U-Net网络架构设计实现了用于遥感影像道路提取的深度语义分割模型AS-Unet,该... 从遥感影像中提取道路目标对智慧城市建设具有重要意义。由于遥感数据中道路及背景特征复杂多样,使用深度学习方法对道路进行提取的准确性仍然受到限制。基于U-Net网络架构设计实现了用于遥感影像道路提取的深度语义分割模型AS-Unet,该模型分为编码器和解码器两部分。在编码器部分加入通道注意力机制,对提取的丰富低层特征进行筛选,突出目标特征,抑制背景噪声干扰,从而提高深浅层信息融合准确率;为解决网络对道路目标单一尺寸的敏感问题,在编码器最后一层卷积层后面加入空间金字塔池化模块来捕获不同尺度道路特征;在解码器部分加入空间注意力机制,进行位置关系信息学习和深层次语义特征筛选,提高特征图还原能力。在Massachusetts和DeepGlobe道路数据集上进行实验,结果证明,在召回率、精度、F1值等评估指标上,明显优于SegNet、FCN等语义分割网络。所设计的AS-Unet网络性能优良,具有更高的分割准确率,具备一定理论和实际应用价值。 展开更多
关键词 语义分割 高分辨率影像 道路提取 注意力机制 空间金字塔模型 卷积神经网络
下载PDF
层次聚类结合空间金字塔的图像分类 被引量:4
2
作者 刘明波 胡朝举 《计算机应用研究》 CSCD 北大核心 2018年第11期3476-3478,共3页
目前,K-means聚类算法所构建的视觉词典已无法满足用户对图像分类的需求,为了提高视觉词汇码本的质量和图像分类的准确率,针对构建视觉词典的算法进行研究。在空间金字塔模型的基础上,图像分类算法首先采用K-means算法对SIFT特征进行初... 目前,K-means聚类算法所构建的视觉词典已无法满足用户对图像分类的需求,为了提高视觉词汇码本的质量和图像分类的准确率,针对构建视觉词典的算法进行研究。在空间金字塔模型的基础上,图像分类算法首先采用K-means算法对SIFT特征进行初步聚类,得到一个粗略的划分,然后利用层次聚类进行精确归类,最后对视觉词典进行特征编码并且用SVM分类器进行分类;在混合的聚类算法中引入基于信息熵的属性加权方法,通过信息熵度量类间及类内的相似性。在Catchl01和Catch256图像库上的实验结果表明,与传统的Kmeans算法和加权K-means算法相比,结合信息熵的混合聚类算法能够有效提高空间金字塔模型的分类准确率。 展开更多
关键词 层次聚类 信息熵 空间金字塔模型 图像分类 K-MEANS聚类
下载PDF
基于多核学习的静态图像人体行为识别方法 被引量:4
3
作者 杨红菊 冯进丽 郭倩 《数据采集与处理》 CSCD 北大核心 2016年第5期958-964,共7页
提出一种基于广义性多核学习的静态图像人体行为识别方法。从图像中提取基于边缘的梯度方向直方图和基于稠密采样的尺度不变特征描述子,并使用空间金字塔模型加入粗略空间信息;运用直方图内交核函数计算金字塔模型各层核矩阵,通过广义... 提出一种基于广义性多核学习的静态图像人体行为识别方法。从图像中提取基于边缘的梯度方向直方图和基于稠密采样的尺度不变特征描述子,并使用空间金字塔模型加入粗略空间信息;运用直方图内交核函数计算金字塔模型各层核矩阵,通过广义性多核学习方法求解各个核矩阵权重,以线性组合方式得到最优核矩阵;最后利用多核学习决策函数进行行为识别。Willow-actions数据集实验结果表明,本文方法比其他几种方法更加有效。 展开更多
关键词 行为识别 广义性多核学习 空间金字塔模型 直方图内交核函数
下载PDF
融合LBP和小波矩特征的肺癌图像精细分类 被引量:1
4
作者 王生生 王琪 《东北师大学报(自然科学版)》 CAS CSCD 北大核心 2017年第2期57-63,共7页
在肺癌图像精细分类中,进一步区分小细胞肺癌、鳞肺癌、腺肺癌、细支气管肺泡癌还不够成熟,为此,在改进现有精细图像分类研究工作的基础上,利用无须码本与释文的快速模板匹配框架,融合了LBP(Local Binary Pattern)纹理特征和小波矩形状... 在肺癌图像精细分类中,进一步区分小细胞肺癌、鳞肺癌、腺肺癌、细支气管肺泡癌还不够成熟,为此,在改进现有精细图像分类研究工作的基础上,利用无须码本与释文的快速模板匹配框架,融合了LBP(Local Binary Pattern)纹理特征和小波矩形状特征,提出了适合肺癌数据的精细图像分类新方法.将纹理特征与形状特征融合,通过分配两种特征的权重,用融合特征进行模板匹配.匹配结果表示成特征响应图的形式,再通过改进的均值空间金字塔模型,从特征响应图中抽取有用特征,进行分类训练.实验结果表明,该方法在肺部影像数据库联盟(LIDC)数据库上达到了91.75%的平均正确率,证明了肺癌图像精细分类方法的有效性. 展开更多
关键词 医学图像 特征融合 精细分类 空间金字塔模型
下载PDF
基于稀疏编码空间金字塔模型的零样本学习 被引量:1
5
作者 董夙慧 徐永刚 陈晨 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第6期696-702,共7页
针对目前零样本图像分类均采用图像底层视觉特征训练属性分类器而导致分类精度较低的问题,提出一种基于稀疏编码空间金字塔模型的零样本学习方法,给出系统结构流程图.首先从原始视觉图像中提取SIFT特征,并进行SIFT特征点提取;然后构建... 针对目前零样本图像分类均采用图像底层视觉特征训练属性分类器而导致分类精度较低的问题,提出一种基于稀疏编码空间金字塔模型的零样本学习方法,给出系统结构流程图.首先从原始视觉图像中提取SIFT特征,并进行SIFT特征点提取;然后构建空间金字塔最大池化模型,对已提取的SIFT中间特征进行稀疏编码;最后建立间接属性预测模型.给出基于稀疏编码的空间金字塔最大池化模型的零样本学习算法步骤,完成对目标图像的属性预测,从而达到零样本图像分类的目的.在Shoes数据集与OSR数据集上进行了对比试验.结果表明:试验证实了文中算法的有效性;相对于传统算法,试验耗时减少,图像属性预测精度增加,图像分类识别率提高. 展开更多
关键词 视觉特征 零样本问题 稀疏编码 空间金字塔模型 属性分类器
下载PDF
基于梯度方向二进制模式的空间金字塔模型方法 被引量:1
6
作者 郭军 周晖 +1 位作者 朱长仁 肖顺平 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第2期129-133,共5页
空间金字塔模型由于其优势在当前图像分类中得到了广泛应用。然而,其码本生成和特征量化这两个环节具有较高的计算复杂度。为了解决这个问题,提出了一种新的局部特征表述———梯度方向二进制模式,首先对图像稠密采样得到多个子图像块,... 空间金字塔模型由于其优势在当前图像分类中得到了广泛应用。然而,其码本生成和特征量化这两个环节具有较高的计算复杂度。为了解决这个问题,提出了一种新的局部特征表述———梯度方向二进制模式,首先对图像稠密采样得到多个子图像块,再将每个子图像块均匀划分为2×2个网格,计算每个网格的梯度直方图,然后对所有网格的梯度主方向进行二进制编码并连接为二进制串值,该二进制串值转换的十进制数即为子图像块的特征表述,最后将该特征表述嵌入到SPM模型中。在标准分类数据库上的实验结果证明了本方法在算法耗时和分类精度上均优于基于SIFT的SPM方法。 展开更多
关键词 空间金字塔模型 梯度方向二进制模式 局部特征描述 图像分类
下载PDF
基于深度学习的高分辨率遥感图像建筑物识别 被引量:44
7
作者 宋廷强 李继旭 张信耶 《计算机工程与应用》 CSCD 北大核心 2020年第8期26-34,共9页
为解决当前深度学习方法在高分辨率遥感图像中存在识别结果过度分割,以及小物体识别差的问题,提出一种基于SegNet架构改进的网络模型AA-SegNet,增加了增强的空间金字塔池化模块和空间注意力融合模块。该网络可以加强特征传播并能够有效... 为解决当前深度学习方法在高分辨率遥感图像中存在识别结果过度分割,以及小物体识别差的问题,提出一种基于SegNet架构改进的网络模型AA-SegNet,增加了增强的空间金字塔池化模块和空间注意力融合模块。该网络可以加强特征传播并能够有效传递更高级别的特征信息以抑制低级特征的噪声,并且可以增强小目标特征学习。基于高分二号遥感影像制作数据集并进行实验,AA-SegNet网络总体识别准确率为96.61%,在识别率、F1分数以及训练时间等方面也都优于SegNet、U-Net、DeepLab-V3网络。 展开更多
关键词 深度学习 建筑识别 高分辨率遥感 增强型空间金字塔模型 注意力机制 语义分割
下载PDF
基于卷积神经网络的语义分割算法研究 被引量:7
8
作者 熊炜 童磊 +3 位作者 金靖熠 王传胜 王娟 曾春艳 《计算机应用研究》 CSCD 北大核心 2021年第4期1261-1264,共4页
针对语义分割中残差网络并不能完好地提取图像信息和分割效果差的问题,提出一种联合特征金字塔模型(JFP)用来融合残差网络的输出特征,并结合暗黑空间金字塔池化模型(ASPP)进一步提取特征。在解码部分应用简单的解码结构,恢复图像尺寸完... 针对语义分割中残差网络并不能完好地提取图像信息和分割效果差的问题,提出一种联合特征金字塔模型(JFP)用来融合残差网络的输出特征,并结合暗黑空间金字塔池化模型(ASPP)进一步提取特征。在解码部分应用简单的解码结构,恢复图像尺寸完成语义分割;同时引入注意力模型作为辅助语义分割网络,辅助神经网络进行训练。该方法分别在Pascal VOC 2012数据集和增强的Pascal VOC 2012数据集上对网络进行训练,并在Pascal VOC 2012的验证集上进行测试,其平均交并集之比(mIoU)分别达到了78.55%和80.14%,表明该方法具有良好的语义分割性能。 展开更多
关键词 图像语义分割 联合特征金字塔模型 暗黑空间金字塔模型 注意力模型
下载PDF
基于超像素空间金字塔模型的场景识别研究 被引量:6
9
作者 程少光 何毕 +1 位作者 布树辉 刘贞报 《计算机工程与应用》 CSCD 2014年第7期139-143,共5页
针对以往场景识别研究中将图像分割成大小相等的矩形区域进行特征提取而导致识别率低的问题,提出了一种基于超像素空间金字塔模型的场景识别方法:先对图像做不同分辨率的超像素分割,在得到的每个图像子区域中提取PACT特征,然后利用K-me... 针对以往场景识别研究中将图像分割成大小相等的矩形区域进行特征提取而导致识别率低的问题,提出了一种基于超像素空间金字塔模型的场景识别方法:先对图像做不同分辨率的超像素分割,在得到的每个图像子区域中提取PACT特征,然后利用K-means聚类构建出图像集的视觉词典。在进行场景识别时,将每幅图像所有分割子区域的PACT特征连接成一个特征向量,并加入bag of words特征进行分类,最终的场景分类结果在支持向量机LIBSVM上获得。实验结果表明该算法能够有效提高识别率。 展开更多
关键词 场景识别 超像素空间金字塔模型 BAG of words特征 支持向量机
下载PDF
哈希编码结合空间金字塔的图像分类 被引量:8
10
作者 彭天强 栗芳 《中国图象图形学报》 CSCD 北大核心 2016年第9期1138-1146,共9页
目的稀疏编码是当前广泛使用的一种图像表示方法,针对稀疏编码及其改进算法计算过程复杂、费时等问题,提出一种哈希编码结合空间金字塔的图像分类算法。方法首先,提取图像的局部特征点,构成局部特征点描述集。其次,学习自编码哈希... 目的稀疏编码是当前广泛使用的一种图像表示方法,针对稀疏编码及其改进算法计算过程复杂、费时等问题,提出一种哈希编码结合空间金字塔的图像分类算法。方法首先,提取图像的局部特征点,构成局部特征点描述集。其次,学习自编码哈希函数,将局部特征点表示为二进制哈希编码。然后,在二进制哈希编码的基础上进行K均值聚类生成二进制视觉词典。最后,结合空间金字塔模型,将图像表示为空间金字塔直方图向量,并应用于图像分类。结果在常用的Caltech-101和Scene-15数据集上进行实验验证,并和目前与稀疏编码相关的算法进行实验对比。与稀疏编码相关的算法相比,本文算法词典学习时间缩短了50%,在线编码速度提高了1.3~12.4倍,分类正确率提高了1%~5%。结论提出了一种哈希编码结合空间金字塔的图像分类算法,利用哈希编码代替稀疏编码对局部特征点进行编码,并结合空间金字塔模型用于图像分类。实验结果表明,本文算法词典学习时间更短、编码速度更快,适用于在线词典学习和应用。 展开更多
关键词 哈希编码 空间金字塔匹配模型 稀疏编码 二进制K均值聚类 图像分类
原文传递
基于拉普拉斯非负稀疏编码的图像分类 被引量:6
11
作者 李钱钱 曹国 《计算机工程》 CAS CSCD 2013年第11期240-244,共5页
针对复杂背景下的图像分类问题,结合非负稀疏编码和局部保持投影算法,提出一种拉普拉斯正则化非负稀疏编码算法。相比于已有的稀疏编码算法,该算法不仅能更好地模拟哺乳动物初级视觉系统主视皮层V1区简单细胞感受野的行为,同时也可使相... 针对复杂背景下的图像分类问题,结合非负稀疏编码和局部保持投影算法,提出一种拉普拉斯正则化非负稀疏编码算法。相比于已有的稀疏编码算法,该算法不仅能更好地模拟哺乳动物初级视觉系统主视皮层V1区简单细胞感受野的行为,同时也可使相似的特征经过编码后仍然相似,从而保证特征度量的一致性。将该算法与空间金字塔匹配模型相结合应用于图像分类,在多个图像数据库上的实验结果表明,该算法具有较高的分类精度。 展开更多
关键词 稀疏编码 非负稀疏编码 拉普拉斯非负稀疏编码 空间金字塔匹配模型 图像分类 支持向量机
下载PDF
基于二进制哈希与空间金字塔的视觉词袋模型生成方法 被引量:1
12
作者 彭天强 栗芳 《计算机工程》 CAS CSCD 北大核心 2016年第12期164-170,共7页
构建视觉词典是视觉词袋模型中的关键步骤,目前大多数视觉词典是基于k-means及其改进算法聚类生成。但由于k-means聚类的局限性以及样本空间结构的复杂性与高维性,该方式构建的视觉词典存在区分性较差、构建时间过长、不包含空间信息等... 构建视觉词典是视觉词袋模型中的关键步骤,目前大多数视觉词典是基于k-means及其改进算法聚类生成。但由于k-means聚类的局限性以及样本空间结构的复杂性与高维性,该方式构建的视觉词典存在区分性较差、构建时间过长、不包含空间信息等问题。为此,提出一种改进的视觉词袋模型生成方法,以缩短视觉词典的构建时间。提取图像的局部特征点,构成局部特征点描述集。学习二进制哈希函数,将局部特征点映射为视觉单词,并对视觉词进行过滤,生成二进制哈希码的视觉词典。利用生成的视觉词典,结合空间金字塔匹配模型生成新的视觉词典模型,将图像表示为空间金字塔直方图向量,并应用于图像分类和检索。实验结果表明,该模型具有较高的分类精度和检索性能。 展开更多
关键词 二进制哈希 空间金字塔匹配模型 视觉词袋模型 图像分类 图像检索
下载PDF
基于Mask- YOLOv3的口罩检测模型 被引量:1
13
作者 杨芳 秦建军 +1 位作者 孟圆 郑皓冉 《北京建筑大学学报》 2022年第6期88-95,共8页
在常态化疫情防控中,针对公共场所流动人群进行口罩佩戴检测存在的受检测目标小、背景复杂等因素影响,导致常规算法存在口罩目标准确率不高的问题,基于YOLOv3算法改进的网络结构Mask-YOLOv3模型融合了密集型卷积神经网络和YOLOv3算法,... 在常态化疫情防控中,针对公共场所流动人群进行口罩佩戴检测存在的受检测目标小、背景复杂等因素影响,导致常规算法存在口罩目标准确率不高的问题,基于YOLOv3算法改进的网络结构Mask-YOLOv3模型融合了密集型卷积神经网络和YOLOv3算法,解决了小目标提取特征不够充分的问题,增强了卷积层网络特征传播能力,提高了网络检测目标精度。通过添加网络空间金字塔池化结构模型增强了特征的复用,用K-means修改目标先验框加强网络对小目标的检测能力。结果表明,基于Mask-YOLOv3的口罩检测模型在步行街、食堂、商场等复杂环境能够更准确地检测出人群口罩佩戴情况,改进模型的平均检测率达到91.3%,与原始YOLOv3算法相比提高了5.6%,召回率达到89.2%,表明该网络模型对口罩检测更加有效。 展开更多
关键词 移动人群 口罩检测 YOLOv3 DenseNet 空间金字塔池化模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部