期刊文献+
共找到100篇文章
< 1 2 5 >
每页显示 20 50 100
图像场景分类中视觉词包模型方法综述 被引量:25
1
作者 赵理君 唐娉 +1 位作者 霍连志 郑柯 《中国图象图形学报》 CSCD 北大核心 2014年第3期333-343,共11页
目的关于图像场景分类中视觉词包模型方法的综述性文章在国内外杂志上还少有报导,为了使国内外同行对图像场景分类中的视觉词包模型方法有一个较为全面的了解,对这些研究工作进行了系统总结。方法在参考国内外大量文献的基础上,对现有... 目的关于图像场景分类中视觉词包模型方法的综述性文章在国内外杂志上还少有报导,为了使国内外同行对图像场景分类中的视觉词包模型方法有一个较为全面的了解,对这些研究工作进行了系统总结。方法在参考国内外大量文献的基础上,对现有图像场景分类(主要指针对单一图像场景的分类)中出现的各种视觉词包模型方法从低层特征的选择与局部图像块特征的生成、视觉词典的构建、视觉词包特征的直方图表示、视觉单词优化等多方面加以总结和比较。结果回顾了视觉词包模型的发展历程,对目前存在的多种视觉词包模型进行了归纳,比较常见方法各自的优缺点,总结了视觉词包模型性能评价方法,并对目前常用的标准场景库进行汇总,同时给出了各自所达到的最高精度。结论图像场景分类中视觉词包模型方法的研究作为计算机视觉领域方兴未艾的热点研究领域,在国内外研究中取得了不少进展,在计算机视觉领域的研究也不再局限于直接应用模型描述图像内容,而是更多地考虑图像与文本的差异。虽然视觉词包模型在图像场景分类的应用中还存在很多亟需解决的问题,但是这丝毫不能掩盖其研究的重要意义。 展开更多
关键词 场景分类 视觉词包 低层特征 直方图表示
原文传递
融合全局和局部深度特征的高分辨率遥感影像场景分类方法 被引量:23
2
作者 龚希 吴亮 +3 位作者 谢忠 陈占龙 刘袁缘 俞侃 《光学学报》 EI CAS CSCD 北大核心 2019年第3期19-29,共11页
提出了一种融合全局和局部深度特征(GLDFB)的视觉词袋模型。通过视觉词袋模型将深度卷积神经网络提取的多个层次的高层特征进行重组编码并融合,利用支持向量机对融合特征进行分类。充分利用包含场景局部细节信息的卷积层特征和包含场景... 提出了一种融合全局和局部深度特征(GLDFB)的视觉词袋模型。通过视觉词袋模型将深度卷积神经网络提取的多个层次的高层特征进行重组编码并融合,利用支持向量机对融合特征进行分类。充分利用包含场景局部细节信息的卷积层特征和包含场景全局信息的全连接层特征,完成对遥感影像场景的高效表达。通过对两个不同规模的遥感图像场景数据集的实验研究表明,相比现有方法,所提方法在高层特征表达能力和分类精度方面具有显著优势。 展开更多
关键词 遥感 深度卷积神经网络 深度特征 视觉词袋模型 特征融合 高分辨率遥感影像场景分类
原文传递
基于深度学习的场景识别方法综述 被引量:8
3
作者 李新叶 朱婧 麻丽娜 《计算机工程与应用》 CSCD 北大核心 2020年第5期25-33,共9页
随着深度学习的快速发展,基于深度学习的场景识别方法逐渐取代传统的基于手工特征的场景识别方法,成为未来研究的主要方向。针对基于深度学习的场景识别方法,对基本思想进行了总结,将其大体分为以下四类:深度学习与视觉词袋结合场景识... 随着深度学习的快速发展,基于深度学习的场景识别方法逐渐取代传统的基于手工特征的场景识别方法,成为未来研究的主要方向。针对基于深度学习的场景识别方法,对基本思想进行了总结,将其大体分为以下四类:深度学习与视觉词袋结合场景识别法、基于显著部分的场景识别法、多层特征融合场景识别法、融合知识表示的场景识别法,分析了各个方法的特点及局限性,并对识别效果进行了比较,最后对未来研究方向进行展望。 展开更多
关键词 场景识别 深度学习 视觉词袋 显著目标 多层特征融合 语义关系
下载PDF
基于对象BOW特征的高分辨率遥感影像变化检测方法 被引量:6
4
作者 罗星 徐伟铭 王佳 《地球信息科学学报》 CSCD 北大核心 2018年第8期1150-1159,共10页
针对传统基于像素的变化检测方法的缺点,以及底层特征表现能力不足等问题,提出一种基于对象BOW特征的变化检测方法。首先,将经过预处理操作的两期影像进行波段组合得到组合后影像,再考虑地物光谱特征和几何空间信息对组合后影像进行多... 针对传统基于像素的变化检测方法的缺点,以及底层特征表现能力不足等问题,提出一种基于对象BOW特征的变化检测方法。首先,将经过预处理操作的两期影像进行波段组合得到组合后影像,再考虑地物光谱特征和几何空间信息对组合后影像进行多尺度分割,获得相对应的对象基元;同时,分别提取两幅影像的底层特征(包括影像各波段的均值和方差以及灰度图像的6种纹理特征)。其次,将对象视作文档,像素的特征向量视作单词,利用BOW模型构建影像对象的中层表达,即对象的BOW特征。最后,通过相似性度量算法比较相应对象的BOW特征,从而识别出影像上的变化区域。本文利用2组WorldView-2影像进行了检验,结果表明本文方法的变化检测结果较为完整,精度优于对比方法。本文方法基本能够满足变化检测的需求,为高分辨率遥感影像上的数据挖掘分析提供了有效的手段。 展开更多
关键词 视觉词包模型 变化检测 中层特征 对象 高分辨率遥感影像
原文传递
基于递归图的乐器识别算法 被引量:5
5
作者 黄雪梅 闫坤 +2 位作者 李亮 李慧慧 张李轩 《传感器与微系统》 CSCD 2020年第11期144-147,共4页
针对乐器分类问题,基于非线性动力学概念,将不同乐器产生的音频时间序列利用递归图方法进行处理,每组音频时间序列对应得到一张递归图。提取每张递归图的稠密比例不变特征变换(SIFT)特征,通过视觉词袋模型法将高维度的SIFT特征降维,得... 针对乐器分类问题,基于非线性动力学概念,将不同乐器产生的音频时间序列利用递归图方法进行处理,每组音频时间序列对应得到一张递归图。提取每张递归图的稠密比例不变特征变换(SIFT)特征,通过视觉词袋模型法将高维度的SIFT特征降维,得到每张递归图的视觉单词频率直方图向量作为特征输入线性支持向量机,采用支持向量机(SVM)算法中的"一对多法"实现多分类。实验表明,该方法识别准确率高于递归图密度比特征法,且比基于梅尔频率倒谱系数方法高出3%~4%。为乐器识别提供新思路。 展开更多
关键词 递归图 比例不变特征变换(SIFT)特征 视觉词袋模型 频率直方图 支持向量机
下载PDF
基于视觉词袋与文本分析的成人图像判定算法 被引量:3
6
作者 傅泉生 董开坤 尹璐 《计算机工程与应用》 CSCD 北大核心 2015年第4期175-179,208,共6页
针对目前单纯依赖于分析图像内容或文本关键词的成人图像判定算法的不足,提出一种融合网络图像的相关文本特征与图像内容语义特征的成人图像判定算法。成人图像的特征信息可能存在于其图像内容及其相关文本如图像文件名、所在网页中。... 针对目前单纯依赖于分析图像内容或文本关键词的成人图像判定算法的不足,提出一种融合网络图像的相关文本特征与图像内容语义特征的成人图像判定算法。成人图像的特征信息可能存在于其图像内容及其相关文本如图像文件名、所在网页中。在视觉词袋模型的基础上,将文本分析得到的相关文本特征与图像视觉元素特征如纹理、局部形态等进行底层特征融合,并采用支持向量机分类器实现图像分类。实验结果表明,该算法具有较好的分类效果。 展开更多
关键词 成人图像 图像识别 视觉词袋 文本分析 SVM分类
下载PDF
图像分类中基于分类矢量量化的视觉词袋模型 被引量:2
7
作者 王娇 罗四维 邹琪 《计算机工程与应用》 CSCD 北大核心 2019年第10期141-145,共5页
特征表示是图像识别和分类的基础,视觉词袋是一种图像的特征表示方法。分析现有视觉词典构建方法的不足,提出一种新的视觉词典构建方法。首先利用梯度方差把特征矢量分为光滑类和边缘类,然后分别针对不同类别的特征矢量进行视觉词典的构... 特征表示是图像识别和分类的基础,视觉词袋是一种图像的特征表示方法。分析现有视觉词典构建方法的不足,提出一种新的视觉词典构建方法。首先利用梯度方差把特征矢量分为光滑类和边缘类,然后分别针对不同类别的特征矢量进行视觉词典的构建,最后根据两类视觉词典生成视觉词袋。图像分类实验表明,提出的新方法能提高分类准确率。 展开更多
关键词 视觉词袋 图像分类 矢量量化 特征表示
下载PDF
基于空间共生词袋模型与卷积神经网络的医学影像分类方法 被引量:2
8
作者 刘东 邱博宇 +1 位作者 方芳 李尚林 《湘南学院学报》 2020年第2期26-31,共6页
医学图像分类技术对于医学辅助诊断具有重要的意义.相比较于自然图像分类,医学图像分类更注重于局部内容之间的细微差别与局部空间关系信息,而目前流行的视觉词袋模型忽视了空间关系信息,深度学习方法则缺少语义特性.因此,本文提出一种... 医学图像分类技术对于医学辅助诊断具有重要的意义.相比较于自然图像分类,医学图像分类更注重于局部内容之间的细微差别与局部空间关系信息,而目前流行的视觉词袋模型忽视了空间关系信息,深度学习方法则缺少语义特性.因此,本文提出一种新的空间共生词袋模型来刻画医学图像视觉单词之间的局部空间关系模式,并进一步与卷积神经网络特征融合,用于医学图像分类.实验结果表明,所提方法能够有效地挖掘医学图像的本质特征,取得高于目前流行方法的分类性能. 展开更多
关键词 视觉词袋模型 卷积神经网络 医学图像分类 特征表达
下载PDF
基于视觉词汇形状描述的图像表示方法 被引量:1
9
作者 王红霞 杨克俭 +2 位作者 张敏 艾浩军 陈先桥 《计算机工程与应用》 CSCD 2012年第21期191-196,204,共7页
针对目前图像表示中引入空间位置信息的空间金字塔匹配方法缺乏对图像中视觉物体平移、缩放和旋转的考虑,提出一种基于视觉词汇形状描述模型的图像表示方法。该方法相对于每个视觉单词的几何中心建立空间几何模型,保证平移不变性;给出... 针对目前图像表示中引入空间位置信息的空间金字塔匹配方法缺乏对图像中视觉物体平移、缩放和旋转的考虑,提出一种基于视觉词汇形状描述模型的图像表示方法。该方法相对于每个视觉单词的几何中心建立空间几何模型,保证平移不变性;给出对数极坐标空间金字塔匹配,对对数极半径做归一化,保证缩放不变性;在空间金字塔划分过程中确定极角的主方向,从而保证旋转不变性。分别在Caltech-101数据集和自建图像数据集上对该方法进行了验证和比较。实验结果表明,该方法提高了分类识别准确率,特别是对于包含明显平移、缩放和旋转变化的图像数据集;该方法的方差较小,说明其鲁棒性更强。 展开更多
关键词 物体分类 视觉词袋模型 图像表示 空间金字塔匹配 视觉词汇形状描述模型
下载PDF
基于词袋模型的医学图像分割
10
作者 史延新 薛鹏翔 +1 位作者 刘建伟 时华 《西安工业大学学报》 CAS 2017年第3期179-183,共5页
为了提高医学图像分割的准确性,从医学图像的特征出发,提出了一种利用词袋模型配合滑动窗口提取像素点特征的分割方法.通过引入词袋模型,建立分类的视觉词典,分别生成肝脏区域词典和背景区域词典,进而组合得到最终的联合视觉词典,利用... 为了提高医学图像分割的准确性,从医学图像的特征出发,提出了一种利用词袋模型配合滑动窗口提取像素点特征的分割方法.通过引入词袋模型,建立分类的视觉词典,分别生成肝脏区域词典和背景区域词典,进而组合得到最终的联合视觉词典,利用滑动窗口等提取像素点的基于词典表达的特征,对词袋模型的图像分割方法进行了优化.通过对腹部CT图像的肝脏和肝癌病灶分割实验,结果表明算法分割结果接近于医生手工分割结果,分割精度较高且具有效性.DICE等系数进一步证实算法的有效性. 展开更多
关键词 医学图像 词袋模型 视觉词典 滑动窗口
下载PDF
时空上下文编码的视频拷贝检测
11
作者 王荣波 陈浩 +1 位作者 孙小雪 张江丰 《传感器与微系统》 CSCD 2016年第11期143-147,共5页
基于内容的视频拷贝检测,目前最流行的方法是基于词袋模型的关键帧内容匹配方法。由于在空间上丢失了视觉词汇的上下文信息,而在时域中,同样丢失了关键帧时域上下文信息,此类方法的精度受到限制。针对这一问题,通过使用一个上下文模型... 基于内容的视频拷贝检测,目前最流行的方法是基于词袋模型的关键帧内容匹配方法。由于在空间上丢失了视觉词汇的上下文信息,而在时域中,同样丢失了关键帧时域上下文信息,此类方法的精度受到限制。针对这一问题,通过使用一个上下文模型用于计算视频关键帧的空间上下文信息和时域上下文信息,同时将时空上下文信息量化成二进制编码,并通过海明距离实现快速的时空上下文验证。在TREVID—2009视频集上的实验验证了该算法具有较高的效率与准确性。 展开更多
关键词 视频拷贝检测 词袋模型 上下文编码
下载PDF
一种基于优化“词袋”模型的物体识别方法 被引量:6
12
作者 李伟生 赵晓霞 《计算机应用研究》 CSCD 北大核心 2011年第9期3288-3290,共3页
针对传统基于"词袋"模型物体识别现有方法的不足,对现特征表达、视觉词典和图像表示方法进行优化,以提高物体识别正确率。采用HUE直方图与SIFT特征描述符分别描述兴趣点周围的颜色和形状特征,实现"词袋"模型下两种... 针对传统基于"词袋"模型物体识别现有方法的不足,对现特征表达、视觉词典和图像表示方法进行优化,以提高物体识别正确率。采用HUE直方图与SIFT特征描述符分别描述兴趣点周围的颜色和形状特征,实现"词袋"模型下两种特征的特征级和图像级融合,引入K-means++聚类算法生成视觉词典,并利用软权重思想将特征向量映射到视觉单词形成图像直方图。实验结果表明,所述方法会产生较高的物体识别正确率,且识别结果不受两种特征融合权重的影响。 展开更多
关键词 物体识别 “词袋”模型 特征融合 K-means++聚类 支撑向量机
下载PDF
基于视觉词袋模型的遥感图像分类方法 被引量:6
13
作者 周宇谷 王平 高颖慧 《重庆理工大学学报(自然科学)》 CAS 2015年第5期71-77,共7页
研究了基于视觉词袋模型的单幅全色遥感图像的分类方法。首先提取图像边缘特征与图像区域,以旋转不变纹理基元作为视觉词汇,再采用面向对象方法进行分类。仿真结果表明:该方法具有较高的分类精度,且具有用时成本较低和适应性强的优点。
关键词 遥感图像 分类 视觉词袋模型 面向对象
下载PDF
基于视觉单词选择的高分辨率遥感图像飞机目标检测 被引量:5
14
作者 李士进 仇建斌 於慧 《数据采集与处理》 CSCD 北大核心 2014年第1期60-65,共6页
高分辨率遥感图像中飞机目标的检测和识别具有重要的军事和民用价值,针对以往方法易受灰度分布和形态变化及伪装干扰等缺点,提出一种基于视觉词袋模型的高分辨率遥感图像飞机目标检测的新方法。为了精简飞机视觉码本得到最具鉴别力的视... 高分辨率遥感图像中飞机目标的检测和识别具有重要的军事和民用价值,针对以往方法易受灰度分布和形态变化及伪装干扰等缺点,提出一种基于视觉词袋模型的高分辨率遥感图像飞机目标检测的新方法。为了精简飞机视觉码本得到最具鉴别力的视觉单词,结合相关性及冗余度分析去除视觉码本中不相关、弱相关以及冗余的视觉单词,选择对飞机目标检测最为重要的视觉单词,减少了计算复杂度,提高了算法的检测性能。 展开更多
关键词 遥感图像 飞机检测 特征选择 视觉词袋
下载PDF
n-words模型下Hesse稀疏表示的图像检索算法 被引量:2
15
作者 王瑞霞 彭国华 《电子与信息学报》 EI CSCD 北大核心 2016年第5期1115-1122,共8页
论文针对视觉词袋(BOVW)模型放弃图像空间结构的缺点,提出一种基于Hesse稀疏编码的图像检索算法。首先,建立n-words模型,获得图像局部特征表示。n-words模型由一系列连续视觉词获得,是图像特征的一种高级描述。该文从n=1到n=5进行试验,... 论文针对视觉词袋(BOVW)模型放弃图像空间结构的缺点,提出一种基于Hesse稀疏编码的图像检索算法。首先,建立n-words模型,获得图像局部特征表示。n-words模型由一系列连续视觉词获得,是图像特征的一种高级描述。该文从n=1到n=5进行试验,寻找最恰当的n值;其次,将二阶Hesse能量函数融入标准稀疏编码的目标函数,得到Hesse稀疏编码公式;最后,以获得的n-words序列作为编码特征,利用特征符号搜索算法求解最优Hesse系数,计算相似度,返回检索结果。实验在两类数据集上进行,与BOVW模型和已有的算法相比,新算法极大地提高了图像检索的准确率。 展开更多
关键词 图像检索 稀疏编码 视觉词袋模型 n-words模型 Hesse能量函数
下载PDF
基于高层语义视觉词袋的色情图像过滤模型 被引量:2
16
作者 吕林涛 赵呈轩 +1 位作者 尚进 杨宇祥 《计算机应用》 CSCD 北大核心 2011年第7期1847-1849,共3页
针对目前色情图像过滤算法对比基尼图像和类肤色图像误检率过高,且不能有效过滤带有淫秽动作的多人色情图像的缺点,提出一种基于高层语义视觉词袋的色情图像过滤模型。该模型首先通过改进的SURF算法提取色情场景局部特征点,然后融合视... 针对目前色情图像过滤算法对比基尼图像和类肤色图像误检率过高,且不能有效过滤带有淫秽动作的多人色情图像的缺点,提出一种基于高层语义视觉词袋的色情图像过滤模型。该模型首先通过改进的SURF算法提取色情场景局部特征点,然后融合视觉单词的上下文和空间相关高层语义特征,从而构建色情图像的高层语义词典。实验结果表明,该模型检测带有淫秽动作的多人色情图像准确率可达87.6%,明显高于现有的视觉词袋色情图像过滤算法。 展开更多
关键词 色情图像 过滤 图像高层语义 语义树 视觉词袋 鲁棒特征加速
下载PDF
基于k密集近邻算法的局部Fisher向量编码方法 被引量:2
17
作者 冀治航 胡小鹏 +2 位作者 杨博 田云云 王凡 《大连理工大学学报》 EI CAS CSCD 北大核心 2020年第4期411-419,共9页
在基于视觉词包模型的图像分类方法中,Fisher向量编码是常用的图像表示方法之一.该方法利用每一个特征关于所有高斯子模型似然函数的梯度信息来构建图像表达.而在编码过程中,每一个特征都会被投影到所有的高斯子模型上并进行编码,同时... 在基于视觉词包模型的图像分类方法中,Fisher向量编码是常用的图像表示方法之一.该方法利用每一个特征关于所有高斯子模型似然函数的梯度信息来构建图像表达.而在编码过程中,每一个特征都会被投影到所有的高斯子模型上并进行编码,同时子模型之间的内在差异也未被考虑,这些不足削弱了Fisher向量的表达能力.为此,提出一种基于k密集近邻算法的局部Fisher向量编码方法.在编码过程中该方法引入局部性约束原则,并利用图像特征空间中高斯子模型间的拓扑结构差异.在多个数据集上进行测试,结果表明改进方法能够有效提升分类的准确率. 展开更多
关键词 视觉词包模型 图像分类 Fisher向量编码 k密集近邻算法
下载PDF
基于多尺度词包表示的hLDA模型的茶园识别研究 被引量:2
18
作者 王小芹 张志梅 王常颖 《青岛大学学报(自然科学版)》 CAS 2020年第3期28-33,42,共7页
以高分一号(GF-1)影像为数据源,构建了一种基于多尺度词包表示的层次隐狄利克雷分配(hierarchical latent Dirichlet Allocation,hLDA)模型的茶园识别框架。结合茶园自身的特点,以场景为基本单元提取茶园。研究结果表明,应用本文构建的... 以高分一号(GF-1)影像为数据源,构建了一种基于多尺度词包表示的层次隐狄利克雷分配(hierarchical latent Dirichlet Allocation,hLDA)模型的茶园识别框架。结合茶园自身的特点,以场景为基本单元提取茶园。研究结果表明,应用本文构建的方法能够得到较高的茶园识别精度。与只利用底层视觉特征的多尺度视觉词包(Multi-scale Bag-of-Visua-Words,MS_BOVW)模型相比,本文构建的方法能够把基于底层视觉特征的分析转化到高层语义信息上,得到更高的分类精度。 展开更多
关键词 高分辨率遥感影像 多尺度视觉词包模型 层次主题模型 茶园识别
下载PDF
基于自适应视距投影和类词典的三维模型检索 被引量:1
19
作者 刘志文 王耀侦 +1 位作者 庞枫骞 李衡 《计算机工程与设计》 北大核心 2016年第10期2744-2749,共6页
基于视图的三维模型检索中,为使投影后图像更多地保留模型的空间几何特征,充分利用模型库中的类标签信息,提出一种结合自适应视距投影和类词典的三维模型检索方法。从多个角度对三维模型进行自适应视距正交投影,得到多幅包含深度信息的... 基于视图的三维模型检索中,为使投影后图像更多地保留模型的空间几何特征,充分利用模型库中的类标签信息,提出一种结合自适应视距投影和类词典的三维模型检索方法。从多个角度对三维模型进行自适应视距正交投影,得到多幅包含深度信息的二维灰度图像;将监督引入到针对三维模型检索的视觉词袋框架中,构建出类词典;通过特征编码、计算模型之间的相似度实现检索。实验结果表明,该算法能够更好地描述三维模型的形状,提高了检索的准确率。 展开更多
关键词 三维模型检索 自适应视距投影 视觉词袋框架 最大后验概率估计 类词典
下载PDF
用于视觉词语生成的概率预测器
20
作者 史淼晶 徐蕊鑫 许超 《中国图象图形学报》 CSCD 北大核心 2013年第6期706-710,共5页
视觉词语的产生是基于字袋模型的图像检索中的重要一环:根据已知的视觉词典,查询图像特征被映射到词典中相应的视觉词语。提出一种新的基于空间相关性的快速视觉词语产生算法。统计视觉词典中任意两个词语在数据库中的共生次数,构建视... 视觉词语的产生是基于字袋模型的图像检索中的重要一环:根据已知的视觉词典,查询图像特征被映射到词典中相应的视觉词语。提出一种新的基于空间相关性的快速视觉词语产生算法。统计视觉词典中任意两个词语在数据库中的共生次数,构建视觉词语共生表。利用共生表,建立一种新的概率预测器来辅助预测已知词语的近邻词语。将预测器与快速近似最近邻查找算法结合,在标准图像检索数据库上进行实验测试,相比较传统的树形搜索算法或哈希算法,新算法在时间效率上获得明显提高。 展开更多
关键词 字袋模型 空间相关性 视觉词语共生表 概率预测器
原文传递
上一页 1 2 5 下一页 到第
使用帮助 返回顶部