期刊文献+
共找到358篇文章
< 1 2 18 >
每页显示 20 50 100
基于Bag-of-phrases的图像表示方法 被引量:25
1
作者 张琳波 王春恒 +1 位作者 肖柏华 邵允学 《自动化学报》 EI CSCD 北大核心 2012年第1期46-54,共9页
在过去的几年,将图像内容表示为特定"视觉词"出现次数直方图的Bag-of-words模型,展示了其在图像内容分类方面的强大优势.然而,在这种统计特定"视觉词"出现次数直方图的模型中,"视觉词"之间的相互位置关... 在过去的几年,将图像内容表示为特定"视觉词"出现次数直方图的Bag-of-words模型,展示了其在图像内容分类方面的强大优势.然而,在这种统计特定"视觉词"出现次数直方图的模型中,"视觉词"之间的相互位置关系几乎被完全丢弃了.本文从分析Bag-of-words模型在文本分类和图像内容分类领域的对应关系的角度出发,提出一种加入"视觉词"之间的相互位置关系的图像表示方法—Bag-of-phrases模型.在标准数据集上验证了该图像表示方法对图像内容分类性能的影响.实验结果显示,本文提出的方法相对于传统的Bag-of-words模型可以达到更好的分类性能. 展开更多
关键词 图像表示 空间排列 bag-OF-words bag—of-phrases SIFT描述子
下载PDF
多核学习融合局部和全局特征的人脸识别算法 被引量:11
2
作者 杨赛 赵春霞 刘凡 《电子学报》 EI CAS CSCD 北大核心 2016年第10期2344-2350,共7页
提出一种基于词袋模型的新的人脸识别算法.该方法将词袋模型和词袋模型的全局模式分别作为人脸图像的局部特征和全局特征描述,最后使用多核学习方法将二者进行融合.AR、FERET、CMU PIE以及LFW公开人脸数据库上的实验结果表明,本文方法... 提出一种基于词袋模型的新的人脸识别算法.该方法将词袋模型和词袋模型的全局模式分别作为人脸图像的局部特征和全局特征描述,最后使用多核学习方法将二者进行融合.AR、FERET、CMU PIE以及LFW公开人脸数据库上的实验结果表明,本文方法能够更好的解决小样本问题,并且对人脸的表情变化、姿态变化以及面部遮挡具有更优良的鲁棒性. 展开更多
关键词 词袋模型 全局特征 多核学习 人脸识别
下载PDF
移动机器人视觉SLAM回环检测原理、现状及趋势 被引量:8
3
作者 杨雪梅 李帅永 《电子测量与仪器学报》 CSCD 北大核心 2022年第8期1-12,共12页
近年来,视觉SLAM以结构简单、成本低、可结合语义信息等优势得到广泛关注。回环检测在其中发挥着重要的作用。根据获得的回环信息,视觉SLAM后端优化算法便可以根据回环约束对位姿进行优化,消除移动机器人在长时间的工作下产生的累积误差... 近年来,视觉SLAM以结构简单、成本低、可结合语义信息等优势得到广泛关注。回环检测在其中发挥着重要的作用。根据获得的回环信息,视觉SLAM后端优化算法便可以根据回环约束对位姿进行优化,消除移动机器人在长时间的工作下产生的累积误差,实现精确的长期定位,从而构建全局一致的运动轨迹和地图。首先介绍视觉SLAM中回环检测原理及作用,从特征提取、相似度判断、实验评估几个方面对传统词袋模型进行深入分析,并概述目前基于词袋模型和概率的改进算法,对比总结基于深度学习的回环检测方法,简单概述结合语义信息的回环检测方法,最后对回环检测技术目前存在的问题以及未来的发展趋势进行总结与展望。 展开更多
关键词 视觉SLAM 回环检测 词袋模型 深度学习 语义分割 性能评价
下载PDF
改进点线特征的双目视觉SLAM算法 被引量:7
4
作者 林利蒙 王梅 《计算机测量与控制》 2019年第9期156-162,共7页
针对点线特征SLAM算法在图像局部密集区域提取大量相似线特征、同一直线上的线段过度分割等弊端,提出一种改进点线特征的双目视觉SLAM算法(ISSLAM);在预处理阶段,利用梯度密度滤波器剔除图像中特征密集区域,降低了线特征的误匹配率加速... 针对点线特征SLAM算法在图像局部密集区域提取大量相似线特征、同一直线上的线段过度分割等弊端,提出一种改进点线特征的双目视觉SLAM算法(ISSLAM);在预处理阶段,利用梯度密度滤波器剔除图像中特征密集区域,降低了线特征的误匹配率加速了特征提取过程;然后,在LSD算法的基础上,利用线段合并机制,将同一直线上由于过度分割而产生的断线重新合并,提高了特征提取的精度;在闭环检测阶段,通过融入线特征的扩展词袋模型,增加了图像相似度计算时的判别依据,提高了闭环检测的精度;ISSLAM算法通过增加筛选与合并机制以及扩展的词袋模型,优化特征提取,提高特征匹配的效率及精度,提高算法性能;最后,以EuRoc公共数据集为实验对象,证明了算法的有效性。 展开更多
关键词 同步定位与地图构建 点线特征 梯度密度滤波器 线段合并 词袋模型
下载PDF
基于时空特征点的群体异常行为检测算法 被引量:6
5
作者 王传旭 董晨晨 《数据采集与处理》 CSCD 北大核心 2012年第4期422-428,共7页
提出了用时空特征点描述群体行为的新方法。首先对比分析时空Harris角点、Gabor小波、Hessian矩阵三种特征点提取方法,选择了基于Hessian矩阵的尺度不变方法提取特征点;分别采用梯度直方图、光流直方图以及时空Haar特征三种方法对特征... 提出了用时空特征点描述群体行为的新方法。首先对比分析时空Harris角点、Gabor小波、Hessian矩阵三种特征点提取方法,选择了基于Hessian矩阵的尺度不变方法提取特征点;分别采用梯度直方图、光流直方图以及时空Haar特征三种方法对特征点构建描述符。采用Bag-of-words策略对正常行为建模,使用基于EM估计的高斯混合模型建模产生关键词,根据关键词为每一视频片段建立一个带有概率分布的编码向量,形成编码表。异常行为的检测是将测试样本的编码向量与训练样本编码表进行比较,计算相似度距离,当最小距离大于阈值时,判该群体行为异常。在UCF和UMN两种群体行为数据集下的实验结果表明,该方法能够对群体异常行为进行有效识别,对尺度变化以及背景光照变化等具有较好的适应性。 展开更多
关键词 群体异常行为 时空特征点 关键词词袋 高斯混合模型
下载PDF
一种SVM集成的图像分类方法研究 被引量:6
6
作者 罗会兰 杜连平 《电视技术》 北大核心 2012年第23期39-42,共4页
针对单分类器没有充分考虑数据集的特征而不能很好地完成分类识别,提出了一种基于集成学习技术的SVM集成的图像分类方法。该方法是在基于较为流行的词袋(Bag-of-Words,BOW)模型的图像分类方法的基础上,利用训练生成的不同SVM分类器分类... 针对单分类器没有充分考虑数据集的特征而不能很好地完成分类识别,提出了一种基于集成学习技术的SVM集成的图像分类方法。该方法是在基于较为流行的词袋(Bag-of-Words,BOW)模型的图像分类方法的基础上,利用训练生成的不同SVM分类器分类测试图像,并将分类结果采用集成学习算法进行集成。分别采用传统的BOW模型的图像分类方法和本文提出的方法进行分类实验,实验结果表明采用SVM集成的图像分类方法明显提高了分类精度,具有一定的稳健性。 展开更多
关键词 词袋模型 尺度不变特征转换 支持向量机 图像分类 集成学习
下载PDF
基于多头注意力机制的BM-Linear信用贷款评估模型
7
作者 赵雪峰 吴德林 +2 位作者 吴伟伟 王世璇 龙森 《系统管理学报》 CSCD 北大核心 2023年第1期118-129,共12页
信贷评估模型可加快放贷效率、缩减放贷时间。利用Pytorch深度学习框架,组合Bag-of-Words及Bert中多头注意力机制得到BM-Linear评估模型,同时在引入多组信贷训练集的前提下,创造性地构建参数独立训练及参数共用训练的对比实验,探究BM-Li... 信贷评估模型可加快放贷效率、缩减放贷时间。利用Pytorch深度学习框架,组合Bag-of-Words及Bert中多头注意力机制得到BM-Linear评估模型,同时在引入多组信贷训练集的前提下,创造性地构建参数独立训练及参数共用训练的对比实验,探究BM-Linear的优异性。研究表明:BM-Linear首先弱化与信贷训练集的对应关系,解决信贷模型受限于信贷场景问题,减少因反复训练模型所造成的放贷效率低下现象;其次,忽略缺失特征并将离散特征转为信贷文本,降低特征处理造成的信贷干扰,提高信贷评估效率;最后,克服因词袋与信贷词语对应关系所带来的词向量固化问题,实现动态词向量过程,进而提高评估准确率。所提出的BM-Linear模型,可为信贷机构高效评估快速放贷提供支持。 展开更多
关键词 多头注意力机制 Bert bag-OF-words 信用贷款 深度学习
下载PDF
基于空间概率乘积核函数的图像分类算法 被引量:5
8
作者 杨赛 赵春霞 《南京理工大学学报》 EI CAS CSCD 北大核心 2014年第3期325-331,共7页
针对词袋模型统计聚集算法忽略了编码矢量的其它统计特征信息及空间信息,并且只能与常用核函数相配合度量图像之间相似性的问题,该文提出一种基于空间概率乘积核函数的图像分类(SPPKBIG)算法。使用Parzen窗方法估计编码矢量所服从的概... 针对词袋模型统计聚集算法忽略了编码矢量的其它统计特征信息及空间信息,并且只能与常用核函数相配合度量图像之间相似性的问题,该文提出一种基于空间概率乘积核函数的图像分类(SPPKBIG)算法。使用Parzen窗方法估计编码矢量所服从的概率密度分布,用来描述图像内容,使用空间概率乘积核函数构建图像之间的核矩阵,最后使用基于此核矩阵的支持向量机对图像进行分类。实验结果表明,SPPKBIC算法对15类场景数据集和MSRcv2数据集的平均分类正确率分别为84.1%和94.8%。 展开更多
关键词 空间概率乘积核函数 图像分类 词袋 统计聚集算法 统计特征信息 空间信息 Parzen窗方法 概率密度分布 核矩阵 支持向量机
下载PDF
词袋特征支持下的无人机影像滑坡解译模型 被引量:5
9
作者 李政 李永树 +2 位作者 郭加伟 张帅毅 刘锟铭 《遥感信息》 CSCD 北大核心 2016年第5期24-29,共6页
川西地区滑坡灾害频发,给当地人民生命、财产安全带来了极大威胁。如何利用无人机高分影像构建滑坡灾害解译模型是实现快速自动解译的关键。针对该问题,首先,对比了多种影像特征提取方法,然后将词袋特征和支持向量机引入到构建滑坡灾害... 川西地区滑坡灾害频发,给当地人民生命、财产安全带来了极大威胁。如何利用无人机高分影像构建滑坡灾害解译模型是实现快速自动解译的关键。针对该问题,首先,对比了多种影像特征提取方法,然后将词袋特征和支持向量机引入到构建滑坡灾害解译模型中,提出了一种基于词袋特征的无人机影像滑坡灾害解译模型。最后,选取512汶川地震及420芦山地震系列无人机影像构建了滑坡灾害样本库,基于该样本库进行了实验,分类准确度达到76%,相比于传统目视解译在效率上有明显优势。分析表明,所提出方法可用于高分影像滑坡自动解译。此外,该模型可用于大面积高分影像快速山地滑坡灾害定位,可实现滑坡灾害的快速检测,对于灾后应急具有一定的指导作用。 展开更多
关键词 山地滑坡 词袋特征 无人机影像 机器学习 遥感图像信息提取
下载PDF
Image Classification Based on the Fusion of Complementary Features 被引量:3
10
作者 Huilin Gao Wenjie Chen 《Journal of Beijing Institute of Technology》 EI CAS 2017年第2期197-205,共9页
Image classification based on bag-of-words(BOW)has a broad application prospect in pattern recognition field but the shortcomings such as single feature and low classification accuracy are apparent.To deal with this... Image classification based on bag-of-words(BOW)has a broad application prospect in pattern recognition field but the shortcomings such as single feature and low classification accuracy are apparent.To deal with this problem,this paper proposes to combine two ingredients:(i)Three features with functions of mutual complementation are adopted to describe the images,including pyramid histogram of words(PHOW),pyramid histogram of color(PHOC)and pyramid histogram of orientated gradients(PHOG).(ii)An adaptive feature-weight adjusted image categorization algorithm based on the SVM and the decision level fusion of multiple features are employed.Experiments are carried out on the Caltech101 database,which confirms the validity of the proposed approach.The experimental results show that the classification accuracy rate of the proposed method is improved by 7%-14%higher than that of the traditional BOW methods.With full utilization of global,local and spatial information,the algorithm is much more complete and flexible to describe the feature information of the image through the multi-feature fusion and the pyramid structure composed by image spatial multi-resolution decomposition.Significant improvements to the classification accuracy are achieved as the result. 展开更多
关键词 image classification complementary features bag-of-words (BOW) feature fusion
下载PDF
An Intelligent Deep Neural Sentiment Classification Network
11
作者 Umamaheswari Ramalingam Senthil Kumar Murugesan +1 位作者 Karthikeyan Lakshmanan Chidhambararajan Balasubramaniyan 《Intelligent Automation & Soft Computing》 SCIE 2023年第5期1733-1744,共12页
A Deep Neural Sentiment Classification Network(DNSCN)is devel-oped in this work to classify the Twitter data unambiguously.It attempts to extract the negative and positive sentiments in the Twitter database.The main go... A Deep Neural Sentiment Classification Network(DNSCN)is devel-oped in this work to classify the Twitter data unambiguously.It attempts to extract the negative and positive sentiments in the Twitter database.The main goal of the system is tofind the sentiment behavior of tweets with minimum ambiguity.A well-defined neural network extracts deep features from the tweets automatically.Before extracting features deeper and deeper,the text in each tweet is represented by Bag-of-Words(BoW)and Word Embeddings(WE)models.The effectiveness of DNSCN architecture is analyzed using Twitter-Sanders-Apple2(TSA2),Twit-ter-Sanders-Apple3(TSA3),and Twitter-DataSet(TDS).TSA2 and TDS consist of positive and negative tweets,whereas TSA3 has neutral tweets also.Thus,the proposed DNSCN acts as a binary classifier for TSA2 and TDS databases and a multiclass classifier for TSA3.The performances of DNSCN architecture are evaluated by F1 score,precision,and recall rates using 5-fold and 10-fold cross-validation.Results show that the DNSCN-WE model provides more accuracy than the DNSCN-BoW model for representing the tweets in the feature encoding.The F1 score of the DNSCN-BW based system on the TSA2 database is 0.98(binary classification)and 0.97(three-class classification)for the TSA3 database.This system provides better a F1 score of 0.99 for the TDS database. 展开更多
关键词 Deep neural network word embeddings bag-OF-words sentiment analysis text classification
下载PDF
一种改进包模型的遥感图像检索方法 被引量:4
12
作者 杨进 刘建波 戴芹 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2014年第9期1109-1113,共5页
提出了一种改进的包模型图像检索方法,使用本底图像构建视觉词汇字典。在建库过程中,通过近似KD-Tree搜索本底图像局部不变特征与入库图像特征间的对应匹配关系,并记录该关系;图像检索时,搜索检索图像与本底图像特征的对应关系,进而计... 提出了一种改进的包模型图像检索方法,使用本底图像构建视觉词汇字典。在建库过程中,通过近似KD-Tree搜索本底图像局部不变特征与入库图像特征间的对应匹配关系,并记录该关系;图像检索时,搜索检索图像与本底图像特征的对应关系,进而计算与入库图像的关系。该方法仅保存本底图像的局部不变特征,可实现感兴趣区域的图像检索。实验结果表明,该方法在提高图像检索准确性的同时,可以减少所需存储局部不变特征的数量。 展开更多
关键词 遥感图像检索 本底图像 包模式 视觉词汇 感兴趣区
原文传递
基于深度学习的网络水军识别技术研究
13
作者 张霁阳 张鹏 +1 位作者 龚泗羽 宋乃鹏 《农业图书情报学报》 2023年第12期49-59,共11页
[目的/意义]互联网的发展带动了社交网络的快速发展,为用户提供了一个方便的信息发布、传播和接受的渠道,但其低门槛的特性也催生了一批灰黑色力量——网络水军,他们传递虚假信息,破坏网络秩序,成为互联网生态中的一大问题。[方法/过程... [目的/意义]互联网的发展带动了社交网络的快速发展,为用户提供了一个方便的信息发布、传播和接受的渠道,但其低门槛的特性也催生了一批灰黑色力量——网络水军,他们传递虚假信息,破坏网络秩序,成为互联网生态中的一大问题。[方法/过程]本研究提出了一种基于深度学习的网络水军识别模型,结合用户的基础信息、历史言论、交互行为3方面特征,并加入了“社交亲密度”属性,通过特征提取与向量融合,利用卷积神经网络构建起水军识别模型。[结果/结论]通过实证分析与模型对比,实验构建的模型在精确率、准确率等指标均取得了较好的效果,可以为网络水军识别提供一定技术支持与理论指导。实验表明,利用机器学习方法主动识别网络水军账号,对重点账号进行实时监管与事前防范,可以更加及时有效地避免恶性网络事件发生,降低非法势力破坏舆情生态的风险。 展开更多
关键词 网络水军 深度学习 卷积神经网络 词袋模型
下载PDF
基于梯度方向直方图词袋的纺织品疵点检测算法 被引量:4
14
作者 刘海军 单维峰 +1 位作者 韩莹 李忠 《毛纺科技》 CAS 北大核心 2019年第3期71-76,共6页
特征提取是疵点检测的关键问题,在分析纺织品纹理结构特点的基础上,受词袋模型的启发,设计了一种基于梯度方向直方图袋的特征提取方法。首先将所有图像分块提取梯度方向直方图描述子,对所有描述子进行k-means聚类构建纹理字典,最后统计... 特征提取是疵点检测的关键问题,在分析纺织品纹理结构特点的基础上,受词袋模型的启发,设计了一种基于梯度方向直方图袋的特征提取方法。首先将所有图像分块提取梯度方向直方图描述子,对所有描述子进行k-means聚类构建纹理字典,最后统计图像在纹理字典上的频次直方图作为原始图像的特征向量。采用最近邻分类器进行分类。为了验证算法的效果,设计了5种梯度模板方案,并在平纹织物数据集和斜纹织物数据集上分别进行实验。在最佳参数下,算法分类准确率达到96.34%和95.33%。 展开更多
关键词 纺织品 疵点检测 梯度方向直方图 词袋模型
下载PDF
融合卷积神经网络与VLAD的闭环检测方法 被引量:4
15
作者 李昂 阮晓钢 +1 位作者 黄静 朱晓庆 《计算机应用与软件》 北大核心 2021年第1期135-142,共8页
传统的闭环检测方法大多采用人工设计的特征,很容易受到环境的影响。卷积神经网络通过提取层次化特征,更好地应对了光照变化,但忽略了图像的局部空间特性。针对该问题,提出一种融合VGG16与VGG-NetVLAD的闭环检测算法。该网络保留了VGG1... 传统的闭环检测方法大多采用人工设计的特征,很容易受到环境的影响。卷积神经网络通过提取层次化特征,更好地应对了光照变化,但忽略了图像的局部空间特性。针对该问题,提出一种融合VGG16与VGG-NetVLAD的闭环检测算法。该网络保留了VGG16的部分结构,并在最后一层引入了基于局部聚合描述符向量(VLAD)思想的池化层NetVLAD,使提取的特征更适用于闭环检测。实验表明,相较于传统的视觉词袋模型及其他几种深度学习方法,该算法具有更强的泛化性,可以在闭环检测中达到更高的准确率并满足实时性的要求。 展开更多
关键词 闭环检测 卷积神经网络 特征提取 词袋模型
下载PDF
基于改进PLSA分类器的目标分类算法 被引量:2
16
作者 赵宏伟 陈霄 +1 位作者 龙曼丽 袁世培 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第S1期231-235,共5页
通过SIFT描述目标特征,利用Bag-of-words模型将目标特征构建为codebook,通过PLSA分类器对目标进行分类,根据PLSA分类学习过程中存在迭代复杂的问题,将贝叶斯分类器中的直接统计方法替换PLSA中最大似然估计,为PLSA提供足够的先验知识,减... 通过SIFT描述目标特征,利用Bag-of-words模型将目标特征构建为codebook,通过PLSA分类器对目标进行分类,根据PLSA分类学习过程中存在迭代复杂的问题,将贝叶斯分类器中的直接统计方法替换PLSA中最大似然估计,为PLSA提供足够的先验知识,减少学习过程中迭代次数,实验结果表明,相比于传统PLSA分类算法,本文方法检测结果较为准确,算法切实可行。 展开更多
关键词 计算机应用 SIFT描述 bag-OF-words PLSA 贝叶斯分类器 目标分类
下载PDF
Improved Bag-of-Words Model for Person Re-identification 被引量:2
17
作者 Lu Tian Shengjin Wang 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2018年第2期145-156,共12页
Person re-identification(person re-id) aims to match observations on pedestrians from different cameras.It is a challenging task in real word surveillance systems and draws extensive attention from the community.Most ... Person re-identification(person re-id) aims to match observations on pedestrians from different cameras.It is a challenging task in real word surveillance systems and draws extensive attention from the community.Most existing methods are based on supervised learning which requires a large number of labeled data. In this paper, we develop a robust unsupervised learning approach for person re-id. We propose an improved Bag-of-Words(i Bo W) model to describe and match pedestrians under different camera views. The proposed descriptor does not require any re-id labels, and is robust against pedestrian variations. Experiments show the proposed i Bo W descriptor outperforms other unsupervised methods. By combination with efficient metric learning algorithms, we obtained competitive accuracy compared to existing state-of-the-art methods on person re-identification benchmarks, including VIPe R, PRID450 S, and Market1501. 展开更多
关键词 person re-identification bag-OF-words unsupervised learning feature fusion
原文传递
基于Faster-RCNN的回环检测优化算法 被引量:3
18
作者 徐建鹏 卜凡亮 《计算机应用研究》 CSCD 北大核心 2019年第12期3628-3631,共4页
如何提高回环检测(loop closure detection)的准确率,是同时定位与地图构建系统(simultaneous localization and mapping,SLAM)中实现更高位姿恢复精度的关键问题之一。基于传统的词袋模型原理,构建了一个全新的算法框架。该算法使用预... 如何提高回环检测(loop closure detection)的准确率,是同时定位与地图构建系统(simultaneous localization and mapping,SLAM)中实现更高位姿恢复精度的关键问题之一。基于传统的词袋模型原理,构建了一个全新的算法框架。该算法使用预处理的Faster-RCNN对图像序列进行检测,利用所检测出的图像语义特征种类、像素位置及特征图等信息来构建具有标志性的二维语义特征向量图,并使用非线性的累积误差来计算二维语义特征向量图之间的相似度,且据此计算初始回环,经位姿验证后得到最终回环结果。通过与传统词袋模型算法的分析比较,实验结果验证了所提算法的有效性,实现了更高精度和效率的回环检测。 展开更多
关键词 三维重建 同时定位与地图构建 回环检测 神经网络 词袋模型 优化算法
下载PDF
An improved Bag-of-Words framework for remote sensing image retrieval in large-scale image databases 被引量:3
19
作者 Jin Yang Jianbo Liu Qin Dai 《International Journal of Digital Earth》 SCIE EI CSCD 2015年第4期273-292,共20页
Due to advances in satellite and sensor technology,the number and size of Remote Sensing(RS)images continue to grow at a rapid pace.The continuous stream of sensor data from satellites poses major challenges for the r... Due to advances in satellite and sensor technology,the number and size of Remote Sensing(RS)images continue to grow at a rapid pace.The continuous stream of sensor data from satellites poses major challenges for the retrieval of relevant information from those satellite datastreams.The Bag-of-Words(BoW)framework is a leading image search approach and has been successfully applied in a broad range of computer vision problems and hence has received much attention from the RS community.However,the recognition performance of a typical BoW framework becomes very poor when the framework is applied to application scenarios where the appearance and texture of images are very similar.In this paper,we propose a simple method to improve recognition performance of a typical BoW framework by representing images with local features extracted from base images.In addition,we propose a similarity measure for RS images by counting the number of same words assigned to images.We compare the performance of these methods with a typical BoW framework.Our experiments show that the proposed method has better recognition performance than that of the BoW and requires less storage space for saving local invariant features. 展开更多
关键词 remote sensing image retrieval base image bag-OF-words visual word
原文传递
基于显著区域的图像自动标注 被引量:3
20
作者 尹文杰 韩军伟 +2 位作者 郭雷 贺胜 许明 《计算机应用研究》 CSCD 北大核心 2011年第10期3925-3928,3933,共5页
为了提高图像自动标注的准确率,提出了一种基于图像显著区域的自动标注方法。首先提取图像的显著区域,然后提取图像的SIFT特征,利用K-均值聚类得到视觉词汇,并根据训练图像的SIFT特征是否位于显著区域进行不同的加权运算得到视觉词汇的... 为了提高图像自动标注的准确率,提出了一种基于图像显著区域的自动标注方法。首先提取图像的显著区域,然后提取图像的SIFT特征,利用K-均值聚类得到视觉词汇,并根据训练图像的SIFT特征是否位于显著区域进行不同的加权运算得到视觉词汇的词袋表示,最后利用支持向量机训练分类模型实现图像分类和标注。在一个包含1 255幅Corel图像的数据库进行实验,所提方法标注的准确率与整体考虑整幅图像特征相比有很大提高,表明提出的算法优于传统方法。 展开更多
关键词 图像自动标注 显著区域 SIFT特征 K-均值聚类 视觉词袋 支持向量机
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部