期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
融合语义主题的图像自动标注 被引量:50
1
作者 李志欣 施智平 +1 位作者 李志清 史忠植 《软件学报》 EI CSCD 北大核心 2011年第4期801-812,共12页
由于语义鸿沟的存在,图像自动标注已成为一个重要课题.在概率潜语义分析的基础上,提出了一种融合语义主题的方法以进行图像的标注和检索.首先,为了更准确地建模训练数据,将每幅图像的视觉特征表示为一个视觉"词袋";然后设计... 由于语义鸿沟的存在,图像自动标注已成为一个重要课题.在概率潜语义分析的基础上,提出了一种融合语义主题的方法以进行图像的标注和检索.首先,为了更准确地建模训练数据,将每幅图像的视觉特征表示为一个视觉"词袋";然后设计一个概率模型分别从视觉模态和文本模态中捕获潜在语义主题,并提出一种自适应的不对称学习方法融合两种语义主题.对于每个图像文档,它在各个模态上的主题分布通过加权进行融合,而权值由该文档的视觉词分布的熵值来确定.于是,融合之后的概率模型适当地关联了视觉模态和文本模态的信息,因此能够很好地预测未知图像的语义标注.在一个通用的Corel图像数据集上,将提出的方法与几种前沿的图像标注方法进行了比较.实验结果表明,该方法具有更好的标注和检索性能. 展开更多
关键词 图像自动标注 主题模型 概率潜语义分析 自适应不对称学习 图像检索
下载PDF
自动图像标注技术研究进展 被引量:21
2
作者 鲍泓 徐光美 +1 位作者 冯松鹤 须德 《计算机科学》 CSCD 北大核心 2011年第7期35-40,共6页
近年来,自动图像标注(Automatic Image Annotation,AIA)技术已经成为图像语义理解研究领域的热点。其基本思想是利用已标注图像集或其他可获得的信息自动学习语义概念空间与视觉特征空间的潜在关联或者映射关系,来预测未知图像的标注。... 近年来,自动图像标注(Automatic Image Annotation,AIA)技术已经成为图像语义理解研究领域的热点。其基本思想是利用已标注图像集或其他可获得的信息自动学习语义概念空间与视觉特征空间的潜在关联或者映射关系,来预测未知图像的标注。随着机器学习理论的不断发展,包括相关模型、分类器模型等不同的学习模型已经被广泛地应用于自动图像标注研究领域。现有的自动图像标注算法可以大致分为基于分类的标注算法、基于概率关联模型的标注算法以及基于图学习的标注算法等三大类。首先根据自动图像标注算法的特征提取及表示机制不同,将现有算法划分为基于全局特征和基于区域划分的自动图像标注方法。其次,在基于区域划分的自动图像标注算法中,按照学习算法的不同,将其划分为基于分类的标注方法、基于概率关联模型的标注方法以及基于图学习的标注方法,并分别介绍各类别中具有代表性的标注算法及其优缺点。然后给出了自动图像标注最新的研究进展,最后探讨自动图像标注的进一步研究方向。 展开更多
关键词 自动图像标注 多示例学习 多标记学习 图学习 概率建模
下载PDF
使用基于多例学习的启发式SVM算法的图像自动标注 被引量:19
3
作者 路晶 马少平 《计算机研究与发展》 EI CSCD 北大核心 2009年第5期864-871,共8页
在基于内容的图像检索中,按照图像的语义内容进行自动标注是一个具有挑战性的难题.将解释语义内容的关键词当做图像类别标签可使自动标注问题转化为图像分类问题.对于多数训练数据,关键词仅仅是针对整幅图像来标注的,并不是针对图像中... 在基于内容的图像检索中,按照图像的语义内容进行自动标注是一个具有挑战性的难题.将解释语义内容的关键词当做图像类别标签可使自动标注问题转化为图像分类问题.对于多数训练数据,关键词仅仅是针对整幅图像来标注的,并不是针对图像中的具体区域.为了克服这个问题,提出了多例学习(MIL)框架下基于支持向量机(SVM)的启发式算法HSVM-MIL.使用迭代的启发式最优化算法来解决多例学习中复杂的整型规划问题,以使分类风险最小化.每次迭代试图改变一个样例的类别以最大化普通SVM的分类间隔.在图像数据库和多例学习的经典数据集MUSK上的实验表明,HSVM-MIL算法具有优良的分类性能.由于该算法针对个体样例的正负分类进行判断,因而能够确定图像区域与关键词之间的对应关系,克服了大多数多例学习算法的缺点. 展开更多
关键词 图像自动标注 多例学习 支持向量机 整型规划 启发式最优化算法
下载PDF
基于多标签学习的卷积神经网络的图像标注方法 被引量:20
4
作者 高耀东 侯凌燕 杨大利 《计算机应用》 CSCD 北大核心 2017年第1期228-232,共5页
针对图像自动标注中因人工选择特征而导致信息缺失的缺点,提出使用卷积神经网络对样本进行自主特征学习。为了适应图像自动标注的多标签学习的特点以及提高对低频词汇的召回率,首先改进卷积神经网络的损失函数,构建一个多标签学习的卷... 针对图像自动标注中因人工选择特征而导致信息缺失的缺点,提出使用卷积神经网络对样本进行自主特征学习。为了适应图像自动标注的多标签学习的特点以及提高对低频词汇的召回率,首先改进卷积神经网络的损失函数,构建一个多标签学习的卷积神经网络(CNN-MLL)模型,然后利用图像标注词间的相关性对网络模型输出结果进行改善。通过在IAPR TC-12标准图像标注数据集上对比了其他传统方法,实验得出,基于采用均方误差函数的卷积神经网络(CNN-MSE)的方法较支持向量机(SVM)方法在平均召回率上提升了12.9%,较反向传播神经网络(BPNN)方法在平均准确率上提升了37.9%;基于标注结果改善的CNN-MLL方法较普通卷积神经网络的平均准确率和平均召回率分别提升了23%和20%。实验结果表明基于标注结果改善的CNN-MLL方法能有效地避免因人工选择特征造成的信息缺失同时增加了对低频词汇的召回率。 展开更多
关键词 图像自动标注 多标签学习 卷积神经网络 损失函数
下载PDF
基于概念索引的图像自动标注 被引量:10
5
作者 路晶 马少平 《计算机研究与发展》 EI CSCD 北大核心 2007年第3期452-459,共8页
在基于内容的图像检索中,建立图像底层视觉特征与高层语义的联系是个难题.一个新的解决方法是按照图像的语义内容进行自动标注.为了缩小语义差距,采用基于支持向量机(SVM)的多类分类器为空间映射方法,将图像的底层特征映射为具有一定高... 在基于内容的图像检索中,建立图像底层视觉特征与高层语义的联系是个难题.一个新的解决方法是按照图像的语义内容进行自动标注.为了缩小语义差距,采用基于支持向量机(SVM)的多类分类器为空间映射方法,将图像的底层特征映射为具有一定高层语义的模型特征以实现概念索引,使用的模型特征为多类分类的结果以概率形式组合而成.在模型特征组成的空间中,再使用核函数方法对关键词进行了概率估计,从而提供概念化的图像标注以用于检索.实验表明,与底层特征相比,使用模型特征进行自动标注的结果F度量相对提高14%. 展开更多
关键词 图像自动标注 多类分类器 空间映射 模型向量
下载PDF
基于集成分类算法的自动图像标注 被引量:11
6
作者 蒋黎星 侯进 《自动化学报》 EI CSCD 北大核心 2012年第8期1257-1262,共6页
基于语义的图像检索技术中,按照图像的语义进行自动标注是一个具有挑战性的工作.本文把图像的自动标注过程转化为图像分类的过程,通过有监督学习对每个图像区域分类并得到相应关键字,实现标注.采用一种快速随机森林(Fast random forest,... 基于语义的图像检索技术中,按照图像的语义进行自动标注是一个具有挑战性的工作.本文把图像的自动标注过程转化为图像分类的过程,通过有监督学习对每个图像区域分类并得到相应关键字,实现标注.采用一种快速随机森林(Fast random forest,FRF)集成分类算法,它可以对大量的训练数据进行有效的分类和标注.在基于Corel数据集的实验中,相比经典算法,FRF改善了运算速度,并且分类精度保持稳定.在图像标注方面有很好的应用. 展开更多
关键词 自动图像标注 机器学习 集成分类器 快速随机森林算法
下载PDF
基于迁移学习与多标签平滑策略的图像自动标注 被引量:10
7
作者 汪鹏 张奥帆 +1 位作者 王利琴 董永峰 《计算机应用》 CSCD 北大核心 2018年第11期3199-3203,3210,共6页
针对图像标注数据集标签分布不平衡问题,提出了基于标签平滑策略的多标签平滑单元(MLSU)。MLSU在网络模型训练过程中自动平滑数据集中的高频标签,使网络适当提升了低频标签的输出值,从而提升了低频标注词的标注性能。为解决图像标注数... 针对图像标注数据集标签分布不平衡问题,提出了基于标签平滑策略的多标签平滑单元(MLSU)。MLSU在网络模型训练过程中自动平滑数据集中的高频标签,使网络适当提升了低频标签的输出值,从而提升了低频标注词的标注性能。为解决图像标注数据集样本数量不足造成网络过拟合的问题,提出了基于迁移学习的卷积神经网络(CNN)模型。首先利用互联网上的大型公共图像数据集对深度网络进行预训练,然后利用目标数据集对网络参数进行微调,构建了一个多标签平滑卷积神经网络模型(CNN-MLSU)。分别在Corel5K和IAPR TC-12图像标注数据集上进行实验,在Corel5K数据集上,CNN-MLSU较卷积神经网络回归方法(CNN-R)的平均准确率与平均召回率分别提升了5个百分点和8个百分点;在IAPR TC-12数据集上,CNN-MLSU较两场K最邻近模型(2PKNN_ML)的平均召回率提升了6个百分点。实验结果表明,基于迁移学习的CNN-MLSU方法能有效地预防网络过拟合,同时提升了低频词的标注效果。 展开更多
关键词 图像自动标注 多标签平滑 迁移学习 卷积神经网络 图像检索
下载PDF
基于迁移学习的多标签图像标注 被引量:10
8
作者 秦莹华 李菲菲 陈虬 《电子科技》 2018年第8期21-24,共4页
自动图像标注(AIA)是图像检索领域一项具有挑战性的任务。卷积神经网络(CNNs)在大规模视觉识别挑战中取得杰出的分类性能。文中将图像标注问题看成一个多标签学习问题,提出了一种基于卷积神经网络的多标签分类算法。采用Corel5k数据库... 自动图像标注(AIA)是图像检索领域一项具有挑战性的任务。卷积神经网络(CNNs)在大规模视觉识别挑战中取得杰出的分类性能。文中将图像标注问题看成一个多标签学习问题,提出了一种基于卷积神经网络的多标签分类算法。采用Corel5k数据库训练和测试卷积神经网络。由于训练集的缺乏,采用从Image Net分类任务中迁移得到的参数作为一个"中级图像特征的通用提取器"。采用两种损失函数作为多标签分类器,将多标签学习转化为多个标签的分类问题。将实验结果与其他方法进行比较,表明了该方法的有效性。 展开更多
关键词 自动图像标注 多标签 卷积神经网络 迁移学习
下载PDF
利用深度玻尔兹曼机与典型相关分析的自动图像标注算法 被引量:10
9
作者 刘凯 张立民 +1 位作者 孙永威 林雪原 《西安交通大学学报》 EI CAS CSCD 北大核心 2015年第6期33-38,共6页
提出一种基于深度玻尔兹曼机与典型相关分析的自动图像标注算法(DBM-CCA)。该算法利用深度玻尔兹曼机实现图像与文本的低层次特征向稀疏高层次抽象概念的转变,并通过典型相关分析建立子空间映射关系以实现标注词汇的生成。首先在深度玻... 提出一种基于深度玻尔兹曼机与典型相关分析的自动图像标注算法(DBM-CCA)。该算法利用深度玻尔兹曼机实现图像与文本的低层次特征向稀疏高层次抽象概念的转变,并通过典型相关分析建立子空间映射关系以实现标注词汇的生成。首先在深度玻尔兹曼机提取图像与文本高层特征过程中,选用伯努利分布和高斯分布分别拟合标注词汇和图像特征,然后在图像与标注词汇高层特征形成的典型变量空间内计算待标注图像与训练集图像的马氏距离并据此加权计算得到高层标注词汇特征,最后由平均场估计生成图像标注词汇。实验结果表明,所提算法对图像的标注准确率改善较好,与经典的基于监督的多类标签方法和多重伯努利相关模型相比,在Corel5K实验中平均查准率和查全查准均率分别提高了10%和5%。 展开更多
关键词 自动图像标注 深度学习 深度玻尔兹曼机 典型相关分析
下载PDF
建模连续视觉特征的图像语义标注方法 被引量:9
10
作者 李志欣 施智平 +1 位作者 刘曦 史忠植 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第8期1412-1420,共9页
针对图像检索中存在的"语义鸿沟"问题,提出一种对连续视觉特征直接建模的图像自动标注方法.首先对概率潜语义分析(PLSA)模型进行改进,使之能处理连续量,并推导对应的期望最大化算法来确定模型参数;然后根据不同模态数据各自... 针对图像检索中存在的"语义鸿沟"问题,提出一种对连续视觉特征直接建模的图像自动标注方法.首先对概率潜语义分析(PLSA)模型进行改进,使之能处理连续量,并推导对应的期望最大化算法来确定模型参数;然后根据不同模态数据各自的特点,提出一个对不同模态数据分别处理的图像语义标注模型,该模型使用连续PLSA建模视觉特征,使用标准PLSA建模文本关键词,并通过不对称的学习方法学习2种模态之间的关联,从而能较好地对未知图像进行标注.通过在一个包含5000幅图像的标准Corel数据集中进行实验,并与几种典型的图像标注方法进行比较的结果表明,文中方法具有更高的精度和更好的效果. 展开更多
关键词 图像自动标注 概率潜语义分析 主题模型 连续视觉特征 图像检索
下载PDF
自动图像标注技术综述 被引量:7
11
作者 马艳春 刘永坚 +2 位作者 解庆 熊盛武 唐伶俐 《计算机研究与发展》 EI CSCD 北大核心 2020年第11期2348-2374,共27页
图像自动标注技术是减少图像数据与内容之间"语义鸿沟"的其中一种最有效途径,对于帮助人类理解图像内容,从海量图像数据中检索感兴趣的信息具有重要现实意义.通过研究近20年公开发表的图像标注文献,总结了图像标注模型的一般... 图像自动标注技术是减少图像数据与内容之间"语义鸿沟"的其中一种最有效途径,对于帮助人类理解图像内容,从海量图像数据中检索感兴趣的信息具有重要现实意义.通过研究近20年公开发表的图像标注文献,总结了图像标注模型的一般性框架;并通过该框架结合各种具体工作,分析出在图像标注研究过程中需要解决的一般性问题;将各种图像标注模型所采用的主要方法归为9种类型,分别为相关模型、隐Markov模型、主题模型、矩阵分解模型、近邻模型、基于支持向量机的模型、图模型、典型相关分析模型以及深度学习模型,并对每种类型的图像标注模型,按照"基本原理介绍—具体模型差异—模型总结"3个层面进行了研究与分析.此外,总结了图像标注模型常用的一些数据集、评测指标,对一些比较著名的标注模型的性能进行了比较,并据此对各种类型的标注模型做了优缺点分析.最后,提出了图像标注领域一些开放式问题和研究方向. 展开更多
关键词 自动图像标注 图像语义分析 图像标识 图像内容标签 图像内容标注
下载PDF
一种新的图像语义自动标注与检索算法 被引量:6
12
作者 朱文球 刘强 《计算机应用研究》 CSCD 北大核心 2007年第7期318-320,共3页
提出了一种新的利用图像语义词汇表进行图像自动标注与检索的方法。采用混合层次模型在已标注好的训练图像集上计算图像区域类与关键字的联合概率分布,并用生成的模型标注未曾观察过的测试图像集,或用来进行基于语义的图像检索。实验结... 提出了一种新的利用图像语义词汇表进行图像自动标注与检索的方法。采用混合层次模型在已标注好的训练图像集上计算图像区域类与关键字的联合概率分布,并用生成的模型标注未曾观察过的测试图像集,或用来进行基于语义的图像检索。实验结果表明,该方法在标注、检索精度和效率方面均优于当前其他方法。 展开更多
关键词 图像检索 语义图像检索 图像语义 图像自动标注
下载PDF
混合生成式和判别式模型的图像自动标注 被引量:8
13
作者 李志欣 施智平 +1 位作者 张灿龙 王金艳 《中国图象图形学报》 CSCD 北大核心 2015年第5期687-699,共13页
目的由于图像检索中存在着低层特征和高层语义之间的"语义鸿沟",图像自动标注成为当前的关键性问题。为缩减语义鸿沟,提出了一种混合生成式和判别式模型的图像自动标注方法。方法在生成式学习阶段,采用连续的概率潜在语义分... 目的由于图像检索中存在着低层特征和高层语义之间的"语义鸿沟",图像自动标注成为当前的关键性问题。为缩减语义鸿沟,提出了一种混合生成式和判别式模型的图像自动标注方法。方法在生成式学习阶段,采用连续的概率潜在语义分析模型对图像进行建模,可得到相应的模型参数和每幅图像的主题分布。将这个主题分布作为每幅图像的中间表示向量,那么图像自动标注的问题就转化为一个基于多标记学习的分类问题。在判别式学习阶段,使用构造集群分类器链的方法对图像的中间表示向量进行学习,在建立分类器链的同时也集成了标注关键词之间的上下文信息,因而能够取得更高的标注精度和更好的检索效果。结果在两个基准数据集上进行的实验表明,本文方法在Corel5k数据集上的平均精度、平均召回率分别达到0.28和0.32,在IAPR-TC12数据集上则达到0.29和0.18,其性能优于大多数当前先进的图像自动标注方法。此外,从精度—召回率曲线上看,本文方法也优于几种典型的具有代表性的标注方法。结论提出了一种基于混合学习策略的图像自动标注方法,集成了生成式模型和判别式模型各自的优点,并在图像语义检索的任务中表现出良好的有效性和鲁棒性。本文方法和技术不仅能应用于图像检索和识别的领域,经过适当的改进之后也能在跨媒体检索和数据挖掘领域发挥重要作用。 展开更多
关键词 图像自动标注 概率潜在语义分析 多标记学习 分类器链 图像检索
原文传递
基于弱匹配概率典型相关性分析的图像自动标注 被引量:8
14
作者 张博 郝杰 +1 位作者 马刚 史忠植 《软件学报》 EI CSCD 北大核心 2017年第2期292-309,共18页
针对弱匹配多模态数据的相关性建模问题,提出了一种弱匹配概率典型相关性分析模型(semi-paired probabilistic CCA,简称Semi PCCA).Semi PCCA模型关注于各模态内部的全局结构,模型参数的估计受到了未匹配样本的影响,而未匹配样本则揭示... 针对弱匹配多模态数据的相关性建模问题,提出了一种弱匹配概率典型相关性分析模型(semi-paired probabilistic CCA,简称Semi PCCA).Semi PCCA模型关注于各模态内部的全局结构,模型参数的估计受到了未匹配样本的影响,而未匹配样本则揭示了各模态样本空间的全局结构.在人工弱匹配多模态数据集上的实验结果表明,Semi PCCA可以有效地解决传统CCA(canonical correlation analysis)和PCCA(probabilistic CCA)在匹配样本不足的情况下出现的过拟合问题,取得了较好的效果.提出了一种基于Semi PCCA的图像自动标注方法.该方法基于关联建模的思想,同时使用标注图像及其关键词和未标注图像学习视觉模态和文本模态之间的关联,从而能够更准确地对未知图像进行标注. 展开更多
关键词 典型相关性分析 概率典型相关性分析 弱匹配典型相关性分析 图像自动标注
下载PDF
基于生成式对抗网络的图像自动标注 被引量:8
15
作者 税留成 刘卫忠 冯卓明 《计算机应用》 CSCD 北大核心 2019年第7期2129-2133,共5页
针对基于深度学习的图像标注模型输出层神经元数目与标注词汇量成正比,导致模型结构因词汇量的变化而改变的问题,提出了结合生成式对抗网络(GAN)和Word2vec的新标注模型.首先,通过Word2vec将标注词汇映射为固定的多维词向量;其次,利用GA... 针对基于深度学习的图像标注模型输出层神经元数目与标注词汇量成正比,导致模型结构因词汇量的变化而改变的问题,提出了结合生成式对抗网络(GAN)和Word2vec的新标注模型.首先,通过Word2vec将标注词汇映射为固定的多维词向量;其次,利用GAN构建神经网络模型——GAN-W模型,使输出层神经元数目与多维词向量维数相等,与词汇量不再相关;最后,通过对模型多次输出结果的排序来确定最终标注.GAN-W模型分别在Corel 5K和IAPRTC-12图像标注数据集上进行实验,在Corel 5K数据集上,GAN-W模型准确率、召回率和F1值比卷积神经网络回归(CNN-R)方法分别提高5、14和9个百分点;在IAPRTC-12数据集上,GAN-W模型准确率、召回率和F1值比两场K最邻近(2PKNN)模型分别提高2、6和3个百分点.实验结果表明,GAN-W模型可以解决输出神经元数目随词汇量改变的问题,同时每幅图像标注的标签数目自适应,使得该模型标注结果更加符合实际标注情形. 展开更多
关键词 图像自动标注 深度学习 生成式对抗网络 标注向量化 迁移学习
下载PDF
基于本体的Web图像语义标注与检索模型 被引量:7
16
作者 张志武 《情报科学》 CSSCI 北大核心 2015年第4期121-124,131,共5页
针对传统的基于关键字Web图像检索中的语义缺失问题,结合Web图像的视觉特征和描述文本,利用本体描述Web图像的语义特征,构建了基于本体的Web图像语义检索模型。该模型以领域本体描述Web图像的语义特征,通过自动图像标注技术构建Web图像... 针对传统的基于关键字Web图像检索中的语义缺失问题,结合Web图像的视觉特征和描述文本,利用本体描述Web图像的语义特征,构建了基于本体的Web图像语义检索模型。该模型以领域本体描述Web图像的语义特征,通过自动图像标注技术构建Web图像本体库,用户可以通过输入关键词或者提交示例图像进行图像检索。实验表明,该模型具有较高的图像检索准确率。 展开更多
关键词 本体 图像检索 自动图像标注 语义特征
原文传递
基于多标签判别字典学习的图像自动标注 被引量:7
17
作者 杨晓玲 李志清 刘雨桐 《计算机应用》 CSCD 北大核心 2018年第5期1294-1298,1303,共6页
针对图像自动标注中底层视觉特征与高层语义之间的语义鸿沟问题,在传统字典学习的基础上,提出一种基于多标签判别字典学习的图像自动标注方法。首先,为每幅图像提取多种类型特征,将多种特征组合作为字典学习输入特征空间的输入信息;然后... 针对图像自动标注中底层视觉特征与高层语义之间的语义鸿沟问题,在传统字典学习的基础上,提出一种基于多标签判别字典学习的图像自动标注方法。首先,为每幅图像提取多种类型特征,将多种特征组合作为字典学习输入特征空间的输入信息;然后,设计一个标签一致性正则化项,将原始样本的标签信息融入到初始的输入特征数据中,结合标签一致性判别字典和标签一致性正则化项进行字典学习;最后,通过得到的字典和稀疏编码矩阵求解标签稀疏编向量,实现未知图像的语义标注。在Corel 5K数据集上测试其标注性能,所提标注方法平均查准率和平均查全率分别可达到35%和48%;与传统的稀疏编码方法(MSC)相比,分别提高了10个百分点和16个百分点;与距离约束稀疏/组稀疏编码方法(DCSC/DCGSC)相比,分别提高了3个百分点和14个百分点。实验结果表明,所提方法能够较好地预测未知图像的语义信息,与当前几种流行的图像标注方法进行比较,所提方法具有较好的标注性能。 展开更多
关键词 图像自动标注 字典学习 特征表示 稀疏编码 图像检索
下载PDF
基于蒙特卡罗数据集均衡与鲁棒性增量极限学习机的图像自动标注 被引量:7
18
作者 柯逍 邹嘉伟 +1 位作者 杜明智 周铭柯 《电子学报》 EI CAS CSCD 北大核心 2017年第12期2925-2935,共11页
针对传统图像标注模型存在着训练时间长、对低频词汇敏感等问题,该文提出了基于蒙特卡罗数据集均衡和鲁棒性增量极限学习机的图像自动标注模型.该模型首先对公共图像库的训练集数据进行图像自动分割,选择分割后相应的种子标注词,并通过... 针对传统图像标注模型存在着训练时间长、对低频词汇敏感等问题,该文提出了基于蒙特卡罗数据集均衡和鲁棒性增量极限学习机的图像自动标注模型.该模型首先对公共图像库的训练集数据进行图像自动分割,选择分割后相应的种子标注词,并通过提出的基于综合距离的图像特征匹配算法进行自动匹配以形成不同类别的训练集.针对公共数据库中不同标注词的数据规模相差较大,提出了蒙特卡罗数据集均衡算法使得各个标注词间的数据规模大体一致.然后针对单一特征描述存在的不足,提出了多尺度特征融合算法对不同标注词图像进行有效的特征提取.最后针对传统极限学习机存在的隐层节点随机性和输入向量权重一致性的问题,提出了鲁棒性增量极限学习,提高了判别模型的准确性.通过在公共数据集上的实验结果表明:该模型可以在很短时间内实现图像的自动标注,对低频词汇具有较强的鲁棒性,并且在平均召回率、平均准确率、综合值等多项指标上均高于现流行的大多数图像自动标注模型. 展开更多
关键词 蒙特卡罗数据集均衡 多尺度特征融合 极限学习机 图像自动标注
下载PDF
基于语义学习的图像多模态检索 被引量:6
19
作者 李志欣 施智平 +1 位作者 陈宏朝 吴璟莉 《计算机工程》 CAS CSCD 2013年第3期258-263,共6页
针对语义鸿沟问题,在语义学习的基础上设计图像的多模态检索系统。该系统结合3种查询方式进行图像检索。基于视觉特征的查询通过特征提取与相似度匹配进行排位。基于标签的查询建立在图像自动标注的基础上,但在语义空间之外的泛化能力... 针对语义鸿沟问题,在语义学习的基础上设计图像的多模态检索系统。该系统结合3种查询方式进行图像检索。基于视觉特征的查询通过特征提取与相似度匹配进行排位。基于标签的查询建立在图像自动标注的基础上,但在语义空间之外的泛化能力较差。基于语义图例的查询能够在很大程度上克服这个缺陷,通过在显式或隐式的语义空间上进行查询,使检索结果更符合人类感知。实验结果表明,与基于纹理特征的图像检索相比,基于语义图例的检索具有更高的精度及召回率。 展开更多
关键词 图像多模态检索 图像自动标注 概率主题建模 概率潜在语义分析 语义鸿沟 语义学习 语义多项式
下载PDF
基于双分支注意力机制的图像自动标注研究
20
作者 张国有 崔永强 《计算机技术与发展》 2024年第9期167-173,共7页
图像自动标注技术能够将图像低层视觉特征转化为人类理解的高层语义信息,增强图像的可理解性和可搜索性,在图像检索和图像分类领域具有重要的应用价值。目前,基于卷积神经网络模型的图像自动标注技术,仍存在浅层网络无法捕捉足够的特征... 图像自动标注技术能够将图像低层视觉特征转化为人类理解的高层语义信息,增强图像的可理解性和可搜索性,在图像检索和图像分类领域具有重要的应用价值。目前,基于卷积神经网络模型的图像自动标注技术,仍存在浅层网络无法捕捉足够的特征信息、容易忽视标签之间的相互关系以及标注时难以确定标签数量的问题。该文提出的基于双分支注意力机制的图像自动标注模型,首先使用双分支注意力网络,增强图像特征和标签的相关性以及学习标签之间的相关性;其次在空间注意力分支增加多尺度特征提取模块,以提取图像的多尺度特征,解决浅层网络特征提取不充分的问题;再次通过融合模块,融合两个分支的输出,将图像特征进一步增强;最后通过标签数量预测模块,预测待标注图像的标签数量,进一步提高标注的准确性。该模型分别在三个基准数据集Corel 5K、ESP Game和IAPR-TC-12上进行实验分析,实验结果表明该模型可以有效解决上述问题,提高标注的有效性与准确性。 展开更多
关键词 图像自动标注 卷积神经网络 多尺度特征 注意力机制 特征融合
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部