-
题名图像场景分类中视觉词包模型方法综述
被引量:25
- 1
-
-
作者
赵理君
唐娉
霍连志
郑柯
-
机构
中国科学院遥感与数字地球研究所
中国科学院大学
-
出处
《中国图象图形学报》
CSCD
北大核心
2014年第3期333-343,共11页
-
基金
国家高技术研究发展计划(863)基金项目(2012AA12A304)
中国科学院遥感与数字地球研究所所长青年基金项目(Y3SJ7700CX)
-
文摘
目的关于图像场景分类中视觉词包模型方法的综述性文章在国内外杂志上还少有报导,为了使国内外同行对图像场景分类中的视觉词包模型方法有一个较为全面的了解,对这些研究工作进行了系统总结。方法在参考国内外大量文献的基础上,对现有图像场景分类(主要指针对单一图像场景的分类)中出现的各种视觉词包模型方法从低层特征的选择与局部图像块特征的生成、视觉词典的构建、视觉词包特征的直方图表示、视觉单词优化等多方面加以总结和比较。结果回顾了视觉词包模型的发展历程,对目前存在的多种视觉词包模型进行了归纳,比较常见方法各自的优缺点,总结了视觉词包模型性能评价方法,并对目前常用的标准场景库进行汇总,同时给出了各自所达到的最高精度。结论图像场景分类中视觉词包模型方法的研究作为计算机视觉领域方兴未艾的热点研究领域,在国内外研究中取得了不少进展,在计算机视觉领域的研究也不再局限于直接应用模型描述图像内容,而是更多地考虑图像与文本的差异。虽然视觉词包模型在图像场景分类的应用中还存在很多亟需解决的问题,但是这丝毫不能掩盖其研究的重要意义。
-
关键词
场景分类
视觉词包
低层特征
直方图表示
-
Keywords
scene classification
bag-of-visual-words
low-level feature
histogram representation
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-