摘要
在对网络图像进行索引时,人们往往利用网页中图像周围的文字作为其近似标注信息,但是这些文字信息质量不高,不足以良好地描述图像内容。该文提出一种综合利用图像视觉特征、相关文本信息以及词汇间语义关系的方法对这些不精确的文本信息进行改善,从而提高图像的索引和搜索质量。在大规模数据集上的实验证明了所提出的方法能够有效改善图像的标注。
When Web images are indexed, the textual information in the hosting web pages are usually used as approximate image description. However, such information is not accurate enough. In this paper, a framework is proposed to utilize the visual content, the textual context, and the semantic relations between keywords to refine the image annotation. Experiments on large-scale dataset demonstrate the effectiveness of the proposed method.
出处
《电子与信息学报》
EI
CSCD
北大核心
2009年第2期270-274,共5页
Journal of Electronics & Information Technology
基金
国家自然科学基金(60672056)资助课题
关键词
自动图像标注
标注改善
多模态学习
Automatic image annotation
Annotation refinement
Multimodality learning