-
题名基于预训练模型的单帧航拍图像无监督语义分割
被引量:1
- 1
-
-
作者
任月冬
游新冬
滕尚志
吕学强
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
-
出处
《北京信息科技大学学报(自然科学版)》
2024年第2期21-28,共8页
-
基金
国家自然科学基金项目(62202061
62171043)
+1 种基金
北京市自然科学基金项目(4232025)
北京市教委科研计划科技一般项目(KM202311232002)。
-
文摘
针对航拍图像语义分割成本高、通用性差和精度低等问题,提出了一种两阶段无监督语义分割网络(two-stage unsupervised semantic segmentation net, TUSSNet),针对单帧航拍图像训练进而生成最终的语义分割结果。算法分为2个阶段。首先,使用对比语言-图像预训练(contrastive language-image pretraining, CLIP)模型生成航拍图像的粗粒度语义标签,然后进行网络的预热训练。其次,在第一阶段的基础上,采用分割一切模型(segment anything model, SAM)对航拍图像进行细粒度类别预测,生成精细化类别掩码伪标签;然后迭代优化网络,得到最终语义分割结果。实验结果显示,相较于现有无监督语义分割方法,算法显著提高了航拍图像的分割精度,同时提供了准确的语义信息。
-
关键词
预训练模型
航拍图像
语义分割
无监督算法
聚类效果估计
深度学习
-
Keywords
pretrained model
aerial image
semantic segmentation
unsupervised algorithm
clustering performance estimation
deep learning
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-