什么是遥感影像样本库？

ytkz2026-02-092026-02-10

大家好，我是小白。很久没写公众号了。

今天聊一聊什么是遥感影像样本库及制作流程。

开门见山地说，深度学习需要的样本，我的理解是：指导计算机去识别、理解输入内容。。

主语是计算机，动词是识别，对象是输入内容。

样本一般形式是两两为一对出现。

Image（原始影像）

就是我们的输入素材，遥感里一般是卫星 / 航拍 / 无人机拍摄的影像，格式多为 TIFF/GeoTIFF（带地理坐标），也可转 JPG/PNG。我一般是滑窗分割为小瓦片转为png，大小一般是512x512。
Label（标注 / 标准答案）

是给计算机看的「正确答案」，文件格式主要分两类：
1. 图片格式（掩码图）
2. 文本格式（坐标 + 类别）

在语义分割，样本一般是图片+图片的形式。

在目标识别，样本一般是图片+文本的形式。

在语义分割也分为二分类和多分类。

语义分割（像素级分类，如土地利用分类、水体提取）

形式：影像图 + 标注图（图片格式）

每个像素都对应一个类别，逐像素匹配。

目标检测（找位置 + 类别，如找建筑、车辆、桥梁、光伏板）

形式：影像图 + 文本标注

文本里记录：目标类别 + 框坐标，告诉计算机 ”哪里有什么“。

简单说：

遥感影像样本库 = 大量标准化、配对好、带地理信息、分类统一的「影像 + 标注」集合。

它是训练遥感深度学习模型的「教材库」，样本质量、数量、规范性，直接决定模型能不能准确识别地物。

二分类如下图，左图是image，右图是label。label中，红色像素的数值是1（或者255）。黑色像素是0。

其实就是告诉计算机，图片中的哪些位置是1，哪些位置是0。

深度学习就是去计算图片中位置的概率，在训练时，需要的多张样本，这些样本我们称之为样本库。

多分类：

不分类，只识别，是目标检测，这时候的样本形式为图片+文本。

文本是描述目标框的位置。目标框也分为不旋转的框和旋转的框。

如果从数据来源来分，也分为：雷达样本和光学样本。

格式标准化与数据集划分

把标注转成模型支持的格式（掩码图、YOLO TXT、COCO JSON 等），统一命名、统一尺寸，再按比例分成：训练集 / 验证集 / 测试集。

一句话总结：

样本就是「影像 + 标准答案」，样本库就是一套标准化教材，流程就是：定规范→预处理→标注→转格式→质检→入库。

以上步骤中最繁琐的步骤是样本标注，一般是在arcgis绘制矢量。

随着技术的发展，我也看到了有一些半自动绘制矢量的工具，但如果要高精度、高标准的样本，还是得靠人工。

问题来了：我们是否可以用大量的中等精度的样本去代替高精度、高标准的样本，最终达到模型的拟合呢？

亦或者只要少量的高精度、高标准的样本，结合自监督学习dinov3，完成微调，最终达到模型的拟合？