计算机视觉领域视觉提示的五大进展
图像理解:简单的视觉标记能够帮助基础模型更好地理解图像中的特定部分。
MLLMs(多模态大型语言模型):利用场景图使多模态大型语言模型能够更精准地描述图像,无需额外的训练数据。
基础模型改进:通过策略性的视觉提示改进视觉基础模型(如SAM),提升其性能。
增强泛化能力:训练人工智能快速识别新(未知)对象,同时保留对旧(已知)对象的记忆。
视觉提示与主动学习结合:AI能够智能地学习新的视觉任务,使用更少的例子,且不会忘记已学的知识。
本文探讨了视觉提示技术,这是一种使大型视觉模型能够适应新任务的方法。
除了定义这种方法并从系统角度阐述提示可调模型如何革新这一领域,我们还着重介绍了CVPR 2024上提出的五个最具影响力的视觉提示进展。
目录
什么是视觉提示Visual Prompting
视觉提示:一种系统视角
CVPR 2024上抢尽风头的视觉提示进展
接下来会发生什么
1.什么是视觉提示?What is Visual Prompting?
1.1 视觉提示的起源视觉提示可以追溯到 2001 年发表的《Image Analogies》,其中研究人员 ...
这些技巧使得处理 Python 中的字典变得更加愉快和优雅。
1)使用 dict(key=value) 创建字典# 正常的方式创建字典,使用字典推导式的语法
normal_dict = {
'red': 'apple',
'orange': 'orange', # 注意颜色和水果名称相同,但这里用作键和值
'yellow': 'banana',
'green': 'grape'
}
# '更好'的方式创建同样的字典,使用dict()构造函数和关键字参数
better_dict = dict(
red='apple', # 键值对直接在函数调用中定义
orange='orange', # 注意这种方式避免了使用元组或列表
yellow='banana', # 直接键=值的形式
green='grape' # 不需要额外的括号或逗号分隔
)
# 打印两个字典以验证它们是否相同
print(normal_dict)
print(better_dict)
为什么后一种是 ...
在地理空间分析领域,温度植被干旱指数(TVDI)是一种广泛采用的遥感指标,用于评估区域干旱状态。它结合了地表温度(Land Surface Temperature, LST)和归一化植被指数(Normalized Difference Vegetation Index, NDVI)的信息,可以有效揭示土壤水分状况。本文将深入探讨如何使用Python中的GDAL、NumPy和Matplotlib库来处理地理空间数据,计算TVDI,并将其可视化。
准备工作确保安装了以下库:
GDAL:用于地理空间数据的操作和读取。
NumPy:用于高效数组处理和数学运算。
Matplotlib:用于数据可视化。
实现细节数据准备与读取首先,我们需要从TIFF文件中读取NDVI和LST数据。这可以通过GDAL的gdal.Open()函数完成,随后使用GetRasterBand().ReadAsArray()方法将波段数据转换为NumPy数组。
def get_data(file_ndvi, file_lst):
ndvi_tif = gdal.Open(file_ndvi, gdal.GA_Re ...
虽然PDF文件对文本布局非常好,容易打印并阅读,但软件要将它们解析为纯文本并不容易,Python目前解析PDF的扩展包有很多。
通过查询资料,建议使用pdfplumber扩展包来解析PDF文档的文本和表格。本文介绍如何通过pdfplumber获取PDF的文本。
准备工作确保安装了以下库:
pdfplumber
若没安装,请在命令行使用以下语句进行安装:
pip install pdfplumber
pdfplumberpdfplumber中有两个基础类,PDF和Page。PDF用来处理整个文档,Page用来处理整个页面。
1.1 pdfplumber.PDF类
.metadata: 获取pdf基础信息,返回字典
pages 一个包含pdfplumber.Page实例的列表,每一个实例代表pdf每一页的信息。
1.2 pdfplumber.Page类pdfplumber核心功能,对PDF的大部分操作都是基于这个类,包括提取文本、表格、尺寸等。
pdfplumber的使用指南使用 pdfplumber 库解析 PDF 的分步指南。
步骤 1:安装 pdfplumber 库 首先, ...
引言在遥感影像处理和分析中,色彩增强是一个常见的任务。通过色彩增强,我们可以更清晰地展示影像中的某些特征,如植被、水体等。本篇博客将介绍如何使用GDAL(地理空间数据抽象库)和Python进行影像植被色彩增强处理,并实现批量处理功能。
遥感影像自然真彩色合成可分为以下几种方法:1、直接用多光谱影像的红、绿、蓝通道合成,一般用于高分辨率影像;2、利用其它波段加权处理,重新生成红、绿、蓝波段,一般用于增强某种地物颜色层次,如植被、水体等;3、利用其它波段信息重新生成某一波段,一般用于缺少波段的传感器,如SPOT、Aster等。
目的这个操作的主要目的是为了影像在视觉上更好看。
植被色彩增强方法这里输入数据可以是原始的L1级数据,也可以是经过大气校正、几何RPC校正后的L2级数据。
输出数据为4波段的8bit的数据。
简单地说一下方法流程:
1.依次读取输入数据的第一、第三、第四波段,对这些波段数据进行线性拉伸,把数据拉伸到8bit。再保存为输出数据的第一、第三、第四波段。
2.读取输入数据的第二波段、第四波段,利用第二波段、第四波段计算NDVI。
3.对NDVI进行二维掩膜,NDVI大于0 ...
在本篇推文中,我们将深入探讨如何使用Python的PyQt5库和GDAL库构建一个图形用户界面(GUI)应用程序,该程序旨在对遥感影像进行色彩增强处理。此应用程序不仅能够处理单个图像文件,还能批量处理文件夹中的多个TIFF文件,同时允许用户自定义色彩增强的程度。
项目背景遥感影像的色彩增强是一种常见的图像预处理技术,用于提高图像的视觉效果,使得特定的地物特征更加突出,便于后续的分析和解读。本项目的目标是创建一个用户友好的界面,使得非专业用户也能轻松地对遥感影像进行色彩增强处理。
技术栈
Python: 编程语言。
PyQt5: 构建跨平台的GUI应用程序。
GDAL: 地理空间数据读取与处理库。
应用程序结构主窗口设计应用程序的主窗口包括以下几个组件:
输入文件/文件夹选择:允许用户选择待处理的单个图像文件或整个文件夹。
输出文件夹选择:指定处理后的文件保存位置。
增强值设置:用户可以自定义色彩增强的程度。
进度条:显示处理进度。
开始处理按钮:启动色彩增强过程。
后台处理逻辑后台处理逻辑主要包括以下步骤:
色彩增强算法:利用NDVI(归一化差值植被指数)和NDWI(归一化差值 ...
https://zhuanlan.zhihu.com/p/629483254
安装好QGIS后,使用pycharm作为开发项目的编辑平台。现在在pycharm中进行配置。
新建项目,如下图所示。
坑:
报错1:
用pyuic5将.ui文件转化为.py文件出现报错,如下:
最终解决办法是:.ui文件名不能有空格。路径名称当中的文件夹名称也不能有空格;比如你的.ui文件在 project program文件夹下面就不能实现转化,得把文件夹名称改为projectprogram
报错2:
不知道为什么由ui文件生成的py文件会带有C++的语法
报错3:
第一次运行python qt时显示:This application failed to start because no Qt platform plugin could beinitialized Reinstalling the application may fix this problemAvailable platform plugins are: direct2d, minimal, offscreen, window ...
在遥感技术的广阔领域中,Sentinel-2卫星以其独特的多波段和高分辨率成像能力脱颖而出,成为环境监测、农业评估、城市规划等多个领域的重要数据来源。然而,Sentinel-2影像的一个显著特点——其拥有三种不同的空间分辨率,使得其数据存储和处理方式与传统遥感影像存在显著差异。本文将深入探讨Sentinel-2影像的这一特殊之处,并解析其数据存储策略背后的考量。
Sentinel-2影像的多分辨率特性Sentinel-2卫星搭载了多光谱成像仪(MSI),能够捕获从可见光到短波红外(SWIR)的多个光谱波段。然而,与许多其他遥感卫星不同,Sentinel-2并非将所有波段数据以相同分辨率记录。如表所示,Sentinel-2的波段涵盖了从443.9nm的蓝色波段到2202.4nm的短波红外2波段,且其空间分辨率分为三种:10米、20米和60米。
10米分辨率波段:主要包括蓝色(B2)、绿色(B3)、红色(B4)和近红外(B8)波段,这些波段对于植被监测、水体识别和地表覆盖分类等应用至关重要。
20米分辨率波段:包括红边波段(B5、B6、B7、B9)和短波红外1波段(B11),这些波段在 ...
将shp文件转换为GeoPackage格式(.gpkg)的过程,可以使用QGIS软件来完成。以下是详细的步骤:
创建GeoPackage数据库文件:
打开QGIS软件。
在浏览面板的GeoPackage上右键,点击“创建数据库…”。
在新建窗口的数据库项输入.gpkg文件的保存路径,直接点击确定即可创建一个后缀为.gpkg的GeoPackage数据库文件。
把shp文件添加到图层面板:
打开资源管理器,在左侧选择“矢量”>“矢量数据集”。
浏览并打开shp文件(仅添加后缀为.shp的文件)。
点击“添加”,即可将shp文件添加到图层面板。
导出到GeoPackage数据库:
在想导出的shp图层上右击。
选择“导出”>“另存要素为…”。
在弹出的窗口中,选择格式为GeoPackage。
选择上面创建的后缀为.gpkg的文件。
填写图层名称,点击“OK”即可将shp文件导入到GeoPackage数据库。
python如何通过代码实现shp文件转换为gkpg文件呢?请看下面代码。
#!/usr/bin/env python
# -*- co ...