【代码】合并Shapefile文件

在地理信息系统中,Shapefile(.shp)是一种非常常见的矢量数据格式,用于存储地理要素的空间信息和属性数据。在处理大量Shapefile时,有时需要将多个文件合并成一个,以便于统一管理和分析。本文将介绍如何使用Python的GDAL/OGR库实现多个Shapefile文件的合并操作,并讨论其中的一些技术细节和注意事项。

一、背景介绍

GDAL/OGR是一个开源的地理数据转换库,提供了丰富的地理数据读写和处理功能。在Python中,我们可以通过osgeo模块来使用GDAL/OGR库。GDAL主要用于栅格数据的处理,而OGR则专注于矢量数据的处理。通过OGR,我们可以方便地读取、创建和修改Shapefile文件。

二、合并多个Shapefile文件

为了合并多个Shapefile文件,我们首先需要获取这些文件的路径列表,然后逐个读取文件并提取其中的地理要素和属性数据。最后,将这些数据写入一个新的Shapefile文件中。

以下是一个简单的Python类MultipleShpMerge,用于实现多个Shapefile文件的合并操作:

import glob
import os
from osgeo import gdal
from osgeo import ogr, osr


# Open the counties dataset

# 多个shp文件合并成一个shp文件  ,存在两个面
class MultipleShpMerge(object):
    # MultipleShpMerge 类的初始化
    def __init__(self, shp_path, saveshp_path=None):

        self.shp_path = shp_path
        self.shp_list = glob.glob(self.shp_path)
        if saveshp_path:
            self.saveshp_path = saveshp_path
        else:
            self.saveshp_path = shp_path
        if not os.path.exists(self.saveshp_path):
            os.makedirs(self.saveshp_path)
        self.outshpfile = self.saveshp_path +'\\'+r"_merge.shp"
        self.shp_list.sort()
        self.shp_merge()
    # 要素合并到一个shp文件中
    def shp_merge(self):
        filePath_list = glob.glob(self.shp_path + r"\\*.shp")
        # 创建空的shp文件路径

        self.CreateShp()
        for i in range(len(filePath_list)):
            ds = ogr.Open(filePath_list[i], True)
            Layer = ds.GetLayer(0)
            Count = Layer.GetFeatureCount()
            # split()方法根据字符"\\"分割字符串,返回包含各个分割要素的List列表,[-1]表示取List列表中最后一个元素
            ParkName = filePath_list[i].split("\\")[-1].split(".")[0]
            for j in range(Count):
                feature = Layer.GetFeature(j)
                geom = feature.GetGeometryRef()
                self.GeometryMerge(geom, ParkName)
            ds.Destroy()
        print("over")
    def GeometryMerge(self, geom, parkname):
        # 解决shp字段写入中文出现字符乱码问题
        gdal.SetConfigOption("GDAL_FILENAME_IS_UTF8", "YES")
        gdal.SetConfigOption("SHAPE_ENCODING", "GBK")

        ds = ogr.Open(self.outshpfile, True)
        Layer = ds.GetLayer(0)
        feature = ogr.Feature(Layer.GetLayerDefn())
        feature.SetGeometry(geom)
        feature.SetField('name', parkname)
        Layer.CreateFeature(feature)  # 创建几何要素,并写入图层
        ds.Destroy()

    # 创建空的Shp文件
    def CreateShp(self):
        driver = ogr.GetDriverByName("ESRI Shapefile")
        ds = driver.CreateDataSource(self.outshpfile)
        spatialref = osr.SpatialReference()
        spatialref.ImportFromEPSG(4326)
        geomtype = ogr.wkbPolygon
        # 创建矢量面图层
        layer = ds.CreateLayer(self.outshpfile[:-4], srs=spatialref, geom_type=geomtype)
        # 添加属性字段name,字符型
        layer.CreateField(ogr.FieldDefn('name', ogr.OFTString))
        ds.Destroy()

在这个类中,我们首先通过glob模块获取指定目录下的所有Shapefile文件路径。然后,我们创建一个空的Shapefile文件作为输出文件。接下来,我们遍历每个输入文件,读取其中的地理要素和属性数据,并将它们写入输出文件。

在合并过程中,我们需要注意以下几点:

  1. 字段匹配:如果输入文件的字段不一致,我们需要决定如何处理。例如,我们可以选择只保留共有的字段,或者添加缺失的字段并为其赋默认值。
  2. 坐标系统:合并Shapefile时,需要确保所有输入文件具有相同的坐标系统。如果坐标系统不一致,我们需要在合并之前进行坐标转换。
  3. 性能优化:当处理大量数据时,合并操作可能会非常耗时。我们可以通过多线程、分块读取等方式来优化性能。
  4. 错误处理:在读取和写入Shapefile时,可能会遇到各种错误,如文件不存在、格式错误等。我们需要添加适当的错误处理逻辑,以确保程序的健壮性。

三、测试

现在有两个矢量文件,一个是朝鲜的面矢量,一个是韩国的面矢量,我们对它们进行合并测试。

image-20240429112910528

在arcgis打开它们,如下所示:

image-20240429112825910

在arcgis打开合并后的结果,如下:

image-20240429130826361

四、结论

通过Python的GDAL/OGR库,我们可以方便地实现多个Shapefile文件的合并操作。在实际应用中,我们需要根据具体需求和数据特点来选择合适的合并策略,并注意处理可能出现的各种问题。希望本文能对大家在使用GDAL/OGR处理Shapefile时提供一些参考和帮助。

代码和测试数据下载地址: