当前位置：首页 > news >正文

GDAL 实现矢量数据读写

news 2026/4/3 19:34:29

❝
GIS 数据的读写作为一个基础操作，是每一个GISer的必修课。在使用GDAL读取矢量数据时，需要掌握其基本的数据结构与类型，了解常用的数据读取方法，这样开发时才会起到事半功倍的效果。

在之前的文章中讲了如何使用GDAL或者ogr2ogr工具将txt以及csv文本数据转换为Shp格式，本篇教程在之前一系列文章的基础上讲解GDAL实现矢量数据读写。

GDAL 简介
GDAL 下载安装
GDAL 开发起步
GDAL 实现 GIS 数据读取转换（全）

如果你还没有看过，建议从以上内容开始。

1. 开发环境

本文使用如下开发环境，以供参考。

时间：2025年

系统：Windows 11

Python：3.11.7

GDAL：3.11.1

2. 矢量数据读取接口

在GDAL中，矢量数据模型遵循下图所示结构。从数据驱动->数据源->图层->属性。

2.1. 获取数据源

GDAL中可以使用Open方法直接打开数据源，进而读取图层数据。在GDAL Python API中，Driver和Dataset类在Raster API文档中，既适用于矢量数据，也适用于栅格数据。

"""
说明：用于打开数据源
参数：
-utf8_path：字符串，数据源路径
-update：布尔值类型，默认值False，是否以更新模式打开数据集（默认为只读模式）
返回值：返回数据集或者None
"""
def Open(utf8_path,update=False)

如下以只读模式打开Shp数据源。

dataSource = ogr.Open(shpPath,False)# False表示只读，True表示可写

除了ogr的Open方法之外，也可以使用gdal模块的打开方法

2.2. 获取图层

GDAL获取图层的常用方法为GetLayer，该方法只有一个参数。iLayer值固定为0，对shapefile图层来说是可选项。

"""
说明：从数据集获取图层
参数：
-iLayer：整型或字符串，图层名称或者基于0的图层索引值。
返回值：返回图层或者None
"""
def GetLayer(iLayer=0)

获取数据集中索引值为0的图层。

# 获取图层
layer = dataSource.GetLayer(0)

除了GetLayer方法之外，还有一个GetLayerByIndex方法用于获取图层。

"""
说明：根据索引获取图层
参数：
-index：整型，图层索引值。
返回值：返回图层或者None
"""
def GetLayerByIndex(index)

图层索引值处于0和GetLayerCount() - 1之间。最后还有个GetLayerCount方法用于获取图层数量。从数据集中获取图层数量。

# 获取图层数量
layerCount = dataset.GetLayerCount()
print(f"图层数量：{layerCount}")

2.3. 获取投影信息

GetProjection和GetProjectionRef方法都可以用于读取坐标系统，两者都返回一个字符串类型WKT格式的数据集空间参考信息。从图层获取投影信息。

# 图层投影
projectionRef = layer.GetProjectionRef()
print(f"空间参考：{projectionRef}")

此外还有一个方法GetSpatialRef也可用于获取数据集空间参考信息。从图层获取空间参考信息。

# 图层空间参考
spatialRef = layer.GetSpatialRef()
print(f"空间参考：{spatialRef}")

2.4. 获取要素

在知道FId(要素编号)的情况下，可以直接使用GetFeature方法获取要素。

# 获取指定要素
feature = layer.GetFeature(0)

也可以通过GetNextFeature方法遍历要素特征，并且返回一个要素Feature。此方法适用于少数几个OGRLayer.GetNextFeature()效率不高的驱动程序，但总体而言，OGRLayer.GetNextFeature()是一个更自然的API。从图层读取要素特征。

# 获取要素
feature = layer.GetNextFeature()
limitCount = 0
# 限制打印前十个要素
whilefeature and limitCount < 10:
print(f"打印第【{limitCount+1}】个要素")

GetFeatureCount方法用于获取图层要素数量。

# 获取图层要素数量
layerFeatureCount = layer.GetFeatureCount()
print(f"要素数量：{layerFeatureCount}")

2.5. 获取属性结构

GetLayerDefn方法用于获取图层属性表，返回要素定义信息。获取图层属性。

# 获取图层属性
layerProperty = layer.GetLayerDefn()

GetFieldCount方法用于获取字段数量。读取图层要素数量。

# 获取图层名称
layerName = layer.GetName()
# 获取图层要素数量
layerFeatureCount = layer.GetFeatureCount()

GetFieldDefn用于获取字段定义信息，其中包括字段名称，字段类型。读取属性表结构。

# 获取图层属性
layerProperty = layer.GetLayerDefn()
# 获取图层字段数量
fieldCount = layerProperty.GetFieldCount()
print(f"字段数量：{fieldCount}")

# 获取字段信息
forjinrange(fieldCount):
# 获取字段属性对象
fieldProperty = layerProperty.GetFieldDefn(j)
# 获取字段属性名称
fieldName = fieldProperty.GetName()
# 获取字段属性类型
fieldType = fieldProperty.GetTypeName()

print(f"第 【{j}】 个字段名称：{fieldName}，字段类型：{fieldType}")

GetField用于获取属性字段值，参数可以是字符串字段名，也可以是字段索引值。GetGeometryRef方法用于获取要素几何对象信息。读取几何对象。

# 读取几何属性
geom = feature.GetGeometryRef()

2.6. 获取图层范围

GetExtent获取图层四至范围。

# 获取范围
extent = layer.GetExtent()

3. 矢量数据修改接口

Driver(驱动程序)是一个知道如何执行特定功能的对象与某种数据类型（如shapefile），为了读写数据，就需要一个合适的驱动程序。本文以下的数据修改都已shapefile驱动为例进行讲解。

3.1. 获取目标数据驱动

首先需要导入ogr模块用于处理矢量数据。GetDriverByName方法可以根据名称获取数据驱动。

from osgeo import ogr,osr

# 获取Shp数据驱动
shpDriver = ogr.GetDriverByName('ESRI Shapefile')

3.2. 创建数据源

CreateDataSource方法根据文件路径创建数据源。

# 创建Shp数据源
shpDataSource = shpDriver.CreateDataSource(shpPath)

3.3. 创建图层

通过CreateLayer方法创建图层，该方法具有四个参数，图层名称、坐标系统以及几何类型是必传。

# 创建点图层
layer = shpDataSource.CreateLayer("points",srs,ogr.wkbPoint)

3.4. 创建属性字段

通过CreateField方法创建属性字段。

iffield notin[lonField, latField]:
# 创建字段定义
fieldDefn = ogr.FieldDefn(field, ogr.OFTString)
fieldDefn.SetWidth(254)
# 直接创建字段，不要存储 FieldDefn 对象
layer.CreateField(fieldDefn)

3.5. 创建几何对象

要素对象方法SetGeometry可以创建几何对象。

# 创建几何对象
point = ogr.Geometry(ogr.wkbPoint)
point.AddPoint(lon,lat)
feature.SetGeometry(point)

3.6. 创建要素

通过图层方法CreateFeature创建要素。

# 创建要素
feature = ogr.Feature(layer.GetLayerDefn())

# 设置属性
forfieldinfieldnames:
iffield notin[lonField, latField]:
feature.SetField(field, str(row[field]))
# 创建几何
point = ogr.Geometry(ogr.wkbPoint)
point.AddPoint(lon,lat)
feature.SetGeometry(point)

# 保存要素
layer.CreateFeature(feature)

4. 关闭数据源

为了防止内存泄露问题发生，在确定数据读取完成后需要关闭数据源。

# 关闭数据源
dataSource = None

# 关闭要素
feature.Destroy()
# feature = None

小提示

GDAL中的方法采用大驼峰命名法

查看全文

http://www.jsqmd.com/news/188340/

IndustrialInternet工业互联网：设备铭牌数据自动录入系统

HunyuanOCR实战案例：从发票识别到护照信息抽取的全流程实现

单指令完成OCR任务：HunyuanOCR如何实现真正的端到端推理？

强烈安利研究生必用TOP10 AI论文平台测评

还在用易留AIGC痕迹的AI工具？7款神器助知网维普查重一把过

BlockchainNFT数字藏品：HunyuanOCR验证纸质证书真伪

将HunyuanOCR集成进企业OA系统：实现合同自动归档与审批

按需计费Token方案上线：调用HunyuanOCR API按实际用量付费

HunyuanOCR能否防御对抗样本攻击？安全性与鲁棒性初步评估

火车票与飞机行程单识别：差旅报销系统的理想OCR引擎

如何使用腾讯HunyuanOCR实现端到端多语言文档解析？轻量化1B参数SOTA模型详解

ArchiveDigitization档案数字化：历史文献抢救性保护工程

HunyuanOCR在金融票据识别中的应用：精准提取金额、日期与账号信息

TelecomBill通信费用分析：个人支出统计自动化起点

DisasterRelief灾后重建：损毁证件信息恢复辅助认证

混合排版文档识别挑战：HunyuanOCR对图文混排与表格的处理能力

关于临时文件自动化管理方案技术文章大纲

学霸同款2025 TOP10一键生成论文工具测评：专科生毕业论文必备神器

低成本部署OCR服务：利用HunyuanOCR 1B参数模型降低GPU算力消耗

GitCode平台发布HunyuanOCR镜像：国内访问更稳定快速

InsuranceClaim理赔材料审核：HunyuanOCR加快处理周期

【数学建模】基于模型的预测控制的建筑热环境多模型对比Matlab仿真，通过 5 种不同的热模型（参考模型、简化电容模型、墙体模型、空气模型、空气 - 墙体耦合模型）仿真建筑室内温度

【数据分析】基于物理的动态模式分解 (piDMD)附Matlab代码

关于Anaconda加速AI模型训练

跨境电商适用：HunyuanOCR多语言商品标签识别与翻译一体化

HunyuanOCR日志分析技巧：定位识别失败原因与优化输入质量

AI排名优化核心逻辑：超越传统SEO的智能营销新路径

使用Prometheus监控HunyuanOCR服务状态：GPU利用率与QPS指标采集

法律文书识别新工具：HunyuanOCR提取判决书关键要素

文件自动化管理方案技术文章大纲