当前位置：首页 > news >正文

ArcGIS Pro 3.0 + YOLO：手把手教你制作遥感影像目标检测数据集（附完整代码）

news 2026/7/26 20:34:50

ArcGIS Pro 3.0与YOLO实战：遥感影像目标检测数据集全流程解析

在遥感影像分析领域，目标检测技术正逐渐成为从海量数据中提取有价值信息的关键手段。无论是农业监测中的作物识别、城市规划中的建筑物检测，还是环境评估中的植被覆盖分析，准确高效的自动化检测方案都能显著提升工作效率。本文将完整呈现如何利用ArcGIS Pro 3.0与YOLO框架构建端到端的遥感目标检测解决方案，特别适合需要处理大范围地理空间数据的GIS专业人员和AI开发者。

1. 环境准备与数据标注

1.1 软件配置要求

构建遥感影像检测流水线需要以下核心组件：

ArcGIS Pro 3.0+：确保安装时勾选"Deep Learning"扩展模块
Python 3.8+环境：推荐使用Miniconda创建独立环境
YOLOv5/v8：可通过pip直接安装最新版本
辅助工具包：GDAL、OpenCV、Shapely等空间数据处理库

提示：ArcGIS Pro的深度学习工具需要单独授权，建议提前确认许可状态

1.2 遥感影像预处理要点

优质数据集的基础是规范的影像预处理：

坐标系统一：确保所有影像采用相同的投影坐标系（如WGS84 Web Mercator）
辐射校正：进行大气校正和辐射归一化处理
波段组合：根据检测目标优化波段选择（如植被检测优先使用NIR波段）
影像分块：建议将大范围影像预先分割为1024x1024像素的区块

# 使用GDAL进行影像分块示例 import gdal input_img = 'input.tif' output_prefix = 'tile_' tile_size = 1024 ds = gdal.Open(input_img) for i in range(0, ds.RasterXSize, tile_size): for j in range(0, ds.RasterYSize, tile_size): gdal.Translate(f"{output_prefix}{i}_{j}.tif", ds, srcWin=[i, j, tile_size, tile_size])

2. ArcGIS Pro标注工作流

2.1 创建标注工程

在ArcGIS Pro中建立标注项目的关键步骤：

新建地图工程，导入待标注影像
创建面要素类（Shapefile或Geodatabase Feature Class）
- 设置与影像一致的坐标系
- 添加class_id（短整型）和class_name（文本型）字段
启动编辑会话，使用"多边形"工具绘制目标轮廓

标注效率技巧：

启用"捕捉"功能保证标注边界精确对齐
对规则形状目标（如圆形树冠）可使用"自动完成多边形"工具
批量标注时先绘制所有同类目标再统一填写属性

2.2 高级标注策略

针对遥感影像特点，推荐以下优化方法：

场景	解决方案	优势
多时相影像	使用时间滑块同步标注	避免重复标注相同地物
大区域覆盖	建立图幅索引系统	便于团队协作标注
多类别目标	定制符号化渲染	直观区分不同类别

# 属性表批量赋值示例（ArcPy） import arcpy feature_class = "标注要素.shp" with arcpy.da.UpdateCursor(feature_class, ["class_id", "class_name"]) as cursor: for row in cursor: if row[1] == "柑橘树": row[0] = 1 # 对应YOLO类别ID cursor.updateRow(row)

3. 数据集导出与格式转换

3.1 使用Export Training Data工具

在ArcGIS Pro的"影像分析"工具箱中找到"导出深度学习训练数据"工具，关键参数配置：

输入栅格：选择待导出的影像图层
输出位置：指定空文件夹存储结果
标注要素：选择标注好的面要素
输出格式：建议选择"PASCAL Visual Object Classes"
切片大小：设置为640x640（适配YOLO输入尺寸）
步长：设置320可获得50%重叠的增强数据

注意：勾选"旋转增强"可自动生成多角度训练样本，显著提升模型鲁棒性

3.2 转换为YOLO格式

导出后的PASCAL VOC格式需要转换为YOLO要求的txt标注文件，转换逻辑包括：

解析XML中的边界框坐标
将绝对坐标转换为相对坐标（0-1范围）
按<class_id> <x_center> <y_center> <width> <height>格式保存

# VOC转YOLO格式完整代码 import xml.etree.ElementTree as ET import os def convert_voc_to_yolo(xml_path, output_dir, class_map): tree = ET.parse(xml_path) root = tree.getroot() size = root.find('size') img_width = int(size.find('width').text) img_height = int(size.find('height').text) txt_filename = os.path.splitext(os.path.basename(xml_path))[0] + '.txt' txt_path = os.path.join(output_dir, txt_filename) with open(txt_path, 'w') as f: for obj in root.iter('object'): cls_name = obj.find('name').text cls_id = class_map[cls_name] bbox = obj.find('bndbox') xmin = float(bbox.find('xmin').text) ymin = float(bbox.find('ymin').text) xmax = float(bbox.find('xmax').text) ymax = float(bbox.find('ymax').text) # 转换坐标 x_center = ((xmin + xmax) / 2) / img_width y_center = ((ymin + ymax) / 2) / img_height width = (xmax - xmin) / img_width height = (ymax - ymin) / img_height f.write(f"{cls_id} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}\n") # 使用示例 class_map = {"柑橘树": 0, "建筑物": 1} # 与标注时的class_id对应 xml_dir = "VOC/Annotations" output_dir = "YOLO/labels" os.makedirs(output_dir, exist_ok=True) for xml_file in os.listdir(xml_dir): if xml_file.endswith('.xml'): convert_voc_to_yolo(os.path.join(xml_dir, xml_file), output_dir, class_map)

4. YOLO模型训练配置

4.1 数据集结构规范

完整的YOLO数据集应遵循以下目录结构：

dataset/ ├── images/ │ ├── train/ │ └── val/ ├── labels/ │ ├── train/ │ └── val/ └── dataset.yaml

4.2 关键配置文件详解

dataset.yaml文件是连接数据和模型的枢纽，典型配置如下：

# 柑橘树检测数据集配置 path: ../dataset # 数据集根目录 train: images/train # 训练集路径 val: images/val # 验证集路径 # 类别信息 names: 0: 柑橘树 1: 建筑物 2: 道路 # 超参数配置 nc: 3 # 类别数量 batch: 16 # 批次大小 imgsz: 640 # 输入尺寸

数据集划分建议：

采用70-15-15比例分配训练/验证/测试集
确保不同集合间的空间分布均衡
对时序数据要保持时间连续性

4.3 训练启动与监控

使用YOLOv8的训练命令示例：

yolo task=detect mode=train model=yolov8s.pt data=dataset/dataset.yaml epochs=100 imgsz=640 batch=16

训练过程监控要点：

指标观察：
- mAP@0.5：主要精度指标
- 损失曲线：关注train/val损失同步下降
数据增强：
- 启用Mosaic增强
- 调整HSV色域变换参数
早停策略：
- 设置patience=20防止过拟合

# 训练结果可视化代码 from ultralytics import YOLO import matplotlib.pyplot as plt model = YOLO('yolov8s.pt') results = model.train(data='dataset.yaml', epochs=100) # 绘制精度曲线 plt.figure(figsize=(10, 6)) plt.plot(results.results['metrics/mAP50(B)'], label='mAP@0.5') plt.xlabel('Epoch') plt.ylabel('Precision') plt.legend() plt.show()

5. 实际应用与优化技巧

5.1 模型部署方案

将训练好的YOLO模型集成回ArcGIS Pro的三种方式：

Python脚本工具：
- 通过ArcPy创建自定义地理处理工具
- 使用ONNX运行时加速推理
Deep Learning Package：
- 将模型��出为.esdl格式
- 利用"检测对象"工具批量处理
REST服务：
- 部署模型为影像服务
- 支持分布式计算和大范围应用

# ArcGIS Pro中调用YOLO模型的示例 import arcpy import torch from PIL import Image def detect_objects(input_raster, output_fc, model_path): # 加载模型 model = torch.hub.load('ultralytics/yolov5', 'custom', path=model_path) # 创建输出要素类 arcpy.CreateFeatureclass_management( os.path.dirname(output_fc), os.path.basename(output_fc), "POLYGON", spatial_reference=arcpy.Describe(input_raster).spatialReference ) arcpy.AddField_management(output_fc, "Class", "TEXT") # 分块处理影像 with arcpy.da.InsertCursor(output_fc, ["SHAPE@", "Class"]) as cursor: for tile in generate_tiles(input_raster, tile_size=640): img = Image.fromarray(tile) results = model(img) for *xyxy, conf, cls in results.xyxy[0]: # 将检测框转换为多边形 polygon = arcpy.Polygon( arcpy.Array([ arcpy.Point(xyxy[0], xyxy[1]), arcpy.Point(xyxy[2], xyxy[1]), arcpy.Point(xyxy[2], xyxy[3]), arcpy.Point(xyxy[0], xyxy[3]) ]) ) cursor.insertRow([polygon, model.names[int(cls)]])

5.2 性能优化策略

针对遥感影像特点的专项优化：

多尺度训练：在dataset.yaml中添加fl_gamma=0.5参数增强小目标检测
TTA（测试时增强）：推理时启用多尺度预测
模型剪枝：使用通道剪枝技术减小模型体积

处理超大影像的技巧：

采用滑动窗口检测时设置50%重叠度
使用NMS（非极大值抑制）合并重复检测
对边缘区域采用镜像填充避免信息丢失

# 大影像滑动窗口处理示例 def process_large_image(image_path, model, window_size=640, stride=320): img = Image.open(image_path) width, height = img.size results = [] for y in range(0, height, stride): for x in range(0, width, stride): # 计算实际窗口范围 x1 = max(0, x) y1 = max(0, y) x2 = min(width, x + window_size) y2 = min(height, y + window_size) # 提取窗口并预测 window = img.crop((x1, y1, x2, y2)) detections = model(window) # 转换坐标到原图坐标系 for det in detections.xyxy[0]: global_x1 = x1 + det[0] global_y1 = y1 + det[1] global_x2 = x1 + det[2] global_y2 = y1 + det[3] results.append([global_x1, global_y1, global_x2, global_y2, det[4], det[5]]) # 应用NMS过滤重复检测 return apply_nms(results, iou_threshold=0.5)

查看全文

http://www.jsqmd.com/news/955309/