当前位置：首页 > news >正文

别再手动画样本点了！用GEE+随机森林，5步搞定北京2023年土地利用分类

news 2026/6/24 7:27:11

5步云端自动化：基于GEE与随机森林的北京土地利用高效分类指南

当遥感初学者面对土地利用分类任务时，最头疼的莫过于在传统软件中手动勾绘数百个样本点。我曾见过一位研究生在ArcGIS前坐了整整三天，只为标注足够数量的训练样本——这种低效方式在2023年已不再必要。本文将展示如何利用Google Earth Engine（GEE）的云端算力和随机森林算法，仅用5个标准化步骤完成从数据准备到分类导出的全流程，特别适合课程作业或小范围研究需求。

1. 云端数据准备：告别本地存储与预处理

传统遥感分析的第一步往往是下载数十GB的影像数据，而GEE的革命性在于直接调用云端数据仓库。对于北京2023年的土地利用分类，Landsat 9是最佳选择——它的30米分辨率足够识别城市、植被和水体等主要地类。

// 定义研究区与时间窗口 var roi = ee.FeatureCollection("users/cduthes1991/boundry/China_province_2019") .filter(ee.Filter.eq('provinces','beijing')); var L9 = ee.ImageCollection('LANDSAT/LC09/C02/T1_L2') .filterDate('2023-03-01', '2023-10-01') // 避开冬季积雪干扰 .filterBounds(roi);

关键预处理步骤：

辐射校正：将DN值转换为地表反射率
去云处理：利用QA波段自动过滤云层
中值合成：减少瞬时噪声影响

提示：GEE的median()合成方法比均值更适合城市区域，能有效消除临时施工场地等异常值

2. 智能特征工程：超越RGB的多维指标构建

仅用原始波段进行分类会遗漏大量信息。通过计算植被、水体、建筑等指数，可显著提升分类精度。以下是经过验证的四核心指数组合：

指数名称	公式	识别目标	最佳阈值
NDVI	(B5-B4)/(B5+B4)	植被覆盖	>0.3
BSI	(B7+B3)-(B4+B1)/(B7+B3)+(B4-B1)	裸土/建筑	>0.5
LSWI	(B4-B7)/(B4+B7)	水体	>0.2
MNDWI	(B1-B7)/(B1+B7)	水体（抗干扰）	>0

function addIndices(image) { var ndvi = image.normalizedDifference(['SR_B5','SR_B4']).rename('ndvi'); var bsi = image.expression(...); // 完整表达式见上文 return image.addBands(ndvi).addBands(bsi); }

3. 自动化样本生成：革命性的半监督采样策略

传统方法需要手动标注每个样本点，而我们可以利用已有土地利用数据+空间规则批量生成初始样本：

水体：基于全球水体数据集JRC/GSW1_3/YearlyHistory筛选永久水体
建筑：夜间灯光数据VIIRS/DNB/MONTHLY_V1/VCMSLCFG > 5nW/cm²/sr
植被：NDVI > 0.3且持续三个季度

var autoWater = JRC.filter(ee.Filter.eq('water',1)).sample(100); var autoUrban = VIIRS.filter(ee.Filter.gt('avg_rad',5)).sample(100);

注意：自动样本需人工抽查验证，可通过GEE的交互式地图添加修正样本

4. 随机森林调参与训练：参数优化实战

GEE提供的smileRandomForest包含多个关键参数：

var classifier = ee.Classifier.smileRandomForest({ numberOfTrees: 300, // 树的数量 variablesPerSplit: 3, // 每节点考虑的特征数 minLeafPopulation: 1, // 叶节点最小样本数 bagFraction: 0.7 // 样本采样比例 }).train({ features: samples, classProperty: 'landcover', inputProperties: ['SR_B4','SR_B5','ndvi','bsi'] // 精选特征子集 });

参数优化建议：

树数量：100-500之间，超过后收益递减
variablesPerSplit设为特征数的平方根
使用bagFraction防止过拟合

5. 精度验证与一键导出：闭环工作流

完整的分类流程必须包含精度评估。GEE提供完整的混淆矩阵计算：

var validation = classified.sampleRegions({ collection: groundTruth, properties: ['class'], scale: 30 }); print('用户精度', validation.errorMatrix('class','classification').consumersAccuracy());

导出结果时，建议选择GeoTIFF格式并设置合适分辨率：

Export.image.toDrive({ image: classified, description: 'Beijing_LULC_2023', region: roi, scale: 30, // 保持原始分辨率 fileFormat: 'GeoTIFF', maxPixels: 1e13 });