乡村的毛细血管:Nature Trace Farmscapes 2020 Vectorised 数据集
乡村的毛细血管:Nature Trace Farmscapes 2020 Vectorised 数据集深度解读
引言
Nature Trace Farmscapes 2020 Vectorised数据集的问世,彻底改变了这一局面。它以25厘米的超高分辨率,精准识别英格兰农业景观中的树篱(hedgerows)、林地(woodland)和石墙(stone walls)三类关键半自然特征,并将其转化为矢量多边形,为生态学家、保护规划者和政策制定者提供了一把前所未有的“放大镜”。本文将全面解读这一数据集的背景、技术方法、核心价值及其广泛的应用前景。
一、数据集背景:为何要绘制乡村的“毛细血管”?
1.1 被忽视的乡村景观特征
农业景观占据了地球陆地面积的近40%。在这些由农田主导的基质中,树篱、林带和石墙是至关重要的半自然元素。它们的功能远超视觉美感:
- 生物多样性廊道:树篱和林带为鸟类、昆虫和小型哺乳动物提供栖息地、食物来源和迁徙通道,是破碎化农业景观中的“生态踏脚石”
- 碳汇功能:树篱和林地是农业景观中重要的碳储存库
- 水土保持:树篱和石墙能够减少土壤侵蚀、拦截养分流失
- 微气候调节:为农作物提供遮荫和防风保护
然而,这些关键特征在大尺度遥感监测中长期被忽视。原因很简单:它们太细了。一条典型的树篱宽度仅为2-5米,石墙更窄——而大多数免费开放的卫星数据(如Sentinel-2的10米、Landsat的30米)根本无法分辨这些细线状的特征。
1.2 填补空白的Farmscapes项目
为了解决这一问题,Google DeepMind、Google Research与牛津大学利弗休姆自然恢复中心(Leverhulme Centre for Nature Recovery)联合启动了Farmscapes项目。项目的目标是:利用深度学习和高分辨率航空影像,绘制英格兰农业景观中每一棵树篱、每一片林地和每一道石墙。
2025年6月,研究团队在arXiv上发表了方法论论文《Mapping Farmed Landscapes from Remote Sensing》。论文指出,这是首个覆盖英格兰大部分地区、高分辨率(25厘米)的乡村景观特征地图。2026年6月2日,该数据集的矢量化版本正式上线Google Earth Engine。
1.3 栅格版与矢量版的区别
Farmscapes 2020 数据集实际上包含两个版本:
- 栅格版(Raster):提供树篱、林地和石墙的概率地图,每个像素(25厘米)输出0-250的缩放概率值。用户可以根据研究需求自定义阈值,生成二值化的特征图。
- 矢量版(Vectorised):栅格数据集的矢量化版本,将概率地图转化为多边形几何图形,直接提供树篱、林地和石墙的空间轮廓。
矢量化的价值在于:多边形几何图形可以直接用于空间分析、面积计算、网络分析和地理信息系统(GIS)中的叠加分析,极大降低了生态学家和规划者的使用门槛。
二、技术方法:视觉Transformer + 94.2万人工标注切片
2.1 数据源:高分辨率航空影像
Farmscapes 2020 的数据源是2018年至2020年间拍摄的高分辨率航空影像(航拍图像镶嵌图)。这些影像的分辨率高达25厘米——这意味着每个像素对应地面25厘米×25厘米的区域。在这一分辨率下,每一棵树篱的轮廓、每一道石墙的走向都清晰可辨。
2.2 训练数据:94.2万个人工标注切片
模型的训练依赖于一个包含942个手动标注图块(tiles)的新型数据集。每一个图块都经过了生态学专家的精细标注,准确标出了树篱、林地和石墙的边界。
需要特别注意的是,这里的“942”是指图块数量,而非单个标注样本——每个图块包含数以万计的像素级标注。研究团队累计标注了94.2万个人工标签。这一庞大的训练数据集,为模型的精准识别奠定了坚实基础。
2.3 模型架构:视觉Transformer(ViT)
Farmscapes 采用了视觉Transformer(Vision Transformer, ViT)模型架构。与传统的卷积神经网络(CNN)不同,ViT将图像分割为一系列的“图块”(patches),并通过自注意力机制(self-attention)捕捉全局上下文信息。
这一架构的优势在于:
- 长距离依赖建模:树篱是线性的、延伸数百米的特征,ViT能够更好地捕捉其连续性和走向
- 上下文感知:模型能够“理解”一条线性结构是树篱还是道路、是石墙还是田埂,基于其周围的景观上下文
- 高精度分割:论文报告了林地F1-score达96%、农田达95%、树篱达72%的优异性能
三、数据规格与访问
3.1 基本规格
| 属性 | 内容 |
|---|---|
| 数据集ID | projects/nature-trace/assets/farmscapes/england_v1_0_vectorised |
| 数据类型 | 矢量(多边形几何图形) |
| 空间分辨率 | 25厘米(源数据) |
| 时间范围 | 2018-2020年(源影像拍摄期间) |
| 地理覆盖 | 英格兰大部分地区 |
| 数据提供方 | Nature Trace(Google DeepMind + Google Research) |
| 合作机构 | 牛津大学利弗休姆自然恢复中心 |
3.2 三类特征
矢量数据集包含三类半自然特征的多边形:
| 特征类别 | 说明 |
|---|---|
| 树篱(Hedgerows) | 农业景观中的线性灌木和树木带,是生物多样性的关键廊道 |
| 林地(Woodland) | 包括小片林地、林带和孤立的树群 |
| 石墙(Stone Walls) | 传统干石墙,是英格兰乡村景观的标志性元素,也为爬行动物和昆虫提供栖息地 |
3.3 Earth Engine 访问
在Google Earth Engine中,通过以下代码即可加载矢量数据集:
varvectorised=ee.FeatureCollection('projects/nature-trace/assets/farmscapes/england_v1_0_vectorised');栅格版(概率地图)的加载方式为:
varfarmscapes=ee.ImageCollection('projects/nature-trace/assets/farmscapes/england_v1_0').mosaic();全部代码
varfc=ee.FeatureCollection('projects/nature-trace/assets/farmscapes/england_v1_0_vectorised');varstyles={'hedgerow':{color:'FF00FF',fillColor:'40FF00FF'},'copse':{color:'00FF7F',fillColor:'4000FF7F'},'linear_woodland':{color:'2E8B57',fillColor:'402E8B57'},'stone wall':{color:'D3D3D3',fillColor:'40D3D3D3'},'woodland':{color:'005e5e',fillColor:'40005e5e'},};varstyleDict=ee.Dictionary(styles);varstyledFc=fc.map(function(f){varfeatureStyle=ee.Dictionary(styleDict.get(f.get('feature_name')));returnf.set('style',featureStyle);});varstyledImage=styledFc.style({styleProperty:'style',width:2});Map.addLayer(styledImage,{},'Farmscapes Vectors');varlegend=ui.Panel({style:{position:'top-left',padding:'8px 15px',backgroundColor:'rgba(255, 255, 255, 0.9)',border:'1px solid black'}});legend.add(ui.Label({value:'Farmscapes Vectors',style:{fontWeight:'bold',fontSize:'16px',margin:'0 0 4px 0',padding:'0'}}));varpalette=[{color:'FF00FF',name:'Hedgerow'},{color:'00FF7F',name:'Copse'},{color:'2E8B57',name:'Linear Woodland'},{color:'D3D3D3',name:'Stone Wall'},{color:'005e5e',name:'Woodland'},];palette.forEach(function(item){varcolorBox=ui.Label({style:{backgroundColor:'#'+item.color,padding:'8px',margin:'0 0 4px 0'}});vardesc=ui.Label({value:item.name,style:{margin:'0 0 4px 6px'}});legend.add(ui.Panel({widgets:[colorBox,desc],layout:ui.Panel.Layout.Flow('horizontal')}));});Map.add(legend);varlon=-1.43;varlat=52.973;Map.setCenter(lon,lat,15);3.4 使用条款
数据集采用CC-BY 4.0许可证,用户需注明:“此数据集由 Google 制作”。
引用格式为:
Conserva, M., Wilson, A., Stanton, C., Batchu, V., & Gulshan, V. (2025). Mapping Farmed Landscapes from Remote Sensing.arXiv preprint arXiv:2506.13993.
四、应用前景
4.1 生物多样性监测与保护
树篱和林地是农业景观中生物多样性的“避难所”。Farmscapes数据集使得保护从业者能够:
- 量化树篱网络:精确计算英格兰每一片区域树篱的总长度、密度和连通性
- 识别破碎化热点:找出树篱网络断裂严重的区域,为生态廊道修复提供靶点
- 评估保护成效:对比不同保护措施下树篱和林地的变化趋势
4.2 生态连通性分析
生态连通性是“昆明-蒙特利尔全球生物多样性框架”(GBF)的核心议题之一。Farmscapes的矢量多边形为连通性分析提供了理想的数据基础:
- 构建生态网络:将树篱和林地视为“节点”和“廊道”,构建农业景观中的生态网络模型
- 最小成本路径分析:识别野生动物在农田基质中移动的最佳路径
- 景观阻力建模:评估不同土地覆盖类型对物种迁移的阻碍程度
4.3 自然恢复与再野化
英国政府承诺到2030年保护30%的陆地和海洋(“30 by 30”目标)。Farmscapes数据集为这一目标的实现提供了精准的空间指引:
- 识别恢复优先区:找出树篱稀疏、生态连通性差的区域,作为树篱恢复和扩建的优先区域
- 监测恢复进展:以2020年为基线,追踪后续年份树篱和林地的变化
- 评估自然恢复潜力:结合土壤、地形等数据,评估不同区域的自然恢复潜力
4.4 农业可持续发展与政策合规
- 农业环境计划评估:英国的环境土地管理(ELM)计划鼓励农民保护和恢复树篱。Farmscapes提供了独立的、可验证的基线数据
- 碳核算:树篱和林地的碳汇功能日益受到重视,精准的面积和长度测量是碳核算的基础
- 供应链监管:虽然主要针对英格兰,但方法论可推广至其他地区,为农业供应链的可持续性评估提供工具
4.5 欧洲范围的扩展
研究团队已经生成了欧洲范围的初步版本。虽然该版本尚未经过同等严格的定量验证,应视为实验性数据,但它预示着Farmscapes的方法论有望在整个欧洲大陆推广。研究人员可通过提交表单申请访问。
五、局限性与注意事项
在使用Farmscapes 2020 Vectorised数据集时,有几个重要的局限性需要留意:
1. 地理覆盖范围的局限
数据集覆盖英格兰大部分地区,但不覆盖整个英国(不包括苏格兰、威尔士和北爱尔兰)。此外,模型在密集城市环境和山区的性能有所下降,因为训练数据主要侧重于乡村景观。
2. 时间准确性的局限
源航空影像的拍摄时间介于2018年至2020年之间。因此,数据集反映的是这一时间窗口内的景观格局,未考虑此后发生的变化——包括树篱的移除、新植树篱的种植、林地砍伐或自然演替等。
3. 类别不平衡问题
与林地和树篱相比,石墙类别的准确率较低,这是由于训练数据中石墙样本严重不足所致。石墙在英格兰乡村中分布不均,某些地区的石墙密集,而在其他地区则较为稀少,导致模型在石墙识别上存在一定的偏差。
4. 概率阈值的选择
栅格版输出的是概率值(缩放至0-250),而非二值化的分类结果。用户需要根据具体研究目的选择合适的概率阈值来生成二值特征图。阈值选择过低会导致大量误报(假阳性),阈值选择过高则会遗漏真实特征(假阴性)。
5. 矢量化的精度损失
矢量版是对栅格概率图的后处理矢量化结果。在矢量化过程中,可能会丢失部分细节——尤其是对于宽度极窄的石墙和树篱,多边形边界可能存在一定的简化。
六、与前三篇数据集的协同
将Farmscapes与之前介绍的数据集结合使用,可以构建从全球到局地、从宏观到微观的多尺度监测体系:
| 维度 | ForTy(森林类型) | VNP22Q2(地表物候) | gHM(人类改造) | Farmscapes(乡村特征) |
|---|---|---|---|---|
| 空间分辨率 | 10米 | 500米 | 90米 | 25厘米 |
| 空间覆盖 | 全球 | 全球 | 全球 | 英格兰 |
| 核心对象 | 森林斑块 | 植被绿度 | 人类压力 | 树篱/林地/石墙 |
| 独特价值 | 区分森林类型 | 监测季节节律 | 量化改造程度 | 识别细微线性特征 |
Farmscapes填补了前三者无法触及的尺度空白。ForTy可以看到一片森林,但看不到森林边缘的那一排树篱;gHM可以看到一个区域的人类改造程度,但看不到农田之间那道石墙的生态价值。Farmscapes是放大镜,让那些在大尺度数据中“隐形”的乡村毛细血管得以显现。
这三者的结合可以催生一系列创新的研究问题:
- 树篱网络与森林类型的关联:原始森林周边的树篱网络是否比人工林周边更密集、更连续?
- 人类改造对树篱的影响:在高人类改造区域,树篱的密度和连通性是否显著降低?
- 物候与树篱健康:树篱的春季返青日期是否与周边林地的物候同步?石墙的微气候效应是否影响邻近树篱的物候?
七、结语
从ForTy的全球森林“身份证”到VNP22Q2的植被“脉搏”,从gHM的人类“足迹”到Farmscapes的乡村“毛细血管”——五篇文章、五个数据集,共同勾勒出一幅从全球到局地、从宏观到微观、从森林到农田的完整生态系统监测图景。
Farmscapes 2020 Vectorised 数据集的独特价值,在于它让那些长期被忽视的乡村景观特征第一次登上了大雅之堂。25厘米的分辨率让每一棵树篱、每一片林地、每一道石墙都拥有了自己的“数字孪生”;矢量化的多边形让生态学家和规划者能够以前所未有的精度进行空间分析和保护规划。
在生物多样性危机日益严峻、自然恢复成为全球共识的今天,Farmscapes为我们提供了一把精准的“手术刀”——它让我们能够看清农业景观中那些细微却至关重要的生态要素,从而做出更明智的保护决策。正如论文作者所言,这项工作“为生态学家和政策制定者提供了一个强大的、开放获取的工具”,能够“支持栖息地恢复的数据驱动规划,支持欧盟生物多样性战略等倡议的监测”。
当我们可以精确到每一米树篱、每一道石墙时,自然恢复便不再是空洞的口号,而是可以量化、可以追踪、可以实现的科学目标。
本文基于Google Earth Engine数据集目录、arXiv预印本及相关学术资料撰写。数据集详情请访问:https://developers.google.com/earth-engine/datasets/catalog/projects_nature-trace_assets_farmscapes_england_v1_0_vectorised
