2024_09_06_004a9bb8d5be2f114ca4g

2010 年的一个耕种星球 - 第 1 部分：全球协同耕地图

苗，文彬，梁志有，琳达·西，斯特芬·弗里茨，强毅于，延兵卫，
迪晨，彭阳，和冰雪
农业遥感重点实验室（AGRIRS），农业和农村部
农业资源与区域规划研究所
中国农业科学院北京，100081，中国
国际食品政策研究所（IFPRI），美国华盛顿特区 20005-3915
奥地利拉克森堡 2361 号应用系统分析国际研究所
农业环境与可持续发展研究所
中国农业科学院，北京，100081，中国
维多利亚大学工程与计算机科学学院
新西兰威灵顿 6140
通讯：吴文彬（wuwenbin@caas.cn）

收到日期：2020 年 1 月 20 日 - 讨论开始日期：2020 年 2 月 11 日

修订日期：2020 年 5 月 22 日 - 接受日期：2020 年 7 月 6 日 - 发表日期：2020 年 8 月 28 日

摘要

全球耕地分布和农业生产信息对世界农业监测和粮食安全至关重要。我们在 2010 年的一个耕种星球的两篇论文系列中提供了耕地范围和农业生产的数据集。在第一部分中，我们提出了一个新的自适应统计分配模型（SASAM）来开发全球耕地分布地图。SASAM 基于多个现有耕地地图的融合和耕地面积的多级统计，与训练样本无关。首先，耕地面积统计用于对输入的耕地地图进行排名，然后建立评分表以指示输入数据集之间的一致性。其次，统计数据被自适应地分配给具有更高一致性得分的像素，直到累积耕地面积接近统计数据。然后，将多级分配结果整合以获得耕地范围。我们应用 SASAM 制作了一个大约 2010 年的全球耕地协同地图，空间分辨率为 500 米。准确性评估显示，协同地图比输入数据集具有更高的准确性，并且与耕地统计数据更一致。协同耕地地图可通过开放数据存储库获得（https://doi.org/10.7910/DVN/ZWSFAA; Lu 等，2020）。这张新的耕地地图已被用作空间生产分配模型（SPAM）的重要输入，用于生成大约 2010 年的全球农业生产数据集，该数据集在两篇论文系列的第二部分中描述。

1 引言

农业土地满足全球对人类食品、饲料和生物燃料的需求，这些需求随着人口和消费增长的持续速度前所未有地增长（Gibbs 等，2010 年；Godfray 等，2010 年）。满足不断增长的人口需求和消费需求仍然是一个巨大挑战（Kastner 等，2012 年；Zhang 等，2016 年；Gao 和 Bryan，2017 年）。关于耕地的准确空间信息是农业监测和粮食安全的重要基础信息（Eitelberg 等，2015 年；Yu 等，2019 年）。卫星获取的土地覆盖数据集已被广泛用于此目的。例如，由饥荒预警系统网络资助的

美国国际开发署一直在利用耕地分布和其他遥感数据，提供及时可靠的早期预警和脆弱性信息，涉及新兴和不断发展的粮食安全问题（Brown 和 Brickley，2012）。然而，各种土地覆盖数据集之间存在重大分歧和高度不确定性（Fritz 等，2013；Tsendbazar 等，2015）。与其他自然植被类型（如树木覆盖）相比，耕地（耕地和管理牧场）的不确定性和不一致性特别高（Congalton 等，2014）。在使用现有耕地数据集时面临的挑战之一是缺乏关于耕地位置和面积范围的一致可靠数据。

农田信息中的不确定性和不一致性是普遍存在的，因为在应用目的、农田定义和分类方法上存在差异（Fritz 等，2013 年；Verburg 等，2011 年；Yang 等，2017 年）。全球范围内，四个全球土地覆盖数据集（即 IGBP DISCover、马里兰大学土地覆盖产品、MODIS 土地覆盖产品和全球土地覆盖 2000（GLC2000））的空间一致性约为 0（Herold 等，2008 年）。在区域尺度上，Pérez-Hoyos 等人（2017 年）比较了包括联合国粮农组织全球土地覆盖网络（FAO-GLCshare）、GLC2000、GlobCover、Globeland30 等在内的九种农田产品，发现非洲、美洲和亚洲的完全一致区域分别仅为 1、2 和 3。农田的不确定性通常高于其他土地覆盖类别，尤其是在过渡区和景观碎片化严重的地区。例如，非洲撒哈拉地带的分歧很明显，因为农作物更为分散，常与草地共存（Pérez-Hoyos 等，2017 年）。在中国，以高海拔和碎片化地貌为特征的西北和西南地区的不确定性和不一致性要高于地貌更均匀的北部和东北部地区（陆等，2016 年）。

卫星数据估算的耕地面积通常与统计数据不一致，这限制了它们在农业经济学和食品政策中的应用。首先，现有数据集通常侧重于土地覆盖而不是土地利用，因为遥感观测的直接性质（Kerr 和 Cihlar，2003；曾等，2018）。耕地作为土地覆盖和土地利用的综合体，不仅被定义为覆盖土地表面的作物，还受到人类为生产粮食而进行的活动的影响。然而，基于卫星的耕地地图可能无法检测土地利用的耕地特征（曾等，2018）。例如，根据 GlobeLand30 的估算，2000 年至 2010 年间欧洲的耕地面积增加了

（向等，2018）。然而，联合国粮食和农业组织（FAO）的官方统计数据显示，同一时期欧洲的耕地面积减少了。其中一个主要原因是农业土地的放弃，这种情况不容易被遥感捕捉。其次，对耕地的不一致定义导致卫星估算和官方统计数据之间存在差异。例如，GlobCover 2005/2009、气候变化倡议土地覆盖（CCI-LC）和 MODIS Collection 5（MODIS C5）包括混合耕地与其他土地覆盖类型的镶嵌类别。因此，这些产品通常会根据如何计算这些镶嵌类别而低估或高估耕地面积（Zeng 等，2018 年）。农业统计数据通常通过访谈和样本调查收集，然后通过与行政数据汇总计算（Gallego 等，2010 年）。这些统计数据提供了高度适用的土地利用信息，这些信息无法通过遥感收集，但通常缺乏空间细节，因为它们被聚合到行政单位的级别。

数据协同方法可以利用土地覆盖数据集和统计数据之间的互补性来解决上述问题。这些方法可以将所有可用的基于卫星的地图和统计数据整合到一个产品中，提高准确性。协同方法大致分为两种类型：协议评分方法和回归方法（Lu 等人，2017 年）。前者假设统计数据提供了农业用地的“真实”面积，并根据卫星数据集的协议将统计数据空间分解到像素级别。例如，Ramankutty 等人（2008 年）使用了这种方法，为大约 2000 年开发了全球耕地和牧场范围地图，空间分辨率为 1 公里。Fritz 等人

对输入数据集进行了排名，并根据其评估的准确性分配了不同的权重，以制作 2005 年国际应用系统分析研究所（IIASA）-国际食品政策研究所（IFPRI）耕地地图。回归方法，如逻辑回归和地理加权回归（GWR），建立了训练样本点和输入数据集之间的耕地百分比回归关系，然后预测没有样本的地区的耕地百分比（Brunsdon 等人，1998 年；Chen 等人，2019 年）。GWR 允许回归参数在空间上变化，并且与观测数据拟合更好（Chen 等人，2019 年）。GWR 已被用于利用来自 Geo-Wiki 的众包验证数据创建全球土地覆盖地图和森林地图（See 等人，2015 年；Schepaschenko 等人，2015 年）。然而，上述方法通常需要足够的原位样本进行训练。协议评分方法需要训练样本来评估输入数据集的质量，而回归模型需要训练样本来估计每个位置的模型参数。尽管众包平台可用于样本收集，例如 Geo-Wiki（http://www.geo-wiki.org，最后访问日期：2020 年 8 月 17 日），LACO-Wiki（https://laco-wiki.net，最后访问日期：2020 年 8 月 17 日）和 Collect Earth（http://www.openforis。org/tools/collect-earth。html，最后访问日期：2020 年 8 月 17 日），无法保证样本的质量和一致性

由于贡献者的领域知识各不相同（Bey 等，2016 年；Fritz 等，2009 年；See 等，2015 年）。

这项研究的目标是解决全球耕地映射训练样本的问题，提高与统计数据的一致性和耕地地图的准确性。我们提出了一种自适应统计分配模型（SASAM），通过融合多种统计数据和基于卫星的耕地数据集，生成全球协同耕地地图。该方法基于输入耕地数据集之间的一致性，并且独立于训练样本。耕地面积统计数据用于对输入耕地地图进行排名，并建立一个评分表以指示输入数据集的一致性。国家以及第一和第二级次国家水平的统计数据被分配给具有较高耕地评分的像素，然后将结果整合以获得耕地范围。使用这种方法，我们已经生成了一个大约 2010 年的全球耕地协同地图，空间分辨率为 500 米。本文的其余部分安排如下。我们在第 2 节介绍输入数据来源，并在第 3 节详细描述 SASAM。第 4 节介绍结果和分析，数据可访问性在第节中描述。 5，随后在第 6 节进行讨论和结论。

2 数据来源

本研究使用的数据来源包括全球和区域卫星遥感农田产品以及农田面积的多层统计数据。

2.1 卫星地图和数据预处理

在全球范围内，从 GlobeLand30、CCI-LC、GlobCover 2009、MODIS C5 和统一耕地图层中选择了大约 2010 年的五种耕地产品（表 1）。 GlobeLand30 是通过使用像素-对象-像素（POK）分类方法（Chen 等，2015）从 Landsat 图像和中国 HJ 图像生成的。 CCI-LC 和 GlobCover 2009 是由欧洲空间局（ESA）生成的，采用了无监督聚类和监督学习的类似分类策略（Bontemps 等，2017；Defourny 等，2017）。 MODIS C5 是通过使用决策树方法从 MODIS 时间序列数据生成的（Friedl 等，2010）。统一耕地图层是基于四个维度：及时性、图例、分辨率和置信度的最适产品的组合的混合地图（Waldner 等，2015）。

在区域尺度上，我们选择了欧洲和北美地区具有高空间分辨率和质量的公开产品（表 1）。CORINE 土地覆盖（CLC）2012 覆盖了 39 个欧洲国家，总面积超过 580 万

。CLC2012 是 CLC2006 的更新版本，使用 2011 年和 2012 年的高分辨率卫星图像的计算机辅助光学解译开发而成（Hościło 和 Tomaszewska，2015）。北美土地变化

监测系统与加拿大自然资源部、美国地质调查局以及三家墨西哥组织合作，为加拿大、美国和墨西哥制作了 2010 年北美 30 米土地覆盖数据集。每个国家都开发了自己的分类方法来识别土地覆盖类别，然后提供了一个输入层，以制作整个北美洲的土地覆盖地图。

此外，我们收集了两个国家的土地覆盖地图，即澳大利亚和中国，作为补充。澳大利亚 2010-2011 年土地利用数据集由澳大利亚农业和资源经济学局制作，该局隶属于澳大利亚政府农业和水资源部，农业土地利用数据基于澳大利亚统计局 2010-2011 年农业普查数据（Smart，2016）。中国国家土地利用/覆盖数据库（NLUD-C）2010 年根据大约 30 米空间分辨率的图像，利用视觉解译、野外调查和大量辅助信息，从 NLUD-C 2008 年进行了更新（Zhang 等，2014）。

这些基于卫星的地图的预处理是必不可少的，因为它们在坐标系统、空间分辨率和分类方案方面存在差异。首先，我们在卫星数据集中屏蔽了非农业区域。然后，选择了具有 WGS84 基准的地理纬度-经度坐标系统作为坐标转换的基础投影。由于区域和全球产品的空间分辨率从 30 到 500 米不等，因此采用了标准的地理网格，分辨率为

（即约 500 米），用于聚合具有农田百分比的输入产品。

数据预处理的关键部分是耕地定义的协调。我们使用联合国粮食及农业组织（FAO）对耕地的定义为“可耕地和永久作物”。可耕地是指种植临时农作物的土地（多次种植的地区仅计算一次）、用于刈割或牧草的临时草地、市场和菜园的土地，以及暂时休耕的土地（不超过 5 年）。永久作物是指种植长期作物的土地，这些作物数年内无需重新种植（如可可和咖啡），种植花卉的树木和灌木的土地（如玫瑰和茉莉花），以及苗圃（除了用于森林树木的苗圃，应归类为“森林”）。由于轮作制度导致的荒地、永久草地和牧场在我们的研究中被排除在耕地之外。根据耕地定义，每个数据集的与耕地相关的类别被提取并按照其耕地定义给予百分比权重：纯耕地类别被分配更高的百分比权重，而镶嵌式耕地类别被分配较低的权重（Lu 等，2017）。通过这个过程，我们生成了从每个基于卫星的产品派生的 500 米分辨率的耕地百分比地图，使用相同的坐标系统。

表 1. 输入卫星产品。

规模

产品

时间

解析

生产商和来源（最后访问日期：2020 年 8 月 17 日）

全球

全球土地 30

2010

30 米

中国国家测绘地理信息局 http://www.globeland30.org

CCI-LC

2010

300 米

欧洲空间局 http://maps.elie.ucl.ac.be/CCI/viewer/download.php

GlobCover 2009

2009

300 米

欧洲空间局 http://due.esrin.esa.int/page_globcover.php

MODIS Collection 5

2010

500 米

波士顿大学 https://lpdaac.usgs.gov/products/mcd12q1v006/

统一耕地图层

2010

250 米

天主教鲁汶大学 https://figshare.com/articles/ucl_2014_v2_0_tif/2066742

区域化

CORINE 土地覆盖（39 个欧洲国家）

2012

100 米

欧洲空间局 https://land.copernicus.eu/pan-european

北美洲的土地覆盖（加拿大，美国，墨西哥）

2010

30 米

北美土地变化监测系统 https://www.mrlc.gov/data/north-american-land-change-monitoring-system

澳大利亚

澳大利亚的土地利用

2010

50 米

澳大利亚农业部门 http://www.agriculture.gov.au/abares/aclump

中国

国家土地利用/覆盖数据库

2010

30 米

中国科学院 http://www.resdc.cn/data.aspx?DATAID=99

2.2 农田面积统计

我们收集了大约 2010 年全国以及第一和第二级次的耕地面积统计数据。全国统计数据来自联合国粮食及农业组织的 FAOSTAT 土地利用数据库（http://www.fao.org/faostat/en/#data/RL，最后访问日期：2020 年 8 月 17 日），该数据库涵盖了世界上约 200 个国家和地区。这些统计数据在农业和食品领域的市场管理、生产预测和政策制定中被广泛应用。根据我们采用的耕地定义，从统计数据中选择了“可耕地和永久作物”项目。由于卫星产品主要来自 2009 年至 2011 年，因此计算了 2009 年至 2011 年的平均值，以提供更稳定的 2010 年耕地协同估计。全国级别的耕地面积统计数据如图 1a 所示，涵盖了世界上几乎所有国家。

尽管联合国粮食及农业组织提供了全国耕地面积的统计数据，但单一跨国机构并未提供次国家级的统计数据，而这些数据在全球范围内很少可得。然而，几十年来，国际粮食政策研究所及其合作伙伴已经在世界许多国家收集了关于耕地和各种作物的次国家级农业统计数据，特别关注非洲、拉丁美洲和亚洲的发展中国家。如果次国家单位存在耕地价值，则采用该价值，忽略单位内各种作物的收获面积。否则，耕地面积通过将单位内所有作物的收获面积相加，再除以各种作物的种植强度来计算。种植强度根据雨养或灌溉系统以及国家而异。强度数据来自各种来源，如季节性收获面积、专家判断和家庭调查（Yu 等，2020）。由于可能存在遗漏的区域或遗漏的作物，次国家级的耕地价值是该单位实际耕地的最低估计。

有两个层次的次国家统计数据。第一个次国家级别表示比国家行政区划更低的单位，例如中国或加拿大的省份，以及美国或印度的州。我们收集了大多数国家第一个次国家级别单位的统计数据，而非非洲的少数国家（图 1b）。第二个次国家级别表示更小的行政单位，例如中国的地级市，美国的县和法国的部门。我们获得了第二个次国家级别单位

的统计数据（图 1c）。

3 方法论

SASAM 的原则是自动将从统计数据中获取的耕地面积分配给具有更高耕地可能性的像素。耕地分布会自适应调整，直到累积耕地面积接近统计数据。该模型有三个主要步骤，即协议排名建立、自适应统计分配和多级分配结果整合。首先，利用国家统计数据评估准确性并为基于卫星的耕地输入地图设置权重。

(c)

可用统计数据
无法获取统计数据

图 1. 全国（a）、第一级次（b）和第二级次（c）的耕地面积统计。

然后根据输入地图的权重建立评分表，生成协议排名结果。国家和次国家统计数据根据它们的协议排名自适应地分配给像素。最后，整合分配的结果生成协同耕地图。

3.1 协议排名建立

通常，输入数据集之间的高度一致性表明耕地的可能性较高。输入数据集的评估准确性也影响协同信心。

（Fritz 等，2015 年；Lu 等，2017 年）。我们使用国家统计数据来评估基于卫星的数据集的准确性，然后根据输入数据集的准确性和一致性自适应地建立协议排名分数。

对于每个输入数据集，每个国家的耕地面积被估计为

,

其中

是由输入数据集估计的国家

的耕地面积，

是标记为耕地的像素，

是数据处理后像素

中耕地的百分比。因为我们使用地理纬度经度坐标

系统，像素区域

是通过等面积投影计算的（Lu 等，2017）。然后计算输入数据集

估计的耕地面积与统计数据之间的绝对差异

，以评估输入地图的准确性，如方程（2）所示：

,

其中

是来自 FAO 的国家

的耕地面积统计数据。较低的 Diff

值表示与官方统计数据更好地一致，输入地图排名更高。

使用反映输入数据集的协议和排名的表格建立协议排名分数。如果有五个输入数据集，则从最高到最低排名的数据集标记为

和 E（表 2）。从 0 到 5 的协议级别表示将像素识别为耕地的输入数据集数量。因为五个输入数据集有 32 种排列

，所以分数从 0 到 31。较高的分数值表示更高的耕地可能性。协议级别为 5 表示所有输入数据集都将像素识别为耕地，像素的最高分数为 31，而协议级别为 0 表示所有数据集将像素分类为非耕地，像素的最低分数为 0。对于其他协议级别，有各种排列。例如，当协议级别为 4 时，数据集有五种组合，分数值设置为 26 到 30。因为 A、B、C 和 D 排名较高，如果所有四个指示为耕地，则分数值设置为 30，高于其他组合。根据这些规则，我们使用五个输入数据集获得了完整评分表的数值（表 2）。同样，我们利用这种方法使用六个输入数据集获得了从 0 到 63 的评分表。然后，评分表用于将输入的耕地图层转换为一张协议排名地图。同时，使用 500 米的空间分辨率计算了输入数据集的平均耕地百分比。

3.2 自适应统计分配

自适应统计分配是将耕地面积统计数据自动分配给排名较高的像素，该过程会自适应调整，直到累积耕地面积接近统计数据。图 2 显示了以五个输入数据集为例的统计分配流程图。首先，选择得分最高的 31 个像素，并通过方程（3）计算它们的总面积：

,

其中

和

是像素区域和像素

标记为得分 31 的平均百分比。然后将该区域与统计数据进行比较。如果该区域远小于统计数据，则选择具有次高协议排名的耕地像素，例如 30，并计算总面积。

表 2. 五个输入数据集的排名评分表。

输入数据集的协议级别

得分

然后按照方程（3）计算。具有 30 分及以上得分的累积耕地面积与统计数据进行比较。如果累积面积与统计数据非常接近，则选择标记为 31 和 30 分的像素作为耕地像素。否则，选择并添加得分较低的像素，直到累积面积达到统计数据。在图 2 中，当具有 29 分得分的累积面积最接近统计数据时，选择得分从 29 到 31 的像素作为耕地范围。我们获得耕地百分比和耕地像素的得分。得分的值表示输入耕地数据集的一致性，反映了耕地像素的置信水平。得分范围从 0 到 31，适用于五个输入数据集，从 0 到 63，适用于六个输入数据集。因此，使用最小-最大归一化将得分归一化到相同的比例。归一化结果是置信水平，值从

到

。

图 2. 用五个输入产品进行耕地面积统计分配的流程图。

分配结果包括得分值和包含所选耕地像素的平均百分比地图。使用上述方法，我们分配了国家以及第一和第二级次国家的统计数据到像素上，并获得了多级分配结果。

3.3 多级分配结果的整合

耕地面积统计的质量各不相同。在国家层面，联合国粮食及农业组织的统计系统包括一个质量框架和一个机制，以确保粮农组织的统计符合这一框架。因此，可以认为国家统计数据具有更高的可靠性。当官方统计数据不可用时，次国家统计数据是通过收获作物面积和种植强度因子来估算的。在一些次国家单位中，特别是在第二个次国家级别，只有一些作物的少量收获面积可用，因此估算的耕地面积可能远低于实际耕地面积（You 等，2014 年；Fritz 等，2015 年）。同时，一些次国家单位的耕地面积统计数据缺失。我们收集了第一级次国家单位的

和第二级次国家单位的

的统计数据（图 1）。因此，可以认为国家统计数据比次国家统计数据更可靠，第一级次国家统计数据比第二级次国家统计数据更可靠。整合原则是，全国范围内的总耕地面积应与统计数据一致，下级的耕地面积应等于或大于统计数据。

我们以阿根廷圣路易斯省为例来描述整合过程。第一和第二个次国家分配结果的耕地面积如图 3a 和

所示。该省由九个部门组成，在图 3b 中标记为 A-I。由于缺乏第二个次国家统计数据，部门

和 G 的第二个次国家分配结果的耕地面积为 0。每个部门的第一个次国家分配结果的耕地面积已计算（表 3）。第一和第二个次国家分配结果的整合使用以下规则：

对于具有统计数据的部门，当第二级次单位的耕地面积高于第一级次单位的面积时，将使用第二级次分配结果。否则，将使用第一级次分配结果。如表 3 所示，部门 I 的第二级次单位的总耕地面积（）高于第一级次单位的面积（）。第二级次单位的结果被选为部门 I 的分配结果。对于部门和 H，两个级别的结果相同，分配保持不变（图 3c，表 3）。
接下来，将没有统计数据的部门合并。计算第一和第二个次国家分配结果之间的耕地面积差异，并分配给合并的部门。例如，在图 3 中，第一次国家分配结果和第二次国家分配结果的总耕地面积分别为 4909.10 和，它们的差异分配给合并的 C、D、E、F 和 G 部门（图 3c，表 3）。
在第 3.2 节中，和 G 合并部门的自适应统计分配重新运行，耕地面积为。根据第 3.1 节建立的协议排名分数，将的耕地面积自动分配给具有更高排名分数的像素，直到累积耕地面积接近。然后，我们获得了合并区域的分配结果，如图 3d 所示。

根据上述整合规则，我们首先整合了第一和第二个次国家结果，以获得次国家耕地结果，然后将次国家和国家分配结果结合起来，创建最终的协同耕地地图。

3.4 全球耕地地图的验证及与 IIASA-IFPRI 方法的比较

全球耕地图的空间位置和耕地面积的准确性进行了评估。首先将百分比耕地图重新分类为耕地非耕地的二元图，其中大于零的耕地百分比被分配到耕地类别。通过基于训练样本的误差矩阵来评估空间准确性。这些样本源自清华大学在开发 FROM-GLC 土地覆盖产品时的工作（Gong 等，2013）。这些样本类型是由数百名学生、研究人员和专家手动识别的，他们使用谷歌地球图像在 2010 年左右的时间内。我们选择了介于

和

之间的样本，几乎包含了世界上所有的耕地。测试数据包括 5743 个耕地样本和 28076 个非耕地样本。计算了各国耕地图中的耕地面积，然后使用相关系数（

）和均方根误差（RMSE）与联合国粮农组织的统计数据进行比较，以评估一致性。

我们在中国将 SASAM 与 IIASA-IFPRI 方法（Fritz 等人，2015 年）进行了比较。与 SASAM 不同，IIASA-IFPRI 方法需要训练样本来评估建立加权评分表的输入数据集的准确性（Fritz 等人，2015 年）。来自中国的训练样本（1387 个耕地和 1430 个非耕地）被用来评估输入数据集的准确性。然后，计算并比较了 SASAM 和 IIASA-IFPRI 方法的结果的空间位置和耕地面积准确性。

4 结果和分析

4.1 全球协同耕地的结果

协议排名被用来生成卫星输入数据的分数和平均耕地百分比。分数的范围由输入数据集的数量确定。欧洲、美国、加拿大、墨西哥、澳大利亚、中国和南非的区域耕地地图可用，因此协议排名分数范围从 1 到 63。欧洲的协议排名分数地图显示值从 1 到 63，如图 4a 所示。在其他地区，例如非洲（图 4c），分数范围从 1 到 31，使用了五个全球输入数据集用于耕地协同。同时，通过取输入数据集的平均百分比来获得平均耕地百分比。欧洲和非洲的地图分别显示在图 4b 和 d 中。通常具有较高分数的区域通常具有较高的平均耕地百分比。

协议排名确定后，统计数据分配给得分较高的像素，然后获得了国家以及第一和第二个次国家统计数据分配结果。在欧洲，收集了所有国家统计数据，并在图 5a 中显示了国家协同结果。我们获得了 586 个行政单位中的 510 个单位的第一级次国家统计数据，以及 3313 个行政单位中的 951 个单位的第二级次国家统计数据。因此，国家级的耕地面积大于次国家级，第一级次国家级的耕地面积大于第二级次国家级（图 5a-c）。在非洲，国家协同结果显示在图 5d 中。在第一级次国家级别，796 个行政单位中有 618 个单位有统计数据。我们没有中非共和国、刚果、塞舌尔、利比亚、赤道几内亚、厄立特里亚、西撒哈拉和佛得角的第一级次国家统计数据。因此，在这些国家中，没有第一级次国家协同结果。在第二级次国家层面，只有

（5541 个中的 770 个）行政单位具有统计数据。大约有 37 个国家，包括尼日利亚、苏丹和纳米比亚，没有第二级次国家统计数据。因此，相应的地区没有分配结果（图 5f）。

国家以及第一和第二次国家分配结果是使用第 3.3 节中描述的规则进行整合的。首先，将第一和第二次国家分配结果合并，以获得国家分配结果，然后将结果与国家分配结果整合，生成全球范围的最终协同耕地图（图 6a）。协同结果的信心水平图是通过对协同耕地像素的一致性排名分数进行归一化来创建的（图 6b）。结果表明，印度、中国、美国、俄罗斯、哈萨克斯坦和乌克兰拥有大片耕地。拉丁美洲正在成为一个重要的粮食-

(a)

(b)

(c)

(d)

图 3. 阿根廷圣路易斯省第一和第二次次国家分配结果的整合：(a)第一次次国家分配结果，(b)第二次次国家分配结果，(c)没有统计数据的部门的组合，以及(d)没有统计数据的部门的分配结果。

表 3. 阿根廷圣路易斯省第一和第二次次国家分配结果及其协调的各部门耕地面积（值为粗体）。

部门

第一个次国家分配结果的耕地面积

第二个次国家分配结果的耕地面积

两个层面的协调

93.51

86.59

1.87

45.80

496.55

537.24

84.15

3271.93

291.46

692.09

自 1980 年以来，由于从完整和受干扰的森林中建立了新的农田，生产区域发生了变化（Gibbs 等，2010 年）。通常高置信水平在同质区域，而低置信水平在具有异质景观或在耕地范围边缘的区域（图 6b）。

4.2 准确性评估和分析

4.2.1 空间精度评估

五个全球输入数据集和协同耕地图在大陆和全球范围内进行了空间精度评估（表 4）。协同耕地映射的准确性为

，高于全球范围内的五个输入数据集。在北美洲、欧洲、大洋洲和亚洲，总体准确性分别为

和

，比五个输入数据集中的任何一个都要高。在南美洲，协同耕地的准确性（

）略低于 GlobeLand30（

）。此外，在非洲，协同耕地的准确性（

）略低于 GlobeLand30（89.9%）。在北美洲、欧洲、大洋洲和亚洲，区域耕地数据可用，而南美洲和非洲的区域数据集不可用。这是南美洲和非洲协同结果准确性略低于部分输入数据集的原因之一。

4.2.2 统计一致性

全球输入数据集的耕地面积和各国协同耕地图进行了计算，并与统计数据进行了相关性分析（图 7）。协同地图的相关系数为 0.99，高于任何输入数据集（图 7f）。高相关性是因为协同地图是通过统计数据和土地覆盖地图的融合而产生的。GlobeLand30 和 MODIS Collection 5 具有更高

(b)

图 4. 欧洲和非洲的协议排名得分地图和平均耕地百分比：(a)和(b)是欧洲的得分地图和耕地百分比；(c)和(d)是非洲的得分地图和耕地百分比。

(a)

(d)

(b)

(e)

(c)

(f)

耕地百分比

图 5. 欧洲和非洲的统计分配结果：(a)和(d)是国家分配结果；(b)和(e)是第一级次国家分配结果；(c)和(f)是第二级次国家分配结果。

(a)

(b)

图 6. 全球协同耕地的结果：(a) 耕地百分比地图，(b) 协同耕地的置信水平。

表 4. 输入数据集和大陆和全球尺度的协同耕地的总体准确性。

	CCI-LC	全球地表覆盖	全球土地 30	MODIS C5	统一耕地图层	协同图

北美洲	90.4	87.4	92.1	90.0	92.3	92.4
南美洲	78.8	78.9	90.1	87.5	89.7	89.4
欧洲	89.7	87.5	87.1	89.4	88.6	93.7
非洲	79.1	83.1	89.9	88.7	86.1	89.1
大洋洲	93.9	88.3	95.4	95.0	95.4	96.5
亚洲	82.6	77.5	86.0	86.7	84.9	88.3
全球	84.5	83.0	89.3	88.8	88.1	90.8

相关系数（0.97）比其他输入数据集更高，而 CCI-LC 和 GlobCover 的相关系数较低（分别为 0.88 和 0.89）。此外，RMSE 被用作另一个指标来评估耕地地图与统计数据之间的离散程度。尽管协同耕地图、GlobeLand30 和 MODIS C5 的相关系数相似，但协同耕地图的 RMSE 远低于 GlobeLand30 和 MODIS C5，分别为

和

。因此，协同地图与国家统计数据的一致性最佳。

协同地图的耕地面积在一些国家高于统计数据（图 7）。 SASAM 是一个过程，从高分到低分累积耕地面积，直到累积面积达到统计数据。由于累积面积不连续，协同地图估计的耕地面积可能与所需统计数据并不非常接近。有时差异可能很大。

图 7. 产品和统计数据估计的耕地面积之间的一致性分析：(a) GlobeLand30，(b) 统一耕地图层，(c) CCI-LC，(d) GlobCover 2009，(e) MODIS C5，和(f) 协同地图。

例如，在日本的情况下，耕地面积的国家统计数据为

。得分高于 27 和高于 26 的累积耕地面积分别为 40618.13 和

。如果我们考虑所有得分高于 26 的像素点，通过协同地图（

）估计的国家面积几乎比国家统计数据多

。同时，在一些国家，如尼日尔、沙特阿拉伯和多米尼加，协同耕地面积略低于统计数据。这是因为从输入数据集估计的耕地面积都低于统计数据。例如，在尼日尔，国家统计的耕地面积为

，而由 GlobeLand30、统一耕地图层、CCI-LC、GlobCover 和 MODIS C5（即

、21925 和

）估计的耕地面积都小于统计数据。协同地图基于这些输入耕地图层，因此协同耕地面积

不可避免地小于统计数据。

4.2.3 与 IIASA-IFPRI 方法的比较

对于 IIASA-IFPRI 方法，根据在中国使用的训练样本，从高到低的排名依次为 MODIS C5、统一耕地图层、CCI-LC、NLUC-C、GlobeLand30 和 GlobCover。根据它们的准确性对输入数据集进行排名，然后将国家统计数据分配给得分较高的像素（Fritz 等人，2015 年）。从最高得分 63 开始，累积面积计算直到得分 59，其中耕地面积最接近

的统计数据（表 5a）。

同时，使用相同的输入数据集和统计数据，采用 SASAM 进行协同耕地估算。估计了输入数据集的耕地面积，并与排名统计进行比较，从高到低的排名为 MODIS C5，NLUC-C，GlobeLand30，Unified Cropland Layer，CCI-LC 和 GlobCover。从得分 63 到得分 58 的累积面积被计算出来，这与统计数据最接近（表 5b）。

IIASA-IFPRI 和 SASAM 方法得出的结果之间存在一些细微差异。验证样本，即 1403 个耕地和 1430 个非耕地，被用来比较结果的准确性。IIASA-IFPRI 结果的总体准确性为

，而 SASAM 的准确性为

。IIASA-IFPRI 方法和 SASAM 估算的耕地面积分别为

和

，两者均与

的国家统计数据一致。表 5a 和 b 中的比较显示，所选的输入数据集组合相似，只是 SASAM 有一个得分为 58 的额外组合。SASAM 在没有训练样本的情况下表现出色，这是一种利用数据集之间的协同作用以成本效益的方式绘制耕地地图。

5 数据可用性

全球耕地地图和置信水平地图是开放获取的，可在https://doi.org/10.7910/DVN/ZWSFAA（Lu 等，2020 年）获取。耕地面积的分省统计数据可在https://doi.org/10.7910/DVN/PRFF8V（In-

表 5. 从高分值到低分值累积面积的计算：(a) IIASA-IFPRI 方法，(b) SASAM。

IIASA-IFPRI 方法

(b) SASAM

分数值

累积面积

全球土地 30

统一耕地

全球地表覆盖

CCI-LC

MODIS C5

NLUC-C

国际食品政策研究所, 2019). 用于协同耕地映射的所有带注释的代码都在此网站共享: https: //sourceforge.net/projects/global-synergy-cropland-map/ (Lu, 2020).

6 讨论和结论

基于卫星产品估计的耕地面积通常与统计数据不一致，这阻碍了耕地图在一些研究中的应用，如粮食安全、农业可持续性和碳循环。在本研究中，开发了一种协同方法（SASAM）来制作 2010 年的新全球耕地图，空间分辨率为 500 米。我们的研究为全球范围的耕地制图做出了两方面贡献。首先，SASAM 解决了全球耕地制图需要大量训练样本的问题。其次，我们显著提高了 2010 年最终耕地图的准确性，与官方统计数据一致。

SASAM 不依赖于训练样本，这对于农田制图更具成本效益。传统的协同方法通常需要相对较多的训练样本来评估输入数据集的准确性。虽然众包工具，如 Geo-Wiki，提供了一种新的低成本收集样本的方式，但由于样本主要由志愿者收集，质量和不确定性问题不能被忽视。我们的方法使用官方统计数据作为参考，评估输入数据集的准确性。准确性较高的数据集通常与统计数据更一致（Lu 等，2016 年，2017 年）。

例如，GlobeLand30 和 MODIS C5 的准确性更高，它们的一致性也比其他输入数据集更好。相比之下，GlobCover 的整体准确性和一致性较低（表 4 和图 7）。因此，统计数据可以取代训练样本来评估输入数据集。与 IIASA-IFPRI 方法在中国的比较证实，没有训练样本，SASAM 在耕地协同方面表现良好。

协同耕地图的准确性及其与统计数据的一致性高于输入数据集。在全球范围内，协同耕地映射的准确性高于五个全球输入数据集。在区域范围内，具有区域输入数据集的大洲，如北美洲、欧洲、大洋洲和亚洲，具有最高的整体准确性。对于没有区域数据集的大洲，如南美洲和非洲，协同耕地的准确性略低于 GlobeLand30。因此，区域数据集对提高协同地图的准确性至关重要。更高的相关系数和较低的 RMSE 表明，协同地图与统计数据的一致性优于输入数据集。SASAM 是一个过程，它选择具有高耕地可能性的像素，直到累积面积达到统计数据。协同地图结合了土地覆盖产品和统计数据的优势，考虑了耕地的土地利用和土地覆盖特征。

协同地图估计的耕地面积与统计数据接近但并非完全相等。评分表是离散的，其值范围从 0 到

，其中 n 是输入数据集的数量。协议排名分数为五个输入数据集的 0 到 31，以及 0 到 63。

六个输入数据集。耕地面积累计从高到低的分数计算，直到接近统计数据。最终累计面积略高于统计面积，以进一步支持 2010 年《耕地星球》两篇论文系列的第二部分中描述的空间生产分配模型（SPAM）。分配规则可以调整以适应不同的耕地制图应用。如果协同效果需要严格与统计数据一致，可以选择最接近的累计面积，可能低于统计数据。我们使用了 SASAM 的国家以及第一和第二级次国家统计数据。次国家统计数据至关重要，特别是对于印度、中国和美国等大国家，因为次国家统计数据不仅考虑耕地分布的空间异质性，还减少了来自国家统计数据的分配误差。

尽管我们在这项研究中展示了从多个来源提取耕地的效率，但我们也意识到这种方法存在不确定性。首先，农业景观是影响耕地协同图输入数据集一致性的重要因素。在均质区域，输入数据集之间的高度一致性占主导地位，因此选择的累积区域具有高一致性排名分数，如印度、美国、阿根廷和巴西。在异质区域，输入数据集之间的一致性较低，因此协同结果存在更多的不确定性。其次，耕地定义的差异也会影响输入数据集之间的一致性。对于 CCI-LC 和 GlobCover，一些山区的混合类耕地和森林是常见的。例如，在印度尼西亚、马来西亚和菲律宾，CCI-LC 和 GlobCover 将永久作物（咖啡、可可和橡胶）归类为耕地，而 GlobeLand30 将其归类为森林。此外，由于牧场与耕地具有相似的特征，GlobeLand30 通常将牧场归类为耕地，采用纹理和光谱特征进行分类。因此，耕牧区的耕地协同图存在不确定性。第三，全球范围内的次国家统计数据来自多个来源，由于各国数据处理和质量标准的差异，不确定性很高。在欧洲、美国、加拿大、中国和其他地区，次国家级别的耕地面积官方普查数据是可获得和可靠的。虽然耕地面积是所有作物收获面积和种植强度之间的比率，在非洲、拉丁美洲和亚洲的一些发展中国家，由于可能缺少作物收获面积，这些地区的耕地面积统计数据不太可靠。

我们将收集更可靠的输入数据，并探索未来整合协同方法和机器学习，以解决上述不确定性，并进一步提高耕地数据集的质量。输入数据集的数量和质量是协同方法的基础。我们将收集更多现有高空间分辨率的耕地地图，以完善协议排名分数。SASAM 将从高到低分数累积耕地面积，直到累积面积达到统计数据。随着更多输入的耕地数据集，累积耕地面积将更接近统计数据。同时，我们将收集更多次国家级耕地面积统计数据。如果全球范围内所有次国家统计数据都可用，就不需要整合多级分配结果，这将极大简化协同过程。为了改进方法，我们将根据输入数据的一致性和地理景观探索协同方法和机器学习的整合。协同方法在那些地理景观高度均匀的地区进行耕地绘图是经济高效的。通常具有异质景观的地区通常具有较低的一致性和较高的不确定性。因此，我们将利用深度学习基于使用高空间分辨率图像和来自现有农田地图一致性的训练样本进行农田分类。

我们应用 SASAM 制作了 2010 年全球作物种植地图，空间分辨率为 500 米。协同地图具有比原始数据集更高的准确性和更好的统计一致性，并结合了土地覆盖产品和统计数据集的优势。因此，该地图可以更好地支持相关研究，如水文模拟、土地利用评估和农业监测。特别是，当前的协同作物种植数据集支持 SPAM2010 的开发，这是 2010 年最新的全球格网农业生产地图，该地图在两篇论文系列的第二部分中介绍（Yu 等人，2020）。尽管一些更新年份的产品已经可用，例如 2015 年的 CCI-LC，但输入数据集的数量仍然不足以支持 SASAM 制作更新的作物种植地图。随着新的个体作物种植地图的发展，我们将在未来更新协同作物种植地图，并进一步提高协同映射的准确性，特别是在具有异质景观的地区。

作者贡献。ML、LY、LS 和 SF 设计了实验。ML、WW、QY 和 PY 进行了农田地图的开发。ML 开发了模型代码。YW 和 DC 进行了验证工作。LY、WW、LS 和 BX 审查和编辑了写作。ML 准备了手稿，并与所有合著者共同撰写了最终论文。

竞争利益。作者声明他们没有利益冲突。

致谢。此活动是由国际水管理研究所（IWMI）领导的 CGIAR 水、土地和生态系统研究计划的一部分，以及由国际食品政策研究所（IFPRI）领导的 CGIAR 政策、制度和市场研究计划的一部分。我们感谢-