通过多标准分析整合多个土地覆盖图,以改善非洲的农业监测
A. Pérez-Hoyos*, A. Udías, F. Rembold 欧洲委员会,联合研究中心(JRC),意大利瓦雷泽省伊斯普拉,E. Fermi 街 2749 号,邮政编码 21027
文章信息
关键词:
多标准分析 数据融合 土地覆盖/土地利用 农业口罩 农业监测
摘要
摘要 监测农业土地覆盖对全球早期预警系统(如 ASAP(农业生产异常热点))具有重要意义,因为它是检测食品安全评估中生产缺口的基础。鉴于现有土地覆盖数据集之间存在显著的不一致性,需要获得更准确的非洲农业区域的空间分布和范围表示。在本研究中,我们探索了一种融合方法,结合了各个数据集的优势,并最小化其局限性。具体而言,开发了一种半自动方法,依赖于多标准分析(MCA),并通过使用最佳评级数据集进行手动微调,以生成两个混合和静态的农业掩模——一个用于耕地,另一个用于草地。在全面选择土地覆盖图后,每个数据集根据五个标准在国家级别进行评估:及时性、空间分辨率、与粮农组织统计数据的比较、准确性评估和专家评估。 进行敏感性分析,基于对权重设置对结果土地覆盖影响的评估。所提出的方法能够改善非洲的农业特征。因此,提供了 2016 年名义年 250 米空间分辨率的两个静态掩模。
1. 引言
可靠且准确的农业范围和位置映射在一系列应用中发挥着重要作用,例如产量估算、农村发展和粮食安全评估(Fritz et al., 2019)。生成的地图为监测农业提供了基本输入,适用于早期预警系统,如最近推出的农业生产异常热点(ASAP) (https://mars.jrc.ec.europa . eu/asap/wexplorer/)(Rembold et al., 2019)。该系统需要土地覆盖/土地利用信息,适用于作物和畜牧生产(FAO, 2014)。监测非洲的草地也至关重要,因为草地大约覆盖了整个大陆的一半,并在粮食供应中发挥着基础性作用(Holechek et al., 2017)。
遥感显著促进了农业空间分布的高效监测;无论是作为单一类别(即农田)还是作为多类别土地覆盖分类的一部分(Pittman 等,2010)。中低分辨率的代表性土地覆盖产品包括全球土地覆盖 2000(GLC2000)(Mayaux 等,2006)、MODIS 土地覆盖(MODISLC)(Friedl 等,2010)、GlobCover(Bicheron 等,2008)、欧洲航天局气候变化倡议土地覆盖(CCILC)(Bontemps 等,2009)和国家制图组织全球土地覆盖(GLCNMO)(Tateishi 等,2014)。另外,已经开发了特定的农田地图,如全球雨养农田面积图(GMRCA)(Birandar 等,2009)、全球灌溉面积图(GIAM)(Thenkabail 等,2009)或 Ramankutty 等(2008)制作的农业地图。然而,它们在 10 公里的低空间分辨率或有限的准确性限制了其在国家和区域层面的操作应用(Vancutsem 等,2013)。此外,还生产了大量区域和国家产品,如 Africover(FAO,1996),在国家层面开发并具有更高的分辨率。 尽管如此,它受到更新频率低和地理覆盖范围有限的影响。
欧洲航天局最近的哨兵卫星图像,以及 Landsat 档案的免费获取(Wulder 等,2012),使得我们能够迈向一个更高分辨率(例如 20 米)土地覆盖制图的新纪元(Herold 等,2016)。此外,新云技术和处理工具的发展,如谷歌地球引擎,使得大数据的科学处理成为可能,并增强了在大面积区域内以更高空间分辨率工作的能力。基于这些技术的产品包括 30 米的 GlobeLand30(Chen 等,2015)、新发布的 CGLS(哥白尼全球土地服务)动态土地覆盖图(Buchhorn 等,2017)、ESA CCI S2 原型土地覆盖图(Lesiv 等,2017)和 GFSAD(全球粮食安全支持分析数据)项目(Xiong 等,2017)。
尽管存在多种产品,但先前的研究强调了它们之间的显著差异,特别是在考虑农业类别时(Fritz et al., 2013)。因此,它们的质量仍然不确定,特定应用的使用仍然存在疑问(Chen et al., 2015)。特别是在非洲,数据集之间存在广泛的不一致(Tsendbazar et al., 2015),在比较九个全球土地覆盖数据集时,仅发现
2.5
%
2.5
%
2.5% 2.5 \% 个耕地的完全一致(Pérez-Hoyos et al., 2017)。
混合或数据融合被定义为将现有土地覆盖数据集整合为一个单一数据集的过程,这是一种值得采用的方法,可以调和各个来源的优势并克服其主要局限性(Herold et al., 2016)。最初的尝试依赖于一种投票程序和一致性评分方法,因为其简单性和可操作性(Lu et al., 2017)。Jung et al.(2006)使用这种方法开发了一个用于碳循环建模的全球土地覆盖图,基于模糊一致性评分方法。同样,Pérez-Hoyos et al.(2012a,Pérez-Hoyos et al.,2012b)基于模糊一致性评分和每个类别为正确类别的概率,开发了一个欧洲的混合土地覆盖图,采用概率投票方案来调和图例。另一种广泛用于数据整合的方法依赖于专家知识,例如用于推导非洲耕地图的方法,采用专家知识对五个土地覆盖产品进行排名(Fritz et al., 2010)。该方法通过包括专家的定量验证进一步增强,以在全球范围内生成 1 公里混合百分比耕地产品(Fritz et al.)。,2015)。同样,Vancutsem 等(2013)通过专家基础的方法对不同数据集进行了协调,以推导出非洲的作物掩膜,而 Latham 等(2014)则应用了在联合国粮食及农业组织土地覆盖分类系统(LCCS)中定义的规则,以推导出 FAO 全球土地覆盖 - SHARE(GLCSHARE)数据集。
空间分析和统计方法正变得越来越受欢迎。例如,Schepaschenko 等(2015)使用地理加权回归(GWR)推导出全球混合森林图,而 See 等(2015a)则应用它来推导全球土地覆盖图。Lesiv 等(2016)将 GWR 与其他方法(最近邻、朴素贝叶斯和回归树)进行了比较,以推导混合森林覆盖图。最近的方法依赖于更复杂的算法,如回归克里金法(Tsendbazar 等,2016)、决策树(Yu 等,2013)、机器学习(Song 等,2017)、贝叶斯空间统计方法(Gengler 和 Bogaert,2018)以及邓普斯特-谢弗理论(Song 等,2014a,b)。最近,Waldner 等(2016)有效地使用多标准决策方法(MCDM)推导出农田图。
本研究是对一项初步研究(Pérez-Hoyos 等,2017)的扩展,在该研究中,我们对九个全球土地覆盖数据集进行了全面比较,发现它们之间存在很大分歧,特别是在非洲。这促使我们提出假设,尽管近年来由于方法的改进和新数据集的可用性,农业制图有所进展,但仍然需要确定农业区域的确切规模及其空间分布。因此,本研究的总体目标是在 2016 年为非洲绘制两个静态混合农业地图,空间分辨率为 250 米,一个用于耕地,另一个用于草地(以下简称为 I(集成)-耕地和 I-草地)。为了实现这一目标,提出并进一步测试了一种依赖于多标准分析的半自动混合方法。为了评估该方法的性能,将生成的农业掩模与现有的混合数据集进行比较,并根据独立验证样本评估其准确性。
2. 数据集
对最常用的土地覆盖数据集进行了全面评审,并分析了最新和最高分辨率的数据集。
2.1. 土地覆盖数据集
本研究中使用的数据集列在表 1 中。有关其具体特征的更多细节可以在表中提供的参考文献中找到。除少量仅可按请求获取的数据集外,这些数据集完全免费并可在网上公开访问。数据集分为两组:1)全球或大陆数据,2)区域或国家数据。
2.2. 参考数据集
传统上,进行验证的一个主要缺点是常见参考数据集的可用性有限(Congalton et al., 2014)。然而,近年来,许多努力致力于开发促进参考数据免费获取和可用性的举措。在本研究中,我们利用其中一些,特别是那些用于土地覆盖验证的数据集,将它们合并为一个包含 5,058 个样本的单一数据集(详见表 2)(Tsendbazar et al., 2016)。使用了来自 GOFCGOLD(全球森林覆盖和土地利用动态观察)的五个地面参考数据集:GLC2000(Bartholomé和 Belward,2005);GlobCover 2015(Bicheron et al., 2008);STEP(陆地生态系统参数化系统)(Friedl et al., 2010);VIIRS(可见光红外成像辐射计套件)(Olofsson et al., 2012);以及 GLCNMO 2008 训练数据集(Tateishi et al., 2014)。除了 GOFC-GOLD 数据集外,我们还使用了来自 FROM-GLC 项目的数据(Zhao et al., 2014),该项目包含点训练样本。 此外,我们使用了国际应用系统分析研究所(IIASA)专家在开发 JRC 作物掩模时进行的验证数据(Vancutsem 等,2013)。最后,参考样本集通过 2012 年 1 月至 3 月进行的第二届 Geo-Wiki 竞赛的样本进行了扩展(Comber 等,2013)。
3. 方法
该方法的一般概述包括以下步骤(图 1)。 1 土地覆盖数据集的识别、收集和预处理 (3.1)。 2 传奇翻译与协调 (3.2)。 多标准分析 (MCA) (3.3)。
识别评估标准并根据这些标准评估每个数据集(3.3.1)。满足土地覆盖图要求(Waldner et al., 2015)并影响地图准确性的五个标准(Fritz et al., 2013)是时效性、空间分辨率、与 FAO 统计数据的比较、准确性评估和专家评估。
为每个国家构建标准化绩效矩阵 (3.3.2)。
敏感性分析和排名 (3.3.3)。 4 在没有明确赢家的国家中,通过人类干预在排名较高的替代方案中进行微调方法。 两种混合面具的组成,通过结合每个国家最合适的土地覆盖。 6 结果混合掩膜的准确性评估 (3.4)。
3.1. 数据预处理
初始步骤涉及将所有数据共同注册并重新投影到可比较的地理投影和分辨率。因此,数据集被重新投影到 WGS 84(世界大地测量系统)纬度/经度,并使用平均重采样方法(Jung 等,2006;Chen 等,2017)重新采样到
250
m
(
0.00225
250
m
(
0.00225
250m(0.00225 250 \mathrm{~m}(0.00225 度的空间分辨率,因为这是监测的折中分辨率。
表 2 本研究中使用的参考数据集摘要。
源文本
验证数据集
几何学
图例 农田
Legend
Cropland | Legend |
| :--- |
| Cropland |
传奇草原
Legend
Grassland | Legend |
| :--- |
| Grassland |
GOFC-GOLD http://www.gofcgold.wur.nl/sites/gofcgold_
GOFC-GOLD
http://www.gofcgold.wur.nl/sites/gofcgold_ | GOFC-GOLD |
| :--- |
| http://www.gofcgold.wur.nl/sites/gofcgold_ |
GLC2000
点数
8. 种植和管理植被
8. Cultivated and managed
vegetation | 8. Cultivated and managed |
| :--- |
| vegetation |
7. 草本植物
refdataportal.php
全球地表覆盖
5
×
5
5
×
5
5xx5 5 \times 5 MERIS 像素 (225 公顷)
5xx5 MERIS pixels
(225 ha) | $5 \times 5$ MERIS pixels |
| :--- |
| (225 ha) |
11. 洪水后或灌溉农田 14. 雨养农田 20. 马赛克农田/植被 30. 马赛克植被/农田
11. Post-flooding or irrigated
cropland
14. Rainfed cropland
20. Mosaic cropland/vegetation
30. Mosaic vegetation/cropland | 11. Post-flooding or irrigated |
| :--- |
| cropland |
| 14. Rainfed cropland |
| 20. Mosaic cropland/vegetation |
| 30. Mosaic vegetation/cropland |
120. 马赛克草原/森林或灌木丛 140. 闭合到开放的草本植物
120. Mosaic grassland/forest or
shrubland
140. Closed to open herbaceous
vegetation | 120. Mosaic grassland/forest or |
| :--- |
| shrubland |
| 140. Closed to open herbaceous |
| vegetation |
STEP
多边形
(
4
×
4
km
)
(
4
×
4
km
)
(4xx4km) (4 \times 4 \mathrm{~km})
Polygon
(4xx4km) | Polygon |
| :--- |
| $(4 \times 4 \mathrm{~km})$ |
12. 耕地 14. 耕地/自然植被
12. Croplands
14. Cropland/natural vegetation | 12. Croplands |
| :--- |
| 14. Cropland/natural vegetation |
9. 稀树草原 10. 草原
9. Savannas
10. Grasslands | 9. Savannas |
| :--- |
| 10. Grasslands |
VIIRS
多边形
(
5
×
5
km
)
(
5
×
5
km
)
(5xx5km) (5 \times 5 \mathrm{~km})
Polygon
(5xx5km) | Polygon |
| :--- |
| $(5 \times 5 \mathrm{~km})$ |
GLCNMO
多边形
11. 耕地 12. 水田 13. 耕地/其他植被
11. Cropland
12. Paddy field
13. Cropland/Other vegetation | 11. Cropland |
| :--- |
| 12. Paddy field |
| 13. Cropland/Other vegetation |
8. 草本 9. 稀疏的草本
8. Herbaceous
9. Herbaceous with sparse | 8. Herbaceous |
| :--- |
| 9. Herbaceous with sparse |
Geo-Wiki https://www.geo-wiki.org/downloads/
Geo-Wiki
https://www.geo-wiki.org/downloads/ | Geo-Wiki |
| :--- |
| https://www.geo-wiki.org/downloads/ |
IIASA 专家
多边形
(
1
×
1
km
)
(
1
×
1
km
)
(1xx1km) (1 \times 1 \mathrm{~km})
Polygon
(1xx1km) | Polygon |
| :--- |
| $(1 \times 1 \mathrm{~km})$ |
%
%
% \% 的耕地
-
竞争 II
多边形
(
1
×
1
km
)
(
1
×
1
km
)
(1xx1km) (1 \times 1 \mathrm{~km})
Polygon
(1xx1km) | Polygon |
| :--- |
| $(1 \times 1 \mathrm{~km})$ |
4. 耕作和管理/农田 5. 马赛克耕作和管理
4. Cultivated and management/
cropland
5. Mosaic cultivated and
management | 4. Cultivated and management/ |
| :--- |
| cropland |
| 5. Mosaic cultivated and |
| management |
3. 草本植被/ 草地
3. Herbaceous vegetation/
grassland | 3. Herbaceous vegetation/ |
| :--- |
| grassland |
赵等人(2014) http://data.ess.tsinghua.edu.cn/
Zhao et al. (2014)
http://data.ess.tsinghua.edu.cn/ | Zhao et al. (2014) |
| :--- |
| http://data.ess.tsinghua.edu.cn/ |
FROM-GLC
点
10. 耕地
30. 草原
Source Validation datasets Geometry "Legend
Cropland" "Legend
Grassland"
"GOFC-GOLD
http://www.gofcgold.wur.nl/sites/gofcgold_" GLC2000 Points "8. Cultivated and managed
vegetation" 7. Herbaceous vegetation
refdataportal.php GlobCover "5xx5 MERIS pixels
(225 ha)" "11. Post-flooding or irrigated
cropland
14. Rainfed cropland
20. Mosaic cropland/vegetation
30. Mosaic vegetation/cropland" "120. Mosaic grassland/forest or
shrubland
140. Closed to open herbaceous
vegetation"
STEP "Polygon
(4xx4km)" "12. Croplands
14. Cropland/natural vegetation" "9. Savannas
10. Grasslands"
VIIRS "Polygon
(5xx5km)"
GLCNMO Polygon "11. Cropland
12. Paddy field
13. Cropland/Other vegetation" "8. Herbaceous
9. Herbaceous with sparse"
"Geo-Wiki
https://www.geo-wiki.org/downloads/" IIASA experts "Polygon
(1xx1km)" % of cropland -
Competition II "Polygon
(1xx1km)" "4. Cultivated and management/
cropland
5. Mosaic cultivated and
management" "3. Herbaceous vegetation/
grassland"
"Zhao et al. (2014)
http://data.ess.tsinghua.edu.cn/" FROM-GLC Point 10. Cropland 30. Grassland | Source | Validation datasets | Geometry | Legend <br> Cropland | Legend <br> Grassland |
| :---: | :---: | :---: | :---: | :---: |
| GOFC-GOLD <br> http://www.gofcgold.wur.nl/sites/gofcgold_ | GLC2000 | Points | 8. Cultivated and managed <br> vegetation | 7. Herbaceous vegetation |
| refdataportal.php | GlobCover | $5 \times 5$ MERIS pixels <br> (225 ha) | 11. Post-flooding or irrigated <br> cropland <br> 14. Rainfed cropland <br> 20. Mosaic cropland/vegetation <br> 30. Mosaic vegetation/cropland | 120. Mosaic grassland/forest or <br> shrubland <br> 140. Closed to open herbaceous <br> vegetation |
| | STEP | Polygon <br> $(4 \times 4 \mathrm{~km})$ | 12. Croplands <br> 14. Cropland/natural vegetation | 9. Savannas <br> 10. Grasslands |
| | VIIRS | Polygon <br> $(5 \times 5 \mathrm{~km})$ | | |
| | GLCNMO | Polygon | 11. Cropland <br> 12. Paddy field <br> 13. Cropland/Other vegetation | 8. Herbaceous <br> 9. Herbaceous with sparse |
| Geo-Wiki <br> https://www.geo-wiki.org/downloads/ | IIASA experts | Polygon <br> $(1 \times 1 \mathrm{~km})$ | $\%$ of cropland | - |
| | Competition II | Polygon <br> $(1 \times 1 \mathrm{~km})$ | 4. Cultivated and management/ <br> cropland <br> 5. Mosaic cultivated and <br> management | 3. Herbaceous vegetation/ <br> grassland |
| Zhao et al. (2014) <br> http://data.ess.tsinghua.edu.cn/ | FROM-GLC | Point | 10. Cropland | 30. Grassland |
国家和地区层面的农业中等分辨率时间序列(Pérez-Hoyos 等,2017)。那些最初为矢量格式的数据集(例如 Africover)以 250 米的空间分辨率栅格化,使用最大面积标准(Vancutsem 等,2013)。
3.2. 图例翻译与协调
本研究中最具争议的问题之一是如何定义耕地和草地,因为没有一个统一的定义。相反,提出了许多不同的定义。此外,我们面临使用土地覆盖数据集来定义农业监测所需的土地利用类别的问题。在这里,采用了 FAO(2014)的术语;该术语将农业用地视为适合畜牧和作物生产的土地,可以进一步细分为耕地(即种植年度作物或暂时休耕的土地)、种植永久作物的土地和永久草地。根据与所使用数据集一致的务实定义,本文中的“耕地”指的是耕地和永久作物的组合,因为一些数据(例如 GlobeLand30)并未区分它们。
草地的定义更为复杂,因为它包括从有树木覆盖的自然草地到稀疏植被,再到集约管理的牧场和草地的广泛土地利用梯度(Friedl et al., 2010)。在这种情况下,土地覆盖和土地利用术语之间的区分比作物(例如,牧场与草地与草本植被)更具挑战性(Herold et al., 2008)。同时,从遥感的角度来看,草地的清晰区分是困难的,因为这一类别常常与类似的光谱类别混淆,例如灌木丛。考虑到我们 I-Grassland 的最终范围是作为评估饲料可用性(最终是牲畜生产)异常的基础,使用遥感数据,我们采用了一种保守的方法,尽量减少由于可能存在的木本植被而导致的光谱变化。因此,更加重视草本区域,而其他也可能具有牧用的类别(例如,木本稀树草原或密灌木丛)则被排除在我们的草地定义之外。 在这个框架中,草原根据 FAO GLCSHARE 术语定义为:任何以自然草本植物为主的地理区域,其覆盖率为
10
%
10
%
10% 10 \% 或更高,无论不同的人类和/或动物活动,如放牧等。木本植物(树木和/或灌木)可以存在,前提是它们的覆盖率低于
10
%
10
%
10% 10 \% (Latham 等,2014)。 为了克服由于产品异质性和每个数据集分类系统差异所带来的某些限制,并尽量减少歧义,所有土地覆盖类别被纳入一个由三类(农田、草地和其他)组成的共同或目标图例。对于图例翻译,我们采用了 Herold 等人(2008)提出的方法,该方法使用 FAO LCCS 作为概念框架(Di Gregori 和 Jansen,2000)。事实上,分析的多数产品在开发中已经使用了 LCCS(例如 GlobCover、Africover、DRC 地图、GLCNMO2008、GeoNetwork),简化了翻译。其他产品则没有,例如基于国际地圈-生物圈计划(IGBP)的 MODISLC,或采用 Chen 等人(2015)定义的十类分类方案的 GlobeLand30。在这种情况下,GOFC-GOLD 与 FAO/UNEP 全球土地覆盖网络(Herold 等,2009)提出的基于 LCCS 的图例翻译协议,以及参考基准(例如 Herold 等,2008),被用来协调图例。 此外,为了确保与之前制作的 MARS-JRC 一致,掩膜中包含了占多数的马赛克类别(
>
50
%
>
50
%
> 50% >50 \% ),而对于少数类别(20-50%),通过视觉解读进行全面分析,使用 Google Earth 的高分辨率影像在国家层面上确定它们是否应包含在分析的类别中。这对于赤道国家至关重要,因为农田与森林混合,只有马赛克类别用于描述农业区域,例如在几内亚,农田仅根据 GLC2000(Vancutsem 等,2013)被映射为马赛克森林/农田类别。
3.3. 多标准分析 (MCA)
提出了一种半自动化的方法,依赖于多标准分析(MCA),并在每个国家的最佳土地覆盖中进行微调,以创建两个非洲的混合农业掩模(ICropland 和 I-Grassland)。MCA 在国家层面应用于对不同选项(即土地覆盖数据集)的排名,或在有限的替代方案中以透明和客观的方式做出选择,考虑五个标准(Keeney 和 Raiffa,1993)。实施的 MCA 基于一个成熟的 TOPSIS(理想解相似性优先级技术)方法,该方法根据替代方案与正负理想解的距离进行排名(Hwang 和 Yoon,1981)。TOPSIS 方法包括以下步骤。1)创建一个绩效决策矩阵。
图 1. 总结方法论主要步骤的流程图。 基于一组
n
n
n n 标准和
m
m
m m 备选方案。2) 标准化矩阵。3) 计算每个标准的权重并计算加权归一化决策矩阵。4) 确定正理想解和负理想解。5) 计算每个标准与正负理想解的距离。6) 计算每个备选方案的接近系数。7) 对备选方案进行排名。
所提议的 MCA 方法整合了一种敏感性分析,能够识别出某种土地覆盖明显优于其他覆盖的情况,以及需要基于视觉分析进行微调的情况。敏感性分析得到了 MCA 部分结果的支持,例如多个箱线图、替代方案排名和雷达图。此外,只有在两个或三个替代方案结果相似时,才需要进行分析,这取决于分配给每个标准的相对重要性或权重。
3.3.1. 评估标准的识别
在 MCA 开发中的一个关键选择是确定一套适当且具有代表性的标准,以评估各国的不同土地覆盖数据集。在对文献进行全面审查后(例如,Congalton 等,2014;See 等,2015a),确定了五个代表性标准,这些标准充分涵盖了农业地图的主要要求,并影响农业制图的准确性(Waldner 等,2015;Fritz 等,2013)。 3.3.1.1. 时效性标准。时效性是指数据集生成与我们混合掩模目标参考年(即 2016 年)之间的时间间隔。前提是,时效性会影响数据的准确性和代表性,因为农业中的土地覆盖变化,例如从自然植被转变为农作物、城市化或农业废弃(Schepaschenko 等,2015)。因此,为了最小化这些变化的影响,最新的产品通过对数插值(公式(1))进行优先选择,该插值范围从 1(即输出掩模的名义年份 - 2016)到 0(即最旧的数据集 - 1992)。对数插值倾向于偏向目标年和相邻年份。
及时性标准
=
83.499
ln
(
=
83.499
ln
(
=83.499 ln( =83.499 \ln ( 年
)
−
634.333
)
−
634.333
)-634.333 )-634.333 3.3.1.2. 空间分辨率标准。空间分辨率是指能够被检测到并因此被绘制的最小土地特征(FAO, 在非洲,农业耕地面积通常较小,农业机械化水平低(Pittman et al., 2010),景观破碎且异质,空间分布比世界其他作物区域更为分散(Yadav and Congalton, 2018),更高的空间分辨率可以更好地表征农业(Lobell and Asner, 2004)。因此,通过对数插值(公式(2)),优先考虑空间细节最丰富的数据集,其中数据范围从 1(最高空间分辨率为 20 米)到 0(最低空间分辨率为 2 公里)。
SR 标准
=
−
0.217
ln
(
=
−
0.217
ln
(
=-0.217 ln( =-0.217 \ln ( 空间分辨率
)
+
1.65
)
+
1.65
)+1.65 )+1.65 3.3.1.3. FAOSTAT 标准或与统计数据的比较。该标准指的是与国家层面的农业统计数据的一致性。关于农业面积和生产力的数据可以通过联合国粮食及农业组织(FAO)获得,该组织从各国收集统计数据并进行协调,以形成一个全球数据库。尽管各国之间的准确性被认为是异质的,但该数据集是最全面的农业数据库,主要集中在统计数据获取存在挑战的地区,如许多非洲国家(FAO,2012)。
FAOSTAT 的统计数据(http://faostat3.fao.org/home )用于 2006 年至 2016 年的平均值,以减少年度变异的影响。耕地和草地的总面积与统计数据进行比较,耕地使用“可耕地”和“永久作物”的总和(即图 1 中的耕地 FAOSTAT),草地使用“永久草地和牧场”(即草地 FAOSTAT)。该标准基于不同国家级土地覆盖数据集的统计数据的绝对差异(有关更多详细信息,请参见 Pérez-Hoyos 等,2017 年)。
根据 FAOSTAT 提供的数据,一个计算分配给农田或草地的表面积与国家总表面积比例的因素,对该标准以及下面描述的标准进行了规范化。通过这种方式,最小化了遗漏类别的影响,例如在埃及,草地的存在几乎可以忽略不计。因此,在这个特定情况下,该类别的规范化值接近于零。 3.3.1.4. 精度评估标准。地图精度评估是地图制作的一个关键组成部分,因为它提供了定量的
图 2. a) 归一化一致性草地图和 b) 归一化一致性农田图。 土地覆盖数据集的质量描述(Strahler 等,2006)。为了比较不同土地覆盖数据集的准确性,基于第 2.2 小节中描述的参考数据,在国家层面进行了一次共同的准确性评估。
为了最小化与验证过程本身相关的问题,分析仅在至少一个分析数据集中被分类为农田或草地的区域进行。否则,农田或草地的表面与其他类别所占表面不平衡,将导致从验证中得出的指标的虚假高估。然后,通过广泛接受的混淆矩阵或错误矩阵执行准确性评估,这是一种将分类数据集与上述参考数据进行简单交叉制表的方法(Congalton, 1991)。由此得出一些常见指标,包括总体准确性(OA)、用户准确性(UA)(或误报错误)和生产者准确性(PA)(或漏报错误)(Foody, 2002)。此外,计算一个更具信息性的准确性指标,如 F-score,作为农田和草地类别的 PA 和 UA 的组合,得出以下方程:
F
score
=
2
×
UA
×
PA
UA
+
PA
F
score
=
2
×
UA
×
PA
UA
+
PA
F_("score ")=2xx(UAxxPA)/(UA+PA) F_{\text {score }}=2 \times \frac{\mathrm{UA} \times \mathrm{PA}}{\mathrm{UA}+\mathrm{PA}} 最终在该标准中使用的参数是整体准确性,作为对每种土地覆盖的全球评估,以及两种特定指标,农田的 F-score 和草地的 F-score(见图 1)。 3.3.1.5. 专家评估标准。该标准的目的是定量捕捉在农业和遥感方面具有扎实背景、对非洲景观有深入了解的 JRC 粮食安全单位七名研究人员的专家和区域知识。为此,使用为此特定范围开发的独立数据集进行准确性评估,并将两个总体准确性指标(耕地 OA,草地 OA)作为标准的输入。这样做的理由是优先考虑在更具问题性或难以分类的区域的采样密度。为此,基于布尔或清晰比较的分歧图(Herold 等,2008),推导出两个概率图(耕地,草地),并进行归一化以避免由于每个国家的数据集数量不同而导致的差异(图 2)。
参考样本采用随机概率与大小成比例(PPS)的方法(Rosén, 1997)进行收集,该方法倾向于在高误分类概率的区域进行采样。因此,在那些对耕地或低耕地存在概率存在分歧的区域,选择了更多的参考样本(图 2)。通过这种方式,它们偏向于错误率较高的区域,这些区域的重采样率更高。为了确保所有国家都有代表,选择每个国家至少 10 个样本。采样单元是一个同质的像素簇(即像素大小为 250 米),以减少地理定位误差的影响(Congalton 和 Green, 2009)。在非洲共分布了 1,750 个样本,其中一半来自分歧耕地图,另一半来自草地图。
每位专家对 250 个编码样本进行照片解读,这些样本可以通过.kmz 文件叠加在 Google Earth 上,并利用 Google Earth Engine 支持决策,以可视化每个特定样本的 NDVI 曲线。然后要求专家根据四个类别指示农田和草地的百分比:
0
%
0
%
0% 0 \% (缺失)、1-25%、26-50%和>
50
%
50
%
50% 50 \% 。最后,计算应急矩阵,考虑占用率大于
50
%
50
%
50% 50 \% 的样本中的农田或草地。
为了评估每个土地覆盖数据集与其他数据集的关系,基于一组
n
n
n n 标准和
m
m
m m 替代方案(即土地覆盖)创建了一个性能决策矩阵。原始测量值被转换为标准化的度量,以实现标准化的性能矩阵。这个性能矩阵使得能够在同一尺度上比较所有土地覆盖在每个标准下的表现。该矩阵的可视化表示如图 3 所示。
土地覆盖数据集
A
A
A A
土地覆盖数据集 B
土地覆盖数据集 C
图 3. 土地覆盖数据集雷达图是一个国家的示例。在雷达图中,可以观察到三个土地覆盖数据集在标准 4 方面非常相似。图中还显示,C 在标准 1 中得分最高,但在标准 3 中得分最低。因此,我们可以得出结论,所有土地覆盖数据集在所有标准上没有一个优于其他。
3.3.3. 敏感性分析与排名
MCA 的下一步是创建一个加权回归矩阵,使用一个涵盖所有标准的分数。为此,提出了一个加性加权分数(WS),如下所示:
W
S
=
∑
j
=
1
n
w
j
×
W
S
=
∑
j
=
1
n
w
j
×
WS=sum_(j=1)^(n)w_(j)xx W S=\sum_{j=1}^{n} w_{j} \times 标准
i
j
i
j
_(ij) _{i j} 在其中,土地覆盖的最终值(WS)通过所有标准的总和计算得出,
j
j
j j 在 1 和
n
n
n n (标准数量)之间变化,乘以每个标准的权重
w
w
w w ,其中
0
≤
w
≤
1
0
≤
w
≤
1
0 <= w <= 1 0 \leq w \leq 1 和
Σ
w
j
Σ
w
j
Sigmaw_(j) \Sigma w_{\mathrm{j}}
=
1
=
1
=1 =1 (标准权重范围从 0 到 1,所有标准权重的总和必须为 1)。
加权并不容易,因为没有客观证据表明一个标准比另一个更重要。权重主要通过某种程度的主观性的方法来确定。在本研究中,我们通过设计一种基于模拟不同权重并调查其对结果或敏感性分析的相对影响的新方法来解决这一可能的缺陷。为此,运行了千次多准则分析(MCA),每个标准的权重是从区间
[
0
,
1
]
[
0
,
1
]
[0,1] [0,1] 的均匀分布中随机生成的。结果是每个土地覆盖数据集成为赢家的概率,以及使某种土地覆盖成为最佳替代方案的权重分布(图 4)。
敏感性分析表明,人为干预大大减少,因为在许多情况下,有一种土地覆盖类型明显优于其他类型。因此,要使另一种土地覆盖类型成为最佳替代方案,必须对大多数考虑的标准分配不平衡的权重。在其他情况下,当多个土地覆盖数据集似乎是可能的替代方案时,人类专业知识结合来自多标准分析的部分结果,有助于在仅限于最佳评分选项中选择最佳选项以整合混合地图(附录 A 包含一个真实案例示例以获取更多细节)。
3.4. 结果混合掩膜的准确性评估
生成的混合地图 I-Cropland 和 IGrassland 的不确定性通过与其他公开可用数据集进行布尔或清晰比较来评估,以确定我们的掩膜的合理性
图 4. 敏感性分析过程中两个假设情况(国家)权重的多重箱线图分布的简化示例。在左侧显示的情况中,对于
90
%
90
%
90% 90 \% 次随机权重模拟,最佳替代方案是土地覆盖数据集 A,只有在
2
%
2
%
2% 2 \% 次中,最佳土地覆盖数据集是 C(而且这仅在相当极端的权重值下发生)。在右侧显示的情况中,最佳替代方案是数据集 A,在
50
%
50
%
50% 50 \% 次模拟中,其他
50
%
50
%
50% 50 \% 的成为最佳替代方案的概率分布在数据集 B 和数据集 C 之间。如果箱体较宽,这意味着该土地覆盖数据集在该标准的广泛权重范围内是最佳的。虚线红色水平线显示了权重的参考值,如果所有标准被视为同等重要(在所示示例中,由于考虑了四个标准,每个标准的值将为
100
/
4
=
25
%
100
/
4
=
25
%
100//4=25% 100 / 4=25 \% )。红色水平线以上的箱线图表示相应的标准需要在公平性之上加权,以使该土地覆盖成为最佳替代方案。 因此,箱线图相对于红色水平线的极端位置表明了土地覆盖在各个标准下的好坏。具体来说,如果某一特定土地覆盖的箱线图值显著高于红色水平线,这表明与该箱线图对应的标准得分高于其他箱线图低于红线的标准。 结果与其他地图进行比较。I-耕地与非洲最新的混合倡议——2014 年统一耕地层(UCL 2014)进行评估,该倡议是在全球农业监测创新刺激(SIGMA)项目下开发的,分辨率为 250 米(Waldner 等,2015)。数据还与 JRC 在 250 米分辨率下生成的先前混合土地覆盖掩模进行评估(MARS-JRC;Vancutsem 等,2013)。I-草地的比较最为简单,因为可比较的混合草地数据量较少。I-草地掩模与 FAO GLC-SHARE 草地层在 1 公里分辨率下进行比较(Latham 等,2014)。此外,结果掩模的一致性还与 FAO 统计数据进行评估。
最后,对 I-Cropland 掩模、UCL 2014 和 MARS-JRC 的准确性评估是基于从混淆矩阵得出的指标,即 F-score 和总体准确性,使用来自 SIGMA 数据集的 6,925 个样本作为参考数据。SIGMA 数据专门用于耕地地图验证,包含
300
×
300
m
300
×
300
m
300 xx300m 300 \times 300 \mathrm{~m} 定位。每个采样单元显示耕地的百分比,范围从 0(无耕地)到 100%(Laso Bayas 等,2017)。为了将这三个数据集与参考样本进行比较,SIGMA 被转换为由两个类别组成的二元图例,耕地(
>
50
%
>
50
%
> 50% >50 \% )和非耕地(
<
50
%
<
50
%
< 50% <50 \% )。
4. 结果
4.1. I-耕地掩膜
图 5a 展示了通过杂交创建的 I-Cropland 掩膜,而
5
b
5
b
5b 5 b 显示了选择的土地覆盖数据集及其在 MCA 中的获胜概率。需要强调的是,在运行 MCA 后,基于对 Google Earth 高分辨率影像的视觉检查,结合 MCA 得出的部分结果(即蜘蛛图、箱线图、排名),评估每个国家最佳评级土地覆盖数据集的代表性,并在必要时进行修改。因此,排名第一的解决方案并不自动被选为最佳土地覆盖数据集。例如,在
10
%
10
%
10% 10 \% 的国家中,其他排名较低的数据集(但仍在最高评分的替代方案中)被整合到最终的 I-Cropland 掩膜中。例如,在多哥,GlobeLand30(与
10.9
%
10.9
%
10.9% 10.9 \% )被优先于 ESA S2(与
32.5
%
32.5
%
32.5% 32.5 \% ),因为后者在视觉检查中不适当地表示了农田。最终的 I-Cropland 很好地展示了非洲农田的知名模式,包括萨赫勒带、大湖区周边、北海岸、尼罗河流域及南部非洲。 区域生产的土地覆盖数据集通常能够很好地捕捉农田分布,因为这种方法适应了每个地区的特性,并且在生产过程中涉及了区域专业知识(Song et al., 2014a,b)。然而,区域生产的土地覆盖数据集与全球产品之间的差异往往随着输入卫星数据空间分辨率的提高而减少,例如 CGLS-LC100
(
100
m
)
(
100
m
)
(100m) (100 \mathrm{~m}) 。我们的研究结果表明,全球数据集可以克服区域替代品,例如在埃塞俄比亚,它们在使用 MCA 时表现(
20
%
20
%
20% 20 \% )优于区域(和较旧的)产品,如世界银行或土地覆盖计划。这些新数据集在缺乏区域生产土地覆盖信息的国家中非常有用,例如纳米比亚或安哥拉(See et al., 2015b)。
与之前的研究结果相似(Pérez-Hoyos 等,2017),GlobeLand30 似乎适合监测农田,特别是在干旱地区。事实上,根据敏感性分析,GlobeLand30 在几乎所有国家中都是评价最高的替代方案之一。我们的研究结果证实了高空间分辨率是可靠捕捉地球表面的关键属性之一,因此能够准确分类农田。相反,低空间分辨率的数据,如 GLC2000 和 GLCNMO2008,几乎没有产生可行的选项,因为在这样的分辨率下,农田检测受到惩罚,因为农田与类似光谱类别(如草地)的误分类。
及时性并不总是被视为关键因素之一,在某些国家,GlobeLand30(2010)相比于其他数据显得尤为突出
图 5. a) 应用 MCA 后生成的 I-耕地掩模;地图上显示了每个国家可用和已分析的数据集数量。b) 胜出数据集及其获胜概率。
ESA S2 原型(2016)或 GCLS-LC100(2015)。实际上,源自 Sentinel 2 的 ESA S2 原型对于次撒哈拉地区的适用性相当差。这与之前的研究结果一致,即 ESA 高估了苏丹的农田面积,而低估了摩洛哥和阿尔及利亚的农田面积(Lesiv 等,2017)。此外,在某些情况下,像 Africover 这样的旧数据仍然足以代表农田,例如在索马里(
40
%
40
%
40% 40 \% )。
在西非(例如加纳、塞拉利昂和利比里亚)有一些低概率评分区域,即大约
50
%
50
%
50% 50 \% 。由于农业集约化程度低、农业系统季节变化大以及云层的存在影响分类,这些地区通过遥感进行制图非常具有挑战性(Vitrou 等,2012)。此外,在西非,农业地块中经常出现油棕和森林冠层,这与粮食安全早期预警无关。由于树木的存在和图例定义的差异,在某些情况下,与统计数据相比,耕地的高估现象会发生。此外,这些错误在不同数据集之间传递,例如在 GlobCover 和 LC-CCI 2015 之间。
最后,在某些特定情况下,两个数据集似乎在空间上是互补的,例如在刚果共和国,Africover 的胜率最高(
54.9
%
54.9
%
54.9% 54.9 \% ),而 GlobeLand30 是第二选择(15.4%)。经过细致分析,我们意识到时效性是耕地扩展的主要原因。在尼日利亚也出现了类似的情况,GlobeLand30 在几乎所有标准上得分很高(
80
%
80
%
80% 80 \% ),但重要的耕地区域缺失,主要集中在该国的西部。在这种情况下,ECOWAS 补充了 12%;然而,主要的限制是低空间分辨率标准。在这个特定案例中(即厄立特里亚、尼日利亚、刚果民主共和国),前两个评级的土地覆盖数据被合并。
4.2. I-草原面具
图 6a 汇集了基于 MCA 的最佳表现产品,并对结果进行了全面修订,而
6
b
6
b
6b 6 b 显示了每个国家使用的来源。I-Grassland 掩模的开发更为困难,因为草地的分类被认为是一个挑战,因为它与其他类别(如森林或灌木丛)之间存在高度混淆,尤其是在热带草原生态系统中(Tsendbazar 等,2018)。概率值通常低于 ICropland 掩模,并且根据结果,对于某些国家,多个数据集更接近理想解决方案。最高的概率值出现在毛里塔尼亚(
90.2
%
90.2
%
90.2% 90.2 \% )和尼日尔(
96
%
96
%
96% 96 \% )等国家,在这些国家,区域倡议如 Repsahel 明显优于其他产品,而安哥拉(30%)、加纳(32.1%)和几内亚(
22
%
22
%
22% 22 \% )的值则最低。
大部分草原掩模的表面位于南非,其次是非洲之角和萨赫勒带。正如预期的那样,来自高分辨率传感器(例如 GeoNetwork、土地覆盖方案)的产品对 I-草原掩模的贡献远远超过其他产品。然而,像 GlobCover 和 LC-CCI 2015 这样的低空间分辨率产品在代表中非共和国或多哥的草原时似乎是可行的解决方案。在这种情况下,时效性标准发挥了重要作用,使得一些数据集在选择时被排除,尽管它们的质量良好。例如,在津巴布韦,南部非洲发展共同体(SADC)与 GlobeLand30 在空间上结合,因为后者在过去十年中草原扩展的地区补充了该产品。
该面具显示出一些由于边界效应而产生的空间不一致性,正如在尼日利亚西北部所发生的那样。该面具是在适用于国家级早期预警系统(如 ASAP(Rembold 等,2019))的每个国家框架上生成的,因此无法完全避免边界效应。为了解决这个问题,可以考虑对提议的方法进行一些修改,例如在每个像素基础上应用 MCA(Pérez-Hoyos 等,2012a,b)。
4.3. 结果混合掩膜的准确性评估
基于来自 SIGMA 的 6,925 个样本像素,非洲 I-Cropland、MARS-JRC 和 UCL 的整体准确率 OA 和 F-score 为
图 6. a) 应用 MCA 后生成的 I-草原掩模;每个国家分析的数据集数量显示在此处。b) 胜出数据集及其获胜概率。
图 7. I-Cropland 掩模与 MARS-JRC(Vancutsem 等,2013 年);I-Cropland 与 UCL(Walder 等,2015 年);以及 I-Grassland 与 FAO GLC-SHARE(Latham 等,2014 年)之间的空间一致性。一致性意味着我们的掩模与比较数据集一致(绿色);蓝色对应我们的掩模,橙色对应比较数据集。 评估。尽管由于某些国家(例如布隆迪、卢旺达)样本数量较少,结果应谨慎解读,但这仍然是一种有效的方式来比较各个数据集。总体而言,结果显示 I-Cropland 的映射精度高于其他数据集(见附录 B 中的数值)。UCL 的精度与我们的混合地图更接近,而 MARS-JRC 显示的精度较低,对于某些国家(如突尼斯),UCL 的整体精度(0.83)高于 I-Cropland(0.71)。然而,在这种特定情况下,评估因语义差异而存在偏差。这是因为 SIGMA 对耕地的定义(也用于 UCL)排除了永久耕地(Laso Bayas 等,2017),而我们则将其包括在内。
图 7 展示了成对比较中的空间一致性。I-Cropland 与 UCL 之间,以及 I-Cropland 与 MARS-JRC 之间,农田的空间分布存在较大差异,只有
38.1
%
38.1
%
38.1% 38.1 \% 和
32.1
%
32.1
%
32.1% 32.1 \% 的一致性。这些农田最大的不一致区域主要位于西非,特别是尼日利亚、贝宁、多哥和加纳,在这些国家中,比较数据集中农田的总量被高估。在这些国家,我们的方法受益于新发布产品的更好空间分辨率,这使得农田的划分更加准确,可能解释了这些差异。
I-Cropland 和 MARS-JRC 之间的主要差异之一是在刚果民主共和国,后者在与 FAO 统计数据比较时,农田的估计值大大高于前者。我们的混合地图在马达加斯加表现更好,2010 年前开发的数据集往往重复相同的错误,导致南部地区的农田分类错误以及东部地区的过高估计。与 UCL 相比,空间不一致性较少;I-Cropland 似乎更好地识别安哥拉、中非共和国、毛里塔尼亚和乍得的作物,而 UCL 则存在高估。这些结果也得到了与统计数据和准确性评估(附录 B)的比较支持。津巴布韦的差异对应于 GlobeLand30 的高估;为我们的混合地图提供数据的选定数据(见图 7)。这是为数不多的几个国家之一,其中 I-Cropland 的 F-score(0.885)低于 UCL 的 F-score(0.951)。
I-草地掩模与 FAO GLCSHARE(
43.31
%
43.31
%
43.31% 43.31 \% )的符合度高于作物掩模。总体而言,I-草地的整体模式与比较层非常相似,因为在一些国家(例如苏丹和南苏丹),GLC-SHARE 使用相同的输入数据集,必然导致内在的一致性。主要的差异主要出现在北非国家(例如摩洛哥),在这些国家,最新的数据集如 GlobeLand30 成为我们掩模的首选解决方案。
5. 讨论
自 2012 年首次发布针对非洲的 JRC 作物掩膜以来(Vancutsem 等,2012),通过结合多个全球和区域产品,出现了新的数据集,更好地满足对高质量农业信息的持续需求。对耕地和草地的详细和准确估计与粮食安全相关问题以及早期预警系统的基线信息高度相关,例如最近推出的 JRC ASAP 系统(Rembold 等,2019)。然而,由于分类方案、空间分辨率、方法论和使用的传感器等因素的差异,现有的土地覆盖数据集彼此之间存在不一致。
混合方法在本研究中的应用,为以准自动和成本效益的方式开发更好的数据集提供了一种替代方案。之前融合的地图主要集中在农田(Fritz et al., 2010)或森林(Schepaschenko et al., 2015),但很少探讨草地的整合,而草地在农业生产和粮食安全中至关重要。本文探讨了一种基于多准则分析(MCA)的半自动混合方法的适用性,因为其简单性和直观逻辑使其透明且完全客观。该方法的综合性提供了一个可以轻松追溯的排名,以及已知的原因,说明为什么某个数据集在特定目的下更或更不合适。例如,在厄立特里亚,由于时效性标准的限制,Africover 的使用受到限制,因为从生产年份(1995 年)到我们掩模的名义年份(2016 年),该国的农田面积有所增加。毫无疑问,这并不是第一次使用 MCA 进行数据混合(Waldner et al., 2016),但该工作受益于新数据集的纳入,如 LC-CCI 2015、ESA S2 原型和 CGLS-LC100。 结果考虑到从高分辨率卫星数据衍生的土地覆盖数据集对于更好地表征高度破碎的景观(如非洲及许多国家所见)是有用的。GlobeLand30 和 S2 原型被认为是理想的解决方案。此外,这些最新的数据集显著改善了对纳米比亚或乍得等国家的特征描述, 信息稀缺(见等,2015b)。事实上,与其他优先使用区域数据集的方法相比(Walder 等,2015;Vancutsem 等,2013;Latham 等,2014),我们的结果表明,选择高分辨率全球数据集是一个不错的替代方案,有时甚至比区域倡议(例如,津巴布韦)更好。
本研究中提出的 MCA 方法保证了灵活性,并且可以轻松修改以适应新的数据集或标准,以防面具的目的发生变化。例如,如果关注点更多地集中在灌溉作物对国家生产的贡献上,它可以包括与水供应(灌溉、雨养)相关的标准。该方法允许同时评估大量数据集。本研究的最大好处之一在于它如何处理多标准分析中的权重。通常,所有标准的权重是统一的(Waldner 等,2016),或者加权过程基于专家知识,涉及人为干预,从而带来一些主观性(Munda 等,1994)。本研究通过一种完全客观的权重方法来解决这个问题,该方法基于随机权重,随后进行敏感性分析,以调查在相对重要性评分修改后不同土地覆盖数据集的响应。然而,仍然有几个问题需要在这里开发的方法中加以解决和考虑。 一个主要的关注点在于传说的协调,特别是草地的定义。在这里,我们只关注草本覆盖,因为在 ASAP 进行的热点自动检测中(详见 Rembold 等,2019),关注的是获得清晰的光谱信号。然而,众所周知,牲畜也会在木本稀树草原上觅食,这个区域对于保证食品供应至关重要。另一个考虑因素是杂交过程本身,这假设至少有一个与另一个相对。然而,有些区域容易出错,例如西非,在这些地方仍需更大努力以准确分类农业(见等,2015b)。
即使仍有改进的空间,这里提出的方法论提供了一种良好的策略来结合不同的土地覆盖产品,与之前的尝试、统计数据或基于独立准确性评估相比,得到了更好的农田和草地掩模。我们认为,考虑到当前可用的资源以及我们的特定目的,得到的掩模是最佳的。越来越多的倡议致力于扩大属于特定类别(如农田或草地)的参考数据量(例如 SIGMA),加上新发布的质量统计数据(FAO,2017),预计将克服我们方法的一些问题。
集成方法被证明适合满足用户特定需求,通过调整现有的主题土地覆盖信息并创建用户调优的地图。例如,对于仅对森林应用感兴趣的用户,农田类别并不相关。在这种情况下,混合化对于利用各个土地覆盖数据集的优势至关重要,尤其是在遥感技术持续进步的背景下,这为高空间和时间分辨率的优质土地覆盖地图的生产提供了支持。
6. 结论
JRC 早期预警决策支持系统 ASAP(农业生产异常热点)旨在触发关于农业生产(即耕地和草地)异常的警报,这些异常需要关于农业土地利用的基本输入信息。然而,在一项初步调查中(Pérez-Hoyos 等,2017),发现数据之间存在相当大的差异,并且对某一土地覆盖产品的明显偏好仍然存在疑问。为了解决这个问题,我们的研究提出了一种基于多标准分析的半自动方法框架,以整合不同的土地覆盖数据集,为非洲推导出两个混合静态掩模(耕地和草地),空间分辨率为 250 米,名义年份为 2016 年。
结果表明,MCA 能够在大范围内捕捉农业信息,当这两种结果与其他现有的单独地图(如 FAO GLCSHARE)进行比较时。我们的掩膜改善了几个易出错国家的结果,例如马达加斯加,并能够突出需要进一步努力的有问题区域,因为所分析的数据集缺乏准确性。MCA 易于复制,并整合了定量标准,以透明和灵活的方式选择数据。此外,该方法旨在处理大数据集,并能够提供可追溯性,以说明哪个更好以及原因。由于新兴土地覆盖数据集的持续纳入,融合方法的发展(如这里进行的方法)具有高度相关性。考虑到高分辨率影像(Landsat 8;Sentinel 1 和 2)的开放可用性以及 Google Earth Engine 等应用的发展,这些方法是必不可少的。
致谢
作者感谢以下贡献者和组织提供数据:Astrid Verhegghen 和 Christelle Vancutsem 提供的 UCL 数据;Mustapha Mimouni 来自 Repsahel;Mustapha Dali 来自阿尔及利亚 INRAA;以及纪念 Antoine Royer 来自 JRC。这些人和组织没有审查也不支持本研究。作者对为论文知识标准做出贡献的专家表示感谢:Michele Meroni、Anne Schucknecht、Hervé Kerdiles、Olivier Leo 和 Javier Gallego。最后,我们还感谢 Ronald Clarke 对手稿的校对。
附录 A. 敏感性分析过程的真实示例
权重的多重箱线图分布示例,来源于对 a)乍得和 b)安哥拉的耕地进行的敏感性分析过程。在乍得,对于
87.7
%
87.7
%
87.7% 87.7 \% 次随机权重模拟,最佳替代方案是 Repsahel,只有在
2.5
%
2.5
%
2.5% 2.5 \% 时,最佳土地覆盖数据集是 Copernicus(这仅在极端权重值下发生)。在安哥拉,最佳替代方案是 Copernicus,在
41
%
41
%
41% 41 \% 次模拟中,GlobeLand 30 在
39
%
39
%
39% 39 \% 中表现最佳。
红色虚线水平线表示权重的参考值,如果所有土地覆盖被视为同等重要(在这个例子中,每个标准的权重为
100
/
6
=
16.6
%
100
/
6
=
16.6
%
100//6=16.6% 100 / 6=16.6 \% )。红色水平线以上的箱线图表明,相应的标准需要在公平之上加权,以使土地覆盖达到最佳。因此,箱线图与红色水平线的位置是一个指示。