文章
中国的协同农田:通过融合多种现有地图和统计数据
苗璐
, 吴文彬
, 游良志
, 陈迪
, 张丽
, 杨鹏
和 华军唐
农业部农业资源研究所农业遥感重点实验室
和区域规划,中国农业科学院,北京 100081,中国;lumiao@caas.cn (M.L.); l.you@cgiar.org (L.Y.); chendicaas@163.com (D.C.); zhangli05@caas.cn (L.Z.);yangpeng@caas.cn (P.Y.); tanghuajun@caas.cn (H.T.)
国际食品政策研究所,美国华盛顿特区 20006
* 通信: wuwenbin@caas.cn; 电话: +86-10-8210-5070
收到:2017 年 5 月 10 日;接受:2017 年 7 月 3 日;发表:2017 年 7 月 12 日
摘要
准确的耕地面积信息对科学研究和资源管理至关重要。现有多种遥感数据集的耕地产品可供使用。然而,这些产品之间存在显著的不一致性,且从这些产品估算的耕地面积与统计数据差异较大。在本研究中,我们提出了一种分层优化协同方法(HOSA),通过融合五个现有的耕地产品,即 GlobeLand30、气候变化倡议土地覆盖(CCI-LC)、GlobCover 2009、MODIS 第 5 版(MODIS C5)和 MODIS 耕地,以及耕地面积的次国家统计数据,开发了 2010 年左右的中国混合耕地地图。HOSA 将广泛使用的评分分配方法简化为两个步骤,包括确定最佳一致性水平和识别最佳产品组合。准确性评估表明,协同地图在空间位置的准确性和与统计数据的一致性方面优于这五个现有数据集。这表明,协同方法可以提高耕地制图的准确性,并增强与统计数据的一致性。
关键词:协同图;农田制图;数据融合;统计;一致性
1. 引言
耕地的范围和动态知识对食品安全和环境可持续性至关重要。预计到 2050 年,全球人口将超过 90 亿,随之而来的食品需求将不断增长[1,2]。随着收入的提高,饮食模式的变化将增加对动物蛋白、植物油、水果和蔬菜的需求,这意味着支持人均饮食所需的耕地将增加[3]。这些变化无疑会对已经超负荷的耕地施加更大的压力。此外,农业活动对环境有巨大的影响,因为它们改变了生态系统的结构和功能的大部分,这影响了生态系统与周围大气、水体和土壤的相互作用[4,5]。因此,确保农业土地系统能够为我们的社会提供足够、安全和营养的食品,同时减少对环境的负面影响,是人类面临的最大挑战之一。 实现这些目标需要准确的耕地分布信息及其时空变化,以支持农业监测、粮食生产估算、粮食安全评估和地球物理模型 [6,7]。
卫星图像提供了一种高效的数据来源,可以用于推导大面积的农田范围。在最近几十年中,多个全球和大陆的农田数据集是通过遥感数据获得的,并已免费向公众提供。早期的农田产品
通常使用粗分辨率图像(像素为 1 公里或类似),例如国际地球圈-生物圈计划数据与信息系统覆盖(IGBP-DISCover)产品[8]、马里兰大学(UMD)产品[9]和全球土地覆盖 2000(GLC2000)数据集[10];然而,低精度和图像质量限制了它们在国家或区域层面的应用。后来,农田数据集的空间分辨率提高到 500 米,然后是 300 米,例如 MODIS 第 5 版(MODIS C5)土地覆盖产品和 GlobCover 2009[11,12]。如今,由于 Landsat 档案的免费获取,高分辨率图像的土地覆盖制图在科学界受到越来越多的关注,这使得生产 30 米分辨率的土地覆盖数据集成为可能,如 GlobeLand30 和更细分辨率观察与监测-全球土地覆盖(FROM-GLC)[13,14]。然而,这些农田制图产品之间存在相当大的不一致性,特别是在异质景观区域如过渡区,因为它们是使用来自不同传感器的数据、采用不同的分类特征和分类器生成的
。 一些研究表明,差异也可能是由于不同的分类方案和农田定义造成的。此外,这些产品估计的农田面积与官方统计数据存在差异,因为在遥感图像中,混合像素是不可避免的,尤其是在粗分辨率图像中。尽管一些地图,如 GlobCover 2009 和气候变化倡议土地覆盖(CCI-LC),包含代表多种类组合的马赛克农田类别,但由于它们未提供农田的精确百分比,因此从这些地图中高精度估计农田面积是相当困难的。
协同方法通过融合可用的数据集和统计数据,为解决上述问题提供了一种替代方案[22]。不同的农田产品可以用来生成混合农田百分比图,通常具有更高的准确性。现有的地图协同算法大致可以分为回归方法和一致性评分方法。在前者中,地理加权回归(GWR)是一种空间分析方法,其回归参数在空间上变化[23]。它已被广泛用于利用 Geo-wiki 的众包数据构建全球范围的混合土地覆盖和森林地图[24,25]。然而,这一过程通常需要大量的训练样本集,并且在采样密度较低时往往不稳定[26,27]。一致性评分方法基于输入数据的一致性水平进行评分分配,由于其简单性和优越的可操作性,使用更为广泛。使用这种方法,Jung 等人开发了用于碳循环建模的 1 公里分辨率全球土地覆盖图[28],而 Ramankutty 等人则开发了全球农田和牧场面积图[29]。 然而,这些研究忽略了输入数据集之间的质量差异。为了解决这个问题,Fritz 等人利用专家知识对输入数据集进行排名,并相应地分配不同的权重[30,31]。众所周知,分数分配是这些方法的关键组成部分。对于给定数量
的输入数据,评分表中有
种组合。当输入数据集数量众多时,建立评分表可能会非常费力且耗时。
本研究通过开发一种基于耕地产品一致性的新的分层优化协同方法(HOSA),改进和简化了上述方法。该方法包括确定最佳一致性水平和识别最佳数据集组合。HOSA 通过融合五个耕地数据集(GlobeLand30、CCI-LC、GlobCover 2009、MODIS C5 和 MODIS 耕地)以及耕地面积统计,测试了创建 2010 年左右中国的协同耕地地图。
2. 数据与方法
2.1. 数据来源
本研究的主要输入是遥感获取的全球耕地数据集、耕地采样点和耕地面积统计数据。选择了五个耕地数据集,即 GlobeLand30、CCI-LC、GlobCover 2009、MODIS C5 和 MODIS Cropland,这些数据集是通过不同的国家或国际倡议开发的,以创建大约某年的中国耕地协同地图。
2010 年。在空间分辨率、数据来源、时间覆盖、方法和准确性方面,它们之间存在一些显著差异(表 1 和表 2)。GlobeLand30 是使用来自 Landsat 和中国 HJ-1 的 30 米空间分辨率影像生成的,采用基于像素-对象-知识(POK)的分类方法生成[13]。CCI-LC 是由欧洲航天局(ESA)主导的气候变化倡议的土地覆盖项目生成的。使用 2008 年至 2012 年的 MERIS(中分辨率成像光谱仪)时间序列数据开发了 300 米空间分辨率的 CCI-LC 地图。CCI-LC 在无监督分类链的基础上,增加了机器学习分类以提高准确性[32]。GlobCover 2009 由 ESA 和鲁汶天主教大学(UCL)实施,主要基于 MERIS 细分辨率(FR)时间序列数据的无监督和监督聚类,空间分辨率为 300 米[12]。MODIS C5 由波士顿大学制作,空间分辨率为 500 米。 决策树是基于 MODIS 1-7 波段的光谱和时间特征以及增强植被指数实现的,使用贝叶斯规则调整类条件概率[11]。MODIS 耕地范围图基于 2000 年至 2008 年的 250 米 MODIS 数据。利用多年 MODIS 指标,应用决策树计算耕地的概率。然后,根据耕地面积统计设置阈值以确定耕地范围[33]。尽管这些耕地图在时间覆盖上存在轻微差异(表 1),但由于输入数据集之间的不一致性远大于时间差异,因此对 2010 年的最终融合图影响较小。
表 1. 五个耕地数据集的特征。
数据集 |
空间分辨率 |
传感器 |
纪元 |
分类方法 |
全球土地 30 |
30 米 |
Landsat TM/HJ-1 |
2010 |
POK |
CCI-LC |
300 米 |
MERIS |
|
|
GlobCover 2009 |
300 米 |
MERIS |
2009 |
|
MODIS C5 |
500 米 |
MODIS |
2010 |
决策树分类 |
MODIS 农田 |
250 米 |
MODIS |
|
决策树分类 |
表 2. 耕地定义和百分比确定。
数据集 |
耕地的定义 |
|
|
全球土地 30 |
耕地 |
|
|
CCI-LC |
雨养农田 |
|
|
草本覆盖 |
— |
|
树木或灌木覆盖 |
|
|
耕地,灌溉或洪水后 |
|
|
马赛克农田 (
)/自然植被(树,
灌木,草本覆盖) (
)
|
|
|
马赛克自然植被(树木、灌木、草本植物)
封面)
/耕地 (
)
|
|
|
GlobCover 2009 |
洪水后或灌溉农田(或水生) |
|
|
雨养农田 |
|
|
马赛克农田(50-70%)/植被(20-50%) |
|
|
马赛克植被(50-70%)/农田(20-50%) |
|
|
MODIS C5 |
耕地 |
83.3% |
|
农田/自然植被马赛克 |
|
|
MODIS 农田 |
耕地 |
— |
|
耕地采样点用于评估现有耕地数据集的准确性,并验证由清华大学提供的协同耕地地图。在清华大学的采样框架中,整个地球通过六边形方案使用 DGGRID 软件进行划分,然后在每个六边形中随机分配 10 个样本。采样点的土地覆盖类型通过高分辨率图像的视觉解译进行识别。尽管这种采样方法可以确保样本分布的均匀性和客观性,但中国的耕地样本总数仅为 443 个,数量不足以进行评估。因此,采用基于五个耕地制图产品一致性的分层随机抽样方法收集更多样本,土地覆盖类型通过谷歌地球图像的视觉解译确定。一般使用 2010 年或 2010 年左右的图像进行样本选择。当 2010 年左右的图像不可用时,谷歌地球的时间滑块被移动以搜索 2010 年前和 2010 年后的图像。这些图像被比较以确定样本的土地覆盖类型。 如果样本在 2010 年前后保持不变,则被视为采样点,否则将被移除。最终的耕地和非耕地样本数量分别为 2800 和 2851。大约一半的总采样点用于训练,以对五个耕地地图进行排名,其余用于验证,以评估新混合耕地地图的准确性(图 1)。2009 年基准年各省耕地面积的统计数据来自第二次全国土地调查。统计的耕地定义与联合国粮食及农业组织(FAO)使用的定义相似。这些统计数据是通过对航空照片进行视觉解读并辅以地面调查获得的耕地多边形估算的,面积不包括耕地的边界。
图 1. 训练和验证样本。
2.2. 数据处理
数据准备包括坐标转换、耕地定义的协调和空间分辨率的标准化。首先,所有五个耕地数据集都被重投影到地理经纬度坐标系统,使用 WGS84 基准,采用最近邻重采样。由于这些数据集在分类方案上存在差异(表 2),因此在数据融合之前有必要协调耕地定义。
根据联合国粮农组织的定义,包括可耕地和永久作物,作为标准。纯耕地类别通常具有更高的准确性,因此被赋予更高的百分比权重,而准确性较低的马赛克耕地类别则被赋予较低的权重,遵循相应分类方案的定义。例如,GlobCover 2009 包含四个耕地类别:两个纯耕地和两个混合耕地。被认为是
耕地的两个纯耕地类别是“洪水后或灌溉耕地”和“雨养耕地”。对于混合类别“马赛克耕地
/植被
”和“马赛克植被
/耕地
”,耕地的百分比根据所述比例进行分配。根据这些规则,土地覆盖产品被转换为其原始空间分辨率的耕地地图。在耕地定义统一后,所有这些数据集都被标准化为
的空间分辨率,平均耕地百分比几乎等于 500 米。
2.3. 方法论
HOSA 的总体原则是,现有农田数据集中一致性更高的像素更有可能是真正的农田像素。HOSA 生成协同农田地图有两个步骤。第一步是确定最佳一致性水平。第二步是识别最佳数据集组合。为了评估该方法的性能,协同农田地图与输入的农田数据集进行比较,使用空间位置和农田面积的准确性。
(1) 确定最佳一致性水平。一致性是将不同土地覆盖图结合以创建改进数据集的重要标准 [31]。因为耕地图之间的一致性越高,真实耕地的可能性就越大,因此最佳一致性水平是通过将耕地区域从高到低进行排名,然后将排名最高的像素分配为耕地,直到达到统计总面积。图 2 显示了使用五个现有产品确定最佳一致性水平的流程图。首先,对五个输入数据集进行叠加分析,生成一致性图和平均百分比图。一致性图中每个像素值范围从 0 到 5,表示标记该像素为耕地的耕地产品数量(图 2a)。然后,在每个像素中,耕地的百分比被平均以获得平均百分比图(图 2b)。对于地理纬度/经度坐标系统,球体上每个像素的面积从赤道到极点变小。因此,使用等面积投影来计算每个像素的投影面积(图 2c)。 其次,按照一致性水平从高到低对像素进行排名,并总结耕地面积,并与统计数据进行比较。
图 2. 确定最佳协议水平的流程图。(a) 协议图;(b) 平均百分比;(c) 像素面积;(d-f) 分别计算协议水平为 5、4 和 3 的耕地面积。
如图 2d 所示,整体耕地面积是通过将最高一致性像素面积乘以耕地百分比后相加而得出的。如果这样聚合的面积小于统计耕地面积,则会添加较低一致性区域的耕地面积(图 2e),直到该面积等于或略大于统计面积。通过这种方式,确定了最佳一致性水平。
(2) 确定最佳产品组合。最佳一致性水平指示参与制图的农田产品数量,但并不指明在协同中使用了哪些产品。通过建立一个评分表来识别产品组合,其中产品按准确性排名。使用图 1 中的训练样本,评估五种产品的准确性,采用误差矩阵。输入产品根据其整体准确性进行排名。准确性评估最高的产品被指定为产品#1,依次为产品#2、#3、#4 和#5。当最佳一致性水平为 3 时,有 10 种可能的组合(表 3)。使用排名较高的产品的组合得分更高。然后使用农田统计数据来识别适当的产品组合。首先选择得分最高的像素,并通过平均农田百分比乘以相应的像素面积来计算其农田面积。接着选择得分次高的像素并将其添加到之前的像素中。然后计算新的总面积。 此步骤重复进行,直到映射的耕地面积尽可能与统计面积匹配。然后,使用确定的产品组合创建协同耕地地图。
(3) 协同耕地图的评估。根据验证样本(图 1),使用误差矩阵
评估和比较了五个输入数据集和协同图的准确性。协同方法的目的之一是解决耕地图与统计数据之间的不一致。因此,计算了中国各省的协同图和五个耕地数据集的耕地面积,并使用以下质量指标与统计数据进行比较:相关系数(
,公式(1))、均方根误差(RMSE,公式(2))、绝对差(
,公式(3))和平均绝对相对差(
,公式(4))。
表 3. 最优一致性水平为 3 时产品组合的得分表。
得分 |
#1 |
#2 |
#3 |
#4 |
#5 |
10 |
1 |
1 |
1 |
0 |
0 |
9 |
1 |
1 |
0 |
1 |
0 |
8 |
1 |
0 |
1 |
1 |
0 |
7 |
0 |
1 |
1 |
1 |
0 |
6 |
1 |
1 |
0 |
0 |
1 |
5 |
1 |
0 |
1 |
0 |
1 |
4 |
0 |
1 |
1 |
1 |
1 |
3 |
1 |
0 |
0 |
1 |
1 |
2 |
0 |
1 |
1 |
1 |
|
1 |
0 |
0 |
|
1 |
|
其中
是由耕地数据集或协同图估算的省份
的耕地面积;
是作为参考的统计耕地面积;
和
分别是估算的耕地面积和统计耕地面积的平均值;
是省份的数量。
3. 结果与分析
3.1. 五个农田数据集的协议分析和准确性评估
图 3 显示了五个农田数据集的一致性和不一致性区域。值
代表像素的一致性。较高的值表示更高的一致性,即值为 5 表示五个数据集之间完全一致;值为 4 表示四个数据集将该像素分类为农田。为了简化分析,研究区域根据邻近省份分为六个区域,即中国的东北、北方、中部、南方、西北和西南部分(图 3)。在东北和北方的平原等大同质区域中显示出高度一致性,这些区域是主要的粮食生产区。从这些主要粮食生产区移动到农牧区时,一致性降低,而在牧区时最低。一致性指数,即每个区域一致性值的平均值,用于定量确定空间一致性(图 4)。北方地区的一致性指数最高(3.87),其次是中部和东北地区。 作为主要的粮食生产区域,耕地面积被 intensively 使用并且连续分布,因为地形均匀。相比之下,西北地区的协议指数最低。因为该地区以农牧区(如陕西和宁夏省)和牧区(如西藏和新疆省)为特征,耕地和牧场形成了广泛的马赛克,使得分类变得困难。由于 CCI-LC 和 GlobCover 2009 的分类系统包括耕地的马赛克类别,中国西北地区的空间一致性明显较低。
图 3. 中国六个地区五个输入数据集的空间一致性。
图 4. 六个地区协议指数的价值。
输入数据集的准确性对于构建评分表至关重要。图 5 展示了基于各地区训练样本的误差矩阵评估的整体准确性。在中国东北、中部和西南地区,GlobeLand30 分别达到了最高的整体准确性
和
。在中国南部和西北地区,MODIS C5 产生了最高的准确性
和
,而 GlobCover 2009 在中国北部的整体准确性为
,表现最佳。在五个数据集中,MODIS Cropland 在大多数地区的准确性较低。根据整体准确性,五个输入产品在每个省进行了排名,以构建相应的评分表。
图 5. 基于训练样本的各区域五个输入数据集的准确性评估。
3.2. HOSA 开发的耕地地图
协同处理以各省为操作单位进行。计算了五个输入数据集的平均耕地百分比。在图 6 中,蓝色区域表示较高的百分比,绿色区域表示较低的百分比。在同质区域,如平原和盆地,百分比较高,而异质区域的平均百分比较低,特别是在中国南方的丘陵和东南及东北地区的高原。对于每个省,耕地面积按一致性水平从高到低进行汇总,并与统计面积进行比较以确定
最佳一致性水平。图 7 显示了各省的最佳一致性水平。总体而言,从中国东部到西部,最佳一致性水平逐渐降低。具体而言,山东省作为主要粮食生产区,其一致性水平最高,为 5,这表明一致性 5 的耕地面积总和(图 3)可以分层统计。最佳一致性水平为 4 的省份包括沿东海岸和中国中北部平原的省份,如河南、湖北和江苏。在一些西部省份,最佳一致性水平降至 3。西藏、云南、宁夏和福建省的最佳一致性水平为 2。由于地形复杂和景观破碎,这些地区混合像素相当普遍,导致数据集之间的一致性较低。相比之下,台湾的一致性水平为 1,为最低水平。统计数据显示,台湾的耕地面积为 120 万公顷,而五个输入数据集中标记为耕地的像素总面积可以满足统计要求。
每个农田数据集的整体准确性在每个省份中进行了计算,并根据其整体准确性对农田数据集进行了排名。接下来,在每个省份建立了产品组合的评分表,并使用统计数据确定了输入数据集的最佳组合。从图 8a 所示的协同结果可以明显看出,高比例的农田主要位于平原和盆地(例如,渭河平原、黄淮海平原、东北平原、长江流域和四川盆地),而低比例则出现在高原和丘陵(例如,黄土高原、云贵高原、西藏高原和东南丘陵),这与实际情况相符。对于农田百分比图的每个像素,根据五个输入数据集的一致性值定义了置信水平。由于高的一致性值通常意味着高的解释质量,因此将 1 到 5 的值分别定义为最低、较低、中等、较高和最高置信度,农田置信度图可以详细表示协同结果的质量(图 8b)。
图 6. 五个输入数据集的平均耕地百分比。
图 7. 各省的最佳协议水平。
(a)
(b)
图 8. 基于五个耕地地图的协同结果:(a) 耕地百分比地图;(b) 耕地置信度地图。
3.3. 精度评估
协同图的准确性通过使用带有验证样本的误差矩阵进行评估(图 1)。耕地和非耕地样本的数量分别为 1422 和 1402。
分别。验证结果如表 4 所示,总体准确率为
,Kappa 系数为 0.57。耕地和非耕地的 commission 错误分别为
和
;耕地和非耕地的遗漏错误分别为
和
。
表 4. 协同图的验证结果。
|
|
验证样本 |
|
|
耕地 |
非农田 |
总和 |
委托错误 |
协同图 |
耕地 |
1111 |
311 |
1422 |
21.87% |
非农田 |
292 |
1110 |
1402 |
|
总和 |
1403 |
1421 |
2824 |
|
遗漏错误 |
|
|
|
|
协同图的准确性进一步与原始的五个农田数据集进行了比较。误差矩阵也被用来评估五个农田地图的准确性,使用的是与协同图相同的测试样本。不同地区输入数据集和协同结果的整体准确性如图 9 所示。协同图的整体准确性高于输入数据集。在五个农田数据集中,GlobeLand30 的整体准确性最高(
),其次是 MODIS C5(76.22%)和 CCI-LC(74.22%)。GlobCover 2009 和 MODIS Cropland 的准确性相对较低,分别为
和
。这一结论与杨等人的研究结果一致[36]。在区域层面上,除了华中和华北,协同图在大多数地区的整体准确性最高。这表明协同方法可以利用多个数据集建立更准确的混合地图。
图 9. 五个农田数据集和协同图的整体和区域准确性。
3.4. 与统计数据的比较
输入数据集的耕地面积和协同图的耕地面积通过质量指标
和
进行计算和比较。图 10 显示了各省统计的耕地面积与使用耕地数据集估算的耕地面积之间的关系。相比之下
通过这五个耕地数据集,我们可以看到协同图与统计数据的一致性最高,相关系数为 0.98,均方根误差(RMSE)最低为 388.82。在输入数据集中,GlobeLand30 的相关系数(0.96)和均方根误差(2040.32)均高于其他四个数据集,这可能是由于其更高的空间分辨率所致。CCI-LC 的数据点(图 10b)明显偏离 1:1 线,相关系数最低(0.02)且均方根误差最高(12164.72),尽管其整体准确性较高(图 9)。这可能是由于耕地的定义包括了一些马赛克类型(表 2)。
图 10. 来自统计数据的耕地面积散点图以及由 GlobeLand30(a);CCI-LC(b);GlobCover 2009(c);MODIS C5(d);MODIS 耕地(e)和协同图(f)估算的耕地面积散点图。
值描述了耕地图与统计数据之间耕地面积的绝对差异,
值反映了与统计数据相比的相对差异。如表 5 所示,协同图达到了最低的
和
值。
的正值表明,除了 MODIS 耕地外,大多数数据集高估了耕地面积,这主要是由于分类图像中的混合像素和马赛克耕地定义[19]。根据分析,显然协同结果与统计数据的一致性更好。因此,协同方法可以有效解决耕地图与统计数据之间的不一致问题。
表 5. 根据统计数据和五个数据集及协同图估算的耕地面积中
和
值的比较。
|
全球土地 30 |
CCI-LC |
GlobCover 2009 |
MODIS C5 |
MODIS 农田 |
协同地图 |
哈) |
1585.11 |
8342.77 |
2357.00 |
499.88 |
-1895.28 |
12.02 |
|
0.45 |
3.50 |
2.00 |
0.32 |
0.65 |
0.09 |
4. 讨论
在大面积高精度的农田制图中,尤其是以成本效益的方式,始终面临挑战。在这里,我们提出了一种新的协同方法 HOSA,旨在实现产品精度与可负担性之间的平衡。这种方法以其高效性和利用现有农田数据集之间的一致性进行制图的准确性而著称。我们测试了该方法以生成一个
中国的混合耕地地图,约 2010 年,空间分辨率为 500 米,使用了五个耕地数据集(GlobeLand30、CCI-LC、GlobCover 2009、MODIS C5 和 MODIS 耕地)以及次国家统计数据。准确性评估显示,协同地图的准确性高于这五个输入数据集,并且与耕地统计数据的一致性更好。这证实了协同方法可以提高空间准确性并增强与统计数据的一致性。
与其他协同方法相比,HOSA 简化了评分分配的方法 [28-31]。现有的方法建立了一个长且静态的表格来确定耕地和非耕地面积,对于五个输入数据集有 32 个评分,这既费力又耗时。相反,HOSA 首先确定了最佳一致性水平,然后在每个省建立了一个动态评分表。大多数省的最佳一致性水平范围从 2 到 4(图 7),评分表是根据一致性水平建立的,这大大减少了评分表的大小,提高了效率。
由于统计区域是通过对航空照片和地面调查的视觉解读获得的,HOSA 假设这些统计数据是农田的“真实”面积,因此这些统计数据与五个农田数据集结合使用,以在每个省分配等效面积。HOSA 的优势在于它可以将来自地面观察的经过验证的统计数据与图像的空间细节相结合。然而,五个输入农田数据集的低空间分辨率意味着混合像素是常见的,统计数据与农田数据集之间存在空间尺度的差距。与统计数据相比,遥感数据集通常会高估农田面积,因为存在混合像素和马赛克农田类别。如表 5 所示,GlobeLand 30、CCI-LC、GlobCover 2009 和 MODIS C5 估算的农田面积高于统计数据。为了解决这个问题,根据分类方案的定义(表 2),对农田数据集应用了百分比权重,并在 500 米网格内计算了农田的平均百分比,以进行分辨率标准化。 最后,生成了一张农田百分比地图,与传统的农田/非农田地图不同,并且与统计数据一致。确定农田类别百分比权重的方法超出了本研究的范围,但值得在未来进行研究,因为它可能会影响最终地图。
构建评分表对于识别数据集组合至关重要。由于农田产品在不同地区的准确性通常存在差异,因此评分表应具有动态性和区域特异性。因此,需要更多样本来评估相应地区的准确性。尽管有一些平台通过众包方法收集样本,例如 Geo-Wiki、Laco-Wiki 和 Collect Earth [37-39],但收集大量样本并评估其可靠性仍然是一项巨大的工作。因此,有必要探索对样本依赖性较小的替代准确性评估方法。在未来的工作中,我们计划使用统计数据作为参考,对输入数据集的准确性进行额外实验。
输入耕地数据集之间的协议是 HOSA 的基础。因为更高的一致性表明对协同结果的更高信心,所以耕地信心图(图 8b)可以被视为地图质量的空间显性指标。显然,在同质景观区域中,信心较高,而在异质景观区域中,信心较低。异质区域耕地数据集的有限准确性和相关不确定性限制了它们的应用[4]。对于这些区域,需要以更具信息性的方式提高准确性,以改善协同结果的质量。将使用 GWR 分析准确性的空间变化,并与信心图进行比较[40,41]。同时,异质区域需要更高分辨率和更准确的地图。
5. 结论
准确的耕地空间范围信息对多种应用非常重要。尽管有几种耕地产品,但它们之间的不一致性足够大,限制了它们的应用。HOSA 旨在基于耕地数据集和统计信息,以成本效益高的方式生成协同耕地地图。这种方法包括两个优化层次,即确定性。
最佳协议水平的确定和最佳数据集组合的确定,并且与传统的评分分配相比,可以简化数据集协同的过程。HOSA 被应用于生成基于五个耕地数据集和统计数据的中国耕地协同图,约在 2010 年。结果表明,协同图的准确性更高,与统计数据的一致性更好,优于原始数据集。因此,该方法可以进一步扩展到区域甚至全球范围的耕地制图。HOSA 还可以用于其他土地覆盖类型,如森林、草地和水域。未来,将收集更多输入产品以提高协同制图的准确性,特别是在异质景观区域,并将探索新的准确性评估方法,以减少对样本的依赖。
致谢:本研究得到了中国国家自然科学基金(41501483)、中国国家留学基金委员会(201603250008)以及由国际食品政策研究所主导的 CGIAR 政策、机构与市场研究项目(PIM)的资金支持。
作者贡献:M.L.、W.W. 和 L.Y. 提出了这个想法;M.L.、W.W.、L.Y.、P.Y. 和 H.T. 设计并构思了实验;M.L. 和 D.C. 进行了实验;M.L. 和 L.Z. 分析了数据;M.L.、W.W. 和 L.Y. 撰写了论文。
利益冲突:作者声明没有利益冲突。
参考文献
萨基尔,J. 农业中的全球挑战及世界银行在非洲的应对。食品能源安全。2014,3,61-68。[CrossRef]
戈德弗雷, H.C.; 克鲁特, I.R.; 哈达德, L.; 劳伦斯, D.; 穆尔, J.F.; 尼斯贝特, N.; 普雷蒂, J.; 罗宾逊, S.; 图尔敏, C.; 怀特利, R. 全球食品系统的未来. 哲学会报. 伦敦皇家学会 B 生物科学. 2010, 365, 2769-2777. [CrossRef] [PubMed]
Kearney, J. 食品消费趋势和驱动因素。哲学会报. R. Soc. Lond. B 生物科学. 2010, 365, 2793-2807. [CrossRef] [PubMed]
Bontemps, S.; Herold, M.; Kooistra, L.; van Groenestijn, A.; Hartley, A.; Arino, O.; Moreau, I.; Defourny, P. 重新审视土地覆盖观测,以满足气候建模社区的需求。生物地球科学 2012, 9, 2145-2157. [CrossRef]
杨, J.; 龚, P.; 傅, R.; 张, M.; 陈, J.; 梁, S.; 许, B.; 石, J.; 迪金森, R. 卫星遥感在气候变化研究中的作用. 自然气候变化. 2013, 3, 875-883. [CrossRef]
弗里茨, S.; 西, L.; 你, L.; 贾斯特斯, C.; 贝克-雷谢夫, I.; 比德克尔克, L.; 库马尼, R.; 德福尔尼, P.; 埃尔布, K.; 福莱, J.; 等. 需要改进全球农田地图. Eos Trans. AGU 2013, 94, 31-32. [CrossRef]
你, L.; Spoor, M.; Ulimwengu, J.; Zhang, S. 中国小麦、水稻和玉米生产的土地利用变化与环境压力. 中国经济评论 2011, 22, 461-473. [CrossRef]
洛夫兰, T.R.; 里德, B.C.; 布朗, J.F.; 奥伦, D.O.; 朱, Z.; 杨, L.; 梅切特, J.W. 基于 1 公里 AVHRR 数据的全球土地覆盖特征数据库和 IGBP DISCover 的开发. 国际遥感杂志. 2000, 21, 1303-1330. [CrossRef]
汉森, M.C.; 德弗里斯, R.S.; 唐申德, J.R.G.; 索尔伯格, R. 使用分类树方法进行 1 公里空间分辨率的全球土地覆盖分类. 国际遥感杂志 2000, 21, 1331-1364. [CrossRef]
巴索洛梅,E.;贝尔沃德,A.S. GLC2000:一种基于地球观测数据的全球土地覆盖制图新方法。国际遥感杂志 2005,26,1959-1977。[CrossRef]
弗里德尔, M.A.; 苏拉-梅纳谢, D.; 谭, B.; 施奈德, A.; 拉曼库提, N.; 西布利, A.; 拉曼库提, N.; 西布利, A.; 黄, X. MODIS 第 5 版全球土地覆盖:算法改进和新数据集的特征化. 遥感环境. 2010, 114, 168-182. [CrossRef]
Bontemps, S.; Defourny, P.; Bogaert, E.V.; Arino, O.; Kalogirou, V.; Perez, J.R. GLOBCOVER 2009. 产品描述和验证报告。在线获取:https://core.ac.uk/download/pdf/11773712.pdf(访问日期:2017 年 4 月 30 日)。
陈, J.; 金, C.; 廖, A.; 辛, C.; 陈, L.; 陈, X.; 何, C.; 韩, G.; 彭, S.; 陆, M.; 等. 全球土地覆盖制图,分辨率为 30 米:一种基于 POK 的操作方法. ISPRS 摄影测量与遥感杂志 2015, 103, 7-27. [CrossRef]