这是用户在 2024-9-5 21:20 为 https://app.immersivetranslate.com/pdf-pro/e17cf24a-68ca-461f-8027-0c395c5ffa38 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?
2024_09_05_c7ed9b2f463bf149082bg

 科学数据

 打开

 数据描述符


验证和完善


西南地区的农田地图


通过利用十个当代数据集的中国


崔义峰 , 董金伟 , 张超 , 杨吉林 , 陈娜 , 郭鹏 , 袁媛 , 陈梦溪 , 艾文 & 刘荣高

准确的耕地地图是有效农业监测的基石。尽管遥感耕地地图不断丰富,但普遍存在的不一致性阻碍了它们的进一步应用。这个问题在观测数据有限的地区尤为明显,例如中国西南地区,该地区地形复杂,地块破碎。在本研究中,我们构建了独立于数据生产者的多源样本,利用开源验证数据集和抽样来纠正中国西南地区十个现代耕地地图的准确性,解码它们的不一致性,并通过利用 2021 年及以后发布的十个最先进的遥感耕地地图,采用自适应阈值方法生成了一个精细化的耕地地图(Cropland )。在地级和县级进行的验证强调了精细化耕地地图的优越性,与国家土地调查数据更为一致。精细化耕地地图和样本对用户公开可用。 我们的研究通过提供高质量的农田地图和验证数据集,为改善监测不足地区的农业实践和土地管理提供了宝贵的见解。

 背景与摘要


农田为人类提供食物,维持地球上的生命。由于仍有十亿人面临饥饿,农田在满足全球日益增长的未来食品安全和可持续性需求方面发挥着不可替代的作用。此外,农田可能对生态系统产生重大影响。例如,农业集约化和扩张的过程可能侵占保护区或森林,导致物种栖息地的破坏和灭绝,或影响陆地碳循环的过程。同时,后农业景观(以农田废弃为代表)在气候变化的背景下持续影响土壤有机碳的固存。因此,联合国 2030 可持续发展目标(SDGs)呼吁国家合作和政策,以改善食品安全(SDG 2)、保护生态系统(SDG 15)和应对气候变化(SDG 13)。在这方面,及时、准确和经济的时空农田数据集是实现这些目标的基础。

卫星数据与时空一致的地球观测(EO)使得农业监测从区域到全球范围成为可能。在过去的四十年中,多个研究团队提供了数百种方法来生成全球土地覆盖数据集,其中大多数包括农田类别。随着时间的推移,最显著的进展是空间分辨率的提高。在 2010 年代,基于 EO 的土地利用产品的空间分辨率经历了从粗糙到中等水平的重大转变。


中国科学院地理科学与资源研究所,北京,100101,中国。 中国科学院大学,北京,100049,中国。 麻省理工学院土木与环境工程系,剑桥,MA,02139,美国。 新加坡国立大学土木与环境工程系,新加坡,117576,新加坡。 中国农业大学草地科学与技术学院,北京,100193,中国。 北京大学地球与空间科学学院遥感与地理信息系统研究所,北京,100871,中国。 诺丁汉大学宁波中国校区科学与工程学院,宁波,315100,中国。 四川农业大学资源学院,成都,611130,中国。 -mail: dongjw@igsnrr.ac.cn; liurg@igsnrr.ac.cn

图 1 中国西南地区的位置。右侧放大的图中覆盖的耕地层来源于 MCD12Q1 版本 06, 可在 https://lpdaac.usgs.gov/products/mcd12q1v006/ 获取。


达到 30 米,利用美国地质调查局(USGS)可自由访问的 Landsat 档案 。随后,随着更高空间分辨率卫星传感器(即高分 、哨兵 、PlanetScope )的相继发射,以及云计算数据处理技术的进步,如谷歌地球引擎(GEE) 和机器学习算法的迭代 ,在 或更高空间分辨率水平上进行更详细的景观尺度农田制图变得可能。在这种背景下,多个研究团队自 以来推出了特定于农田的数据集和各种土地利用与土地覆盖(LULC)产品,空间分辨率达到 或更高。然而,不同数据集中农田的数量和空间范围的描绘存在相当大的差异,空间分辨率从数百米锐化到仅数十米,因为在低分辨率下可以忽略的一些因素在高分辨率下会成为主要信号 。 更不用说普遍存在的标准不一致、数据来源和分类方法的差异,以及缺乏对这些地图的独立定量评估,这些都带来了挑战。尤其是在观察有限的地区进行农业监测时,如中国西南部的高地形起伏、碎片化的地块和脆弱的生态环境,这限制了现有数据集的深入应用。

先前的研究表明,全球范围内在 2020 年发布的三种新的土地利用/土地覆盖(LULC)数据集之间存在显著的不一致,包括 ESA WorldCover、ESRI 的土地覆盖和 Google 动态世界 。在子全球尺度上,也有关于多类土地覆盖产品 或专题地图 一致性评估的报告案例,指向上述问题。例如,发现五个广泛使用的非洲耕地数据集之间的不一致百分比超过 。Gao 等人 在欧洲的评估显示,三种 LULC 地图中耕地和森林类别的一致性和准确性较高,但在山区的一致性较低。这些研究共同表明,全球精度并不一定意味着在区域层面上更好地展示地方表现 。在中国对七个全球土地覆盖数据集的森林评估以及六个耕地地图的评估中也报告了类似的情况 ,以及对大约 六个耕地数据集的准确性量化。 这些研究基于 2020 年或更早更新的数据集,进行了国家、省级及其他规模的行政评估工作,这些数据集的空间分辨率等于或比 30 米粗。自 2020 年以来,发布了十多个新的、持续更新的数据集,涵盖耕地类别,提供了前所未有的高分辨率遥感细节。然而,这些新发布的数据集的一致性和准确性尚未得到独立评估和比较,特别是在复杂地形和碎片化地块中,耕地制图历来更具挑战性。

在这里,我们首先通过整合来自公开可用数据集的验证样本以及分层随机抽样构建了一个验证数据集,并生成了一张一致性图,以量化中国西南地区十个现有耕地数据集的空间模式,然后呈现了一个经过优化的耕地分布数据集,具有 空间分辨率 耕地 。本研究详细介绍了生产。

GLAD_2019
 全球陆地 30

图 2 本研究中的农田地图示意图。十个现有的农田地图( )和两个经过阈值 精细化的地图。所有这十二张地图的空间分辨率为


这些数据集的处理过程,包括对现有耕地地图的准确性修正、解码不一致性以及生成精细化地图。我们的研究为理解不同耕地地图的不一致性提供了清晰的视角,并生成了一个数据驱动的精细化地图,以更好地获取中国西南地区的空间范围和耕地面积。

 方法


研究区域。研究区域位于中国西南部,地理坐标范围从 ,从 (图 1)。该区域包括四个省级行政单位:重庆、四川、贵州和云南。该地区以丰富的自然资源和多样的生态系统类型为特征,拥有碎片化的地块和多样的地形,包括平原、盆地、丘陵和山脉 。研究区域还居住着约 2 亿人,是中国最重要的农业生产区之一。该地区的农田主要位于气候潮湿多云的盆地和平原,如四川盆地和云南-贵州高原。农田也在平坦的坝和河谷中耕作,四川盆地被誉为“天府之国的粮仓”(图 1)。鉴于地形的多样性和人地冲突的加剧,准确的农田地图在确保中国西南部农田的可持续管理中具有极其重要的意义

耕地地图。十幅当代耕地覆盖/使用地图。在本研究中,我们分析了 之后发布的十幅最新耕地地图,以生成精细化的耕地地图。这些地图是最近三年(2021-2023)发布的全球或地方尺度的耕地专题或土地利用/覆盖(LULC)地图。表 S1 总结了。

图 3 中国西南地区验证样本的空间分布。
 子区域  样本来源  摘要
 管理代码 GFSAD AGLC  BU 一瞥

分层随机抽样
 耕地  非耕地  总和
 重庆 500000 161 135 41 889 176 1050 1226
 四川 510000 735 517 2005 5569 962 7864 8826
 贵州 520000 368 285 43 1078 313 1461 1774
 云南 530000 427 359 298 2955 571 3468 4039
 中国西南部 1691 1296 2387 10491 2022 13843 15865

表 1. 西南地区精度校正所用样本的组成。


这些地图的一般元数据涵盖了不同的地理范围和各种空间分辨率。这些农田地图的可获取性在数据记录中得以体现。


中土 LC1 中土 LC1 是中国首个国家级土地覆盖图,空间分辨率接近 。它是通过使用低成本的基于深度学习的框架和开放获取的数据(包括全球土地覆盖(GLC)产品、开放街图(OSM)和谷歌地球影像)建立的。该数据集包含 11 种土地覆盖类型,其中耕地被标记为 5。由于谷歌地球在中国的数据更新和覆盖问题,中土 LC1 的制作者使用插值方法填补数据空白。

ESA WorldCover。由欧洲航天局(ESA)制作的 WorldCover 产品提供了基于 Sentinel-1 和 Sentinel-2 卫星数据的 2020 年全球土地覆盖图的免费访问 。WorldCover 产品包含与联合国粮农组织(UN-FAO)土地覆盖分类系统对齐的十一种土地覆盖类别,并经过独立验证,全球整体准确率约为

ESRI 土地覆盖。ESRI 土地覆盖数据集是 2020 年的全球土地利用/土地覆盖(LULC)地图,基于 ESA Sentinel-2 影像,分辨率为 。它是 2020 年十个类别的 LULC 预测的综合(其中农田定义为人类种植/规划的谷物、草类和未达到树高的作物;例如:玉米、小麦、大豆、休耕的结构化土地)。ESRI 土地覆盖数据集是通过深度学习模型生成的(使用六个波段的 Sentinel-2 表面反射率(SR)数据:可见光蓝、绿、红、近红外和两个短波红外波段),并使用超过 50 亿个手动标记的 Sentinel-2 像素进行训练,这些像素来自全球超过 20,000 个地点的采样。该数据集在全球验证中实现了 的总体准确率。

动态世界。动态世界是一个近实时的 10 米全球土地利用/土地覆盖(LULC)数据集,通过对 2015 年至今的 Sentinel-2 Level1C 遥感数据进行深度学习生成,免费提供通过 Google Earth Engine,并且开放许可 。这是谷歌与世界资源研究所合作的结果,旨在生成地球表面物质的动态数据集。动态世界具有三个特征:近实时、每像素在九个土地覆盖类别中的概率以及 分辨率。


开源耕地地图


多来源验证样本

 我在一瞥
 IV 随机抽样
П GFSAD
III AGLC


自适应阈值精细化


优化的精细地图阈值

图 4 研究流程图。

动态世界每天生成超过 5000 张图像,并通过利用基于哨兵-2 大气顶层的新型深度学习方法,因此可以每 2-5 天更新全球土地覆盖数据(具体的重访周期取决于其在地球上的位置)。在本研究中评估了 2020 年的年度农田地图,采用了地球引擎中的多数复合方法对动态世界数据集进行了数据预处理,以生成年度复合农田地图。

CRLC。CRLC 是跨分辨率国家级土地覆盖 框架的名称。本研究使用 CRLC 来表示 分辨率的土地覆盖图。该图是基于 Sentinel-2 影像和 历史产品(GlobeLand30-2010)使用 CRLC 框架完成的,提供了快速高效地全球更新产品的可能性。该数据集涵盖八种土地覆盖类型,结果显示,估计的耕地用户精度为 ,估计的生产者精度为 ,估计面积为

全球土地 30。全球土地 30 由中国国家测绘地理信息局(NGCC)开发,具有 30 米的空间分辨率,提供 10 年间隔(2000/2010/2020)的多时相土地覆盖影像 。数据来源于多光谱影像,包括 Landsat TM 和 ETM+ 多光谱影像。全球土地 30 包含十种土地覆盖类型,该数据的总体精度为 ,在中国的总体精度为 。它于 2014 年首次发布,供开放访问和非商业利用,2020 版本于 2021 年更新。

CLCD。中国土地覆盖数据集(CLCD)是一个基于 Landsat 的年度数据集,处理于 Google Earth Engine 平台。它包含 1990 年至 2022 年中国的年度土地覆盖数据,空间分辨率为 。在处理过程中,使用 335,709 幅 Landsat 影像构建了多个时间指标,并输入随机森林分类器以获得分类结果。根据数据生产者的 5,463 个视觉解释样本,CLCD 的整体准确率达到了

GLC_FCS30。全球土地覆盖产品与精细分类系统(GLC_FCS30)2020 版提供了全球精细分类的土地覆盖产品,空间分辨率为 ,使用 Landsat 时间序列影像 。GLC_FCS30 提供了 1985 年至 2020 年的时间序列数据集,间隔为 5 年,并利用了来自 Google Earth Engine 平台的连续 Landsat 影像。特别是,GLC_FCS30 2020 基于 2015 版产品,通过结合多源辅助数据集(例如,2019-2020 年 Landsat SR 数据、Sentinel-1 SAR 数据、DEM 地形高程数据、全球主题辅助数据集)和先验知识进行了优化。
A.


图 5 中国西南地区十个现有耕地地图的一致性图(A)及四个省级统计数据(B)。


来自专家(例如,新的 GLC_FCS30 2020 产品在农田分类性能上相比其前身 GLC_FCS30 2015 有了进一步的提升)。

GLAD。本文中使用的 GLAD 是全球耕地扩展的缩写,来源于全球土地分析与发现团队制作的 世纪数据集,该数据集代表了 2000 年至 年间以 像素空间分辨率的全球一致耕地范围时间序列。耕地制图使用了一致处理的 Landsat 卫星数据,时间间隔为四年(2000-2003、2004-2007、2008-2011、2012-2015 和 2016-2019) 。每个时期的耕地层以产品周期的最后一年命名(共五张地图,分别为 2003 年、2007 年、2011 年、2015 年和 2019 年)。使用四年的较长时间间隔(而不是单一年)可以增加时间序列中可用的卫星影像数据。另一方面,在该数据集中,耕地类别的休耕期限制为四年(在每个四年间隔内,如果在这些年份中的任何一年检测到生长作物,则将该区域映射为耕地),这可以提高土地表面物候的代表性和耕地检测的准确性。由于缺乏 2019-2023 年的最新版本,研究中使用了 2019 年的版本。

图 6 从精细地图得出的耕地面积及阈值下指标的表现。红线和蓝线分别代表 F1 分数和 MCC。

CACD。中国年度耕地数据集(CACD)是一个 的中国年度耕地数据集,涵盖 1986 年至 。该数据集利用了 1986 年至 2021 年间所有可用的 Landsat TM/ETM+/OLI 一级 SR 影像,空间分辨率为 。该数据集中年度耕地的定义为一块最小面积为 0.09 公顷(最小宽度为 30 米)的土地,在播种或种植日期后的 12 个月内至少播种/种植并可收获一次。该数据集的生产采用了自动化训练样本生成、随机森林监督分类和 LandTrendr 时间分割算法,基于 Google Earth Engine 平台,实现了成本效益高的细分辨率动态耕地识别监测。

生成二元耕地地图。根据每个数据集中耕地的定义(表 S1),首先从 GEE 中相应的土地利用/覆盖(LULC)地图中提取二元耕地地图,然后按西南中国的边界进行裁剪。研究中使用的所有耕地数据集均转换为阿尔伯斯等面积圆锥投影坐标系统(PCS),以便于面积计算和比较。所有地图均使用最近邻方法重采样至 分辨率,并在 Python 环境中通过 ArcPy 模块批量处理。经过这些预处理步骤后,生成的二元地图中,耕地的像素值为 1,非耕地的像素值为 0(图 2)。

基于独立样本集的准确性评估。生成与地图制作者独立的真实样本。参考样本的质量对于准确评估至关重要,特别是在全球准确性被认为在地方准确性上表现不佳的情况下 。从多源样本池中提取的真实参考样本被构建,以纠正中国西南地区十个农田地图的区域准确性。样本集包含 15,865 个真实样本(农田 2,022 个,非农田 13,843 个),具有三个属性:地质位置的经纬度坐标,以及附加到每个项目的农田标签(代码:1)和非农田标签(代码:0)(图 3)。

构建参考样本集整合了来自公共可访问库的现有样本和来自分层抽样辅助实地调查的额外样本 。第一部分来自全球粮食安全支持分析数据(GFSAD) 、年度全球土地覆盖(AGLC) 和全球土地覆盖估算(GLanCE) 的西南中国子集,分别有 1,691、1,296 和 2,387 个样本。这些样本在西南中国随机分布。在第二部分,我们进行了分层随机抽样,分层依据是耕地一致性图的比例。我们在最大耕地范围内生成了总共 10,491 个样本点,以增加样本的密度。最终,15,865 个地面真实单位被合成并分布在西南中国(在潜在耕地范围内和外)(表 1)。然后,它们使用 2020 年左右的谷歌超高分辨率(VHR)图像进行了交叉验证,由两位经过培训的高级专家分别审核,以确保参考集的稳定性和代表性。

准确性指标。该研究在不同尺度上实施了指标,以展示每个省级单位和整个西南中国的准确性。西南中国不同耕地地图的准确性评估是一个二元分类场景中的精度评估问题。这里使用了五个常用的指标来评估机器学习和二元遥感分类的性能:用户准确率(称为精度)、生产者准确率(称为召回率或敏感性)、F1 分数、总体准确率,以及马修斯相关系数(MCC)。MCC 包括真正例(TP)、真负例(TN)、假正例(FP)和假负例(FN),通常被视为一个平衡指标。即使在两个类别的样本大小存在显著差异时,它仍然适用。只有当预测在混淆矩阵的四个类别(TP、TN、FN 和 FP)中都取得令人满意的结果时,才会产生高分。根据 Chicco 和 Jurman 的研究,MCC 产生了


%

图 7 西南中国八个地点的耕地面积比较。上述地点(a-j)的具体位置可以在图 5 中找到。数字高程模型(DEM)生成的阴影被叠加到每个耕地地图上,以展示每个地点的地形,阴影的透明度在精细地图列中特别明显。最后一列的精细地图来源于 threshold_05,也称为耕地
 阈值 OA PA UA OE CE  F1-分数  映射区域 MCC
 阈值_01 0.724 0.961 0.311 0.039 0.689 0.470 4796.66 0.444
 阈值_02 0.821 0.914 0.409 0.086 0.591 0.565 3546.09 0.533
 阈值_03 0.860 0.851 0.472 0.149 0.528 0.607 2886.52 0.564
 阈值_04 0.889 0.790 0.544 0.210 0.456 0.644 2370.82 0.595
 阈值_05 0.910 0.698 0.632 0.302 0.368 0.663 1848.92 0.612
 阈值_06 0.922 0.571 0.758 0.429 0.242 0.651 1265.37 0.616
 阈值_07 0.916 0.430 0.829 0.570 0.171 0.566 824.05 0.560
 阈值_08 0.905 0.296 0.885 0.704 0.115 0.443 503.41 0.479
 阈值_09 0.891 0.158 0.920 0.842 0.080 0.270 259.73 0.356
 阈值_10 0.880 0.062 0.933 0.938 0.067 0.116 88.11 0.223

表 2. 通过阈值精炼地图的性能。OE 和 CE 分别是通过 1 减去 PA 和 UA 计算的遗漏和误报错误。耕地面积和与土地调查的偏差单位为万公顷。


更可靠的统计率,这使得得分较高,特别是在二元分类及其混淆矩阵中。我们还使用 Olofsson 等人提出的方法调整了准确性。

公式如下:

图 8 西南中国研究中使用的农田地图的混淆矩阵。

TP(真正例)和 TN(真负例)代表被正确映射的耕地/非耕地样本;而 FP(假正例)和 FN(假负例)则分别代表被错误映射到其他类别的耕地/非耕地样本。

精细耕地图的生成。我们对现有的十个耕地图进行了协调,并通过自调整阈值方法生成了精细耕地图(图 4)。具体而言,我们生成了一张投票图,其中每个像素表示在十个不同耕地图中被标记为耕地的频率(图 5)。对于未被任何数据集识别为耕地的像素(投票图上的灰色区域),频率值的最小值为 1,最大值为 10。我们将频率从小到大排序,使用 1 到 10 的 10 个数字作为阈值,然后提取相应阈值下的耕地范围。例如,阈值为 1 表示只有十个数据集中的一个被认为是耕地。

所有十个数据集都是农田,在这种情况下,生成的农田地图被称为地图阈值_10。通过提取

合成了十个数据集的一致性。此外,计算了从不同阈值的精细地图中得出的单个耕地地图的耕地面积、总体准确率和 F1 分数,并绘制了直方图。

根据 F1 分数最高且与 TNLS 统计数据映射区域之间的偏差最低的原则,通过相应的频率阈值生成的最佳耕地图(地图 )被确定为精细耕地图。指标性能如图 6 所示。

图 9 中国西南地区农田地图的委托和遗漏样本。

耕地面积在多个尺度上的比较。基于面积的比较。在本研究中,从十个耕地数据集中得出的耕地面积在三个行政级别上进行了计算:整个西南中国、省级和区级。行政边界文件来自中国科学院资源与环境科学数据中心(https://www.resdc.cn/)。然后,这些数据与第三次全国土地调查(TNLS)的普查数据进行了比较(https://gtdc.mnr.gov.cn)。值得注意的是,由于重庆作为中央政府直接管辖的市(相当于省级行政单位)的特殊行政组织设置,其管辖下的区级行政实体(例如,重庆的万州区)被视为与其他省的地级市进行比较的地级市。包括 和两个指标,

图 10 来源于西南中国研究中使用的耕地地图的耕地面积。与 X 轴平行的红色参考虚线表示第三次全国土地调查(TNLS)的总耕地面积。在 Y 轴方向上距离虚线越近,表示该数据集与 TNLS 耕地面积越接近。

均方根误差(RMSE)用于衡量映射区域与统计数据之间的相关性,公式如下所示。

其中 分别表示 TNLS 区域和 TNLS 的平均值, 表示映射区域, 则表示行政单位的数量。

空间范围比较。中国西南地区的耕地空间分布是不均匀的,这意味着整体面积的一致性并不一定导致空间上的一致性。为了比较不同数据集在空间细节上的表现,本研究进行了逐像素比较,并为十个耕地产品生成了投票图。标记为耕地的像素频率被计算并以从 1 到 10 的投票数表示,1 表示差,10 表示好,以反映一致性。未被任何数据集标记为耕地的像素不予考虑,并标记为零。

此外,本研究选择了分布在中国西南部的八个地点(放大视图见图 7),以展示耕地地图的空间细节。这八个地点涵盖了平原、丘陵、山脉、河谷和其他典型的西南中国景观,以证明精细化地图更好地描绘了耕地的范围。

 数据记录


根据本文的方法生成的精细耕地图被命名为耕地 ,取决于表 2 中呈现的最佳阈值。具体而言,threshold_05 具有最高的 F1 分数,并且与统计数据更一致,但其总体精度(OA)略低于总体精度更高的 threshold_06。基于 threshold_05 的耕地 显著改善了耕地映射的面积和范围。

不一致的投票地图和精细耕地地图以 GeoTIFF 格式提供,采用阿尔伯斯圆锥等面积投影坐标系统,分辨率为 ,以及其附加的.ovr 格式金字塔文件可从 figshare 存储库 获取。所有栅格数据可以在脚本工具(如 rasterio、gdal、cartopy 等)和支持.tif 格式文件的软件中加载和编辑,例如 ESRI ArcGIS (https://www.esri.com/) 和 QGIS (https://qgis.org/)。

西南中国的耕地/非耕地样本以 ESRI shapefile 格式也已在仓库中共享。属性表中有五个字段;除了经纬度坐标外,土地字段的值为 0 和 10,分别代表非耕地和耕地样本。来源字段提供样本点的来源。应用于西南中国的阿尔伯斯圆锥等面积投影坐标系统文件以“.pry”格式结尾,也已上传到仓库,供 ESRI ArcGIS 中的数据用户重复使用,无需自定义。

 技术验证


使用了两种方法来验证结果地图,包括样本辅助的精度评估和与现有的十个农田地图的交叉比较。

全国土地调查的耕地面积 ( )


图 11 映射区域与 TNLS 耕地面积的地级市比较。图中的红点代表重庆市的数据,由于其特殊的行政级别,该数据已被排除在比较之外。

农田地图的准确性评估。为了定量表征现有十个农田地图和精细化地图在多行政区划尺度上的准确性,我们使用之前构建的样本数据集在中国西南地区及不同省级行政区划尺度上对它们进行了验证。

结果显示,基于投票图阈值的 精细耕地图(其中 threshold_ 05 被重命名为数据记录中的耕地 )在省级行政区域的准确性排名最高(总体准确率通常高于 0.80)。

全国土地调查的耕地面积 ( )


图 12 映射区域与 TNLS 的农田面积之间的县级比较。


关于中国西南地区的整体准确性、F1 分数和 MCC 值(图 8 和表 S2)。这也得到了图 9 中基于样本的误差分布的支持。它的表现超过了大多数现有的十个产品(尤其是所有五个具有相同 空间分辨率的数据集,这些数据集的准确性甚至低于平均水平)。它仅被 WorldCover 超越,后者的空间分辨率为 10 米。

与现有耕地地图和土地调查数据的比较。图 2 显示了中国西南地区 12 个耕地地图的空间分布。为了避免因空间分辨率造成的视觉效果差异,采用最近邻方法对空间分辨率为 10 米或 1 米的耕地地图进行了重采样至 30 米。总体而言,基于阈值_05 的精细耕地地图改善了耕地的高估问题。


现有 数据的区域(主要由于误分类错误)以及对 数据中农田的低估(主要由于遗漏错误)。具体来说,这在图 7 中展示的八个地点的空间范围比较中得到了证实。对于平原地区(图 7 中的 ,i),优化后的农田地图提供了与实际分布更一致的农田映射。在丘陵地区(图 7 中的 b、f、h),其他 农田地图的误分类可以得到显著改善。

每个农田地图的映射区域进一步与 TNLS 在不同行政级别的统计数据进行了比较,TNLS 被认为是中国土地面积数据最精确的来源 。一般来说,空间分辨率较高的农田地图 往往低估了中国地区的农田面积,与 TNLS 发布的面积相比(图 10 中的红色虚线)。相反,30 米的农田地图往往高估了农田面积。然而, CRLC 和 30 米 GLAD 与其他相同空间分辨率的农田地图相比,显示出相反的趋势。阈值 5 和 6 的精细地图与图中的红线之间的差距要小得多,显著优于其他九个现有的农田地图,除了世界覆盖图,且与世界覆盖图的差异极小。此外,12 个农田地图的面积分别在地级(图 11)和县级(图 12)进行了比较。 精细耕地地图的散点比现有地图的高估和低估更集中地分布在 1:1 线上。这表明,精细地图减少了高分辨率地图的遗漏误差和低分辨率地图的虚假误差,接近于 NLSD 在耕地面积方面的准确性。

不确定性分析。数据集中可能存在几种不确定性。首先,在生成投票图时,标记为非农田且像素值为零的像素可能是由于相应农田产品中的遗漏错误造成的。例如,使用阈值法精细化的农田图可能由于图 7(j)中某些山区的遗漏错误而失去一部分准确性。因此,可能存在一些真正的农田未被任何数据集识别为农田,进一步导致精细化农田图中的遗漏错误。在未来的工作中,根据投票图在不一致性高的区域添加训练样本,以提高在农田映射困难区域(即图 5 中的丘陵和山区)的准确性,是一个可能的解决方案

其次,本研究进行了重采样,以协调十个可用耕地数据产品的空间分辨率,这在一定程度上削弱了 空间分辨率数据集描绘耕地细节的能力(见数据预处理)。尽管在土地覆盖类型多样且地块破碎的区域进行耕地制图本质上是困难的,但本研究所产生的精细地图仍在准确性和耕地面积方面提供了更显著的改进(图 7 和图 8)。本研究还展示了在开放源耕地地图日益丰富的时代,从现有数据生成优化新数据的可行性 。为了进一步改善数据融合,可以通过基于地理细分和数据驱动算法优化和整合数据集来生成更高精度的耕地地图

第三,该研究分析了自 2021 年以来发布的十张耕地地图。然而,仅考虑了 2020 年进行比较。这些地图(包括世界覆盖、ESRI 土地覆盖、动态世界、CLCD、GLC_FCS 30、CACD 和 GLAD)大多能够反映长期耕地动态 。因此,接下来的工作可以集中在优化时间序列耕地地图,并使用时间序列验证样本集,以更好地满足动态耕地监测的需求。

 使用说明


耕地地图在指导农业土地管理中发挥着不可或缺的作用。然而,在开放数据不断丰富的时代,数据集之间的不一致性阻碍了我们对农业土地系统过程、模式及其对人为干扰反应的理解。与现有的十个耕地数据集相比,我们的数据驱动精细地图(CroplandSyn)与官方土地调查数据的一致性更高,准确性更强。此外,本研究共享的样本集有助于对中国西南地区耕地地图的质量评估和持续改进。

 代码可用性


用于生成农田地图和准确性评估指标的地球引擎库的 JavaScript 代码已在 figshare 库中共享并可用。还提供了用于栅格金字塔构建的 Python 代码。

本研究中使用的软件和模块包括 Origin 2023b、ArcGIS Pro 3.1、Python 3.7、gma 1.1.5 和 ArcPy 3.1。

非常高空间分辨率(VHR)的谷歌地球图像可以通过 ArcGIS 网络地图切片服务(WTMS)访问。

收到:2023 年 9 月 13 日;接受:2024 年 6 月 12 日;


在线发布:2024 年 6 月 22 日

 参考文献


  1. 福利,J. A. 等。为耕作的星球提供解决方案。《自然》478, 337-342 (2011)。

  2. 福利,J. A. 等. 土地利用的全球后果. 科学 309, 570-574 (2005).

  3. 扎贝尔,F. 等. 未来耕地扩张和集约化对农业市场和生物多样性的全球影响. 自然通讯 10, 2844 (2019).

  4. 孟, Z. 等. 2020 年后生物多样性框架受到保护区内农田扩张的挑战. 自然可持续性, 1-11 (2023).