这是用户在 2024-9-9 10:34 为 https://app.immersivetranslate.com/pdf-pro/af7de7d6-35a2-4f08-90c4-6487582c3766 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?
2024_09_08_398f3cb8ad707383cde9g


CIrrMap250:通过多源数据整合开发的 2000 年至 2020 年中国灌溉农田的年度地图


张玲 , 谢艳华 , 朱秀芳 , 齐敏 , 卢卡·布罗卡


甘肃省遥感重点实验室,黑河遥感实验研究站,西北生态环境资源研究所,中国科学院,兰州 730000,中国


俄克拉荷马大学地理与环境可持续性系,美国俄克拉荷马州诺曼市博伊德街东 100 号,邮政编码 73019


北京师范大学遥感科学国家重点实验室,中国北京 100875


成都信息工程大学资源与环境学院,中国成都 610225


意大利佩鲁贾 06128,国家研究委员会地质水文保护研究所


通讯至:Ling Zhang (zhanglingky@lzb.ac.cn)

 摘要


准确的灌溉范围和动态地图对于研究粮食安全及其对地球系统和环境的深远影响至关重要。尽管在中国已经进行了一些绘制灌溉区的努力,但其中很少提供多年地图,纳入国家土地调查,解决数据差异,并考虑灌溉农田的覆盖比例(即混合像素问题)。在本研究中,我们解决了这些重要的空白,并开发了 2000 年至 2020 年中国灌溉农田的新年度地图,命名为 CIrrMap250。我们协调了灌溉面积统计和土地调查,并将其与遥感数据进行了调和。然后,经过半自动训练方法,将精细化的灌溉面积估算与多种遥感数据(即植被指数、混合农田产品和水稻田地图)以及灌溉适宜性地图进行了整合。随后,我们使用独立解释的 20,000 个参考位置、高分辨率灌溉水取水数据以及现有的地方到全国地图对我们的 CIrrMap250 地图进行了评估。 我们的评估结果显示,CIrMap250 与参考点高度一致,2000 年、2010 年和 2020 年的整体准确率分别为 0.79-0.88。CIrrMap250 估算的 irrigated area 可以解释中国灌溉水取水的 50%方差。我们的 CIrrMap250 产品表现优于目前可用的产品(即 IrriMap_CN、IAAA 和 GFSAD)。CIrrMap250 显示,中国的灌溉面积从 2000 年到 2020 年增加了约 (或 ),其中大部分( )是水资源不可持续的,发生在面临高到严重水压力的地区。此外,我们的产品揭示了中国灌溉面积明显向北移动,这归因于东北和西北中国灌溉农田的显著扩展。CIrMap250 中灌溉面积的准确表示将大大支持中国的水文、农业和气候研究,以改善水和土地资源管理。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。

 1 引言


灌溉作为应对气候变化的适应策略日益重要(Zaveri 和 B. Lobell, 2019;Bhattarai 等, 2023),在通过减少作物的水分和热应激来确保粮食安全方面发挥着至关重要的作用(Zhu 和 Burney, 2022;Zhu 等, 2022)。全球耕地的 20%进行灌溉,提供了 的全球粮食生产(Wwap, 2019),灌溉农业是土地和水资源管理的关键组成部分(Mcdermid 等, 2023)。全球农业灌溉占总淡水提取量的 和消费水使用的 (Wu 等, 2022;Qin 等, 2022)。大量的灌溉水使用加剧了水资源管理,并推动了众多地球系统和环境影响(Mcdermid 等, 2021;Mcdermid 等, 2023)。这些影响包括水文气候和生物地球化学循环的变化(Yang 等, 2023;Guo 和 Zhou, 2022;Kang 和 Eltahir, 2018;Mishra 等, 2020;Thiery 等, 2020)、地下水和地表水体的枯竭(Cheng 等, 2014;Noori 等, 2021)、淡水盐碱化(Thorslund 等, 2021)和滑坡(Lacroix 等, 2020)。 考虑到灌溉的重要性,了解其确切位置及其动态是至关重要的。然而,由于灌溉信号的隐蔽性以及灌溉田和雨养田之间的频繁混淆,这一任务具有挑战性(Ozdogan 和 Gutman,2008;Chen 等,2023;Zhang 等,2022d)。

遥感为土地表面的成本效益高且空间明确的制图提供了重要机会(Potapov et al., 2021)。虽然许多土地利用/覆盖和主题农田产品已向公众提供,但它们通常缺乏灌溉状态的信息(Mpakairi et al., 2023; Xie and Lark, 2021)。在过去十年中,利用卫星地球观测来绘制灌溉范围的兴趣日益增长(Massari et al., 2021)。目前,基于卫星数据绘制灌溉区的方法大致可分为基于植被、基于土壤水分和植被-土壤水分综合的方法。各种基于光学传感器的植被指数,如归一化差异植被指数(NDVI)(Rouse et al., 1974)、绿色指数(GI)(Gitelson, 2005)和归一化差异水分指数(NDWI)(Gao, 1996),已被用于通过阈值分割方法(Zhu et al., 2014; Ozdogan et al., 2010; Wang et al., 2023)、光谱匹配技术(Ozdogan and Gutman, 2008; Lu et al., 2021)、决策树(Ozdogan and Gutman, 2008; Shahriar Pervez et al.)检测灌溉区。,2014;Ambika 等,2016;Xiong 等,2017),以及监督分类算法(Deines 等,2019;Deines 等,2017;Xie 等,2019)。基于植被的方法的基本原理是,灌溉田地通常表现出比相邻的雨养区更高的生产力、绿度和水分含量,尤其是在干旱条件下。此外,来自微波和光学传感器的遥感土壤水分也被应用于通过阈值分割方法(Yao 等,2022)、监督/无监督分类算法(Dari 等,2021;Gao 等,2018)和遥感-建模比较方法(Zohaib 和 Choi,2020;Zaussinger 等,2019)来检测灌溉区。基于土壤水分的方法的基本原理是,灌溉改变了土壤水分,并导致与相邻的雨养区相比,具有明显的时空动态。此外,结合植被指数和土壤水分进行灌溉区检测的植被-土壤水分综合方法近年来也受到关注并取得了成功(Zuo 等,2023;Longo-Minnolo 等,2022;Pun 等)。,2017;Elwan 等,2022)。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。

尽管在灌溉制图的遥感技术方面取得了显著进展,但在大空间尺度(例如国家和全球层面)上识别灌溉区仍然是一个重大挑战,因为灌溉实践、地理和气候特征存在显著差异(Salmon et al., 2015; Zhang et al., 2022d)。这一挑战因缺乏足够的参考数据而进一步加剧(Xie and Lark, 2021; Xie et al., 2019)。因此,全球和大多数国家仍缺乏高精度的灌溉区地图(Mpakairi et al., 2023; Chen et al., 2023)。近年来,研究人员通过将遥感数据与农业统计数据及其他相关数据集(如灌溉适宜性和现有灌溉区地图)结合,寻求解决大规模灌溉制图的挑战(Xie et al., 2021; Meier et al., 2018; Zhang et al., 2022a; Zhang et al., 2022d)。与之前的产品相比,他们成功生成了具有更高时空分辨率和制图精度的新灌溉地图,覆盖全球或国家层面。 这些努力强调了多源数据融合技术在大规模灌溉制图中的巨大潜力。

中国是一个农业大国,拥有世界上最大的灌溉面积。中国仅占全球可耕地面积的 ,却养活了 的全球人口,并与其他国家的食品供应链紧密相连。因此,开发可靠的灌溉农田地图对中国尤为重要。尽管如此,与美国和印度等灌溉广泛的国家相比,中国在灌溉农田的地图绘制上关注较少(Zhang et al., 2022d; Zhu et al., 2014)。近年来,专门为中国量身定制的灌溉农田地图逐渐出现,这得益于遥感、统计数据、现有灌溉地图和灌溉适宜性地图等多源数据的整合(Zhang et al., 2022c; Bai et al., 2022; Xiang et al., 2020; Zhang et al., 2022b; Zhang et al., 2022d)。

虽然这些先前的研究在很大程度上提高了我们对中国灌溉农田空间分布的理解,但仍然存在一些局限性。首先,很少有研究提供灌溉农田的年度地图,这妨碍了对中国灌溉区域的时空分析。因此,尚不清楚灌溉面积的扩展在哪里是水资源可持续的(即,灌溉面积在没有经历水资源压力的情况下扩展)(Mehta 等,2022)。其次,来自官方统计局的灌溉面积数据是通过现场抽样调查和自下而上的汇总收集的,这在先前的研究中被广泛用于限制灌溉农田的总体范围。除了统计数据外,中国国务院进行的全国土地调查实际上也提供了关于灌溉农田面积的准确可靠的信息。全国土地调查涉及大量调查员,并依赖于最先进的卫星遥感影像和先进的调查技术(Chen 等,2022)。 与国家土地调查的灌溉面积统计的协调可能有助于减少与灌溉面积相关的偏差和不确定性(Yu et al., 2021),但这很少被考虑。第三,中国大多数农场规模小且分散,平均耕地面积不到一公顷(Teluguntla et al., 2018)。这导致混合像素的广泛存在,其中既有农田又有其他土地利用/覆盖类型。然而,大多数先前的研究以布尔方式描述灌溉农田,其中每个像素完全被灌溉农田或非灌溉农田占据。这可能导致对灌溉农田的高估或低估,具体取决于网格单元内农田的比例。最后,值得注意的是,除了张等人进行的研究。(2022a),许多其他研究评估了他们的地图

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。

c)
 通过

由于参考样本数量相对有限,可能会影响评估结果的可靠性。获取足够的参考点对于国家级灌溉农田地图的稳健评估至关重要,但由于涉及的成本和时间巨大,这一任务却颇具挑战性。

基于我们之前的研究(Zhang et al., 2022d; Zhang et al., 2023a),本研究旨在通过整合遥感数据(即植被指数、混合农田产品和水稻田地图)、灌溉面积统计和调查以及灌溉适宜性,填补上述重要空白,创建中国灌溉农田的新年度地图(2000-2020)。新开发的灌溉农田地图(命名为 CIrMap250)具有 250 米的空间分辨率,通过分数覆盖描述灌溉农田的分布。我们的具体目标是:(i)使用足够数量的参考点和高分辨率的灌溉水取水数据评估 CIrrMap250 的准确性;(ii)将 CIrrMap250 的性能与覆盖整个中国的三种现有大规模灌溉地图进行比较,包括 IrriMap_CN(Zhang et al., 2022a)、IAAA(Siddiqui et al., 2016)和 GFSAD(Thenkabail et al., 2016),以及一个田间规模地图,即 OPTRAM30(Yao et al., 2022);(iii)研究中国灌溉农田的时空动态,并量化灌溉面积变化的水资源可持续性。


数据采集与处理

 2.1 遥感数据


我们收集了来自 NASA 地球科学数据系统的 Terra 中等分辨率成像光谱仪(MODIS)植被指数,即 NDVI 和增强植被指数(EVI)(Huete 等,1997),https://www.earthdata.nasa.gov/。这些指数每 16 天生成一次,空间分辨率为 250 米。同时,MODIS 产品 MOD09A1 的第 4 波段表面光谱反射率通过最近邻插值法从原始的 500 米重采样到 250 米(Debeurs 和 Townsend,2008)。这些重采样数据与 MOD09Q1 产品的第 1 波段 250 米和 8 天表面反射率结合,用于推导绿度指数(GI)(补充表 S1)。所有 MODIS 数据都经过质量筛选,依据质量和有用性指标,只有那些无云和无雪/冰且符合最高质量标准的像素被认为是可靠的(Hilker 等,2012)。不可靠像素的数据通过简单的最近邻插值法进行重建。

我们为中国创建了一种新的高分辨率( )混合农田产品(CCropLand30),通过融合最先进的遥感土地利用和土地覆盖产品与最新的国家土地调查(Zhang et al., 2023a)。CCropLand30 在 2000 年至 2020 年间以 5 年为间隔生成,其准确性高于现有产品。在 CCropLand30 的基础上,我们开发了 2000 年、2005 年、2010 年、2015 年和 2020 年的 250 米农田层,使用分数覆盖方法描述农田分布,即估算每个 250 米网格中农田的比例。这些层作为绘制灌溉农田的基础。此外,我们从中国的土地利用/覆盖数据集(CLUD)中提取了 2000 年、2005 年、2010 年、2015 年和 2020 年的水稻田(Liu et al., 2014; Xu et al., 2018)。水稻田

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。


包括种植水稻和莲藕的耕地,并由水源和灌溉设施支持,这些地区可以被视为高可信度的灌溉农田的一部分(张等,2022c)。


2.2 灌溉面积统计与调查


2.2.1 灌溉面积统计和调查的协调


我们从中国国家统计局和地方统计局提供的多种统计年鉴中收集了 2000 年至 2020 年的灌溉面积年度数据。这些年鉴包括《省级统计年鉴》、《农村统计年鉴》、《中国区域经济统计年鉴》和《中国水利统计年鉴》。这些数据集的主要数据来源是中国经济和社会大数据研究平台(https://data.cnki.net/)。我们编制了中国超过 个省份的高分辨率(即县级)灌溉面积数据,以及其余省份的地级数据,涵盖 2000 年至 2020 年的每一年(Zhang et al., 2022d),这些数据提供了比早期研究(Xiang et al., 2020; Zhang et al., 2022b; Zhu et al., 2014)更详细的灌溉农田分布信息。

除了统计数据,土地调查还提供了关于灌溉区的准确可靠信息。中国目前已在 1980 年代、2010 年和 2020 年进行了三轮全国土地调查。全国土地调查动员了大量的测量师,并利用高分辨率卫星遥感影像,以及移动互联网、云计算和无人机等先进测量技术(陈等,2022)。由于国家安全问题,这些土地调查的结果和地图直到最近才公开。中华人民共和国自然资源部已发布第二和第三次全国土地调查的县级调查结果(包括耕地及其子类型,即旱地、灌溉地和水田)(https://www.mnr.gov.cn/)。灌溉地和水田的调查面积反映了灌溉耕地的范围,涵盖了 2009-2016 年和 2019-2022 年。在有可用调查数据的年份,灌溉面积统计与县级调查的灌溉面积使用公式 1 进行了协调。 该过程是在以下假设下进行的:(1)统计和调查的灌溉面积之间的最大值应该更可靠,以及(2)灌溉面积应小于总耕地面积。第一个假设是由于统计和调查数据往往低估灌溉面积,因为田野抽样不足且不具代表性(Zhang et al., 2022a),以及碎片化和小规模耕地的普遍存在(Teluguntla et al., 2018)。我们还测试了其他协调方法(例如,均值和最小值),但与最大协调方法相比,它们的表现较差。在缺乏调查数据的年份,协调的灌溉面积是使用公式 2 确定的,假设统计灌溉面积的相对变化是可靠的。
https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。

(c) (i)

其中 分别代表协调、统计和调查的县级 irrigated cropland 区域; 是调查的耕地面积; 分别表示有和没有土地调查的年份。


2.2.2 统计/调查数据与遥感数据的对比


耕地面积统计和调查数据由于测量技术的差异,与遥感数据本质上不兼容。前者测量的是耕地的净面积,而后者表示的是包括亚像素非耕地特征(如田埂、线性元素和分散特征(例如道路、池塘和房屋))的耕地总面积(Zhang et al., 2023a)。因此,统计和调查的耕地面积与遥感数据得出的耕地面积相比,表现出负向和系统性的偏差(Zhang et al., 2021; Zhang et al., 2022d)。灌溉耕地是耕地的一部分,其统计和调查也表明灌溉面积的净面积。因此,统计/调查的灌溉面积与遥感数据得出的灌溉面积之间存在差距。直接使用统计/调查的灌溉面积来限制基于遥感的灌溉耕地范围,可能导致对灌溉耕地的低估(Schepaschenko et al., 2015)。为了填补这一差距,我们调整了协调的灌溉面积数据(第 2.2.1 节),以使统计/调查数据与遥感数据相一致,如公式 3 所示。 此调整是在假设灌溉比例在统计/调查数据和遥感衍生地图中保持一致的情况下实施的。例如,如果统计/调查数据表明某县的农田灌溉比例为 ,则遥感衍生的灌溉比例也应高达

其中 分别是 年的调和灌溉面积; 是从我们的混合耕地产品(Zhang et al., 2023a)估算的遥感衍生耕地面积; 是调查的耕地面积; 表示遥感衍生耕地面积相对于调查的偏差比率。该比率是为每个县估算的,并限制在其农业区所有县的中位数值(Zhang et al., 2022c),以排除极端偏差比率并确保保守调整。在缺乏调查数据的年份,偏差比率是使用简单的最近邻插值法估算的。

 2.3 辅助数据


本研究利用了各种辅助数据集,包括气象和环境变量、灌溉用水提取、水资源短缺指数和行政边界。从国家气象信息中心(NMIC,http://data.cma.cn/)收集了大约 2400 个气象站的每日气象观测数据,包括降水、相对湿度、气温和气压。这些数据集与 MCD43A3 结合使用。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。


用于潜在蒸散发(PET)计算的反照率产品(Priestley 和 Taylor,1972)和干旱指数(即降水量与 PET 的比率)。环境数据包括海拔、坡度、作物强度、土壤类型和距离水体的距离。海拔数据来源于航天飞机雷达地形测量任务数字高程模型(SRTM DEM),坡度图是基于 SRTM DEM 数据在 ArcGIS 软件中使用坡度函数得出的。距离水体的距离是使用 ArcGIS 中的欧几里得距离工具确定的,采用了包括河流、湖泊、水库、运河和池塘在内的水体空间分布数据。上述辅助数据部分来源于国家西藏高原 (https://data.tpdc.ac.cn/),部分来源于资源与环境科学数据中心 (https://www.resdc.cn/Default.aspx)。

此外,关于中型行政单位(称为地级市)灌溉水取用的数据被整理为两个不同的时间段(具体为 2009-2011 年和 2018-2020 年),数据来源于 31 个省的水资源部门和地方统计局。2010 年至 2020 年间的水资源稀缺指数(WSI)地级市数据来自我们之前的研究(Zhang et al., 2023c)。WSI 的计算方法是将总水使用量(灌溉、工业、生活用水以及用于林业、畜牧业、渔业和生态的其他水使用)与水资源可用量(即由降水产生的总地表水和地下水)之比。

 3 方法论


在本研究中,我们通过半自动训练方法整合多源数据创建了 CIrMap250(Zhang et al., 2022d; Xie et al., 2019)。在数据获取和处理之后,我们的方法论首先是创建训练样本,如图 1 所示。此步骤包括三个主要过程:(i) 通过阈值校准方法生成中间灌溉图;(ii) 通过中间图的叠加分析建立训练池(即潜在训练数据);(iii) 通过从训练池中随机抽样生成训练样本。在这些训练样本的基础上,我们使用随机森林算法对每个县的灌溉和雨养农田进行年度分类。然后,将映射结果拼接并后处理,以获得中国的年度灌溉农田图,称为 CIrrMap250。随后,我们评估了 CIrrMap250 的准确性,并与现有产品进行了性能和可视化比较。 最后,我们研究了灌溉农田的时空变化,并通过与水资源紧张地区的比较,量化了灌溉区扩展的水资源可持续性。

数据采集与处理

生成训练样本

分类、准确性评估、时空分析

图 1. 本研究的工作流程


3.1 训练样本的生成


一种阈值校准方法被应用于自动生成灌溉和雨养农田的训练池,遵循之前的研究(Zhang et al., 2022d; Xie et al., 2019)。我们首先计算了峰值植被指数,并通过灌溉适宜性进行了调整。每年农田网格的生长期峰值 NDVI、EVI 和 GI 被确定。基于农田的海拔、坡度和干旱指数构建了静态灌溉适宜性图(Zhang et al., 2022d)。正如 Liu et al.(2022)所示,这些因素在影响中国灌溉农田的空间分布中至关重要。假设海拔较低、坡度较缓和干旱指数较高的农田具有更高的灌溉适宜性。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。

(c) (i)

灌溉适宜性和潜力。具体而言,农田灌溉适宜性图是通过结合海拔、坡度和干旱指数的灌溉适宜性值得出的,如公式 3 所示。

其中 是省 的农田单元 的灌溉适宜性,是影响因素的权重,通过试错程序确定;SElev、SSlope 和 SArid 分别是海拔、坡度和干旱指数的灌溉适宜性值(补充表 S2)。随后,峰值植被指数通过灌溉适宜性进行了调整(公式 4),假设灌溉农田不仅更绿、更高产,而且比雨养农田更适合灌溉。

SVI 表示灌溉适宜性调整后的峰值植被指数; 表示植被指数的值, 分别代表生长周期和年份。

我们随后利用 SVI(即灌溉适宜性调整的峰值 NDVI、EVI 和 GI)和水稻田地图,为 2000 年至 2020 年的每一年生成了三个中间灌溉地图。这是通过阈值分割方法实现的(Pervez 和 Brown,2010;Zhu 等,2014;Meier 等,2018)。具体而言,所有农田的 SVI 值在每个县内按降序排列,并顺序估算累计灌溉面积。随后,将累计面积与调和后的灌溉面积进行比较。累计灌溉面积与调和后的灌溉面积接近的网格对应的 SVI 值被确定为阈值。值得注意的是,对于水稻田,SVI 值被设定为该县农田的最大 SVI,优先考虑其作为灌溉区域。最后,使用公式 5 将农田分类为“灌溉”和“雨养”类别。

这些中间灌溉地图被叠加和交叉;这些地图一致识别为灌溉或雨养农田的像素被指定为潜在的训练样本,构成特定年份和县的训练池。我们从每个县和每年随机选择了 200 个雨养农田网格和 200 个灌溉农田网格,这确保了样本充足性和分类算法计算效率之间的平衡(Xie et al., 2019;Zhang et al., 2022d)。


3.2 使用随机森林对灌溉农田进行分类


我们采用随机森林算法(Breiman, 2001)对灌溉和雨养农田进行分类,使用从训练池中提取的随机样本。随机森林算法的实现是通过 MATLAB 的 TreeBagger 函数进行的。随机森林模型的超参数通过试错法进行了优化。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。


过程。这些参数包括树木数量、每个节点的最小观察数以及在每个决策分裂时随机抽样的变量数量(补充表 S3)。所选的预测变量包括时间变化变量(即植被指数、降水量、温度、潜在蒸散发和干旱指数)和时间不变的环境变量(即纬度、经度、作物强度、海拔、水体距离、坡度和土壤类型)。灌溉和雨养农田的分类是在 2000 年至 2020 年期间每个县独立进行的。分类后,我们合并了年度和县级的制图结果,以生成中国的灌溉农田地图。为了提高这些地图的准确性,应用了空间滤波器( 窗口)以消除孤立像素(占窗口面积的 )并识别遗漏的灌溉农田(占窗口面积的 )。


3.3 精度评估与相互比较


CIrrMap250 的准确性从三个不同的角度进行了评估。首先,使用从现有文献和中国国家土地调查的土地利用地图中收集的超过 20,000 个参考点评估了像素级准确性。此外,通过将 CIrrMap250 的灌溉面积估算与高分辨率的灌溉水取用数据进行比较,间接评估了 CIrrMap250 的性能。此外,我们还将 CIrrMap250 与三种当前可用的大规模灌溉地图进行了比较,即 IrriMap_CN(Zhang et al., 2022a)、IAAA(Siddiqui et al., 2016)和 GFSAD(Thenkabail et al., 2016),以及西北中国河西走廊的一个田野尺度( 分辨率)地图(Yao et al., 2022)。


3.3.1 参考点评估


我们使用三个独立的验证样本数据集评估了 CIrrMap250 的准确性(图 2)。2000 年的验证样本来自 Zhu 等人(2014),主要来源于中国气象数据共享服务系统提供的作物生长和土壤湿度数据集(https://data.cma.cn/)。2020 年的验证样本来自 Chen 等人(2023),他们绘制了全球干旱地区的中心 pivot 灌溉系统(CPIS)。CPIS 的特点是以 pivot 为中心的圆形灌溉模式,这在作物上形成了明显的圆形图案(图 2c)。这一特征使得能够从遥感图像中可靠地识别 CPIS。我们提取了分布在中国各地的 CPIS 多边形,并将其转换为验证点(即每个 CPIS 多边形的中心),这些点主要位于中国北方。此外,我们从中国第二次全国土地调查的省级土地利用图中检索了大约 2010 年的验证样本(https://www.mnr.gov.cn/)。 由于缺乏地理参考信息,我们使用 ArcGIS 中的地理参考工具结合高分辨率图像对这些土地利用地图进行了地理参考。灌溉样本来自地理参考土地利用地图中的灌溉土地和稻田,而非灌溉样本则来自干旱地块。请注意,目前第三次全国土地调查的调查土地利用地图尚不可用。总的来说,我们获得了超过 20,000 个参考样本,使得对灌溉地图的评估更加可靠。

图 2. 验证样本的空间分布。a 和 b,2000 年和 2020 年第三方样本的空间分布。c,2010 年从中国第二次全国土地调查的省级土地利用图中获取的样本的空间分布。d,不同年份的灌溉和非灌溉样本数量。

CIrrMap250 的性能通过整体准确度(OA)、F1 分数、生产者准确度(PA)和用户准确度(UA)进行了定量评估(补充表 S4)。CIrrMap250 通过分数覆盖而非二元方式描述了灌溉农田的分布。CIrMap250 中的像素值表示每个网格单元内灌溉农田的百分比。值得注意的是,这个百分比代表的是 250 米网格单元内农田的比例(从 30 米混合农田产品估算得出),而不是灌溉农田与总农田的比例。实际上,每个 250 米网格单元内的农田面积被分类为“灌溉”或“非灌溉”。因此,为了进行像素级准确度评估,CIrrMap250 被转换为二元地图,其中像素值大于 0 的被编码为 1,表示灌溉农田,而其他像素被编码为 0,表示非灌溉区域。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。


3.3.2 使用灌溉水取水数据进行评估


我们进一步评估了 CIrrMap250 的性能,通过将其灌溉面积估算与 2010 年和 2020 年关于灌溉水取用的高分辨率(地级)数据进行比较。灌溉面积是灌溉水取用的主要驱动因素(Puy 等,2021;Lamb 等,2021)。因此,灌溉水取用可以间接验证灌溉地图的准确性(Zhang 等,2022a)。预计更准确的灌溉耕地地图将在其灌溉面积估算与实际灌溉水取用之间表现出更强的相关性,而低准确度的地图则相反。通过线性回归模型中的决定系数 来衡量这种相关性的强度,该系数量化了灌溉水取用的方差在多大程度上可以通过灌溉面积的变化来解释。


3.3.3 与现有产品的比较


我们将 CIrMMap250 与三种现有的大规模灌溉地图进行了比较,包括 IrriMap_CN(Zhang 等,2022a)、IAAA(Siddiqui 等,2016)和 GFSAD(Thenkabail 等,2016)。IrriMap_CN 是中国范围内的年度灌溉农田地图,分辨率为 500 米,涵盖 2000 年至 2019 年。该地图最近使用 MODIS 数据和基于从现有灌溉地图中生成的训练样本的机器学习方法开发而成,这些样本是从统计数据中缩小比例得出的(Zhang 等,2022a)。IAAA 是 2000 年和 2020 年亚洲和非洲的灌溉面积地图,分辨率为 500 米。这些地图是通过利用多季节卫星图像中捕捉到的季节变化创建的(Siddiqui 等,2016)。GFSAD 是 2010 年全球灌溉农田地图,分辨率为 。该地图是通过将世界五种主要作物与遥感获取的灌溉和雨养农田面积地图叠加生成的(Thenkabail 等,2016)。

此外,我们获得了一张田野规模的遥感灌溉农田地图,称为 OPTRAM30,由姚等人(2022 年)开发。OPTRAM30 是专门为中国西北的河西走廊创建的,采用光学梯形模型的土壤水分变化检测方法。该地图具有 30 米的高分辨率,并在与现场数据集验证时显示出接近 的准确性。鉴于 OPTRAM30 的高准确性和空间分辨率,它可以作为评估大规模灌溉地图的宝贵参考。因此,我们还将 CIrrMap250、IrriMap_CN、IAAA 和 GFSAD 与河西走廊的 OPTRAM30 进行了比较。


3.4 灌溉面积的变化及与水压力地区的比较


我们使用 21 年的数据以空间明确的方式研究了灌溉面积的趋势。通过使用最小二乘法计算拟合到像素尺度灌溉面积时间序列数据的回归线斜率来量化这些趋势。此外,我们采用了“重心”概念来追踪灌溉面积的空间动态(Zeng 和 Ren,2022)。灌溉面积的重心 表示为:

其中 表示网格 中的灌溉面积, 分别是网格 的经度和纬度; 是灌溉耕地网格的数量; 是年份。

此外,我们量化了灌溉区域变化的水资源可持续性。首先在像素尺度上识别了 2000 年至 2020 年间灌溉面积的扩张和减少。为了更好地可视化结果,我们将灌溉面积的变化聚合到 分辨率,遵循之前的研究(Deines 等,2019;Xie 和 Lark,2021)。随后,我们将这些变化与 2010 年至 2020 年期间 WSI 平均值得出的地级水资源压力图进行比较。WSI 表示人类占用的可用水资源的比例,并用于将不同地级的水资源压力分为四个级别:低(WSI )、中等( )、高( )和严重(WSI>1)(Zhang 等,2023c)。在严重到极端水资源压力下的灌溉面积扩张被认定为“不可持续”,因为它们可能加剧地表水和地下水资源的枯竭(Mehta 等,2022)。相反,在低到中等水资源压力下的灌溉面积扩张或在严重到极端压力下的灌溉面积减少被视为“可持续”。

 4 结果


4.1 灌溉农田地图的准确性评估


4.1.1 像素级评估


如图 3 和补充表 S5 所示,CIrrMap250 在 2000 年的整体准确率(OA)和 F1 分数分别为 0.79 和 0.78,超过了 IrriMap_CN 和 IAAA 的表现。在 2010 年,CIrrMap250 达到了 0.79 的高 OA 和 0.71 的 F1 分数,而现有地图的 OA 值低于 0.66,F1 分数低于 0.63。对于 2020 年,CIrrMap250 检测到中心枢轴灌溉系统的 个田地,而 IrriMap_CN 仅识别出 个(图 3c 和补充图 S1)。对于灌溉样本,CIrrMap250 的生产者准确率显著高于现有产品。CIrrMap250 和 IrriMap_CN 在用户准确率方面表现相似。对于非灌溉样本,CIrrMap250 的生产者准确率相对低于 IrriMap_CN,但用户准确率显著高于 IrriMap_CN。在生产者和用户准确率方面,CIrrMap250 和 IrriMap_CN 明显优于 IAAA 和 GFSAD。

图 3. CIrrMap250 与现有地图(IrriMap_CN, IAAA, GFSAD)的性能。面板 a、b 和 分别显示 2000 年、2010 年和 2020 年的结果。OA、PU 和 UA 分别是总体准确度、生产者准确度和用户准确度。Irr 和 NIrr 分别表示灌溉样本和非灌溉样本。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。

(c) (i)


4.1.2 与现有产品的全国和区域比较


图 4 比较了 CIrMap250 中灌溉农田的空间分布与现有地图。在国家层面上,专门为中国开发的 CIrrMap250 和 IrriMap_CN 能够捕捉到相似的灌溉模式。灌溉热点(例如,华北平原和西北中国)以及众所周知的灌溉区如河套、宝鸡峡、都江堰、青铜峡和汾河在这些地图中始终被识别。CIrrMap250 描绘的灌溉农田在中国大部分地区的分布比 IrriMap_CN 所描绘的更广泛(补充图 S2)。CIrrMap250 为中国、华北和新疆维吾尔自治区的灌溉比率分别为 和 0.96。这些数值与现实和官方报告(https://gtdc.mnr.gov.cn/)更为接近,而从 IrriMap_CN 得出的数值仅为 (补充图 S2)。然而,与 IrriMap_CN 相比,CIrrMap250 在东北中国(NEC)往往会给出较低的灌溉面积估计。 与 CIrrMap250 和 IrriMap_CN 相比,IAAA 显著低估了中国西北地区(NWC)和华北地区(NC)的 irrigated croplands,但在东北地区(NEC)和西南地区(SWC)则高估了 irrigated croplands。GFSAD 在都江堰地区和华北平原的 irrigated area 方面存在高估,但在像 NWC 和华南南部(SC)这样稀疏分布的灌溉区域则明显存在遗漏错误。


图 4. 2010 年不同灌溉图中灌溉农田的空间分布。NEC、NC、NWC、SWC、SC 和 CSC 分别是东北中国、华北、中国西北、华南、中国南方和中南中国的缩写。IrrPct 表示灌溉农田相对于网格单元总面积的比例。

我们进一步将 CIrrMap250 与四个高度灌溉区域的现有地图进行了比较(A-D 位置如图 4a 所示)。A 区和 B 区位于干旱地区,作物生长在很大程度上依赖灌溉,而 C 区和 D 区位于湿润地区,稻米广泛种植,并严重依赖补充灌溉。如图 5 所示,CIrrMap250 准确描绘了这些区域灌溉农田的实际分布。相比之下,IrriMap_CN 低估了 A 区和 B 区的灌溉范围,并且缺乏 C 区和 D 区灌溉农田的详细信息。IAAA 显著低估了 A 区的灌溉面积,错误识别了 B 区的灌溉农田,并高估了 C 区的灌溉农田。GFSAD 的分辨率为 1 公里,在四张地图中与实际灌溉农田的分布一致性最低。

图 5. CIrrMap250 与现有地图的视觉比较。自上而下的五行对应于


谷歌地图,CIrrMap250,IrriMap_CN,IAAA


390 和 GFSAD,分别。四个选定区域的位置如图 4a 所示。

图 6 提供了上述大规模灌溉地图与中国西北地区河西走廊的田野尺度遥感灌溉地图(OPTRAM30)之间的额外比较。CIrrMap250 在绘制灌溉农田方面与 OPTRAM30 表现出强一致性。虽然 IrriMap_CN 捕捉到了灌溉农田的一般模式,但它往往低估了该地区灌溉农田的范围。相比之下,IAAA 在识别该地区的灌溉农田方面存在困难,显示出显著的遗漏和错误识别。同样,GFSAD 在准确描绘河西走廊的灌溉区域方面能力有限。

图 6. 中国西北地区河西走廊大规模灌溉地图(CIrrMap250、IrriMap_CN、IAAA、GFSAD)与田间尺度遥感灌溉地图(OPTRAM30)的比较。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。


4.1.3 使用高分辨率灌溉用水数据比较灌溉面积


如图 7 所示,CIrrMap250 估算的 irrigated area 与灌溉水取水量之间存在良好的相关性。CIrrMap250 确定的灌溉面积变化大约解释了 2010 年和 2020 年灌溉水取水量方差的 。相比之下,来自 IrriMap_CN 的灌溉面积变化仅能解释同一时期,即 2010 年和 2020 年灌溉水取水量方差的 。来自其他两张地图,即 IAAA 和 GFSAD 的灌溉面积估算只能解释灌溉水取水量方差的一小部分(即 0.12 和 0.20),这表明这些地图在中国的表现相对较低。这些结果间接暗示了 CIrrMap250 在现有灌溉地图中的更好表现。

图 7. 2010 年和 2020 年灌溉面积估算与灌溉水取用量的散点图。数据以对数单位呈现,以反映小值和大值。


4.2 灌溉农田的时空变化


如图 8 所示,从 2000 年到 2020 年,东北地区(NEC)和西北地区(NWC)的灌溉面积显著扩大。相反,南方的 SC 和 CSC 的北部、SWC 的东北部以及 CSC 和 NC 的南部的灌溉面积明显减少。灌溉面积的下降往往集中在人口稠密地区,这可以归因于大面积农田的快速城市扩张(张等,2023a)。灌溉面积的重心位于 NC 和 CSC 的边界,并在 2000 年至 2020 年间明显向北移动。这一灌溉面积的北向空间趋势可能会加剧。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。

(c) ()

中国北方的水危机(李等,2023),该地区仅拥有中国 20%的水资源,却支持着超过一半的人口。

图 8. 2000 年至 2020 年灌溉面积的时空变化。具有显著增加或减少趋势的像素( )标记为“扩展”或“减少”,而变化不显著的像素标记为“稳定”。具有 灌溉农田的像素被排除在地图之外。图上方插入的面板描绘了灌溉面积的重心移动。

如图 9 所示,所有子区域在 2000 年至 2020 年间灌溉面积均呈上升趋势,其中东北地区的扩张速度显著快于其他子区域。中国的灌溉面积从 750,000 增加到 ,年均增长约 (或 )。值得注意的是,东北地区和西北地区大约贡献了这一扩张的一半。尽管灌溉面积持续上升,但不同子区域灌溉面积相对于中国总灌溉面积的比例变化并不一致。东北地区和西北地区的灌溉面积比例呈上升趋势,而南海、四川和南方地区则呈下降趋势。四川的灌溉农田比例最大( ),其次是长江中下游( )、南方({{5})、西北(12%-14%)、西南( )和东北(7%-11%)。

图 9. 2000-2020 年中国六个子区域灌溉面积的变化。a,灌溉面积的相对变化。b,中国总灌溉面积的变化,不同子区域的贡献在插入的饼图中显示。c,灌溉面积比例的相对变化。d,2000 年、2010 年和 2020 年灌溉面积的比例。


4.3. 不同水分压力水平下的灌溉农田变化


图 10 显示了不同水压力水平下灌溉农田的变化。我们发现,从 2000 年到 2020 年,中国的灌溉面积总共扩大了约 ,其中 从水资源的角度来看是不可持续的,并且位于水压力高到严重的地区。灌溉面积的扩展主要位于西北地区、东北地区、华北和华南及华东的北部。灌溉面积的总减少约为 ,其中 是可持续的,位于水压力高到严重的地区。这些可持续的灌溉面积减少主要位于华北、华东和华南,缓解了不可持续的灌溉农田扩张。灌溉面积的净扩展约为 ,其中 是水资源不可持续的。东北地区和西北地区的不可持续扩展的灌溉面积占比相较于其他子区域更大,约占中国净不可持续的 70%。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。

(c)

灌溉扩展。相比之下,CSC 和 SWC 子区域的可持续扩展灌溉面积比例高于其他子区域,这得益于丰富的水资源和较低的水压力。

图 10. 2000 年至 2020 年不同水资源压力水平下灌溉面积的变化。面板 a 和 分别显示了在低至严重水资源压力下灌溉面积的总扩展和减少的空间分布。面板 c 和 显示了中国及六个子区域按水资源压力类别划分的灌溉面积的总变化和净变化。

 5 讨论


5.1 CIrrMap250 对现有产品的改进


我们的 CIrrMap250 产品提供了 2000 年至 2020 年中国灌溉农田的年度地图,显示出比现有产品更高的准确性。CIrrMap250 的性能提升可以归因于几个关键因素。首先,CIrrMap250 消化了前所未有的详细灌溉面积统计数据和可靠的国家土地调查,同时考虑了统计/调查数据与遥感数据之间的差异。我们编制了县级统计数据。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。


在中国超过 个省份,以及其余省份的地级数据。这些数据集首次与国家土地调查进行了协调,极大地减少了灌溉面积统计中的错误和不确定性。协调后的灌溉面积数据进一步进行了调整,以使统计/调查数据与遥感数据相一致。这种协调是必要的,因为统计和调查的灌溉面积代表了灌溉农田的净面积,而遥感得出的灌溉面积则表示总面积。如果不调整原始的灌溉面积统计,灌溉范围将被显著低估,从而导致灌溉制图准确性下降 (补充图 S4)。

此外,CIrrMap250 通过分数覆盖描述灌溉农田分布,而不是大多数现有产品采用的二元方法。中国的大多数农场都很小且分散。例如,在 2020 年,我们观察到约 农田网格被中国不到一半的农田占据,而不到 的农田网格被超过 的农田占据。因此,在农田掩模中考虑农田的分数覆盖对于绘制灌溉区域变得至关重要。我们进行了额外的灌溉映射实验,其中 农田地图以二元方式描述,并从 30 米混合农田产品中重新采样。如补充图 S5 所示,如果不考虑农田的分数覆盖,南中国特别会忽视大量灌溉农田。灌溉农田地图的准确性将下降约 5%-6%(补充图 S6)。

最后,CIrrMap250 整合了一张灌溉适宜性地图,该地图通过加权平均法结合了三个影响因素的灌溉适宜性值——海拔、坡度和干旱指数。为了展示将灌溉适宜性整合到灌溉制图过程中的重要性,我们随机生成了 250 组权重(分配给影响因素),涵盖中国所有省份,结果产生了 250 张不同的灌溉适宜性地图。基于这些地图,我们随后使用本研究提出的方法为 2010 年创建了 250 张不同的灌溉农田地图。如补充图 S7 所示,无论选择哪种灌溉适宜性地图,这些灌溉地图的表现始终优于基线灌溉地图,后者是使用本研究的方法创建的,但在制图过程中未考虑灌溉适宜性。此外,这些灌溉地图的整体准确性范围较窄 ,这表明该制图方法对不同灌溉适宜性地图的使用具有稳健性(低敏感性)。


5.2 CIrrMap250 的不确定性和局限性


尽管 CIrrMap250 相比现有产品有了进展,但我们承认该产品存在若干局限性。首先,CIrrMap250 的准确性与灌溉面积统计密切相关。尽管我们努力将灌溉统计与国家土地调查进行协调,但由于技术和政治因素(如统计方法和行政区划的变化),固有的偏差和不确定性依然存在(Thenkabail 等,2009;Meier 等,2018)。这些偏差和不确定性不可避免地反映在 CIrrMap250 中,因为我们的训练样本来源于受统计约束的灌溉地图。此外,CIrrMap250 的空间分辨率相对较粗,为 250 米。虽然

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。


CIrrMap250 的空间分辨率高于许多现有的大规模灌溉地图,但在较小的空间尺度(例如,田地或灌溉区尺度)上可能仍不适用。此外,混合像素问题可能会给我们的制图结果带来不确定性。尽管考虑了耕地的分数平均值,CIrrMap250 仍无法在亚像素尺度上区分灌溉和雨养耕地。南中国山区有许多小而零散的耕地,地形复杂,植被类型多样。由于混合像素的广泛存在,CIrrMap250 在这些地区的使用应谨慎。混合像素问题不仅可能显著影响耕地掩模的精度(Zhang et al., 2023a),还可能影响灌溉和雨养耕地之间的植被指数差异。尽管存在这些局限性,我们的 CIrrMap250 对灌溉制图领域做出了宝贵贡献,并将大大支持中国的水文、农业和气候研究。 克服上述限制并探索潜在改进途径的努力无疑将提高我们未来灌溉地图的准确性和实用性。

 6 数据可用性


中国 2000 年至 2020 年的灌溉农田年度地图(称为 CIrrMap250)可以在以下链接访问:https://doi.org/10.6084/m9.figshare.24814293.v1(Zhang et al., 2023b)。所有地图均以 GeoTIFF 格式呈现,地理坐标使用 WGS84 参考系统。像素大小为 在赤道上。

 7 结论


本研究概述了 2000 年至 2020 年中国灌溉农田年度地图的开发,称为 CIrrMap250。该新产品通过整合多源数据开发而成,包括遥感数据(植被指数、混合农田产品和水稻田地图)、灌溉面积统计和调查以及灌溉适宜性地图。这些数据的整合是通过半自动训练方法实现的,该方法首先使用阈值校准方法生成训练样本,然后采用随机森林算法对灌溉和雨养农田进行分类。我们使用来自现有文献和中国国家土地调查的土地利用地图的 2 万多个参考数据评估了 CIrrMap250 的准确性。此外,还使用更高分辨率的灌溉水取水数据对 CIrrMap250 进行了间接评估。我们的 CIrrMap250 产品与三种现有的大规模灌溉地图(即 IrriMap_CN、IAAA 和 GFSAD)以及一张田间规模地图(即 OPTRAM30)进行了比较。

结果表明,CIrrMap250 在 2000 年、2010 年和 2020 年的整体准确率达到了 0.79-0.88,超过了现有产品的精度。此外,CIrMMap250 估算的 irrigated area 可以解释 50-60%的地级市灌溉水取水的方差,并与灌溉水显示出更强的相关性。

https://doi.org/10.5194/essd-2024-2

预印本。讨论开始:2024 年 1 月 29 日


(c) 作者 2024. CC BY 4.0 许可。

(c) (i)
 通过

比现有产品的提取量更多。视觉比较进一步确认了 CIrrMap250 在性能上优于现有产品。利用 21 年的数据,我们发现从 2000 年到 2020 年,中国所有子区域的灌溉面积呈现出持续上升的趋势。值得注意的是,东北和西北中国的增长率超过了其他子区域。因此,中国灌溉农田的重心显著向北移动,这可能加剧了华北的水危机。在 2000 年至 2020 年期间,我们观察到中国灌溉面积净增加约 180,000 (或 )。然而,从水资源的角度来看,这一扩张的很大一部分( )被认为是不可持续的,并且发生在面临高到严重水压力的地区。

CIrMMap250 相较于现有产品的性能提升可归因于对详细灌溉面积统计数据和可靠的国家土地调查的消化,考虑了统计/调查数据与遥感数据之间的差异,通过分数覆盖描述灌溉农田分布,以及纳入灌溉适宜性。我们预计,CIrrMap250 产品将大大支持中国的水文、农业和气候研究,以改善水资源和土地资源管理。

 作者贡献


LZ 设计了研究,进行了实验,分析了结果,并在所有合著者的贡献下准备了手稿。YX 分析了结果,提供了技术支持,审阅和编辑了手稿。XZ 和 QM 收集了验证数据集。LB 审阅和编辑了手稿,并监督了工作。

 竞争利益


作者声明他们没有利益冲突。

 致谢


本研究得到了中国国家自然科学基金(42271286 和 41901045)以及中国科学院青年创新促进会(2023454)的支持。我们非常感谢中华人民共和国自然资源部提供的数据。

 参考文献


安比卡,A. K.,沃德洛,B.,和米什拉,V.:2000 年至 2015 年印度遥感高分辨率灌溉区地图,科学数据,3,160118,10.1038/sdata.2016.118,2016。

白明、周思、唐涛:基于协同效应重建 2000 年至 2019 年中国灌溉农田的范围