2015 年基于多源产品融合方法的改进全球土地覆盖制图，分辨率为 30 米（GLC-2015）

李冰洁 $^{1}$ , 许晓聪 $^{1}$ , 刘小平 $^{1, 2}$ , 施倩 $^{1}$ , 庄浩铭 $^{1}$ , 蔡耀通 $^{1}$ , 和贺达 $^{1}$
广东省城市化与地理仿真重点实验室，地理与规划学院，太阳
中山大学，广州，510275，中国
南方海洋科学与工程广东实验室（珠海），珠海，519080，中国

correspondence: 刘小平 (liuxp3@mail.sysu.edu.cn)

收到：2022 年 4 月 28 日 - 讨论开始：2022 年 8 月 3 日

修订日期：2023 年 4 月 19 日 - 接受日期：2023 年 4 月 23 日 - 发布日期：2023 年 6 月 7 日

摘要

全球土地覆盖（GLC）信息以精细的空间分辨率为地球系统的生物地球化学循环和全球气候变化研究提供了基础数据输入。尽管有多个公共的 30 米分辨率 GLC 产品，但在这些产品之间发现了相当大的不一致性，特别是在破碎区域和过渡带，这给各种应用任务带来了很大的不确定性。在本文中，我们基于证据的邓普斯特-谢弗理论（DSET），融合多个现有的土地覆盖（LC）产品，开发了 2015 年改进的全球土地覆盖图（GLC-2015），其分辨率为 30 米。首先，我们使用超过 160,000 个全球基于点的样本，局部评估每个地理网格内每个土地覆盖类别的输入产品的可靠性，以建立基本概率分配（BPA）函数。然后，使用邓普斯特的组合规则，对每个 30 米像素进行处理，从所有候选地图中推导出每个可能土地覆盖类别的组合概率质量。最后，根据决策规则确定每个像素的土地覆盖类别。通过这一融合过程，预计每个像素将被分配到有助于实现更高准确度的土地覆盖类别。我们分别使用 34711 个全球基于点的样本和 201 个全球基于斑块的样本评估了我们的产品。结果显示，与现有的 30 米 GLC 地图相比，GLC-2015 地图在全球、洲际和生态区的制图性能达到了最高，整体准确度为 $79.5 % (83.6 %)$ ，与基于点（基于斑块）验证样本的 kappa 系数为 $0.757 (0.566)$ 。此外，我们发现 GLC2015 地图在不一致性区域表现出显著的优越性，在中等不一致性区域的准确度提高了 $19.3 % - 28.0 %$ ，在高不一致性区域的准确度提高了 $27.5 % - 29.7 %$ 。希望这一改进的 GLC-2015 产品能够应用于减少全球环境变化研究、生态系统服务评估和灾害损失评估中的不确定性。本研究开发的 GLC-2015 地图可在https://doi.org/10.6084/m9.figshare.22358143.v2（Li et al., 2023）获取。

1 引言

土地覆盖（LC）受到自然和人类活动的影响（Running, 2008；Gong et al., 2013；Song et al., 2018；H. Liu et al., 2021），是地球系统的重要组成部分（Yang and Huang, 2021）。全球土地覆盖（GLC）产品可以作为气候和环境变化等各种研究的基础数据（Bounoua et al.,

2002；Foley 等，2005；Grimm 等，2008；Yang 等，2013；Schewe 等，2019），粮食安全（Verburg 等，2013；Ban 等，2015），碳循环（Moody 和 Woodcock，1994；Defries 等，2002；Gómez 等，2016），生物多样性保护（Chapin 等，2000；Giri 等，2005），以及土地管理（Mayaux 等，2004；Verburg 等，2011）。因此，迫切需要详细的，

准确且高质量的 GLC 产品，以支持全球变化研究和可持续发展。

在初步阶段，土地覆盖（LC）制图主要依赖于视觉解读，这既耗时又费力，并且在全球范围内应用困难（龚，2012）。近年来，卫星遥感数据因其能够提供大面积覆盖和长期监测的信息而被采用来生成全球土地覆盖（GLC）产品。利用高级非常高分辨率辐射计（AVHRR）、中分辨率成像光谱仪（MODIS）、中分辨率成像光谱仪（MERIS）和全球陆地表面卫星（GLASS）等低分辨率卫星数据，开发了多种分辨率在 5 公里到 300 米之间的 GLC 产品（洛夫兰德等，2000；汉森等，2000；巴尔托洛梅和贝尔沃德，2005；弗里德尔等，2010；德福尼等，2018；刘等，2020）。尽管这些 GLC 产品已广泛应用于许多领域，但已证明传感器、分类系统之间的差异以及某些地区的准确性较低阻碍了这些产品的协调（赫罗德等，2008；维尔堡等，2011；格雷库西斯等，2015）。此外，由于这些产品的空间分辨率相对较粗，远未能提供足够的 LC 细节，无法满足许多研究的需求（Giri 等，2013；Yang 等，2017）。为了进行能够捕捉大多数人类活动的研究，需要更高分辨率（例如，30 米）的 GLC 产品（Giri 等，2013）。

随着高分辨率卫星遥感数据的免费获取，细分辨率的全球土地覆盖（GLC）制图已成功进行。利用 Landsat 影像，取得了里程碑式的成就，生成了两个分辨率为 30 米的 GLC 产品，即全球土地覆盖的更细分辨率观测与监测产品（FROM_GLC）（Gong 等，2013）和 Globeland30（Chen 等，2015）。此后，2017 年利用首个全季节样本集实现了 30 米分辨率的 GLC 制图（Li 等，2017）。最近，Zhang 等（2021）使用 Landsat 时间序列影像和来自全球时空光谱库（GSPECLib）的高质量训练数据，生成了 2015 年的 30 米 GLC 地图（GLC_FCS30），采用了两级分类方案。在过去几年中，已经进行了多次尝试，以提高 30 米 GLC 产品的准确性，这些产品在 GLC 制图任务的生成中占据了主导地位。FROM_GLC 是通过采用四种分类算法对 Landsat 影像进行分类，并选择 MODIS EVI 数据的时间序列进行训练和测试而创建的。 Globeland30 是通过提出基于像素-对象-知识（POK）的方法来确保一致性和准确性而创建的。GLC_FCS30 是通过采用具有高质量训练样本的局部自适应随机森林模型生成的，这些样本来自 GSPECLib。Globeland30、FROM_GLC 和 GLC_FCS30 是优秀且不可或缺的 GLC 产品，为生物多样性保护（吴等，2020；孟等，2023）、气候变化（金等，2016；薛等，2021；郑等，2022）和土地管理（Shafizadeh-Moghadam 等，2019）等多项研究做出了重要贡献。除了这些多类 GLC 产品外，还成功生成了针对单个土地覆盖（LC）类别的 GLC 产品，如农田（余等，2013；陆等，2020）、森林（汉森等，2013；岛田等，2014；张等，2020）、湿地（胡等，2017；张等，2023）、水体（廖等，2014；佩克尔等，2016；皮肯斯等，2020）和不透水表面（龚等，2020；黄等，2021, 2022；刘等，2020）。

尽管在生产更准确的产品方面付出了巨大努力，但现有的 30 米全球土地覆盖（GLC）产品在某些土地覆盖类别和特定区域（Sun et al., 2016; Kang et al., 2020）仍然表现不稳定。此外，现有的 30 米产品在整体空间分布模式上表现出很好的一致性，但在某些特定区域（异质区域和过渡区）以及光谱相似类别（森林和灌木丛、农田和草地）上存在显著的空间不一致性（Gao et al., 2020; L. Liu et al., 2021）。现有 30 米 GLC 产品之间的空间不一致性源于它们的分类系统、所采用的分类技术、源数据以及训练样本的空间分布和大小的差异（Yang et al., 2017; Gao et al., 2020）。由于上述限制，GLC 产品的用户在为其特定应用选择数据时仍然面临困难。最终，这种情况导致在使用不同的 30 米 GLC 产品时，相关研究的结果存在不确定性。对于具有精细空间分辨率的 GLC 制图，应更加关注在异质和碎片化景观中的制图改进（Herold 等，2008；L. Liu 等，2021）。因此，迫切需要生成更准确和可靠的 GLC 产品，具有高分类精度，特别是针对空间不一致区域和低精度 LC 类别。

根据 Gong 等人（2016）的研究，LC 产品之间的不一致性表明可用的补充信息，通过将输入地图与数据融合方法结合，可以生成更强大和可靠的数据。考虑到不同地图之间存在分歧，并且在不同位置提供准确的信息，我们可以通过加权所有可用信息的可信度，并通过决策规则将其结合，从而为每个像素分配最佳类别标签（Clinton 等人，2015）。通过这种方式，输入地图的集成输出图可以减少将错误类别标签分配给像素的整体风险，并至少达到输入地图的平均性能。已经进行多次尝试，使用各种方法生成准确且一致的 LC 地图，例如多数投票（MV）、模糊一致性和贝叶斯理论。Iwao 等人（2011）基于简单的多数投票方法创建了 GLC 地图。Jung 等人（2006）通过结合 MODIS、GLC2000 和 GLCC 数据，基于模糊一致性评分生成了 1 公里的 GLC 地图。随后，

弗里茨等人（2011）通过对 LC 地图进行排名，扩展了 Jung 等人（2006）的方法，并绘制了撒哈拉以南非洲的耕地范围。See 等人（2015）通过将中分辨率 LC 产品与地理加权回归（GWR）结合，生成了两个 GLC 产品。Gengler 和 Bogaert（2018）提出了一种贝叶斯数据融合方法，并将其应用于比利时特定区域的 LC 绘制。所有这些研究表明，融合方法可以创建一个集成的 LC 产品，通过结合候选地图的最佳部分，显著提高了绘制精度。然而，MV 方法对候选地图的质量敏感，当输入产品存在较大分歧时，会产生显著的不确定性（Chen 和 Venkataramanan，2005）。模糊一致性高度主观，因为它依赖于专家评估，而贝叶斯理论需要先验知识或条件概率，并无法处理无知状态（Liu 和

Xu, 2021

）。

德姆普斯特-谢弗证据理论（DSET）是一种基于证据的处理不确定性的方法。与多数投票不同，DSET 方法可以根据反映信念程度的概率质量来折扣来自不准确信息的证据，而不是简单的二元决策（Razi 等，2019）。与贝叶斯理论相比，DSET 可以整合来自多种来源的证据，而不需要先验知识（Chen 和 Venkataramanan，2005）。此外，基于 DSET 方法的最终融合结果的可靠性是通过总信念度来衡量的。尽管以往文献集中于 DSET 方法在多源数据聚合中的应用，但由于缺乏准确和充足的样本以及对足够计算资源的需求，全球范围内的研究非常有限。

在本研究中，我们提出了一种多源产品融合方法，基于谷歌地球引擎（GEE）平台，旨在生成 2015 年改进的 GLC 产品（GLC-2015），分辨率为 30 米。我们提出的融合方法旨在解决之前 30 米 GLC 产品之间的不一致性，并生成一幅映射性能优于任何候选地图的地图，通过在地方尺度上评估这些现有产品的映射精度，选择最可信的土地覆盖（LC）类别。为实现这一目标，我们首先进行了可靠性评估，其中每个 LC 类别在每个地理网格中的每个产品的准确性被视为创建基本概率分配（BPA）函数的证据概率。然后，根据邓普斯特组合规则融合来自不同产品的所有 LC 类别的 BPA 值。最后，在将最大组合概率质量的最终接受 LC 类别分配给每个 30 米像素后，整合了 GLC-2015 地图。 GLC-2015 地图分别使用两种不同的验证集进行了验证，即全球点基样本和全球块基样本，并与现有产品进行了比较。此外，我们提供了 GLC-2015 在高映射不一致区域与其他 GLC 产品相比的映射改进分析。GLC-2015 地图被证明是准确和可信的，并且可以显著提高高不一致区域的映射准确性。

2 个数据集

2.1 多类 GLC 产品

三种现有的 30 米 GLC 产品，包括 GlobeLand30、FROM_GLC 和 GLC_FCS30，被用作基于 DSET 的融合输入图。它们的详细信息总结见表 1。

GlobeLand30 是一个广泛使用的全球地理信息产品，采用基于 POK 的方法，利用 Landsat 和 HJ-1 卫星影像制作而成。Globeland30 产品可以在网站上免费访问（http://www.globalland30. org，最后访问时间：2023 年 4 月 15 日），涵盖 2000 年和 2010 年。从准确性评估来看，2010 年的 Globeland30 整体准确率超过

80.0 %

，使用了大量样本（Chen et al., 2015）。尽管 GlobeLand30 的数据时间为 2010 年，与其他产品有 5 年的时间差，但由于时间间隔造成的土地覆盖变化区域相较于全球土地面积而言微乎其微，因此仍被使用。此外，由于土地覆盖变化引起的不确定性相对较小，低于由于分类不准确引起的不确定性（Xu et al., 2014）。现有地图之间的大多数空间不一致主要是分类错误，而不是时间间隔内的土地覆盖变化（McCallum et al., 2006；See et al., 2015）。

来自 GLC 的首个 30 米 GLC 产品是利用众多 Landsat 影像生成的，具有两级结构的精细分类系统。通过对完整测试样本的验证，其总体准确率

(OA)

为

64.5 %

，在同质区域的测试样本子集上为

71.5 %

（龚等，2013）。

GLC_FCS30 是使用 Landsat 时间序列数据和来自 GSPECLib 的大量训练样本开发的。它具有两级分类方案，包含 16 个全球 LCCS 土地覆盖类别和 14 个详细的区域土地覆盖类别。根据 LCCS 一级验证方案，GLC_FCS30 的整体准确率达到了

71.4 %

（Zhang 等，2021）。

2.2 单类 GLC 产品

为了提高融合结果的质量，还使用了一套具有 30 米精细分辨率的单一类别高质量 GLC 产品。与多类别 GLC 产品相比，这些单一类别 GLC 产品更有可能提供准确的信息，因为它们通常专注于提升特定土地覆盖类别的制图性能。这些产品包括全球森林变化（GFC）（Hansen 等，2013 年）、全球年度城市动态（GAUD）（X. Liu 等，2020 年）、联合研究中心的全球地表水（JRC GSW）（Pekel 等，2016 年）和全球红树林监测（GMW）（Bunting 等，

2022 年）。虽然这些单类产品是年度或多时期的，但我们仅选择了 2015 年的这些产品。这些单类产品的背景信息被视为参与融合的另一种土地覆盖类别（例如，非水域）。背景信息的准确性默认为 0，因为它没有提供关于我们分类系统中其他九个类别的任何信息。表 1 还描述了这些选定单类 GLC 产品的信息。

GFC 是通过对生长季节 Landsat 影像进行时间序列分析而得出的，旨在提供关于全球树冠范围、增益和损失的信息，空间分辨率为 30 米。准确性评估在全球和气候领域尺度上进行，森林增益的总体准确率达到了

99.6 %

，而全球森林损失达到了

99.7 %

（Hansen 等，2013）。截至目前，它的临时覆盖范围为 2000 年至 2020 年。

GAUD 提供了 1985 年至 2015 年间的 30 米年度城市范围，使用了大量的 Landsat 影像，通过数据融合方法和时间分割方法在 GEE 平台上生成。产品开发者在不同的城市生态区域和全球范围内进行了验证。1985 年至 2000 年期间城市化年份的映射准确率为

76.0 %

，2000 年至 2015 年期间在全球湿润地区的准确率为

82.0 %

（X. Liu et al., 2020）。

JRC GSW 数据集提供了 1984 年至 2015 年全球地表水变化的月度展示，分辨率为 30 米。利用专家系统、可视分析和证据推理来检测水域范围和变化。基于全球 40124 个验证点和 32 年的数据，确定了委托精度，整体精度为

99.45 %

（主题制图仪 - TM）、

99.35 %

（增强主题制图仪 Plus

ETM +

）、和 99.54%（OLI - 操作性土地成像仪），遗漏精度反映在整体精度为

97.01 %

™、

95.79 %

（ETM+）和

96.25 %

（OLI）（Pekel 等，2016）。我们在 GEE 目录中使用了 GSW 年度水分类历史 v1.1。每幅图像中都有一个“waterClass”波段，提供了水的季节性，分为四类：无数据、无水、季节性水和永久水。由于 GSW 数据中的季节性水不如永久水可靠（Meyer 等，2020），我们选择了永久水体并排除了季节性水体。

GMW 数据集是 GMW 计划的结果，该计划旨在提供关于红树林范围的一致信息。2010 年的全球红树林地图作为基准地图生成，采用极端随机树分类器对先进陆地观测卫星（ALOS）相控阵 L 波段合成孔径雷达（PALSAR）和 Landsat 图像进行分类。全球共评估了 53878 个样本点，基准地图的整体准确率达到了

95.3 %

，生产者的准确率达到了

94.0 %

（Bunting 等，2018）。基于

2010 年的基线，已建立 1996 年至 2016 年间六个时期的红树林分布图，并从 2018 年起进行年度变化监测。

2.3 国家级土地覆盖产品

关注国家层面的土地覆盖产品更有可能具有更高的准确性，因为它们是由对国家土地覆盖类别有良好了解的专家制作的。因此，2016 年美国大陆地区的国家土地覆盖数据库（NLCD 2016）（Yang et al., 2018）、中国的土地利用/覆盖数据集（CLUD）（Liu et al., 2014）2015 年数据，以及 2015 年的年度中国土地覆盖数据集（CLCD）（Yang and Huang, 2021）也被纳入了融合。这些国家级产品的详细信息列在表 1 中。

NLCD 2016 数据库提供了 2001 年至 2016 年间每 2 或 3 年一次的连续和准确的土地覆盖和变化信息，基于像素和对象的方法以及有效的后分类过程（Yang et al., 2018）。NLCD 2016 数据库在 2016 年的整体准确度为

90.6 %

和

86.4 %

，适用于 CONUS（Wickham et al., 2021）。CLUD 是通过使用 Landsat 影像的数字解译方法开发的，提供了 1980 年代至 2015 年间中国的土地覆盖信息。CLUD 的整体准确度在一级和二级土地覆盖类别中分别达到了

94.3 %

和

91.2 %

（Liu et al., 2014）。CLCD 是通过从 CLUD 和 Landsat 时间序列中获得的稳定训练样本生成的。经过 5463 个验证样本的评估，CLCD 获得了整体准确度

79.31 %

（Yang and Huang, 2021）。

2.4 全球基于点和基于补丁的样本

在本研究中，我们收集了两组全球样本，即基于点的全球样本和基于块的全球样本。为了高效地收集具有代表性和充足的样本，我们将世界陆地面积划分为

4^{\circ} \times 4^{\circ}

个地理网格。总共有 1507 个网格均匀分布在全球，如图 1 所示。

为了推导全球基于点的样本，我们在每个网格中采用了分层随机抽样。分层随机抽样依赖于土地覆盖产品中各类的面积比例。我们使用 FROM_GLC 作为先验知识，而不是 Globeland30 和 GLC_FCS30，主要基于两个考虑。 (1) FROM_GLC 与我们的目标地图（GLC-2015）具有相同的数据时间，而 Globeland30 与我们的样本之间有 5 年的间隔，这影响了每个土地覆盖类的样本大小。 (2) FROM_GLC 的 10 个一级土地覆盖类与 GLC-2015 的分类系统相似，而 GLC_FCS30 在分类方案和土地覆盖类的定义上与 GLC-2015 存在差异。首先，使用 FROM_GLC 产品来

图 1. 全球

4^{\circ} \times 4^{\circ}

地理网格的空间分布。使用六个尺寸为

{0.25}^{\circ}

的黑色矩形块进行我们产品与其他三个产品的视觉比较。

计算每个 LC 类别的面积比。然后，根据每个类别的面积比和空间位置，从 FROM_GLC 中随机提取点。最终，收集了超过 200000 个全球样本。通过上述采样方法，全球基于点的样本在全球范围内均匀分布，并且每个网格中的每个类别都有足够的样本。因此，对于面积比小的类别，在

4^{\circ} \times 4^{\circ}

网格中可以轻松获得超过 50 个点。FROM_GLC 对某些 LC 类别的准确性较低，特别是对农田和森林（Gao 等，2020；L. Liu 等，2021；Zhang 等，2021，2022）。如果从 FROM_GLC 中提取带有 LC 类别标签的全球样本，将不可避免地出现错误。因此，FROM_GLC 仅用于确定每个类别样本的大小和位置。相反，所有点都是根据 Google Earth 高分辨率图像手动标记的。整个样本集被随机分成两个子集：

80 %

的全球样本用于评估每个 GLC 产品在全球范围内和每个网格中对各种 LC 类别的准确性。剩余的

20 %

用于验证 GLC2015 地图和不同产品之间的数据比较。图 2 展示了全球基于点的样本的分布以及用于准确性评估和数据比较的子集。

为了验证 GLC-2015 与地方尺度上实际景观模式的一致性，我们还建立了全球基于斑块的样本。采用简单随机抽样方法在全球陆地面积和不同生态区中提取

5 km \times 5 km

个区块，因为这种方法易于执行，并能够增加目标区域的样本量（Pengra 等，2020）。由于当前 GLC 地图之间的不一致性往往出现在异质区域，如破碎区域和过渡带，我们稍微增加了异质景观区域的样本量，以更好地评估我们的制图结果。总共有 201 个区块被选为全球基于斑块的样本，如图 3a 所示。然后，对于每个基于斑块的样本区块，我们使用 ArcGIS 10.5 软件。

图 2. (a) 全球基于点的样本的空间分布和 (b) 用于准确性评估和数据比较的全球基于点的样本子集；每个土地覆盖类别的比例在饼图中显示。

提取不同大小的多边形（补丁），以捕捉高分辨率图像上的真实景观。同时，每个多边形都手动标记了一个土地覆盖（LC）类别。图

3 b

和 c 展示了基于补丁样本的四个示例。

三种方法

在本研究中，我们提出了一种多源产品融合方法来生成 GLC-2015 地图。该过程主要包括基于 Dempster-Shafer 证据理论（DSET）的融合、精度评估和数据比较，如图 4 所示。本研究的基础是基于 DSET 的多源产品融合。融合方法在像素级别进行，涉及以下三个主要步骤。(1) 构建每个像素的基本概率分配（BPA）函数，考虑各种产品的精度评估，属于每个土地覆盖（LC）类别。(2) 使用 Dempster 组合规则计算每个像素每个类别的组合概率质量。(3) 通过决策规则确定每个像素最终接受的 LC 类别。随后，将确定的 LC 类别的像素整合以生成新地图。对于大规模或全球土地覆盖制图，之前的研究者将研究区域划分为多个子区域，并在每个子区域内进行分类，使用 GEE（Gong et al., 2020; X. Liu et al., 2020; Huang et al., 2021; Jin et al., 2022; Zhang et al., 2021; Zhao et al., 2021）。子区域的形状和大小在之前的工作中有所不同，例如边长为

2^{\circ}

的六边形和大小为

1^{\circ} \times 1^{\circ}, {3.5}^{\circ} \times {3.5}^{\circ}, 5^{\circ} \times 5^{\circ}

或

10^{\circ} \times 10^{\circ}

的地理网格。在决定子区域的大小时，应考虑两个重要因素。每个子区域中的样本大小应足够，以确保不会遗漏稀有的土地覆盖类型。另一方面，由于内存限制，无法在我们想要的那么大的子区域内实施制图工作。为了确定合适的大小，我们测试了不同大小的子区域（见补充材料中的表 S1）。结果表明，将研究区域划分为

4^{\circ} \times 4^{\circ}

个网格效果最佳。因此，我们将全球陆地面积划分为

15074^{\circ} \times 4^{\circ}

个地理网格。整个框架在 GEE 平台上的所有

4^{\circ} \times 4^{\circ}

个地理网格中实施。

3.1 分类系统的定义

在本研究中，我们采用了包含 10 个土地覆盖类型的分类系统，包括农田、森林、草地、灌木丛、湿地、水体、苔原、不透水表面、裸地和永久性雪冰（Chen et al., 2015），如表 2 所示。由于不同的应用需求，

图 3. 全球基于补丁样本的空间分布及选定示例。面板(a)显示了

5 km \times 5 km

个基于补丁的样本位置，四个选定样本的位置用红色虚线圆圈表示。面板(b)和(c)展示了基于手动解读的全球基于补丁样本的生成。2015 年左右高分辨率图像中的红线是使用 ArcGIS 10.5 软件进行矢量化的结果。四个相应的基于补丁的样本显示在面板(c)中。

现有的 GLC 产品和国家级 LC 产品采用了不同的分类系统（表 S2-S3）。GlobeLand30 使用了一个简单的分类系统，仅包含 10 个一级类。与 GlobeLand30 不同，FROM_GLC 和 GLC_FCS30 采用了两级分类方案。通过对这些系统的分析，我们发现分类系统并不相同，但有一些共识。尽管某些类别的定义有所不同，GlobeLand30 和 FROM_GLC 中都有 10 个主要类别。此外，与 GlobeLand30 和 FROM_GLC 相比，GLC_FCS30 的 0 级分类系统缺少苔原。然而，在 GLC_FCS30 的 2 级详细 LC 类别中，地衣和苔藓与苔原之间几乎没有区别。

根据 LC 翻译表（表 S2-S3），2015 年的 FROM_GLC 和 GLC_FCS30、CLUD 的原始 LC 类别，以及 2016 年的 NLCD，已根据相似性转换为 10 个目标土地覆盖类别

LC 定义。请注意，在我们的分类系统中，农田被定义为用于食品生产和动物饲料的土地面积。因此，FROM_GLC 的二级类别中的牧场被转换为农田，而不是草地。此外，GLC_FCS30 的二级详细分类系统中的地衣/苔藓被转换为苔原。

3.2 GLC-2015 制图的多源产品融合

DSET 是一种广泛应用于多源数据融合的有效方法。为了生成新的高质量 GLC 地图，提出了一种使用 DSET 的多源产品融合方法。在第 3.2 节的其余部分，我们介绍了该理论的概述，并展示了 DSET 在我们的制图过程中的应用。

图 4. 基于 DEST 的多源产品融合方法生成 GLC-2015 地图的框架。

表 2. 本文采用的分类系统。

LC 类别

定义

耕地

用于食品生产和动物饲料的土地面积。

森林

树木覆盖的土地区域，树冠覆盖率超过

30 %

，以及稀疏的树木和树树冠覆盖率在

之间 10 %

和

30 %

。

草原

自然草地覆盖率超过

10 %

的土地区域。

灌木丛

以灌木为主的土地面积，覆盖率超过

30 %

，包括山地灌木、落叶植物灌木、常绿灌木和沙漠灌木，覆盖在

上 10 %

。

湿地

以湿地植物和水体为主的陆地区域。

水体

积累液态水的土地区域。

苔原

极地地区以地衣、苔藓、难以生存的多年生草本植物和灌木为主的土地。

不透水表面

覆盖有人工结构的土地区域。

光秃的土地

植被稀少、覆盖率低于

10 %

的土地区域。

100

永久雪和冰

永久积雪、冰川和冰盖主导的陆地区域。

3.2.1 邓普斯特-谢弗证据理论

DSET 是由 Dempster 和 Shafer 开发的，它是贝叶斯概率理论的扩展。该理论将来自不同数据源的信息视为独立证据，并将这些证据整合在一起，而不需要先验知识。在融合过程中，我们假设一个分类过程，其中所有输入数据都被分类为互斥的类别。设这些类别的集合

Ω

为判别框架。

2^{Ω}

是

Ω

的幂集，包含所有类别及其可能的并集。我们定义函数

m : 2^{Ω} \to [0, 1]

为 BPA 函数，当且仅当它满足

m (\emptyset) = 0

和

\sum_{A \subseteq 2^{Ω}} m (A) = 1

，其中

\emptyset

表示空集。对于每个类别

A \subseteq 2^{Ω}, m (A)

称为基本概率质量，可以从 BPA 函数计算得出，表示对类别

A

的支持程度或对类别

A

的信心。

融合的目的是评估和整合来自多个来源的信息。在 DSET 中，这些多源数据被视为不同的证据，并提供不同的评估。为了生成所有证据，Dempster-Shafer 证据理论提供了一条规则。假设

m_{i} (B_{j})

是从 BPA 函数为每个输入数据

i

计算的基本概率质量，

1 \leq i \leq n

适用于所有类别

B_{j} \in 2^{Ω}

。Dempster 的组合规则用于从不同证据中计算组合概率质量。融合规则在方程（1）和（2）中给出。

m (C) = \frac{\sum_{B_{1} \cap B_{2} \dots \cap B_{n} = C 1 \leq i \leq n} m_{i} (B_{j})}{1 - k}

k = \sum_{B_{1} \cap B_{2} \dots \cap B_{n} = \emptyset} \prod_{1 \leq i \leq n} m_{i} (B_{j})

,

其中

k

代表与证据源之间冲突相关的基本概率质量。

C

是所有类别

B_{j}

的交集，并携带所有输入数据的联合信息。组合后，我们采用决策规则来决定我们最终接受的类别。有几种方法可以通过简单地选择具有最大信念、可能性、支持或共性的类别来决定最终类别。

3.2.2 基于 DSET 的映射

在这里，我们展示了在 DSET 框架下对 GLC-2015 映射的实现。第 2 节中描述的所有 GLC 产品和国家级产品被选为要合并的输入地图。在多源产品的整合中，由于我们分类系统中的所有土地覆盖类别都是已知的，因此判别框架被定义为我们的分类系统。

Ω =

{\begin{cases} cropland, forest, grassland, \\ shrubland, wetland, water bodies, \\ tundra, impervious surfaces, bare land, \\ permanent snow and ice \end{cases}}

BPA 函数的定义是应用 DSET（Rottensteiner 等，2005）的关键点。在融合中，我们希望实现每个像素分类为 10 个土地覆盖（LC）类别之一：农田、森林、草地、灌木丛、湿地、水体、苔原、不透水表面、裸地和永久性雪和冰。对于每个产品，计算了每个 LC 类别的准确性，并用作构建 BPA 的证据概率。鉴于

4^{\circ} \times 4^{\circ}

网格的局部准确性无法充分反映实际的土地覆盖景观，特别是对于稀有的 LC 类别，因此在 BPA 的构建中纳入了全球准确性，以避免从局部角度带来的不确定性。由于基于局部样本的评估在局部网格的 BPA 构建中起着更关键的作用，因此应为局部准确性分配更高的权重。为了确定最佳权重，我们测试了局部准确性的不同权重（见补充材料中的图 S1）。结果表明，使用

75 %

表现稳健，并获得了相对较高的整体准确性。因此，我们选择

75 %

作为局部准确性的权重，

25 %

作为全球准确性的权重。在这里，我们将 BPA 函数定义如下：

\begin{aligned} m_{i} (T_{j}) & = \frac{{PA}_{{local}_{(i j)}} + {UA}_{{local}_{(i j)}}}{2} \\ \times 75 % + \frac{{PA}_{{global}_{(i j)}} + {UA}_{{global}_{(i j)}}}{2} \times 25 % \end{aligned}

其中

m_{i} (T_{j})

代表证据的 BPA 功能

证据源

i

在 LC 类别

T_{j}

下，对于每个

4^{\circ} \times 4^{\circ}

地理网格的生产者精度和用户精度分别为

{PA}_{{global}_{(i j)}}

和

{UA}_{{global}_{(i j)}}

，而证据源

i

在 LC 类别

T_{j}

下的生产者精度和用户精度在全球范围内。

为了估计

{PA}_{{local}_{(i j)}}, {UA}_{{local}_{(i j)}}

、

{PA}_{{global}_{(i j)}}

和

{UA}_{{global}_{(i j)}}

的确切值，我们使用了第 2.3 节中获得的超过 160000 个全球基于点的样本的

80 %

。一旦我们获得了

m_{i} (T_{j})

的测量值，基于 Dempster 组合规则评估了每个被分类为 LC 类

T_{j}

的像素的组合概率质量

m (T_{j})

，通过融合所有证据源的 BPA 值：

m (T_{j}) = \frac{\sum_{T_{1 j} \cap T_{2 j} \dots \cap T_{n j} = T_{j}} \prod_{1 \leq i \leq n} m_{i} (T_{j})}{1 - k}

k = \sum_{T_{1 j} \cap T_{2 j} \dots \cap T_{n j} = \emptyset} \prod_{1 \leq i \leq n} m_{i} (T_{j})

,

其中

k

代表与冲突相关的基本概率质量，

n

代表输入地图的总数，

m_{i} (T_{j})

代表来自第

i

个 LC 地图的某个像素属于 LC 类

T_{j}

的基本概率质量。

此外，给定了一个信念度量（Bel），用于衡量在结合所有可用证据时，被标记为最终接受的 LC 类别的像素的可信度。

信念测量是通过以下方式确定的

Bel (T_{j}) = \sum_{T_{i j} \subseteq T_{j}} m_{i} (T_{j})

.

为了确定每个像素最终接受的土地覆盖（LC）类别，我们采用最大组合概率质量的规则作为决策规则，并将具有最大组合概率质量的 LC 类别分配给 30 米像素。标记为 LC 类别的像素被整合以生成 GLC-2015 产品。

3.3 精度评估

为了评估 GLC-2015 地图的准确性，我们采用了两种验证方法：基于全球点的样本验证和基于全球斑块的样本验证。由于全球点样本集在世界范围内均匀分布，并且每个土地覆盖（LC）类别的样本量相对充足且均衡，即使是稀有类别，它也能为全球 GLC-2015 地图的估算提供一个具有代表性和可信度的基础。此外，我们使用全球斑块样本从局部景观尺度进行准确性评估。尽管全球斑块样本集对稀有 LC 类别的样本量不足，但它可以利用空间上下文信息，有效反映景观的实际模式。

混淆矩阵用于评估和分析 GLC-2015 的制图结果。误差矩阵由条目

A_{i j}

组成，表示参考土地覆盖类别

j

被分类为土地覆盖类别

i

的样本数量。总体精度（OA）、卡帕系数、生产者精度（PA）和用户精度（UA）是从混淆矩阵生成的，用于描述 GLC-2015 地图的质量。它们的定义如下：

OA = \frac{\sum_{i} A_{i i}}{\sum_{i} \sum_{j} A_{i j}}

P_{o} = OA

P_{e} = \sum_{k} \frac{\sum_{i} A_{i k}}{\sum_{i} \sum_{j} A_{i j}} \times \frac{\sum_{j} A_{k j}}{\sum_{i} \sum_{j} A_{i j}}

,
kappa

= \frac{P_{o} - P_{e}}{1 - P_{e}}

{PA}^{i} = \frac{A_{i i}}{\sum_{k} A_{k i}}

{UA}^{i} = \frac{A_{i i}}{\sum_{k} A_{i k}}

其中

{UA}^{i}

和

{PA}^{i}

分别代表 LC

i

的 UA 和 PA，

P_{o}

是参考数据与分类数据之间的协议，

P_{e}

是偶然协议的假设概率。

3.4 数据互比

为了更好地反映 GLC-2015 地图的质量，我们将 GLC-2015 地图与多个尺度的现有产品进行了相互比较。在不同产品的准确性评估中，采用了前面描述的两个全球验证集。

为了确定 GLC-2015 地图是否在分类难度较高的区域提高了准确性，以及与其他 GLC 产品相比改善了多少，我们进行了 GlobeLand30、FROM_GLC 和 GLC_FCS30 之间的空间一致性分析，并比较了 GLC-2015 在低不一致性、中等不一致性和高不一致性区域的制图性能。为了直观展示三种现有 GLC 地图之间的空间一致性，我们采用了空间叠加方法逐像素获取不同地图之间的空间对应关系。根据所有 GLC 产品在同一土地覆盖（LC）类别上达成一致的次数，像素的一致性程度被识别为三个级别，协议值分别为 3、2 或 1。低不一致性区域被视为在所有三种 GLC 地图中被分类为相同 LC 类别的像素（标记为 3）。中等不一致性区域被视为仅在两种 GLC 地图中一致的像素（标记为 2）。高不一致性区域被视为在这三种 GLC 地图中完全不一致的像素（标记为 1）。为了进行视觉比较，所有这些 GLC 地图被汇总到

{0.05}^{\circ}

，其中比例最大的 LC 类别决定了每个

{0.05}^{\circ}

网格中的类别。

3.5 DSET 及其他方法的映射性能评估

除了对 GLC-2015 地图与现有产品之间的相互比较，我们还将 DSET 方法与两种现有的常用融合方法进行了比较，包括基于两个全球验证集的多数投票（MV）和空间对应（SC），这些验证集包括全球点基样本和整个全球基于样本的样本。MV 是一种融合方法，它结合输入地图，并采用大多数候选地图所偏好的 LC 类别。在 MV 方法中，我们在每个像素上比较 GlobeLand30、FROM_GLC 和 GLC_FCS30，并选择两个或三个 LC 产品一致的类别。对于三个 LC 产品不同的像素，采用准确性最高的产品的 LC 类别。SC 方法通过选择与参考数据具有最高空间对应的输入地图的 LC 类别来生成综合土地覆盖图。在本研究中，全球点基样本被用作参考数据，以获得每个 GLC 产品的 SC 地图。如果一个类别的

产品与基于点的样本一致时，该样本被赋值为 1。相反，如果产品的类别与样本的类别不同，则该样本被赋值为 0。在每个

4^{\circ} \times 4^{\circ}

网格中，我们使用克里金方法获得空间对应图，这些图的对应值在 0 到 1 之间，适用于三种产品。然后，为每个像素选择具有最高空间对应的产品类别。

此外，我们将 DSET 的映射性能与随机森林（RF）进行了比较，后者被认为是土地覆盖映射中最流行的算法之一。在使用 FR 分类器进行土地覆盖分类时，采用了 2015 年及其相邻两年 Landsat 8 OLI 传感器的所有可用的二级一级表面反射率（SR）数据，数据来源于 GEE。所有 Landsat 影像均经过大气校正。以下六个波段被用作输入特征：蓝色、绿色、红色、近红外（NIR）、短波红外 1（SWIR1）和短波红外 2（SWIR2）。为了提高映射性能，还使用了几个重要的光谱指数，包括归一化差异植被指数（NDVI）、归一化差异水体指数（NDWI）和归一化差异建筑指数（NDBI），作为 RF 分类器的辅助数据。RF 分类器是在

80 %

的全球基于点的样本上进行训练的，因为这些样本在高分辨率影像的人工视觉解读后质量较高。由于基于 RF 分类器的全球土地覆盖映射是一项艰巨的任务，我们随机选择了总共 300 个大小为

4^{\circ}

的网格（图。 S2) 并将相应的局部 RF 分类器应用于这些网格。然后，通过剩余的

20 %

点基样本验证映射结果。

4 结果与讨论

4.1 GLC-2015 地图的映射结果

基于 DSET 的多源产品融合方法，我们生成了 2015 年改进的 30 米全球土地覆盖图（GLC-2015）。图 5 展示了 GLC-2015 地图。GLC-2015 地图能够准确描述各种土地覆盖类型的空间分布。例如，农田主要分布在中美洲、从匈牙利平原到西伯利亚平原的区域、中国东部和南部以及印度的大部分地区。此外，森林作为地图上易于区分的类别之一，主要集中在北美东部、南美的亚马逊盆地、欧亚大陆的北部以及非洲的赤道地区。

4.2 GLC-2015 地图的准确性评估

4.2.1 使用全球点基样本进行准确性评估

GLC-2015 地图的准确性首先通过全球点基样本进行了测试，评估结果列在表 3 中。GLC-2015 地图在全球范围内达到了

79.5 %

的总体精度（OA）和 0.757 的卡帕系数，显示了我们地图的良好表现。在所有土地覆盖类型中，永久性雪和冰的制图性能最佳，PA 和 UA 分别达到了

89.1 %

和

93.7 %

。水体、森林和不透水表面的准确性也很高，PA 和 UA 均超过了

80.0 %

。草地、灌木地和湿地的准确性相对较低，PA 低于

75.0 %

。其中，草地和灌木地主要与森林混淆，这可能是因为这些类别都是植被，因此在光谱信息的识别上造成了困难。由于复杂的光谱特征，湿地常常与植被混合（Ludwig 等，2019）。

区域准确性如图 6 所示。GLC-2015 的总体精度（OA）范围从

66.4 %

到

93.4 %

，而卡帕系数范围从 0.552 到 0.813。从 OA 的角度来看，水域的表现最好，其次是热带沙漠、温带大陆森林和极地。这些地区具有均匀的土地覆盖，映射难度较低。北方苔原林、热带干旱森林、热带灌木丛和亚热带沙漠的 OA 较低。第一个可能与高纬度有关。后两个可能是因为它们属于复杂和混合的土地覆盖类型，不易分类。最后一个可能是沙漠地区植被稀疏的结果。卡帕系数的排名与 OA 相似。

4.2.2 使用全球基于补丁的样本进行准确性评估

GLC-2015 地图的准确性评估也使用了全球基于样本的补丁。表 4 总结了 GLC-2015 地图中每个土地覆盖类型（LC 类）的准确性评估结果。从评估结果可以看出，GLC-2015 地图的总体准确度（OA）达到了

83.6 %

，高于使用全球基于点的样本测试的

79.5 %

。GLC-2015 地图的卡帕系数为 0.566，比使用全球基于点的样本计算的结果低 0.191。在基于两种不同验证数据集的准确性评估结果中，水体、森林和永久性雪冰的准确性被验证为高，而草地、灌木地和湿地的准确性被验证为低。然而，各个 LC 类的准确性排名略有不同。例如，在基于全球点样本的评估中，不透水表面和永久性雪冰的排名高于基于全球的评估。

图 5. 2015 年全球土地覆盖图，分辨率为 30 米（GLC-2015）。

表 3. 基于全球点样本的 GLC-2015 地图的混淆矩阵。

耕地

森林

草原

灌木丛

湿地

水体

苔原

不透水表面

光秃的土地

永久的雪和冰

总计

耕地

3623

387

356

4656

0.778

森林

155

8813

186

141

232

9685

0.910

草原

337

1920

184

2599

0.739

灌木丛

155

438

656

1469

442

3380

0.435

湿地

287

1067

110

1715

0.622

水体

1936

2216

0.874

苔原

242

119

1411

269

2115

0.667

不透水表面

1295

1489

0.870

光秃的土地

237

4909

5561

0.883

永久雪和冰

1154

1295

0.891

总计

4128

10705

3590

1746

1547

2245

1681

1614

6223

1232

34711

0.878

0.823

0.535

0.841

0.690

0.862

0.839

0.802

0.789

0.937

0.795

卡帕

0.757

基于斑块的样本。这可能是因为 LC 地图可以很容易地显示一个 LC 类别的分布，但很难描述其实际形状。除了在像素尺度上的准确性评估外，在斑块尺度上的验证同样重要，因为它可以反映 GLC-2015 地图与实际景观之间的形状一致性，即使全球基于斑块的样本数量相对较小。总体而言，无论是各自的全球基于点的样本还是全球基于斑块的样本，GLC-2015 地图的制图准确性都是令人满意的。

4.3 与现有 GLC 产品的比较

4.3.1 基于全球点样本的互比

基于全球基于点的样本，对 GLC-2015 地图与 GlobeLand30、FROM_GLC 和 GLC_FCS30 进行了互比。所有 GLC 地图的准确性评估结果列在表 5 中。可以发现，GLC-2015 地图的总体准确率（OA）为

79.5 %

，相比之下，GlobeLand30 为

65.3 %

，FROM_GLC 为

61.7 %

，GLC_FCS30 为

65.5 %

。GLC-2015 地图与其他现有地图之间的准确性差距为

14.0 % - 17.8 %

。此外，GLC-2015 地图的卡帕系数优于其他产品。除了苔原外，GLC-2015 地图在 PA 方面优于其他三张地图。对于农田、草地、灌木地、湿地和苔原，GLC-2015 地图在 UA 方面也表现出比 GlobeLand30、FROM_GLC 和 GLC_FCS30 更好的性能。总体而言，在 PA 或 UA 方面，GLC-2015 地图在几乎所有土地覆盖类别中排名第一或第二，这表明 GLC-2015 地图在遗漏和错误分类方面相较于其他三种产品具有更小的误差。

对不同 GLC 产品的进一步定量准确性评估是在

4^{\circ} \times 4^{\circ}

网格中使用全球基于点的样本进行的，并生成了箱线图

图 6. 根据生态区划的 GLC-2015 地图的区域准确性。(a) 总体准确性和(b) 卡帕系数。生态区划边界来自联合国粮食及农业组织(FAO)。

表 4. 基于全球补丁样本的 GLC-2015 地图的映射精度。

耕地

森林

草原

灌木丛

湿地

水体

苔原

不透水表面

光秃的土地

永久的雪和冰

0.887

0.895

0.629

0.589

0.301

0.939

0.701

0.757

0.682

0.825

0.836

卡帕

0.566

对于不同生态区内所有网格的每个产品，如图 7 所示。可以发现，GLC-2015 地图在不同生态区中表现优于其他现有产品，具有最佳的总体精度和卡帕系数。此外，GLC-2015 地图在所有生态区的平均总体精度超过了

65.0 %

，显示了我们制图结果的高质量。值得注意的是，GLC-2015 地图的箱体较短，除了亚热带干燥森林和亚热带沙漠，这意味着 GLC-2015 地图的波动相对较小。在亚热带沙漠、热带干燥森林和北方苔原林地，四个产品的总体精度和卡帕系数相对较低。然而，GLC-2015 地图超过了其他产品的最高值，并大大提高了这些地区的平均总体精度。

4.3.2 基于全球补丁样本的相互比较

尽管全球基于点的样本在全球范围内是充足且均匀的，但每个

4^{\circ} \times 4^{\circ}

地理网格中点的分布过于稀疏，无法反映实际的景观空间模式。我们还使用了全球基于斑块的样本，专注于局部尺度的 LC 模式，这些样本可以提供空间上下文信息，以进行 GLC-2015 地图的准确性评估并比较不同的 GLC 产品。表 6 列出了 GLC-2015 地图和其他三个 GLC 产品的准确性。显然，GLC-2015 地图在这四个 GLC 地图中实现了最佳的总体准确率和卡帕系数。GLC-2015 产品与其他产品之间的总体准确率差距为

5.9 % - 24.5 %

，与基于全球点的结果相比，呈现出更显著的变化。

表 5. GLC 产品与全球基于点的样本的映射准确性。

耕地

森林

草原

灌木丛

湿地

水体

苔原

不透水表面

光秃的土地

永久的雪和冰

OA（卡帕系数）

GLC-2015

0.778

0.910

0.739

0.435

0.622

0.874

0.667

0.870

0.883

0.891

0.795

0.878

0.823

0.535

0.841

0.690

0.862

0.839

0.802

0.789

0.937

(0.757)

全球土地 30

0.752

0.719

0.713

0.245

0.540

0.680

0.769

0.688

0.609

0.821

0.653

0.786

0.818

0.255

0.428

0.573

0.869

0.577

0.809

0.868

0.905

(0.598)

FROM_GLC

0.389

0.694

0.707

0.411

0.307

0.607

0.712

0.732

0.731

0.881

0.617

0.671

0.859

0.278

0.422

0.289

0.742

0.686

0.661

0.761

0.773

(0.558)

GLC_FCS30

0.757

0.775

0.452

0.399

0.455

0.604

0.228

0.777

0.809

0.726

0.655

0.616

0.816

0.384

0.405

0.515

0.808

0.688

0.774

0.645

0.947

(0.591)

图 7. 21 个生态区的准确性箱线图。(a) 总体准确性和(b) 卡帕系数。生态区缩写及其对应的生态区在表 S4 中描述。

基于样本。在 PA 和 UA 方面，GLC-2015 地图在大多数土地覆盖类别中高于其他三个地图。具体而言，所有产品在草地、灌木地和湿地的准确性较低，这与基于全球点样本的准确性评估相似。显然，FROM_GLC 在草地、灌木地和湿地的制图准确性最低，这意味着 FROM_GLC 的分类方法对这三种土地覆盖类别不够稳健。

每个基于样本的补丁都计算了准确性评估，并为每个大陆尺度的 GLC 产品生成了箱线图，如图 8 所示。GLC-2015 地图在每个大陆上表现出色，在所有地图中具有最高的总体准确率（OA）和卡帕系数。此外，在所有大陆中，GLC-2015 地图的 OA 箱体最短，这表明其在大陆尺度上的准确性变化较小。在四个产品中，GLC_FCS30 和 Globeland30 在大多数大陆上达到了相似的准确性。显然，FROM_GLC 在不同大陆上的准确性最低，特别是在大洋洲，大多数基于补丁的样本的 OA 低于

40.0 %

；即，大洋洲的大多数像素被错误分类。我们进一步比较了不同大陆上每个土地覆盖（LC）类别的制图准确性（图 S3 和 S4）。由于苔原和永久性雪冰稀少，仅存在于某些地区，因此未纳入比较。至于不同大陆的 PA，GLC-2015 地图在森林、水体和裸地方面优于其他地图。关于不同大陆的土地利用/覆盖（UA），GLC-2015 地图在农田、草地、灌木地和湿地方面的表现优于其他地图，并在森林方面达到了与 GLC_FCS30 和 Globeland30 相似的准确性。总体而言，GLC-2015 地图在大陆尺度的制图准确性上优于其他地图。此外，所有 GLC 产品在大多数大陆的草地、灌木地和湿地方面显示出显著的变化和较低的平均准确性。

此外，为了将 GLC-2015 地图的整体精度与其他 GLC 产品进行比较，使用散点图描述了 GLC-2015 地图的整体精度与每个基于样本的其他产品之间的关系，如图 9 所示。大多数点位于 1:1 线的上方，表明 GLC-2015 地图在整体精度方面超过了其他 GLC 产品。在 GLC-2015 地图与 FROM_GLC 的图中，点的分布比其他图更为分散。这表明这两个产品之间存在更显著的差异，这在表 6 中也得到了证明。

表 6. GLC 产品与全球基于样本的映射精度。

耕地

森林

草原

灌木丛

湿地

水体

苔原

不透水表面

光秃的土地

永久的雪和冰

GLC-2015

0.887

0.895

0.629

0.589

0.301

0.939

0.701

0.757

0.682

0.825

0.836

0.916

0.844

0.617

0.714

0.511

0.917

0.872

0.713

0.599

0.767

(0.566)

全球土地 30

0.896

0.698

0.765

0.539

0.455

0.824

0.752

0.643

0.492

0.831

0.777

0.891

0.906

0.444

0.527

0.157

0.893

0.500

0.703

0.829

0.705

(0.437)

FROM_GLC

0.485

0.714

0.640

0.254

0.032

0.904

0.760

0.506

0.681

0.501

0.591

0.872

0.809

0.193

0.139

0.186

0.884

0.696

0.808

0.496

0.703

(0.360)

GLC_FCS30

0.865

0.779

0.398

0.565

0.363

0.869

0.051

0.648

0.658

0.742

0.748

0.857

0.832

0.509

0.330

0.132

0.942

0.573

0.643

0.462

0.752

(0.418)

图 8. 不同大陆的准确性箱线图。(a) 整体准确性和 (b) 卡帕系数。

4.3.3 各个类别的区域比较

为了评估 GLC2015 与其他 GLC 产品之间的相似性和差异，我们在多个尺度上比较了各种土地覆盖类别的面积，包括全球、洲际、国家和生态区域尺度。

全球不同 GLC 产品各类的面积比较如图 10 所示。一般来说，四个 GLC 产品的水体和永久雪冰的面积非常相似，这可能与相似的土地覆盖定义有关。相比之下，GLC-2015 中的农田、森林、草地和灌木地的面积与其他 GLC 产品有显著差异。GLC-2015 中的森林面积远高于其他产品。这可能是因为 FROM_GLC 和 GLC_FCS30 将森林定义为树冠覆盖超过

15 %

，而 GLC-2015 使用的阈值为超过

10 %

。GLC2015 和 Globeland30 的农田面积接近，高于 FROM_GLC 但低于 GLC_FCS30。此外，FROM_GLC 低估了农田面积，因为其农田的生产者准确度较低（见表 5），这在之前的研究中也得到了证明（刘和徐，2021；张等，2021）。FROM_GLC 和 Globeland30 的草地面积相似，因为这两个产品的草地准确度相似（见表 5）。然而，FROM_GLC 和 Globeland30 显著高估了草地的范围，许多裸地被错误分类为草地（胡等，2014）。 GLC_FCS30 的草地面积最小，这可能与其对草地植被覆盖的较高阈值有关。对于灌木林，GLC-2015 和 Globeland30 之间的面积差异最小，而 FROM_GLC 和 GLC_FCS30 的面积相似。此外，FROM_GLC 的湿地面积在所有产品中最低，总面积为

0.168 \times 10^{6} {km}^{2}

。相比之下，Globeland30 和 GLC_FCS30 的湿地面积大于 GLC-2015，因为这两个产品将对水敏感的非湿地分类为湿地（Zhang et al., 2023）。特别是，GLC_FCS30 的冻原面积远小于其他产品。这主要是因为在 GLC_FCS30 的原始分类系统中，只有地衣/苔藓被转换为苔原

图 9. GLC-2015 地图与使用全球基于样本的其他产品之间的散点图。

图 10. 全球范围内不同土地覆盖类型在 GLC 产品中的面积比较。类别 ID

10, 20, 30, 40, 50, 60

、

70, 80, 90

和 100 分别表示农田、森林、草地、灌木地、湿地、水体、苔原、不透水表面、裸地以及永久性雪和海冰。

我们使用的分类系统导致了苔原的遗漏。GLC-2015、Globeland30 和 GLC_FCS30 中的不透水表面积非常接近，并且高于 FROM_GLC。对于裸地，Globeland30 与其他产品之间存在较大差异，而 GLC-2015 和 GLC_FCS30 中的面积非常接近。

不同 GLC 产品的各类区域相似性和差异性也在六大洲、按面积排名的前 40 个国家和 21 个生态区进行了比较（图 S5-S7）。总体而言，这四种产品显示出不同类别的相似分布趋势。对于大多数土地覆盖类别，这四种产品在大陆、国家和生态区的排名与其在全球范围内的排名一致，而对于草地和灌木地，这四种产品在三个不同区域尺度上的面积排名则有所不同。

4.3.4 各个类别的视觉比较

在三个地方区域（图 S8）中，对 GLC-2015、Globeland30、FROM_GLC、GLC_FCS30、全球粮食安全支持分析数据（GFSAD30）（Xiong 等，2017；Teluguntla 等，2018）以及其他国家级地图的耕地进行视觉比较。在埃及农业区，GLC-2015、FROM_GLC 和

GLC-FCS30 对农田的划分相似，并且在空间细节上对农田有很好的表现。由于 Google Earth 图像的日期为 2015 年，Globeland30 错过了新耕作的农田。GFSAD30 在五个产品中农田面积最大，但将裸地误分类为农田。在中国东南部的农业区，GLC-2015 与 GFSAD30 和 CLCD 一致。Globeland30 和 GLC_FCS30 高估了农田面积。至于 FROM_GLC，它未能描绘农田的空间分布，并且有许多遗漏。在美国的农田主导区域，FROM_GLC 显著低估了农田的范围。其他五个产品对农田的划分相似，但在一些小区域存在少量差异。例如，Globeland30 将一些草地误分类为农田，而 NLCD 2016 在区分农田小路方面表现良好。

我们还比较了在刚果、中国和美国三个森林普遍地区不同产品的表现（图 S9）。总体而言，GLC-2015 和 Globeland30 在这三个地区的划分准确。FROM_GLC 在刚果和美国的森林表现良好，但在中国高估了森林，将灌木丛和草地错误标记为森林。此外，GFC 在中国倾向于漏掉稀疏树木，而 GLC_FCS30 在所有三个地区都低估了森林的范围。至于国家级产品，CLCD 和 NLCD 2016 在识别森林细节方面表现良好，而 CLUD 则严重漏掉了密林和稀疏林地。

此外，为了将 GLC-2015 在湿地的表现与其他全球和国家级产品进行比较，选择了加拿大南中部、美国沿海和桑达巴尔群岛的三个湿地区域。可以发现，GLC-2015 和 Globeland30 在三个区域内的表现相似，能够很好地识别湿地（图 S10）。出乎意料的是，FROM_GLC 在每个区域的表现都很差，几乎没有捕捉到湿地。GLC_FCS30 在三个区域的质量也不稳定。例如，它在美国沿海严重低估了湿地面积，并在桑达巴尔群岛将红树林完全错误标记为农田。NLCD 2016 和 GMW accu-

湿地的空间模式被准确地展示出来，而 CA_wetlands 地图低估了湿地的范围，因为它将湿地定义为 2000 年至 2016 年间湿地频率不低于

80 %

（Wulder 等，2018）。

为了了解不同产品中不透水表面的空间分布，图 S11 显示了东京、上海和纽约三个特大城市的制图结果比较。在东京，GLC-2015、FROM_GLC 和 GAUD 之间发现了高度一致性，二者都成功捕捉到了城市边缘地区的不透水表面。GLC_FCS30 显示的不透水表面面积最大，因为它将许多农田错误分类为不透水表面。在上海，GLC_FCS30 低估了中心城市的面积，而 CLUD 由于采用视觉解译方法，失去了不透水表面的细节。其他产品通常具有相似的表现，并准确展示了城市的空间分布。对于纽约，FROM_GLC、GLC_FCS30 和 GAUD 与 GLC-2015 一致，而 Globeland30 和 NLCD 2016 的不透水面积高于其他产品。

4.3.5 局部尺度的视觉互比

我们选择了覆盖六大洲和不同景观环境的六个典型地理图块，以进一步展示 GLC-2015 地图、Globeland30、FROM_GLC 和 GLC_FCS30 的映射性能，如图 11 所示。总体而言，从局部的角度来看，GLC-2015 地图在土地覆盖类型上更为多样，并且在各类中具有更好的识别性能。在平坦的农田区域（图 11a 和 b）中，GLC-2015 地图揭示了多样的土地覆盖类型，并准确区分了不透水表面；然而，Globeland30 夸大了不透水表面的范围，而 FROM_GLC 未能描绘小尺寸的不透水表面。此外，FROM_GLC 将一些农田像素错误分类为草地（图 11a），并出现了异常的“印章”（图 11b）。至于山区（图 11c 和 d），GLC-2015 地图揭示了自然森林、人工林、农田和草地的空间模式。在 FROM_GLC 和 GLC_FCS30 的结果中，农田和草地之间存在较大的混淆，而一些不透水表面和农田区域被 FROM_GLC 错误标记为裸地。 11c) 被分类为森林的区域在其他三个产品中被错误识别为农田和草地。在大量树木被开垦为农田的雨林地区（图 11e），GLC-2015 地图、Globeland30 和 GLC_FCS30 在农田面积上有相似之处，但 FROM_GLC 将一些开垦区域识别为草地。此外，GLC-2015 地图准确呈现了不透水表面的空间分布，而其他产品存在遗漏或错误分类。在以农田为主的区域（图 11f），GLC-2015 地图和 Globeland30 显示出更高的一致性，两者都将起伏地区标记为草地。与前面提到的两个产品不同，FROM_GLC 将大面积的农田错误分类为草地，而 GLC_FCS30 未能捕捉到起伏地区的草地。图 11 还显示了不同地理瓦片中融合结果的置信度测量。尽管它并未直接评估制图准确性，但它作为对接受的土地覆盖类别为真实的假设的支持程度，仍然可以反映 GLC-2015 地图的质量。总体而言，GLC-2015 地图的 Bel 在每个图块的大多数区域超过了

80 %

，这证明了我们制图结果的可信度和高质量。

4.4 与国家级产品的比较

除了与现有的 GLC 产品进行比较外，GLC-2015 还与三个国家级产品（CLCD、CLUD 和 NLCD 2016 在 CONUS 地区）进行了比较。我们首先使用基于点的样本（表 S5-S6）比较了 GLC-2015 与 NLCD 2016、CLCD 和 CLUD 的准确性。可以发现，GLC-2015 在中国的总体准确率为

88.8 %

，高于 CLCD（

78.3 %

）和 CLUD（

70.2 %

）。具体而言，GLC-2015 在所有土地覆盖类别中（除了湿地和不透水表面）都达到了最高的生产者准确率（PA）和用户准确率（UA）。在 CONUS 地区，GLC-2015 的表现优于 NLCD 2016，整体准确率提高了

13.2 %

。此外，GLC-2015 在几乎所有土地覆盖类别中表现出更好的制图性能。

对 GLC-2015 与三个国家级产品的准确性比较也使用了基于样本的补丁进行（表 S7-S8）。总体而言，GLC-2015 在中国相对于 CLCD（

83.6 %

）和 CLUD（

75.4 %

）取得了更好的总体精度（OA）

85.7 %

。在生产精度（PA）和用户精度（UA）方面，GLC-2015 在大多数土地覆盖（LC）类别中排名第一和第二。在连续美国（CONUS）地区，GLC-2015 的总体精度（OA）为

84.5 %

，卡帕系数为 0.787，优于 NLCD 2016。尽管 GLC-2015 在农田、森林和不透水表面方面的 PA 或 UA 低于 NLCD 2016，但在其他土地覆盖类别中，GLC-2015 的表现优于 NLCD 2016。

我们进一步对 GLC-2015 的每个土地覆盖（LC）类别与三个国家级产品进行了面积比较（图 S12 和 S13）。一般来说，GLC-2015、CLCD 和 CLUD 在大多数类别中表现出相似的面积。值得注意的是，GLC-2015 中的农田、灌木地和湿地的面积与 CLCD 非常接近，但与 CLUD 不同。在连续美国（CONUS）地区，GLC-2015 和 NLCD 2016 中的农田、水体和裸地面积相近。相比之下，GLC-2015 中其余土地覆盖类别的面积与 NLCD 2016 存在较大差异。GLC-2015 与 NLCD 2016 之间的森林、草地和灌木地的面积差异主要与不同的土地覆盖定义有关。例如，GLC-2015 中森林的树冠覆盖最小比例为

10 %

，而 NLCD 2016 使用的最小比例为

20 %

。NLCD 2016 的不可渗透表面积比 GLC-2015 更高，因为 NLCD 2016 中的“开放城市”包含了过多的植被。

图 11. GLC-2015 地图与其他三种产品在不同大陆的视觉比较。面板（a）至（f）分别是欧洲、亚洲、非洲、北美、南美和大洋洲的示例。

4.5 与现有 GLC 产品相比，GLC-2015 地图的改进

全球范围内三种 GLC 产品之间不一致性的空间分布如图 12 所示。从不一致性图中，我们发现低不一致性区域主要对应于具有简单土地覆盖类型的均匀区域。例如，非洲北部主要被分类为裸地，南美北部主要被分类为森林，格林兰被分类为永久性雪和冰。相比之下，高不一致性区域位于土地覆盖类型复杂的地区，特别是在混合植被区域或稀疏植被区域，如北亚、南非、萨赫尔地区、澳大利亚、北美和南美的东部及南部。

基于全球基于点的样本，我们评估了 GLC-2015 地图、Globeland30、FROM_GLC 和 GLC_FCS30 在上述低不一致性、中等不一致性和高不一致性区域的准确性，如表 7 所示。总体而言，GLC-2015 地图在这三个区域的准确性高于其他三者。对于每个产品，低不一致性区域的准确性最高，其次是中等不一致性区域，最后是高不一致性区域，这表明现有产品的不一致性可以指示地图的质量。在低不一致性区域，GLC-2015 地图与之前产品的整体准确性差距小至

0.1 % - 0.6 %

。然而，在中等和高不一致性区域，比较准确性差距分别扩大到

19.3 % - 28.0 %

和

27.5 % - 29.7 %

。这证明了 GLC-2015 地图的优越性。

图 12. Globeland30、FROM_GLC 和 GLC_FCS30 之间不一致性的分布。蓝色矩形是高不一致性网格，其中像素值为 1 的区域占总面积的比例超过

20 %

。

在高识别难度的领域中，优于其他三种产品。

我们进一步对三个之前的 GLC 产品和 GLC-2015 地图在高不一致性区域进行了比较分析。我们计算了

4^{\circ} \times 4^{\circ}

网格中值为 1 的像素面积。选择值为 1 的像素面积占总面积超过

20 %

的网格作为高不一致性网格。最终，共选择了 147 个网格（图 12）。为了比较 GLC-2015 地图与其他地图的准确性，我们利用散点图表示每个高不一致性网格中一个之前产品的整体准确性与 GLC-2015 地图之间的关系，基于全球点样本（图 13）。大多数点位于

1 : 1

线之上；即，这些点对应的

y

轴的值大于

x

轴的值，这表明 GLC-2015 地图在大多数高不一致性网格中表现优于其他 GLC 产品。可以发现，每个散点图中的拟合线的截距超过 0.40，斜率小于 0.55，

R^{2}

小于 0.35，显示出 GLC-2015 地图与其他地图之间存在较大差异。

为了直观比较 GLC2015 地图与三个现有地图在高不一致性区域的映射结果，我们基于四个

5 km \times 5 km

基于补丁的样本，专注于在各个区域进行视觉检查，并进行了如图 14 所示的准确性统计。在详细展示中，明显可以看出三个先前产品在四个区域存在较大差异。从四个视觉案例中可以看出，高不一致性区域的 LC 类别之间的典型混淆情况如下：(1) 灌木林容易被误分类为森林和草地。(2) 农田、草地和灌木林之间严重混淆。(3) 裸地可能与灌木林和草地混合。总体而言，GLC-2015 地图在地方准确性评估中优于其他产品。在西澳大利亚的穆尔加灌木林（图 14a）中，GLC-2015 地图和 GLC_FCS30 显示了裸地和森林的相似空间分布和形状，与真实景观一致，而 Globeland30 将裸地分类为草地，FROM_GLC 则低估了裸地。至于赞比西亚和莫帕尼林地（图。在 14b)中，GLC2015 地图表现最佳，整体准确率达到

82.6 %

，其次是 FROM_GLC。相比之下，其他产品将灌木丛与森林或草地混合。在美国西部的农业用地（图 14c）中，GLC-2015 和 Globeland30 的制图结果与地面真实情况相似，而 FROM_GLC 与其他产品存在较大差异。至于几内亚森林-草原马赛克（图 14d），GLC-2015 地图和 Globeland30 显示出高空间一致性，且两者对农田、森林和不透水表面的分类准确，而其他产品则将农田错误识别为其他土地覆盖类型。

4.6 DSET 与其他方法的比较

4.6.1 与其他数据融合方法的比较

GLC-2015 的准确性评估是通过 DSET 和其他两种数据融合方法的全球制图结果，基于两个全球验证样本集进行的。全球点基样本的混淆矩阵见表 S9 和 S10。通过 MV 和 SC 获得的全球土地覆盖分类的总体精度（OA）分别为

72.1 %

和

71.8 %

。如表 3 所示，通过 DSET 方法获得的 GLC-2015 地图的 OA 为

79.5 %

，与 MV 和 SC 的制图结果相比，提升了

7.4 %

和

7.7 %

。此外，GLC-2015 地图在大多数土地覆盖类别中获得了更高的生产精度（PA）和用户精度（UA）。

在使用全球基于样本的补丁进行不同数据融合方法获得的 GLC 地图进行评估时，DSET 方法获得了最高的总体精度

83.6 %

和 0.566 的卡帕系数，而

80.1 %

为 0.497。

表 7. 三个区域 GLC 产品的准确性评估。

	GLC-2015		全球土地 30		FROM_GLC		GLC_FCS30
	OA	卡帕	OA	卡帕	OA	卡帕	OA	卡帕
低不一致性区域	0.951	0.938	0.945	0.929	0.950	0.936	0.951	0.937
中等不一致的领域	0.760	0.723	0.561	0.498	0.480	0.411	0.567	0.495
高不一致性区域	0.567	0.498	0.292	0.204	0.286	0.198	0.270	0.160

图 13. GLC-2015 地图与其他产品在高不一致性网格中的整体准确性关系。

对于 MV 和

71.8 %

，SC 的值为 0.391（表 S11）。在这里，DSET 方法实现了

3.5 %

和

11.8 %

的准确性提升。与其他两种方法相比，DSET 几乎在所有 LC 类别中提高了准确性，特别是在草地、灌木地和湿地方面。我们还比较了 DSET 与其他方法之间的整体准确性关系。从散点图（图 15）中，我们发现大多数点位于

1 : 1

线之上，这意味着 DSET 在全球大多数地区的映射性能优于其他方法。

土地覆盖制图结果来自 DSET 和其他方法，已在六个大小为

{0.25}^{\circ}

的图块中直观展示，覆盖不同的大陆，如图 S14 所示。尽管 DSET 和 MV 的制图结果在除北美图块外的所有图块中显示了相似的 LC 类别空间分布，但 DSET 更准确地描绘了散布在以农田为主的（图 S14a）或干旱（图 S14c）地区的小型不透水表面。值得注意的是，SC 方法的制图结果与 DSET 和 MV 获得的结果存在显著差异。例如，SC 方法未能捕捉到分散的农村住宅区（图 S14b），并将草地错误分类为农田（图 S14d）。总体而言，DSET 方法在各种 LC 类别中的识别性能优于其他两种方法。

4.6.2 与随机森林的比较

基于来自

20 %

的全球基于点的样本的验证数据，我们评估了通过 DSET 方法获得的 GLC-2015 地图的质量，以及通过 RF 分类器分类的映射结果，共计 300 个网格。DSET 方法在六大洲的平均总体精度（OA）为

80.9 %

，而 RF 的准确性较低，为

69.9 %

。从比较 DSET 和 RF 逐网格的 OA 和 kappa 系数的散点图中发现，DSET 在大多数网格中具有更高的准确性（图 S15）。特别是，点聚集在图的右上角（图 S15a），这表明使用全球基于点的样本训练的 RF 分类器在这些选定网格中表现良好，尽管其不如 DSET 方法。图 S16 显示了 DSET 和 RF 在六大洲的 OA。我们发现 DSET 方法在每个大洲的表现都优于 RF 分类器。特别是，两种方法的映射结果在大洋洲的准确性最低。这可能是因为选定的网格位于具有异质景观的区域。关于 RF 分类器的箱线图，除了大洋洲外，所有大陆的低边缘均超过

60.00 %

，这表明由全球基于点的样本训练的 RF 分类器的可靠性。然而，RF 分类器的表现不如 DSET 方法。这突显了 DSET 方法在整合现有地图以获得更好结果的可行性。

4.7 进展与局限性

为了解决当前 30 米全球土地覆盖（GLC）产品在异质区域存在较大不一致性以及对光谱相似的土地覆盖类型映射精度低的问题，本研究采用基于 DSET 的多源产品融合方法，创建了改进的全球土地覆盖图

图 14. GLC-2015 地图与基于

5 km \times 5 km

的补丁样本和谷歌地球图像的其他三种产品在四个高不一致区域（a-d）之间的视觉比较。每个产品的总体精度（OA）是通过相应的补丁样本计算得出的。

图 15. 基于全局补丁样本的 DSET 与其他数据融合方法之间的散点图。

2015 年）。结果表明，GLC-2015 具有良好的映射性能，基于两个不同的验证集，OA 达到了

79.5 %

和

83.6 %

。与现有产品相比，GLC-2015 在全球范围内大大提高了准确性，特别是在高不一致性地区，显著提高了

27.5 % - 29.7 %

。与其他常用的数据融合方法相比，采用的 DSET 方法提供了更高的 OA 和 kappa 系数，显示了 DEST 在整合各种土地覆盖数据方面的优势。无论是各自的全球点基样本还是全球块基样本，GLC-2015 在草地、灌木地和湿地的准确性相对较低，与其他土地覆盖类别相比。这些土地覆盖类别由于与其他类别的光谱相似性、模糊的定义或区域的多样性，在全球范围内映射具有挑战性。然而，与其他现有的 30 米 GLC 产品相比，GLC-2015 地图在草地、灌木地和湿地的 PA 和 OA 排名第一或第二，表明 GLC-2015 在映射不良的土地覆盖类别方面有所改善。研究发现，

GLC-2015 地图在争议较多的地区表现较差（表 7）。然而，GLC-2015 地图在其他产品中表现优越，特别是在高度不一致的地区。此外，GLC-2015 地图与其他地图在高不一致地区的准确性差距大于在争议较少地区的差距，这意味着 GLC-2015 地图在映射不良地区提供了更准确的土地覆盖特征。尽管 GLC-2015 地图无法避免所有因候选 GLC 产品之间的争议而导致的错误映射结果，但在易于误分类的类别和高度不一致的地区，其映射准确性优于现有产品。

尽管 GLC-2015 地图显著提高了不一致区域的制图精度，但仍然存在一些不确定性。首先，我们使用了三种多类 GLC 地图和四种单类 GLC 地图作为整合的源数据。由于这些产品提供了全球范围内的土地覆盖信息，因此在某些特定区域不可避免地存在分类错误。基于 DEST 的多源产品融合方法高度依赖于这些候选地图的质量，因此这些源地图之间的不一致可能导致错误分类。其次，GlobeLand30 的日期时间与其他地图不同。由于 5 年的时间间隔，土地覆盖发生了变化，这不可避免地扭曲了融合结果。然而，与全球陆地面积相比，变化区域微不足道。由于土地覆盖变化引起的不确定性与分类错误相比是微小的。此外，使用全球基于点的样本来评估每个产品的可靠性。对于土地覆盖变化的区域，GlobeLand30 的准确性低于其他产品。在这种情况下，融合更多依赖于其他地图，以避免由于土地覆盖（LC）变化引起的错误。第三，由于不同的 LC 定义，分类系统转换中的不确定性是不可避免的（Zhang et al., 2017），这可能会对基于 DSET 方法的融合造成问题。然而，我们对候选地图进行了可靠性评估，以减少分类系统转换中的不确定性对融合的影响。用于可靠性评估的点样本是根据我们分类系统中的 LC 定义进行标记的，因此所有地图都是在我们使用的分类系统标准下进行评估的。通过可靠性评估，候选地图在信息不匹配的区域被评估为准确性较低。当逐网格整合所有地图时，不匹配的信息对融合的贡献会更小。最后，大多数候选 LC 产品使用简单的分类系统，而没有二级分类系统，因此在作为数据融合的源数据时，它们对更详细的分类系统没有贡献。尽管一些地图提供了详细的土地覆盖（LC）分类结果，例如 2015 年的 GLC_FCS30 和 FROM_GLC，但由于定义和标准的巨大差异，二级分类系统的标准化和统一性可能面临一些挑战。因此，GLC-2015 采用了一个包含 10 个主要土地覆盖类别的简单分类系统。在未来的工作中，将采取措施以满足对 GLC 制图更详细分类系统的期望。可以基于高度适用和通用的 DSET 方法，进一步开发具有详细分类系统的改进 GLC 产品，而不是简单的单级分类系统，前提是有更多具有多样化土地覆盖类别的产品可用。此外，应开发一个可行的框架，以将不同的二级分类系统转换为统一系统。

5 数据可用性

2015 年改进的全球土地覆盖图，分辨率为 30 米，可在https://doi.org/10.6084/m9.figshare.22358143.v2（Li et al., 2023）获取。GLC-2015 产品由全球陆地区域的总计

15074^{\circ} \times 4^{\circ}

个地理网格以 GeoTIFF 格式组织。GLC-2015 产品的每个图像命名为“GLC-2015_long_lat”（long 和 lat 分别表示网格左下角的经度和纬度）。

6 结论

全球环境和气候研究中，具有精细空间分辨率的 GLC 信息对于捕捉人类活动的足迹至关重要。由于分类方案、卫星传感器数据、分类算法和采样策略的差异，现有的 GLC 产品在世界某些地区，尤其是在碎片化区域和过渡带，存在较高的不一致性。在高映射不一致性区域，获得更准确和可靠的数据是非常渴望的。在本研究中，我们借助 GEE 平台，基于 DSET 整合多个现有 GLC 地图，开发了 GLC-2015 地图。GLC-2015 地图可以显著提高映射精度，并在各种土地覆盖类别中具有良好的识别性能。

GLC-2015 地图通过全球点基样本和全球块基样本进行了验证。准确性评估显示，GLC-2015 地图的总体精度（OA）为

79.5 %

，使用了 34711 个全球点基样本的卡帕系数为 0.757；总体精度（OA）为

83.6 %

，使用了 201 个全球块基样本的卡帕系数为 0.566。数据对比表明，GLC-2015 地图在视觉和定量上均超越了其他三种产品，通过全球点基样本验证的 OA 提升为

14.0 % - 17.8 %

，通过全球块基样本验证的提升为

5.9 %

24.5 %

。与其他产品相比，GLC-2015 地图在大多数土地覆盖类别中，如森林、农田，误分类情况较少。