文章
海上丝绸之路沿海地区多源土地利用/土地覆盖数据集的数据融合与精度分析
万侯
和西永侯 1,3,4,*
中国科学院烟台海岸带研究所,烟台 264003, 中国;whou@yic.ac.cn
中国科学院资源与环境学院,北京 100049,中国
中国科学院烟台 264003,沿海环境过程与生态修复重点实验室
中国青岛 266071,中国科学院海洋大科学中心
* 通信: xyhou@yic.ac.cn; 电话: +86-0535-2109196
收到:2019 年 11 月 4 日;接受:2019 年 12 月 2 日;发布:2019 年 12 月 4 日
摘要
高精度的土地利用/土地覆盖分类制图源自遥感,为全球和区域尺度的环境评估、气候变化模拟、地理条件监测和环境管理提供了重要的数据集。这是地球系统科学研究中的一个重要课题,而沿海地区是该领域的热点区域。本文以海上丝绸之路的沿海地区为研究对象,采用基于一致性分析和模糊集理论的融合方法,实现了三种土地利用/土地覆盖数据集的融合:MCD12Q1-2010、CCI-LC2010 和 GlobeLand30-2010。通过误差矩阵、空间混淆、平均整体一致性和平均类型特异一致性分析了融合结果的准确性。主要发现如下:(1) 在基于谷歌地球建立参考数据后,与三种输入数据源相比,融合数据的生产者准确性和用户准确性均有所提高,且融合数据具有最高的整体准确性和 Kappa 系数,值为
和 0。8617,分别。(2) 各种输入数据源在融合数据中不同土地利用/土地覆盖类型的正确分类贡献和误分类影响方面存在差异;此外,融合数据与任何一个输入数据源之间的整体准确性和 Kappa 系数远高于任何两个输入数据源之间的值。(3) 融合数据的平均整体一致性最高为
,大约比输入数据源高出
。(4) 融合数据中农田、森林、草地、灌木地、湿地、人造表面、裸地和永久性雪和冰的平均类型特异性一致性最高,分别为
、
和
;与输入数据源相比,融合数据的平均类型特异性一致性高出
。本文为未来全球和区域沿海地区土地利用/土地覆盖数据的发展和准确性评估提供了信息和建议。
关键词:遥感;土地利用/土地覆盖;数据融合;一致性分析;模糊集理论;精度分析;海上丝绸之路沿海地区
1. 引言
高精度的全球和区域土地利用/土地覆盖分类数据集可以提供重要的基础信息,有效支持全球变化和区域可持续发展的科学研究,作为客观信息来源的关键
描述陆地生态系统的结构及其生态过程[1-3]。全球各国和组织相继应用不同的影像数据和分类技术,进行以土地利用/土地覆盖为主要数据类型的众多遥感制图研究。此外,已经形成了许多全球和区域尺度的土地利用/土地覆盖数据集[4,5],例如,由美国地质调查局建立的 IGBP-DISCover、由美国马里兰大学开发的 UMD、由欧盟联合研究中心建立的 GLC2000、由美国波士顿大学制作的 MCD12Q1、由欧洲航天局准备的 GlobCover 和 CCI-LC、由中国清华大学开发的 FROM-GLC,以及由中国国家测绘地理信息局提供的 GlobeLand30[6-14]。然而,由于使用了不同的数据源、分类系统和分类技术,来自单一数据源的土地利用/土地覆盖数据集存在许多问题,如准确性低、一致性差以及与统计数据存在显著差异[15]。
在多源数据共存和融合研究增加的背景下,基于多源数据融合的精细土地利用/土地覆盖遥感分类制图已成为一个热门问题[16,17]。具体而言,现有的土地利用/土地覆盖分类数据集被全面利用,并采用数学算法进行多源数据融合,以获得具有时空连续性和准确估计的结果。总体而言,融合结果在一定程度上利用了多源数据的优势和特性,并弥补了单一数据源的缺陷和不足。因此,学者和众多国际组织充分利用数据融合技术的优势,开展基于多源数据融合的土地利用/土地覆盖遥感分类制图研究[18,19]。例如,Jung 等人提出了一种基于亲和指数的融合方法,该方法融合了 GLCC、GLC2000 和 MODIS 数据,融合结果更好地表达了异质区域的土地利用/土地覆盖类型[20]。Schepaschenko 等人。 以俄罗斯为研究对象,提出了一种基于适宜性指数的融合方法,该方法融合了遥感数据、统计数据和实地调查数据;融合结果应用于生化模型的参数设置[21]。Pérez-Hoyos 等人利用模糊集理论实现了欧洲地区 CORINE、GLC2000、MODIS 和 GlobCover 数据的融合,融合结果在空间一致性和准确性方面得到了改善[22]。Kinoshita 等人使用逻辑回归模型实现了 MOD12C4/5、UMD、GLC2000、GlobCover 和 GLCNMO 数据的融合,发现融合数据集的数量对融合结果的准确性有重要影响[23]。Bai 等人设计了一种基于模糊逻辑的决策融合方法,融合了 GLCC、UMD、GLC2000、MODIS LC、GlobCover、MODIS VCF、MODIS 农田概率和 AVHRR CFTC 等多源数据集,并生成了一套全球范围内空间分辨率为 1 公里的土地利用/土地覆盖融合数据[24]。 截至目前,基于多源数据融合的土地利用/土地覆盖遥感分类制图在大多数陆地区域已经相对成熟,而对宏观尺度沿海地区的相关研究仍然不足。
海上丝绸之路起源于蓬勃发展的亚太经济圈,延伸至高度发达的欧洲经济圈;其发展使沿线国家受益,尽管沿线的生态环境也受到了一定影响。沿海地区覆盖了大部分沿海陆地和近海海域,该地区的土地利用/土地覆盖因陆海格局、气候、地形、入海河流、植被等因素的影响,与陆地面积有显著差异。海上丝绸之路的沿海地区位于陆地生态系统和海洋生态系统之间,作为经济和文化繁荣的区域,包含聚集的城市、人口和产业,同时也是受到人类活动和气候变化影响的脆弱生态系统区域。 这些地区的土地利用/土地覆盖的遥感分类制图可以为区域尺度的环境评估、气候变化模拟、地理条件监测和环境管理的科学研究提供基本数据来源。
因此,参考现有研究对各种分类数据的评估[4,5],选择了三种相对高精度的土地利用/土地覆盖分类数据集(MCD12Q1-2010、CCI-LC2010 和 GlobeLand30-2010)作为本研究的源数据集。换句话说,基于海上丝绸之路沿海地区,对土地利用/土地覆盖数据集进行了协议分析,以确定这三种数据集的一致性和不一致性,并采用基于模糊集理论的融合方法重构不一致性,以生成高精度的土地利用/土地覆盖融合数据。本文为未来全球和区域沿海地区土地利用/土地覆盖的数据开发和特征分析研究奠定了坚实基础。
2. 研究区域和材料
2.1. 研究区域
根据相关研究结果[29,30],本研究区域定义为沿海岸线 100 公里范围内的陆地和 100 米等深线范围内的海域(见图 1),涵盖东亚、东南亚、南亚、西亚、东北非和南欧。该区域包括广泛的陆地和海洋,自然环境复杂多样,人类活动影响深远。该地区的土地利用/土地覆盖受自然条件、资源禀赋、人类环境和社会经济的影响,具有与陆地面积显著不同的特征[31]。具体而言,该地区的气候类型表现出显著的带状分布,包括温带气候、亚热带气候、热带气候和地中海气候,植被类型则表现出显著的多样性,包括温带混交林、温带落叶阔叶林、亚热带常绿硬叶林、亚热带常绿阔叶林、雨林和稀树草原。 此外,该地区拥有漫长的海岸线和许多大型港口,包括广州、孟买、雅加达、新加坡和雅典等多个大型港口城市,以及中国-印度支那半岛、中国-巴基斯坦和中国-孟加拉国-印度-缅甸等几个主要经济走廊,这些都是区域经济繁荣和发展的最具活力的地区。
图 1. 研究区域概览图。
2.2. 材料
近年来,由多种制图技术和数据源产生的全球和区域尺度的土地利用/土地覆盖分类数据不断涌现,并逐渐得到应用,如 IGBP-DISCover、UMD、GLC2000、MCD12Q1、GlobCover、CCI-LC、FROM-GLC 和 GlobeLand30。我们综合了现有研究中对各种分类数据的评估[4,5],并选择了三种整体准确率相对较高的分类数据类型(MCD12Q1-2010、CCI-LC2010,
并使用 MCD12Q1-2010、CCI-LC2010 和 GlobeLand30-2010 作为源数据集进行本研究(表 1)。MCD12Q1-2010 的分辨率为 500 米,其土地利用/土地覆盖被划分为 IGBP 指定的 17 类,由美国波士顿大学使用 MODIS 影像制作[32]。CCI-LC2010 的分辨率为 300 米,其土地利用/土地覆盖被划分为 FAO 指定的 22 类,由欧洲航天局使用 MERIS 和 SPOT-VGT 影像建立[11,33]。GlobeLand30-2010 的分辨率为 30 米,其土地利用/土地覆盖被划分为 10 种类型,由中国国家测绘地理信息局开发;主要影像来源为 Landsat-TM/ETM7 影像,并辅以 HJ-1A/b 影像
。
表 1. 三个土地利用/土地覆盖数据集的基本信息。
数据名称 |
MCD12Q1 |
CCI-LC |
全球土地 30 |
时期/年 |
2010 |
2010 |
2010 |
分辨率/m |
500 |
300 |
30 |
整体准确率/% |
71.6 |
70.8 |
80.3 |
传感器 |
MODIS |
MERIS, SPOT-VGT |
Landsat-TM/ETM7, HJ-1A/b |
分类系统 |
IGBP 17 类别 |
FAO LCCS 22 类别 |
10 节课 |
分类方法 |
决策树 |
神经网络 |
基于 POK |
创作者 |
NASA |
ESA |
NASG |
下载数据网址 |
https://ladsweb.modaps. eosdis.nasa.gov/search/
|
http://maps.elie.ucl.ac. be/CCI/viewer/
|
http://www.globallandcover.com/GLC30Download/DownLoad.aspx
|
注:NASA 是美国国家航空航天局;ESA 是欧洲航天局;NASG 是中国国家测绘地理信息局。
2.3. 数据预处理
根据多源数据融合的要求,必须对数据进行预处理,包括上述三种土地利用/土地覆盖分类数据,这些数据与研究区域的矢量数据进行了拼接和裁剪,以获得边界一致的土地利用/土地覆盖分类数据集。为了防止面积失真,这三个数据集统一为 WGS 1984 圆柱等面积投影。采用最大面积聚合方法将三个数据集转换为
分辨率,选择 300 米分辨率的主要原因是 300 米分辨率的数据集具有相对较优的分类结果。三个数据集的土地利用/土地覆盖分类系统[11,14,32]进行了合理的排列,排列后的类型代码及相应关系如表 2 所示。
表 2. 三个土地利用/土地覆盖数据集的分类系统。
MCD12Q1-2010 |
CCI-LC2010 |
全球土地 30-2010 |
|
120 |
耕地,雨养,草本覆盖 |
11 |
耕地 |
10 |
农田,雨养,树木或灌木覆盖 |
12 |
耕地,灌溉或洪水后 |
20 |
140 |
马赛克自然植被/农田 (
) |
30 |
马赛克农田/自然植被 (
) |
40 |
常绿阔叶林 |
20 |
树冠,阔叶,常绿,封闭到开放 |
50 |
森林 |
20 |
落叶阔叶林 |
|
树冠,阔叶,落叶,封闭 |
61 |
落叶阔叶林 |
40 |
树冠,阔叶,落叶,开放 |
62 |
常绿针叶林 |
10 |
树冠,针叶,常绿,封闭 |
71 |
常青针叶林 |
10 |
树冠,针叶,常绿,开放 |
72 |
落叶针叶林 |
30 |
树冠,针叶,落叶,封闭 |
81 |
树冠,针叶,落叶,开放 |
82 |
混合森林 |
50 |
树冠,混合叶型 |
90 |
30 |
木质草原 |
80 |
马赛克草本覆盖/树木和灌木 (
) |
100 |
草原 |
草原 |
90 |
马赛克树木和灌木/草本植物覆盖 (
) |
110 |
草原 |
100 |
草原 |
130 |
表 2. 续。
MCD12Q1-2010 |
CCI-LC2010 |
全球土地 30-2010 |
封闭灌木丛 |
60 |
常绿灌木丛 |
121 |
|
|
开放灌木丛 |
70 |
落叶灌木林 |
122 |
灌木丛 |
40 |
|
|
树冠,淹没,淡水或咸水 |
160 |
|
|
永久湿地 |
110 |
树冠,淹水,盐水 |
170 |
湿地 |
50 |
|
|
|
180 |
|
|
水 |
170 |
水体 |
210 |
水体 |
60 |
- |
- |
地衣和苔藓 |
140 |
苔原 |
70 |
城市和建筑区 |
130 |
城市地区 |
190 |
|
80 |
贫瘠或植被稀疏 |
160 |
稀疏灌木 稀疏草本覆盖 固结裸露区域 非固结裸露区域
|
|
光秃的土地 |
90 |
雪和冰 |
150 |
永久雪和冰 |
220 |
|
100 |
注:此表中的数字是多源土地利用/土地覆盖数据集原始分类系统的类型代码。
3. 融合原理与方法
3.1. 技术
具体技术如图 2 所示。首先进行了数据收集和预处理。然后,采用基于一致性分析和模糊集理论的融合方法,实现了多源土地利用/土地覆盖分类数据的融合。最后,分析了融合结果的准确性。
图 2. 研究内容和技术方法。(a) 数据收集;(b) 数据预处理;(c) 多源数据融合;(d) 数据准确性分析。
3.2. 建立目标分类系统
需要制定一个科学合理的土地利用/土地覆盖分类系统,特别是在土地利用/土地覆盖遥感分类制图的研究中。参考现有的研究成果[9,11,14,32-34],沿海土地利用/土地覆盖被划分为八种主要类型:农田、森林、草地、灌木地、湿地、人造表面、裸地和永久性雪冰(表 3)。该分类系统具有两个基本特征:(1)所有分类信息均可从上述三种输入数据源中获得,(2) 所有融合结果均可通过遥感影像识别。
表 3. 研究区土地利用/土地覆盖分类系统。
数字 |
类型名称 |
描述 |
1 |
耕地 |
用于农业、园艺和花园的土地。 |
2 |
森林 |
树木覆盖的土地,植被覆盖率超过
。 |
3 |
草原 |
覆盖有自然草的土地,植被覆盖率超过
。 |
4 |
灌木丛 |
灌木覆盖的土地,植被覆盖率超过
。 |
5 |
湿地 |
被水体或湿地植物覆盖的土地。 |
6 |
人工表面 |
人类活动改造的土地。 |
7 |
光秃的土地 |
没有植被覆盖或植被覆盖低于
的土地。 |
8 |
永久雪和冰 |
被永久雪、冰川或冰盖覆盖的土地。 |
根据表 3 中的土地利用/土地覆盖分类系统,三个输入数据源的土地利用/土地覆盖类型被重新分类为八种目标类型,如表 4 所示。值得注意的是,在 CCI-LC2010 中,编码为 40 和 100 的土地利用/土地覆盖类型分别是马赛克农田/自然植被(
)和马赛克草本覆盖/树木和灌木(
)。分析表明,这两种类型对森林比例有利,因此这两种类型都被纳入森林的目标类型。此外,为了方便后续研究,输入数据源中的水体和冻土也被纳入湿地的目标类型。
表 4. 三个数据集中土地利用/土地覆盖类型的对应关系。
目标类型 |
MCD12Q1-2010 |
CCI-LC2010 |
全球土地 30-2010 |
耕地 |
120,140 |
|
10 |
2 森林 |
|
|
20 |
3 草原 |
|
110,130 |
30 |
灌木丛地 |
60,70 |
121,122 |
40 |
5 湿地 |
110,170 |
|
|
6 人工表面 |
130 |
190 |
80 |
7 裸土地 |
160 |
|
90 |
8 永久雪和冰 |
150 |
220 |
100 |
注:此表中的数字是多源土地利用/土地覆盖数据集原始分类系统的类型代码,如表 2 所示。
接下来,三个重新分类的输入数据源(即 MSRmcd-2010、MSRcci-2010 和 MSRgl30-2010)被空间叠加,以确定这三个数据集中土地利用/土地覆盖类型的逐像素对应关系。然后,我们逐像素评估不同数据集的土地利用/土地覆盖类型是否相同,并确定这三个数据集之间的一致性和不一致性[35]。具体而言,对于每个像素,如果三个数据集中有两个或三个使用相同的土地利用/土地覆盖类型,则该像素的类型将被定义为此类型(即一致性,编码为 1-8);如果三个数据集的类型各不相同,则该像素将被定义为不一致,并编码为 9。最后,基于不一致性,三个未重新分类的原始土地利用/土地覆盖分类数据被裁剪,之后将这三个裁剪的数据集与一致性数据拼接,以获得初步融合数据集(即 Fmcd-1、Fcci-1 和 Fgl30-1)。
3.4. 争议的重建
基于模糊集理论的数据融合方法被用于重建上述初始土地利用/土地覆盖融合数据集。
首先,对于每个数据集的初始类型,分配了八个“隶属度”值,以建立与每个目标类型的相应关系,表征每个初始类型属于每个目标类型的程度。值得注意的是,亲和指数被用来指示
“隶属度”。具体来说,如果亲和指数为 4,则初始类型和目标类型相同;如果亲和指数为 0,则两种类型完全不同;如果亲和指数为 1、2 或 3,则随着分数的增加,隶属度变得更强。附录 A-C 分别呈现了三个初始融合数据集的隶属度分数。
其次,每次轮换固定一个像素。如果所有三个初始融合数据集的初始类型为
,则该像素被定义为初始类型;如果所有三个初始融合数据集的初始类型不为
,则初始融合数据集的初始类型和目标类型的隶属度将根据附录 A-C 进行评分。具体公式如下[20]:
其中
是当前像素的行;
是当前像素的列;
是目标类型的代码;
是初始融合数据集的代码;
是像素
在初始融合数据集
中针对目标类型
的分数;
是像素
针对目标类型
的总分。为了消除初始融合数据集中隐藏的误分类,并提高在特征多样区域的评分可信度,像素分数在
领域进行了加权。评分后,比较每个目标类型的总像素分数,然后将像素定义为总分最高的目标类型。因此,最终输出是一组基于 2010 年的海上丝绸之路沿海地区 300 米的土地利用/土地覆盖融合数据(即 FusLULC-2010)。
3.5. 精度分析方法
错误(混淆)矩阵是一种有效的方法,用于测量土地利用/土地覆盖分类数据集中土地利用/土地覆盖类型的分类准确性 [36-38]。通过计算参考数据和待验证数据的生产者准确率(PA)、用户准确率(UA)、总体准确率(OA)和 Kappa 系数(K),可以测量两个数据集之间的一致性。具体公式如下 [39]:
其中
是土地利用/土地覆盖类型;
是正确分类为类型
的像素数量;
是参考数据中类型
的像素数量;
是待验证数据中类型
的像素数量;
是总像素数量。
谷歌地球可以实时为用户提供高分辨率的全球图像数据,这些图像已成为中低分辨率土地利用/土地覆盖遥感制图精度分析的有效参考数据[40]。验证样本收集和制图精度分析的具体过程如下:(1) 基于 ArcGIS,在研究区域内随机生成采样点;(2) 通过叠加分析获取多源土地利用/土地覆盖数据集在采样点的分类信息(即待验证的数据);(3) 根据高分辨率的谷歌地球图像,可以对采样点的土地利用/土地覆盖类型进行视觉解读;值得注意的是,某个采样点的土地利用/土地覆盖类型被定义为采样点周围
区域内最主要的土地类型(即参考数据);(4) 土地利用/土地覆盖的精度分析结果。
遥感制图是基于误差矩阵获得的。此外,进行多源土地利用/土地覆盖数据集的相互验证也很重要[41]。具体而言,将任意两个多源土地利用/土地覆盖数据集进行空间叠加,以获得两个数据集之间土地利用/土地覆盖类型的逐像素对应关系,然后根据混淆矩阵汇总空间叠加结果。最终获得土地利用/土地覆盖类型的空间混淆及其准确性特征。
土地利用/土地覆盖数据集的平均整体一致性和平均特定类型一致性是有效的指标,可以用来定量描述土地利用/土地覆盖分类数据集之间的一致性精度。在本文中,计算了任意两个土地利用/土地覆盖数据集之间的一致性(即计算了两个数据集中具有相同分类类型的像素百分比),然后通过计算该数据集与其他任一数据集之间一致性的平均值,得到了一个数据集的平均整体一致性。此外,计算了任意两个土地利用/土地覆盖数据集之间某一类型的一致性,然后通过计算该类型在该数据集与其他任一数据集之间一致性的平均值,得到了该类型在一个数据集中的平均一致性。具体公式如下:
其中
是多源土地利用/土地覆盖分类数据集;
是数据集
与其他任何数据集之间的一致性;
是数据集
的平均整体一致性;
是土地利用/土地覆盖类型;
是两个数据集中类型
的像素数量;
和
分别是数据集
和
中类型
的像素数量;
是数据集
与其他任何数据集之间类型
的一致性;均值
是数据集
中类型
的平均一致性。
4. 融合结果与准确性分析
4.1. 多源土地利用/土地覆盖数据集的融合结果
FusLULC-2010 是一个沿海上丝绸之路地区的土地利用/土地覆盖融合数据集,采用上述融合方法获得,如图 3 所示。与通过谷歌地球图像的视觉观察形成的主观认知相比,可以初步确定该数据集能够准确反映中国黄海和渤海沿岸、东南亚沿岸、印度东海岸以及地中海沿岸广泛分布的农田。该方法能够准确反映日本海沿岸、南中国海沿岸、东南亚沿岸、印度西海岸以及南欧沿岸广泛分布的森林。它还能够准确描述分布在南班牙沿岸、从摩洛哥到阿尔及利亚的沿岸、希腊沿岸、南土耳其沿岸、从吉布提到索马里的沿岸以及西也门沿岸的草地或灌木地。它还能够准确描述分布在北摩洛哥沿岸、从突尼斯到厄立特里亚的沿岸以及从阿拉伯半岛到巴基斯坦的沿岸的裸地。 与此同时,位于陆地与海洋交界处的湿地、研究区内零星分布的人造表面以及源自阿尔卑斯山的永久雪和冰也可以被准确描绘。
图 3. 海上丝绸之路沿海地区的土地利用/土地覆盖融合数据集(FusLULC-2010)。
4.2. 基于谷歌地球采样的准确性分析
在研究区域内随机生成了采样点,采样间隔为 5 公里,最终获得 5896 个采样点。基于高分辨率的谷歌地球图像,对采样点的土地利用/土地覆盖类型进行了视觉解读,以获取参考数据。然后,通过叠加分析获得了 FusLULC-2010、MSRmcd-2010、MSRcci-2010 和 MSRgl30-2010 采样点的分类信息。最后,基于误差矩阵获得了土地利用/土地覆盖遥感制图的准确性分析结果(图 4 和表 5)。
在 FusLULC-2010 中,农田、森林、灌木丛、湿地和人工表面的生产者精度高于三个输入数据源;此外,草地的生产者精度低于 MSRg130-2010,裸地的生产者精度低于 MSRcci-2010。同时,在 FusLULC-2010 中,森林、草地、灌木丛和裸地的用户精度高于三个输入数据源;此外,农田和湿地的用户精度低于 MSRg130-2010,人工表面的用户精度低于 MSRmcd-2010。值得注意的是,永久雪和冰的采样点数量为四个,仅占总采样点的
;少量参考数据无法准确描述制图结果的可靠性和可用性,可能严重误导制图结果的真实精度。
此外,FusLULC-2010 的整体准确率和 Kappa 系数最高,分别为
和 0.8617,换句话说,整体准确率比三种输入数据源高出
,Kappa 系数比三种输入数据源高出
。
图 4. Google Earth 参考数据与土地利用/土地覆盖数据之间的类型精度比较(1. 农田;2. 森林;3. 草地;4. 灌木地;5. 湿地;6. 人工表面;7. 裸地;8. 永久性雪和冰)。
表 5. 土地利用/土地覆盖数据的整体精度比较。
数据名称 |
OA/% |
卡帕系数 |
FusLULC-2010 |
90.37 |
0.8617 |
MSRmcd-2010 |
84.55 |
0.7800 |
MSRcci-2010 |
84.43 |
0.7770 |
MSRgl30-2010 |
87.14 |
0.8162 |
4.3. 多源土地利用/土地覆盖数据集的相互验证
土地利用/土地覆盖类型的混淆图及其准确性特征来自 FusLULC-2010、MSRmcd-2010、MSRcci-2010 和 MSRgl30-2010 四个土地利用/土地覆盖分类数据集,如图 5 和表 6 所示。
如图 5 所示,在 FusLULC-2010/MSRcci-2010 中,农田、湿地、人造表面、裸地和永久性雪冰的一致性最高,值分别为
、
和
。此外,FusLULC-2010/MSRgl30-2010 中森林和草地的一致性最高,分别为
和
,而一致性
FusLULC-2010/MSRmcd-2010 中的灌木丛面积最高,为
。上述结果表明,在多源数据融合的过程中,MSRcci-2010 对农田、湿地、人造表面、裸地和永久性雪冰的融合结果贡献最大。此外,MSRgl30-2010 对森林和草地的融合结果贡献最大,而 MSRmcd-2010 对灌木丛的融合结果贡献最大。
同样,在 MSRcci-2010/MSRgl30-2010 中,农田、湿地、人造表面和裸地的误分类率最高(即,错误主要表现为农田和湿地被误分类为森林,人造表面被误分类为农田,裸地被误分类为草地和灌木地)。在 MSRmcd-2010/MSRcci-2010 中,森林、草地和灌木地的误分类率最高(即,错误主要表现为森林被误分类为农田;草地被误分类为农田、森林和灌木地;灌木地被误分类为森林、草地和裸地)。最后,永久性雪和冰在 MSRmcd-2010/MSRgl30-2010 中显示出最多的误分类,几乎所有的误分类都被误认为是草地、湿地或裸地。这些结果表明,在多源数据融合的过程中,MSRgl30-2010 对农田、湿地、人造表面和裸地的分类错误影响最大,而 MSRmcd-2010 和 MSRcci-2010 对森林和草地的分类错误有显著影响。 此外,MSRcci-2010 对灌木林的分类错误影响最大,而 MSRmcd-2010 和 MSRgl30-2010 对永久雪和冰的分类错误有显著影响。
此外,如表 6 所示,FusLULC-2010/MSRmcd-2010 的整体准确率和 Kappa 系数分别为
和 0.8654,显示出最高的值;因此,MSRmcd-2010 对融合结果的贡献略高于其他两个数据源。此外,FusLULC-2010/MSRgl30-2010 和 FusLULC-2010/MSRcci-2010 的整体准确率和 Kappa 系数仅次于 FusLULC-2010/MSRmcd-2010,且远高于其他数据组合。
图 5. 续。
图 5. 不同数据集之间土地利用/土地覆盖类型的空间混淆(1. 农田;2. 森林;3. 草地;4. 灌木地;5. 湿地;6. 人工表面;7. 裸地;8. 永久性雪和冰)。注:在此图中,
表示两个数据集之间的混淆关系。以图 5a 为例,
坐标表示 FusLULC-2010 的土地利用/土地覆盖类型,
坐标表示在某种 FusLULC-2010 类型下 MSRmcd-2010 中各种类型的像素百分比。
表 6. 不同数据集之间整体精度的比较。
数据名称 |
OA/% |
卡帕系数 |
FusLULC-2010/MSRmcd-2010 |
90.44 |
0.8654 |
FusLULC-2010/MSRcci-2010 |
88.32 |
0.8339 |
FusLULC-2010/MSRgl30-2010 |
89.09 |
0.8455 |
MSRmcd-2010/MSRcci-2010 |
81.81 |
0.7438 |
MSRmcd-2010/MSRgl30-2010 |
81.96 |
0.7467 |
MSRcci-2010/MSRgl30-2010 |
81.28 |
0.7355 |
4.4. 多源土地利用/土地覆盖数据集的一致性
对 FusLULC-2010、MSRmcd-2010、MSRcci-2010 和 MSRgl30-2010 的土地利用/土地覆盖分类数据集的平均整体一致性和平均类型特异性一致性进行了分析,如表 7 和图 6 所示。
表 7. FusLULC-2010 与三个原始土地利用/土地覆盖数据集之间的整体一致性比较(%)。
数据名称 |
FusLULC-2010 |
MSRmcd-2010 |
MSRcci-2010 |
MSRgl30-2010 |
FusLULC-2010 |
89.29 |
90.44 |
88.32 |
89.09 |
MSRmcd-2010 |
90.44 |
84.74 |
81.81 |
81.96 |
MSRcci-2010 |
88.32 |
81.81 |
83.81 |
81.28 |
MSRgl30-2010 |
89.09 |
81.96 |
81.28 |
84.11 |
注意:对角线上的值是四个数据集的平均整体一致性,而非对角线上的值是任意两个数据集之间的整体一致性。
图 6. FusLULC-2010 与三个原始土地利用/土地覆盖数据集之间的平均一致性比较(1. 农田;2. 森林;3. 草地;4. 灌木地;5. 湿地;6. 人工表面;7. 裸地;8. 永久性雪和冰)。
如表 7 所示,FusLULC-2010 的平均整体一致性最高(
);MSRmcd-2010 和 MSRgl30-2010 分别位列第二和第三(
和
);而 MSRcci-2010 的平均整体一致性最低(
)。与输入数据源相比,FusLULC-2010 的平均整体一致性提高了约 5%。FusLULC-2010/MSRmcd-2010、FusLULC-2010/MSRcci-2010 和 FusLULC-2010/MSRgl30-2010 的整体一致性均高于
,而 FusLULC-2010/MSRmcd-2010 的整体一致性最高,为
。
此外,如图 6 所示,与三个输入数据源相比,FusLULC-2010 中农田、森林、草地、灌木地、湿地、人造表面、裸地和永久性雪冰的平均一致性最高,分别为
、
和
。因此,农田、森林、湿地、人造表面和裸地的分类结果相对较好,而草地、灌木地和永久性雪冰的分类结果相对较差。这种差异的原因在于农田、森林,
湿地、人造表面和裸地具有独特的光谱特征和清晰的空间纹理,而草地、灌木地以及永久性雪和冰则具有相似的光谱特征和模糊的空间分布。此外,与三种输入数据源的值相比,FusLULC-2010 中农田、森林、草地、灌木地、湿地、人造表面、裸地和永久性雪和冰的平均一致性分别提高了 8.33-14.46%、
和
。
5. 讨论
5.1. 优越性和总结
高精度土地利用/土地覆盖遥感分类制图广泛应用于精准农业、植被生态、湿地水质、城市热岛、矿产资源、大气环境等研究领域。本文基于一致性分析和模糊集理论进行了多源数据融合[20,35]。只需少量计算即可减弱多源土地利用/土地覆盖数据集之间的矛盾,并整合了各种分类算法的优势。通过误差矩阵、空间混淆、平均整体一致性和平均类别特异一致性显示,无论是整体精度还是类别精度,本文采用的多源数据融合方法获得的融合数据与输入数据源相比均表现出一定的改善。
值得注意的是,本文提出的多源数据融合方法有效地结合了协议和隶属度这两个评估因素,这在相对上是新颖和独特的。与现有研究[20,35,43,44]相比,我们发现本文获得的结果与现有研究的结果存在共性(即,共性表现为目标分类系统高度一致,采用的数据融合方法得到了继承和发展,融合结果的准确性得到了提高)。此外,本文获得的结果也具有独特性(即,特征主要表明研究区域位于沿海地区,沿海湿地具有独特的分类规则;选择 MCD12Q1-2010、CCI-LC2010 和 GlobeLand30-2010 作为源数据集;融合结果的时间阶段和空间分辨率分别固定在 2010 年和 300 米)。
基于一致性分析和模糊集理论的数据融合方法可以用于决策、未来预测以及对异质区域土地利用/土地覆盖类型的准确分析。当输入数据源在研究区域的土地利用/土地覆盖类型分布上具有广泛的异质性时,可以进一步基于本文采用的多源数据融合方法进行处理,以提高数据源的分类准确性。例如,在索马里沿海地区出现了草地、灌木地和森林的共存,而该地区分别被不同分类算法的输入数据源定义为草地、灌木地和森林。接下来,基于一致性分析和模糊集理论的多源数据融合被用于处理该区域。与通过高分辨率谷歌地球图像的视觉观察形成的主观认知相比,可以发现该区域确实以灌木地为主。
5.2. 限制与展望
本文采用的基于一致性分析和模糊集理论的数据融合方法存在一定的局限性。(1) 尽管目标分类系统是全面的,但过于笼统。(2) 尽管核心算法是实用的,但其主观性过大;特别是在选择其他源数据集作为研究对象时,需要付出很大努力来确定初始类型与目标类型之间的“模糊隶属度”。(3) 融合结果的准确性受到研究区域景观异质性的影响。因此,尽管本研究在基于多源数据融合的土地利用/土地覆盖遥感分类制图方面取得了重要进展,但仍需完成许多后续研究
以获得最佳融合结果。
例如,目标分类系统可以进一步细化。参考源数据集,本研究将沿海土地利用/土地覆盖分为八种主要类型:农田、森林、草地、灌木丛、湿地、人造表面、裸地和永久性雪冰。具体而言,这些类型是对实际土地类型的高度概括,尽量避免由于分类复杂性而造成的混淆。然而,鉴于沿海地区的特殊性,后续研究应合理关注湿地资源[47](即在当前研究的基础上,应强调对包括盐水湿地和淡水湿地在内的沿海地区湿地资源的科学分类)。
此外,数据融合算法可以进一步开发。本文采用的多源数据融合算法基于一致性分析和模糊集理论。具体而言,初始类型与目标类型之间在分歧中的“模糊隶属度”非常主观,咨询了众多学者以确定相关评分,以最小化主观性对本研究融合结果的影响。然而,“一致性”定义本身在某种程度上会影响融合结果。因此,在后续研究中,应寻求更多辅助信息,包括地形、温度、降水、人口和经济,以支持决策融合 [48]。
最后,融合结果的准确性可以进一步提高。在本文的融合结果中,农田、森林、湿地、人造表面和裸地的分类结果相对较好,而草地、灌木地和永久性雪冰的分类结果相对较差。因此,按土地类型或子区域进行数据重构是未来研究的重要方向[18](即应采用更准确的主题数据重新分类相对较大误分类的土地类型或子区域,以有效提高固定点的融合结果准确性)。
5.3. 先前的工作和后续研究
前期工作如下:(1)建立了全球沿海地区土地利用/土地覆盖的遥感分类系统,考虑了湿地的细分类[49];(2)分析了全球沿海地区多种基于遥感的土地利用/土地覆盖分类数据集的一致性,使用了偏差系数、相关系数、误差矩阵和空间混淆[50]。此外,后续研究如下:(1)将基于本文采用的多源数据融合方法实现全球沿海地区土地利用/土地覆盖的分类制图和精度分析;(2)将利用年度梯度、动态度和转移矩阵揭示全球沿海地区土地利用/土地覆盖的变化特征和驱动因素。总体而言,这些研究填补了全球沿海地区土地利用/土地覆盖研究的空白,为沿海地区人地关系、土地资源管理、生态环境保护和协调经济发展等科学研究提供了参考和建议。
6. 结论
多源数据融合在很大程度上整合了多源数据的优势,减少了单源数据的缺陷,使得融合数据比单源数据更准确。因此,针对大规模沿海地区遥感数据和土地利用/土地覆盖融合方法的现有不足,我们使用了 MCD12Q1-2010、CCI-LC2010 和 GlobeLand30-2010 三个土地利用/土地覆盖数据集作为输入数据源,并通过一致性分析确定了这三个数据集的一致性和不一致性。随后,我们基于模糊集理论对不一致性进行了重新分类,生成了一套基于 2010 年数据的沿海地区土地利用/土地覆盖融合数据,分辨率为 300 米(即 FusLULC-2010)。最后,我们使用误差矩阵、空间混淆、平均整体一致性和平均类别特异一致性评估了融合结果的准确性。
研究结果如下:无论是整体精度还是类型精度,以上提到的方法获得的融合数据相比均表现出一定的改善
与输入数据源相关。在整体精度方面,融合数据的整体准确率、Kappa 系数和平均整体一致性最高,分别为
和
。与三个输入数据源相比,这些精度分别提高了
和
。融合数据与任一三个输入数据源之间的整体准确率和 Kappa 系数高于任意两个输入数据源之间的值。在类型精度方面,与三个输入数据源相比,融合数据中每种土地利用/土地覆盖类型的生产者准确率、用户准确率和平均一致性都有所提高,特别是在平均特定类型一致性方面,提高了
。不同的输入数据源在融合数据中对不同土地利用/土地覆盖类型的正确分类贡献和误分类影响方面存在差异。 总之,融合数据分类准确率的提高反映了本文采用的多源数据融合方法的有效性、可靠性、可行性、可控性和传播性。
作者贡献:万侯和西勇侯构思了本文的想法。随后,数据的编纂和分析由万侯完成。最后,本文由万侯撰写,并送交西勇侯进行评论。
资助:本研究由中国科学院战略性先导科技专项(编号:XDA19060205)和国家自然科学基金(编号:31461143032)共同资助。
致谢:我们衷心感谢本研究中使用的数据集的作者。
利益冲突:作者声明没有利益冲突。
附录 A
表 A1. Fmcd-1 的亲和力评分。
初始类型 |
目标类型 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
3 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
5 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
6 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
7 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
8 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
10 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
20 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
30 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
40 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
50 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
60 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
70 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
80 |
0 |
2 |
3 |
0 |
0 |
0 |
0 |
0 |
90 |
0 |
1 |
3 |
1 |
0 |
0 |
0 |
0 |
100 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
110 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
120 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
130 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
140 |
3 |
1 |
1 |
1 |
0 |
0 |
0 |
0 |
150 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
160 |
0 |
1 |
1 |
1 |
0 |
0 |
3 |
0 |
170 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
附录 B
表 A2. Fcci-1 的亲和力评分。
初始类型 |
目标类型 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
3 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
5 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
6 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
7 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
8 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
11 |
3 |
0 |
2 |
0 |
0 |
0 |
0 |
0 |
12 |
3 |
2 |
0 |
2 |
0 |
0 |
0 |
0 |
20 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
30 |
3 |
1 |
1 |
1 |
0 |
0 |
0 |
0 |
40 |
2 |
2 |
2 |
2 |
0 |
0 |
0 |
0 |
50 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
61 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
62 |
0 |
3 |
1 |
1 |
0 |
0 |
0 |
0 |
71 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
72 |
0 |
3 |
1 |
1 |
0 |
0 |
0 |
0 |
81 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
82 |
0 |
3 |
1 |
1 |
0 |
0 |
0 |
0 |
90 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
100 |
0 |
3 |
2 |
3 |
0 |
0 |
0 |
0 |
110 |
0 |
2 |
3 |
2 |
0 |
0 |
0 |
0 |
121 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
122 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
130 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
140 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
152 |
0 |
0 |
0 |
2 |
0 |
0 |
3 |
0 |
153 |
0 |
0 |
2 |
0 |
0 |
0 |
3 |
0 |
160 |
0 |
2 |
0 |
0 |
3 |
0 |
0 |
0 |
170 |
0 |
2 |
0 |
0 |
3 |
0 |
0 |
0 |
180 |
0 |
0 |
2 |
2 |
3 |
0 |
0 |
0 |
190 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
201 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
202 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
210 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
220 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
附录 C
表 A3. Fgl30-1 的亲和力评分。
初始类型 |
目标类型 |
|
|
|
|
|
|
|
|
|
|
4 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
|
0 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
|
0 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
|
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
|
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
|
0 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
|
0 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
|
4 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
0 |
4 |
0 |
0 |
0 |
0 |
0 |
0 |
|
0 |
0 |
4 |
0 |
0 |
0 |
0 |
0 |
|
0 |
0 |
0 |
4 |
0 |
0 |
0 |
0 |
|
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
|
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
|
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
|
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
|
0 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
|
0 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
参考文献
萨瑟兰,W.J.;亚当斯,W.M.;阿伦森,R.B.;阿维林,R.;布莱克本,T.M.;布罗德,S.;塞巴略斯,G.;科特,I.M.;考林,R.M.;达·丰塞卡,G.A.B.;等。对全球生物多样性保护重要的 100 个问题。《保护生物学》2009,23,557-567。[CrossRef] [PubMed]
刘, J.X.; Vogelmann, J.E.; 朱, Z.L.; Key, C.H.; Sleeter, B.M.; Price, D.T.; 陈, J.M.; Cochrane, M.A.; Eidenshink, J.C.; Howard, S.M.; 等. 使用过程模型和土地覆盖干扰数据估算加利福尼亚生态系统碳变化:1951-2000. 生态模型. 2011, 222, 2333-2341. [CrossRef]
斯图尔特,I.D.;奥克,T.R. 城市温度研究的地方气候区。美国气象学会公报 2012,93,1879-1900。[CrossRef]
Congalton, R.G.; Gu, J.Y.; Yadav, K.; Thenkabail, P.; Ozdogan, M. 全球土地覆盖制图:综述与不确定性分析。遥感. 2014, 6, 12070-12093. [CrossRef]
Grekousis, G.; Mountrakis, G.; Kavouras, M. 全球 21 个和区域 43 个土地覆盖制图产品的概述。国际遥感杂志 2015, 36, 5309-5335. [CrossRef]
洛夫兰, T.R.; 里德, B.C.; 布朗, J.F.; 奥伦, D.O.; 朱, Z.; 杨, L.; 梅切特, J.W. 基于 1 公里 AVHRR 数据的全球土地覆盖特征数据库和 IGBP DISCover 的开发. 国际遥感杂志. 2000, 21, 1303-1330. [CrossRef]
汉森, M.C.; 德弗里斯, R.S.; 唐申德, J.R.G.; 索尔伯格, R. 使用分类树方法进行 1 公里空间分辨率的全球土地覆盖分类. 国际遥感杂志 2000, 21, 1331-1364. [CrossRef]
巴托洛梅,E.;贝尔沃德,A.S. GLC2000:一种基于地球观测数据的全球土地覆盖制图新方法。《国际遥感杂志》2005,26,1959-1977。[CrossRef]
弗里德尔, M.A.; 麦克艾弗, D.K.; 霍奇斯, J.C.F.; 张, X.Y.; 穆乔尼, D.; 斯特拉赫勒, A.H.; 伍德科克, C.E.; 戈帕尔, S.; 施奈德, A.; 库珀, A.; 等. 基于 MODIS 的全球土地覆盖制图:算法和早期结果. 遥感环境. 2002, 83, 287-302. [CrossRef]
比舍龙, P.; 阿姆贝格, V.; 布尔格, L.; 佩蒂, D.; 赫克, M.; 米拉斯, B.; 布罗克曼, C.; 哈戈尔, O.; 德尔瓦特, S.; 拉内拉, F.; 等. MERIS GlobCover 正射校正产品的地理定位评估. IEEE 地球科学与遥感学报. 2011, 49, 2972-2982. [CrossRef]
ESA. CCI-LC 产品用户指南 v2.4. 在线获取: http://maps.elie.ucl.ac.be/CCI/viewer/download/ ESACCI-LC-PUG-v2.4.pdf(访问于 2014 年 10 月 10 日)。