使用 LSTM 神经网络预测局部环流指数*

LI Hui WANG Runze WANG Chi
(中国科学院国家空间科学中心空间天气国家重点实验室，北京 100190)
(中国科学院大学，北京 100049）

摘要

磁暴期间地磁扰动的局部时间依赖性表明了预报局部磁暴指数的必要性。我们首次利用长短期记忆（LSTM）神经网络构建了SMR-LT（SuperMAG局部环流指数）的预报模型，预报时间从1小时增加到12小时。一般来说，预测性能随着提前时间的增加而降低，SMR-06 指数的预测性能优于 SMR-00、SMR-12 和 SMR-18 指数。对于提前 12 小时的预测，相关系数分别为 $0.738, 0.608, 0.665$ 和 0.613 。为了避免地磁静止期海量数据的过度影响，我们只使用磁暴期间的数据来训练和测试我们的模型，预测指标的改进随提前时间的增加而增加。例如，在预测提前 12 小时的风暴时间 SMR-06 指数时，相关系数和预测效率分别从 0.674 和 0.349 提高到 0.691 和 0.455。对暴雨强度预报模式性能的评估表明，强烈暴雨的相对误差通常小于中等暴雨的相对误差。

关键词地磁暴、部分环流指数（PRCI）、人工神经网络（ANN）
分类索引 P353

0 简介

地磁暴是地球磁层中的全球性剧烈扰动，是太阳风-磁层能量通过磁重联机制

^{[1 - 2]}

耦合增强的结果之一。一般来说，高速太阳风与持续南下的行星际磁场（IMF）会导致地球西向环流的增强，从而引发以地磁场水平分量（H 分量）凹陷为特征的地磁暴。

D s t

指数

^{[2 - 6]}

。Dst 指数基于赤道附近 4 个地面观测站磁强计的测量结果，代表了低纬度地磁场中几个电流系统（如环流、尾流和查普曼-费拉罗电流）的影响。典型的地磁暴由三个阶段组成。首先，在风暴开始时，Dst 会突然或逐渐上升（初始阶段）。风暴开始后，Dst 保持在高于风暴前值的水平上波动，持续时间从几分钟到几小时不等。其次，随着环流的增强，Dst 值会逐渐减小。

在剧烈波动中迅速下降到最小值（主要阶段）。最后，随着干扰的减少，

D

st 缓慢回升到平静水平（恢复阶段）。

地磁暴一直是地球物理学界最具挑战性和探索热情的课题之一。这不仅是因为地磁暴对全球地磁场模式有重大影响，还因为地磁暴是太阳-地球能量耦合链中最重要的一环。此外，地磁暴对通信系统、电力系统、石油管道和太空飞行器等技术基础设施也有严重影响。因此，预测地磁暴具有重要的理论和实用价值。

自 20 世纪 70 年代以来，有关 Dst 预报的研究一直在进行。Burton等人

^{[3]}

利用太阳风速度和密度以及IMF的南北分量，开发了一种用于预报

D

st的经验算法，其中包含对太阳风动压、等离子体片的粒子注入以及指数衰减等影响的近似描述，并用常微分方程进行约束。在这一模型的基础上，又提出了一些假设来描述这种非线性行为

^{[6 - 8]}

。

除了基于经验公式构建的模型外，还有从数据科学角度对

D s t

预测进行的研究。其中一种广受欢迎的方法是通过人工神经网络（ANN）构建机器学习模型。Lundstedt 和 Wintoft

^{[9]}

开发了一种前馈神经网络，利用太阳风的密度和速度以及 IMF 的

z

分量来预测前方的

D s t 1 h

，可以预测磁暴的初始阶段和主要阶段。后来，为了进一步提高

^{[10, 11]}

预报效果，又引入了一种具有特定结构的人工神经网络--循环神经网络（RNN）。不同的优化技术也被用于 Dst 预报。Wei 等人

^{[12]}

通过改变隐层神经元的激活函数，使用了多尺度径向基网络。Lazzús 等人

^{[13]}

采用蜂群优化算法实现了提前 6 小时的

D s t

预测。Gruet 等人

^{[14]}

进一步取得了

D s t

预测

1 \sim 6 h

的更好结果。

使用长短时记忆（LSTM）网络来提高效率。此外，

k

近邻（KNN）、非线性自回归移动平均与外生输入（NARMAX）和支持向量机（SVM）等算法也被引入到Dst预测和空间物理学的其他课题中

^{[15 - 17]}

。

虽然 Dst 指数有明确的物理解释，但其隐含的简化假设，即来自低纬度或中纬度地面站的方位角不变的

H

扰动，往往与观测结果不一致。在风暴期间，

H

凹陷往往会出现明显的黎明-黄昏不对称现象（见 Li 等人，

^{[18]}

，及其中的参考文献）。鉴于在中纬度站观测到的 H - 分量在当地时间（LT）的强烈变化，Newell 和 Gjerloev

^{[19]}

提出了 SuperMAG 环流指数（SMR 指数）和 SuperMAG 部分环流指数（SMR-LT 指数）。SuperMAG是一个全球性的组织和国家机构合作项目，目前运行着300多个地基磁强计。利用 98 个中低纬度磁强计，SMR 指数在概念上与 Dst 指数相同，其当地时间版本 SMR-LT（包括 SMR-00、SMR-06、SMR12 和 SMR-18）包含以各自当地时间中心点命名的当地时间成分，分别代表午夜、黎明、正午和黄昏。SMR全球指数是SMR-LT指数的算术平均值。

在这项工作中，我们首先从几个不同的角度分析了地磁暴期间 SMR-LT 指数的不对称性。研究结果表明了预测 SMR 区域指数的重要性。然后，我们将人工神经网络方法 LSTM 应用于该主题，提前提供 SMR-LT 指数

1 \sim 12 h

的预测。为了提高风暴时数据的预测性能，我们仅使用风暴时的数据训练了一个新模型，并分析了该模型在预测磁暴强度方面的性能。

1 部分环流指数预测的重要性

每小时部分环流指数 SMR-LT 和相应的平均指数 SMR 由以下公式得出

超级磁暴*。对 1998 年至 2019 年期间的 318 次磁暴进行了分析。

Li等

^{[18]}

提出，由于磁暴过程中部分环流的重要贡献，

D s t

指数在磁暴主阶段和恢复初期存在明显的晨昏不对称现象。图 1 显示了 2018 年 8 月 26 日磁暴期间部分环流指数的演变。不出所料，SMR-LT 的四个指数在

图 1 2018 年 8 月 26 日磁暴期间的部分环流指数

主要阶段和早期恢复阶段。黄昏侧地磁场扰动的

H

分量（如 SMR-18 和 SMR-12）的衰减一般大于黎明侧的

H

分量（如 SMR-00 和 SMR-06）。SMR-00、SMR-06、SMR-12 和 SMR-18 的最小值分别为

- 156.9 nT, - 155.3

nT, - 204.4 nT

和 -209.3 nT。此外，SMR-18 指数最早达到最小值，而 SMR-00 指数则在一小时后达到最小值。在随后的恢复阶段，所有指数几乎相同。

图 2 给出了 318 次磁暴中 SMRLT 最小值的统计特征及其与 SMR 最小值的时间差。上面板显示了风暴期间 SMR-LT 指数的相对强度与风暴强度之间的关系，风暴强度分别由 SMR-LT 最小值与 SMR 最小值和 SMR 最小值的比值定义。一般来说，SMR-18 的相对强度大于 1，表示地磁凹陷较大，而 SMR-06 的相对强度小于 1，表示地磁凹陷较小。SMR-00 和 SMR-12 的结果类似，在大多数情况下相对强度大于 1。

图 2 318 场磁暴中 SMR-LT 最小值的统计特征及其与 SMR 最小值的时间差

情况。318个风暴的SMR-00、SMR-06、SMR-12和SMR-18的平均最小值分别为-111.5 nT、

- 80.7 nT, - 109.4 nT

和-133.8 nT，这与之前的结果一致。此外，随着风暴强度的增大，四个指数的相对强度都趋向于 1，这表明环流趋向于更对称，正如 Li 等

^{[18]}

所指出的那样。除风暴强度外，四个部分环流指数的风暴最小值的起始时间也各不相同。下图给出了 SMR-LT 最小值到 SMR 最小值的时滞分布。对于 SMR-00、SMR-12 和 SMR-18，时滞集中在 1 小时之内。时滞的中值相同，均为 0 。平均值分别为

1.5, 1.6

和 -0.7 h 。对于 SMR-06，很多情况下时滞大于 0，中位值为 1 h，平均值为 2.2 h。

因此，预测 SMR-LT 指数而不是 SMR 指数应该更适合区域空间天气预警或预报。

2 方法和数据集

2.1 LSTM 网络

LSTM 是一种特殊的 RNN。传统的神经网络无法处理时间序列预测。然而，RNN 可以通过在网络中设计循环来解决这一问题，从而允许信息从网络的一个步骤持续传递到下一个步骤。RNN 可被视为同一网络的多个副本，信息可从一个副本传递到下一个副本。链式性质表明，RNN 与序列和列表密切相关。然而，当相关信息与所需信息之间的差距过大时，RNN 就无法学习连接信息。这个问题被称为 "长期依赖性"，Bengio 等人

^{[20]}

对其进行了深入探讨，发现它源于 RNN 训练阶段的梯度消失问题。

LSTM 是为避免长期依赖问题而明确设计的。它是由 Hochreiter 和 Schmidhuber

^{[21]}

提出的，后来被许多研究人员改进和推广，使其在大量问题上发挥了巨大作用。LSTM 也具有链状结构，但重复模块有所不同。LSTM 并非只有一个神经网络层，而是有多个重复模块、

在 LSTM 中有四个，它们以一种非常特殊的方式相互作用。

LSTM 的关键在于细胞状态，它沿着整条链直向下运行，只有一些微小的线性交互。链的一端是

C_{t - 1}

，代表旧的细胞状态，另一端是

C_{t}

，代表新的细胞状态。LSTM 的设计目的是在细胞状态中移除或添加信息，并通过称为门的结构进行精确调节。门是选择性地让信息通过的一种方式。它们由一个 sigmoid 神经网层和一个点乘法运算组成。西格码神经网络层输出 0 和 1 之间的数字，描述了每种成分应被允许通过的程度。0 表示完全拒绝，1 表示完全接受。

LSTM 由三个门组成，用于保护和控制细胞状态，即遗忘门层、输入门层和输出门层。遗忘门层是一个 sigmoid 层，用于决定从单元状态中遗忘哪些信息。它接收

h_{t - 1}

和

x_{t}

，分别表示前体副本的输出和时间步骤

t

的输入，并输出一个介于 0 和 1 之间的数字，表示细胞状态

C_{t - 1}

被遗忘的程度。在随后的等式中，将保留

w_{*}

和

b_{*}

分别代表层的相应权重和偏置的符号。

f_{t} = sigmoid (w_{f} \cdot [h_{t - 1}, x_{t}] + b_{f}) .

下一步是决定在细胞状态中存储哪些新信息，这包括两个部分。首先，一个称为 "输入门层 "的 sigmoid 层决定哪些值需要更新。接下来，一个 tanh 层会创建一个可添加到状态中的新候选值向量

{\tilde{C}}_{t}

。

\begin{aligned} i_{t} = sigmoid (w_{i} \cdot [h_{t - 1}, x_{t}] + b_{i}), \\ {\tilde{C}}_{t} = \tanh (w_{C} \cdot [h_{t - 1}, x_{t}] + b_{C}) \end{aligned}

在下一步中，将这两者结合起来，将旧的单元状态

C_{t - 1}

更新为新的单元状态

C_{t}

。我们将旧状态乘以

f_{t}

，再加上

i_{t} {\tilde{C}}_{t}

。这就是新的候选值，其比例是我们决定更新每个状态值的大小。

C_{t} = f_{t} C_{t - 1} + i_{t} {\tilde{C}}_{t}

最后，输出门层将生成细胞状态

C_{t}

的过滤版本。首先，将运行一个 sigmoid 层，该层决定输出细胞状态的哪些部分--

C_{t}

。

放。然后，我们将单元状态通过 tanh（将数值推至-1 和 1 之间）并乘以 sigmoid 门的输出，这样就只输出了我们决定输出的部分。

\begin{aligned} o_{t} = sigmoid (w_{o} \cdot [h_{t - 1}, x_{t}] + b_{o}), \\ h_{t} = o_{t} \tanh C_{t} \end{aligned}

2.2 性能指标

在本研究中，使用了几个性能指标来评估机器学习预测模型的有效性。均方根误差

(E_{rms})

用于表示观察值和预测值之间的误差。

E_{rms} = \sqrt{\frac{1}{N} \sum_{i = 1}^{N} {(y_{i} - {\hat{y}}_{i})}^{2}}

皮尔逊相关系数

C

用于表示预测值和观测值之间的线性关系。

1 / - 1

表示完全正相关/负相关，而 0 表示没有线性相关。

\begin{aligned} C = & \frac{Cov (y, \hat{y})}{\sqrt{Var (y) Var (\hat{y})}} = \\ \frac{\sum_{i = 1}^{N} (y_{i} - {\bar{y}}_{i}) ({\hat{y}}_{i} - {\overset{―}{\hat{y}}}_{i})}{\sqrt{\sum_{i = 1}^{N} {(y_{i} - {\bar{y}}_{i})}^{2} \sum_{i = 1}^{N} {({\hat{y}}_{i} - {\overset{―}{\hat{y}}}_{i})}^{2}}} \end{aligned}

此外，还使用了预测效率

P_{e}

，其计算方法如下。

P_{e} = 1 - \frac{\sum_{i = 1}^{N} {(y_{i} - {\hat{y}}_{i})}^{2}}{\sum_{i = 1}^{N} {(y_{i} - {\bar{y}}_{i})}^{2}} .

P_{e} = 1

表示完美预测，

P_{e} = 0

表示模型的性能等同于观测数据的算术平均值。

P_{e}

可以是负值，在这种情况下表示模型的预测效果并不比取测试数据的算术平均值好。

C

只反映时间序列趋势的一致性，与之相反，

P_{e}

还可以表示模型特征的振幅，从而检验预测的准确性。

2.3 数据预处理

太阳风参数由 OMNI da-

ta*由美国国家航空航天局（NASA）国家空间科学数据中心（NSSDC）维护。SMR 和 SMR-LT 指数来自 SuperMAG 合作者**。

合理选择特征参数可以大大提高方差网络的学习效率。本研究采用太阳风场

E_{y}

、太阳风动压

P_{d}

、太阳风速度

V_{p}

、太阳风密度

N_{p}

、太阳风温度

T_{p}

、IMF强度

B_{t}

及其

z

分量

B_{z}

，用

D_{sw}

表示。

D_{sw} = (\begin{array}{lllllll} E_{y} & P_{d} & V_{p} & N_{p} & T_{p} & B_{t} & B_{z} \end{array}) .

我们从 OMNI 和 SuperMAG 中选择的数据集时间跨度为 1998 年 1 月 1 日至 2019 年 12 月 31 日，时间分辨率为 1 小时。22 年的数据集分为三个部分，即训练集（1998-2009 年）、验证集（2010-2014 年）和测试集（2015-2019 年）。训练集和验证集都考虑了一个以上的完整太阳活动周期。在这两个周期内，共识别出 257 个磁暴。

我们的目标是提前几个小时预测 SMR-LT 指数（记为

p

），这在数据结构上意味着要开发一个用于多滞后时间步的多变量时间序列预测的 LSTM 模型。在本研究中，考虑的是

p = 1, 3, 6, 12 h

。第一步是为 LSTM 准备数据集，这包括将数据集设定为一个监督学习问题，并对输入变量进行归一化处理。我们将监督学习问题定义为：根据之前多个时间步骤的太阳风参数，预测当前时刻的 SMR-LT 指数。OMNI 数据已经从其观测位置时移到地球弓形震荡位置，这是为了更好地支持太阳风-磁层耦合研究。接下来，我们分别对每个特征进行归一化处理，将物理量转化为可由 ANN 处理的数据流。ANN 预测结果后，我们再应用缩放过程来获得真正的 SMR-LT 指数。

RNN 的重要设计模式有很多不同的例子。我们采用的是隐单元之间具有递归连接的神经网络，该网络读取一个

然后产生单一输出，即 SMR 指数或 SMR-LT 指数之一。我们构建了两个隐藏层，第一层包含 50 个神经元，第二层包含 100 个神经元。根据 LSTM 处理数据的结构特征，每个参数都是时间序列上的多维向量。时间序列的长度（用

s

表示）会显著影响模型的性能。为了评估这种影响，图 3 给出了在不同

s

条件下得到的结果。一般来说，当

s = 3

时，模型性能最佳。因此，在下面的研究中，我们将时间序列的长度设为 3，因此输入为

3 \times 8

矩阵。

输入

= (\begin{array}{lllllll} E_{y} & P_{d} & V_{p} & N_{p} & T_{p} & B_{t} & B_{z} \end{array}) \oplus

索引、

N_{LSTM} : Input (t - p) \mapsto Index (t), p \in {1, 3, 6, 12}

。

3 项成果

3.1 SMR-LT 指数的预测性能

鉴于太阳风的 7 个输入特征，共有 127

图 3 使用不同序列长度 (s) 的模型预测 SMR 指数的性能。四个板块表示考虑不同

p

时的结果

Lazzús等人的

^{[23]}

在提前6小时和12小时的预测结果较好，但在提前1小时和3小时的预测结果较差。Lazzús 等人的

^{[23]}

得到了提前 1 小时到 6 小时的预测结果，

C

分别为

0.978, 0.895

和 0.788 。总体而言，我们的结果与已发表的模型大致相当，这验证了我们模型的可靠性。

图 4 给出了模型对测试集 SMR-LT 指数预测的散点图。蓝线代表拟合结果，黑色虚线代表精确预测结果。蓝色

表 1 参考文献[14]、[15]和[16]之间的比较[14]、参考文献[22]、参考文献[23] 和我们提出的模型

$p / h$	坚持不懈	我们的模式	参考文献 [14］	参考文献 [22］	参考文献 [23］
1	0.945	0.965	0.966	0.845	0.978
3	0.853	0.903	0.923	0.872	0.895
6	0.755	0.824	0.865	0.864	0.788
12	0.592	0.705	-	0.857	-

当

p = 1

与黑色虚线的距离越近时，预测结果越好。很明显，当

p = 1

时，预测结果与观测结果非常接近。随着

p

的增加，预测结果（主要是低估）与观测结果的偏差也相应增加。

表 2 给出了我们的预测模型在 SMR-00、SMR-06、SMR-12 和 SMR-18 指数上的定量表现。考虑到之前没有关于 SMR-LT 指数预测的研究，我们将模型的预测结果与持久性操作的结果进行比较，以定量表示模型的能力。总体而言，从

E_{rms}, C

和

P_{e}

的角度来看，我们的模型可以很好地预测SMR-LT指数。在用

p = 1, 3, 6, 12 h

对SMR-06进行预测时，

E_{rms}

分别为5.752、

6.592, 7.639

和9.976 nT，分别比持久运算结果

3.4 %

、

17.7 %, 22.1 %

和

18.0 %

小；

C

分别为

0.925, 0.873, 0.825

和0.738 ，分别

2.5 %, 6.2 %, 12.4 %

、

25.1 %

优于持久化操作的结果；

P_{e}

为

图 4 模型对测试集上 SMR-LT 指数预测的散点图。蓝线表示拟合结果，黑色虚线表示精确预测结果

0.817, 0.759, 0.677, 0.449

，分别为

1.6 %

、

17.7 %, 44.7 %

和

149.4 %

，优于持续运算的结果。对于SMR-18的预测，

p = 1, 3, 6, 12 h

的

E_{rms}

分别为

7.316, 10.692, 14.022

和16.836 nT ，分别比持久化操作的结果

19.3 %, 20.9 %, 14.0 %

和

15.2 %

小；

C

分别为

0.934, 0.844, 0.743

和0.613 ，分别为

4.4 %, 10.0 %, 12.4 %

、

23.1 %

优于持久化操作的结果；

P_{e}

分别为

0.864, 0.708

、0.499 、0.277 ，分别为

9.4 %, 32.6 %

、

55.0 %

、

5440.0 %

优于持久化操作的结果。对于 SMR-00 和 SMR-12 指数的预测，结果类似。很明显，预测性能随着

p

的增加而降低，但是，随着

p

的增加，对持久性的改进明显增加。

3.2 磁暴期间 SMR-LT 指数的预测性能

图 4 中显示的预测值被低估的问题可能来自于训练数据结构。在上一节中，我们使用了所有数据集来训练模型。整个数据集共包含 192839 个数据，其中只有 65071 个数据，即约

33.74 %

是在 318 次磁暴期间的数据。在强度小于-100 nT 的强风暴中，只有 6452 个数据，约占

3.35 %

。磁静止期间的数据过多（这不是研究的重点）可能会影响训练好的机器学习模型的偏好，使其总是偏向于低估磁暴的强度，并且在预报准备时间较长的情况下变得更加突出。因此，虽然受相同的基本物理定律支配，但仍有必要将数据分开

从数据科学的角度看磁暴期间的历时序列。请注意，性能最佳的参数空间变为

E_{y}, P_{d}

、

V_{p}, N_{p}, B_{t}, B_{z}

。图 5 显示了 2018 年 8 月 26 日风暴期间预测的 SMR-LT 指数示例。当

p = 1, 3 h

时，预测结果与观测结果相似，尤其是 SMR-00 和 SMR-06 指数。当

p = 6, 12 h

时，预测值与观测值的偏差更大。

表 3 给出了我们的预测模型在磁暴期间对 SMR-00、SMR-06、SMR-12 和 SMR-18 指数的定量性能。"全时 "表示使用所有数据集训练模型，并根据磁暴期间的预测结果计算指标。而 "磁暴 "则表示只使用磁暴期间的数据集来训练模型，并根据磁暴期间的预测结果计算指标。与表 2 中显示的结果相比，"持续性 "和 "历时性 "的

C

和

P_{e}

都由于删除了磁静止期间的数据而有不同程度的降低，并且降低幅度随着预测准备时间的延长而增大。同时，"风暴 "的结果优于 "所有时间 "的结果，而且性能的提高随预测准备时间的延长而增加。对于采用

p = 1, 3, 6, 12 h

的 SMR06 预测，

C

的改进分别为

0.2 %

、

0.3 %, 1.4 %

和

2.5 %

；

P_{e}

的改进分别为

3.6 %, 1.5 %, 4.0 %

和

30.4 %

。对于使用

p = 1, 3, 6, 12 h

的 SMR-18 预测，

C

的改进分别是

0.1 %, 1.1 %, 2.5 %

和

8.3 %

；

P_{e}

的改进是

- 0.1 %, - 0.6 %, 12.2 %

、

表 2 SMR-LT 指数的预测性能

		$p = 1 h$			$p = 3 h$			$p = 6$ h			$p = 12 h$
		$E_{rms}$	C	$P_{e}$	$E_{rms}$	C	$P_{e}$	$E_{rms}$	C	$P_{e}$	$E_{rms}$	C	$P_{e}$
SMR-00	坚持不懈	8.942	0.838	0.675	11.384	0.737	0.474	13.438	0.633	0.267	16.049	0.477	$- 0.046$
SMR-00	模型	7.468	0.883	0.773	8.616	0.836	0.699	10.793	0.737	0.527	13.350	0.608	0.276
SMR-06	坚持不懈	5.957	0.902	0.804	8.012	0.822	0.645	9.804	0.734	0.468	12.172	0.590	0.180
SMR-06	模型	5.752	0.925	0.817	6.592	0.873	0.759	7.639	0.825	0.677	9.976	0.738	0.449
SMR-12	坚持不懈	8.054	0.893	0.786	11.886	0.767	0.534	13.898	0.682	0.363	16.899	0.529	0.059
SMR-12	模型	6.473	0.928	0.862	9.884	0.826	0.678	11.485	0.769	0.565	13.811	0.665	0.371
SMR-18	坚持不懈	9.065	0.895	0.790	13.517	0.767	0.534	16.311	0.661	0.322	19.851	0.498	$- 0.005$
SMR-18	模型	7.316	0.934	0.864	10.692	0.844	0.708	14.022	0.743	0.499	16.836	0.613	0.277

图 5 2018 年 8 月 26 日风暴期间观测到的（黑色）和预测的（蓝色）SMR-LT 指数的变化情况

表 3 风暴时间 SMR-LT 指数的预测性能

		$p = 1 h$		$p = 3 h$		$p = 6 h$		$p = 12 h$
		C	$P_{e}$	C	$P_{e}$	C	$P_{e}$	C	$P_{e}$
SMR-00	坚持不懈	0.838	0.675	$0.726$	0.452	$0.597$	0.194	0.352	$- 0.296$
	所有时间	0.885	0.783	0.838	0.700	0.724	0.485	0.526	0.134
	风暴	0.887	$0.759$	0.840	0.704	0.734	0.499	0.552	0.257
SMR-06	坚持不懈	$0.896$	$0.793$	$0.804$	$0.608$	$0.686$	0.372	0.457	$- 0.087$
	所有时间	0.922	0.823	0.868	0.748	0.807	0.642	0.674	0.349
	风暴	$0.924$	0.853	0.871	0.759	0.818	0.668	0.691	0.455
SMR-12	坚持不懈	$0.895$	$0.789$	0.763	$0.525$	$0.647$	$0.293$	$0.406$	$- 0.189$
	所有时间	$0.934$	$0.872$	$0.829$	$0.674$	$0.758$	0.532	0.595	0.250
	风暴	$0.935$	$0.875$	$0.840$	$0.705$	$0.770$	0.552	0.618	0.316
SMR-18	坚持不懈	$0.894$	$0.788$	$0.756$	$0.513$	$0.613$	$0.226$	$0.361$	$- 0.278$
	所有时间	$0.935$	0.872	0.842	0.698	$0.718$	$0.435$	$0.516$	0.106
	风暴	0.936	0.871	0.851	0.694	0.736	0.488	0.559	0.214

和

101.9 %

。对于 SMR-00 和 SMR-12 指数，改进情况类似。很明显

预测性能随

p

的增加而降低，但随

p

的增加而显著提高。

3.3 风暴强度预测的性能

表 4 给出了数据集上不同磁暴强度的分布情况，表 5 给出了磁暴强度预测相对误差的平均值和标准偏差。测试数据集中有 61 个磁暴。所有这些风暴分为两组，一组是中等风暴，SMR-LT 指数的最小值介于 -50 nT 和 -100 nT 之间；另一组是强烈风暴，SMR-LT 指数的最小值小于 -100 nT。负值表示低估了风暴强度，正值表示高估了风暴强度。请注意，本小节讨论的风暴强度是绝对值。很明显，相对误差会随着预测时间的延长而增大。以中等风暴期间的 SMR-06 指数预测为例，相对误差为

- 10.99 %, - 13.73 %

，

- 16.88 %

为

p = 1, 3, 6 h

。在中等风暴期间，

p = 1 h

的相对误差最小的是 SMR-12 指数预测，为

- 9.81 %

。对于

p = 3, 6 h

，相对误差最小的是

- 13.73 %

和

- 16.88 %

，均为SMR-06指数预测。相比之下，SMR-00 和 SMR-18 预报的相对误差相对较大，因为它们的变化幅度往往较大，因此更难准确预测。此外，强风暴的相对误差相对小于中等风暴。

表 4 磁暴强度分布

Moderate 风暴

强烈风暴

总计

训练集

119

191

验证集

测试装置

总计

224

318

4 摘要

在本文中，我们通过 LSTM 神经网络构建了预报局部环流指数 SMR-LT 的模型，预报时间从 1 小时到 12 小时不等。虽然 Dst 指数被广泛用于呈现全球范围内的平均磁扰动，但磁暴期间地磁扰动的局地时间依赖性表明了预报局地磁暴指数的重要性，尤其是在研究磁暴对特定区域的影响时。

利用LSTM神经网络，我们首次构建了部分环流指数SMR-LT的预测模型，提前时间从1小时到12小时不等。在 7 个太阳风参数的 127 种组合中，

E_{y}, P_{d}, T_{p}, B_{t}, B_{z}

参数空间的性能最佳。SMR指数预测的性能与已发表模型的结果相当，这验证了我们的模型在应用于预测SMR-LT指数时的可靠性。一般来说，预测性能随着时间的提前而降低，SMR-06 的预测性能优于 SMR-00、SMR-12 和 SMR18。在提前 12 小时预测 SMR-00、SMR-06、SMR-12 和 SMR-18 时，相关系数分别为

0.608, 0.738, 0.665

和 0.613。

对模型结果的评估表明，磁静止期间的数据过多（超过

66.26 %

）可能会影响方差网络的学习偏好。为了避免过多的影响，我们从数据集中过滤掉了磁静止期间的数据，并训练了一个新的模型，标记为 "风暴 "模型。性能的提高随着时间的提前而增加。以提前 12 小时预测风暴时间 SMR06 指数为例，其相关系数和预测效率均有所提高。

表 5 风暴强度预测的相对误差（平均

\pm

标准偏差

		R	相对误差 / (%)
			SMR-06	SMR-12	SMR-18
52 次中度风暴	1		$- 10.99 \pm 7.73$	$- 9.81 \pm 13.89$	$- 12.49 \pm 12.10$
52 次中度风暴	3		$- 13.73 \pm 13.84$	$- 19.79 \pm 16.57$	$- 24.42 \pm 14.52$
9 次强烈风暴	6	$- 37.34 \pm 13.34$	$- 16.88 \pm 14.66$	$- 28.40 \pm 15.93$	$- 32.85 \pm 13.80$
	1	$- 11.80 \pm 9.16$	$- 9.93 \pm 3.28$	$- 8.76 \pm 9.73$	$- 10.56 \pm 10.92$
	3	$- 13.04 \pm 13.28$	$- 13.67 \pm 6.16$	$- 23.19 \pm 14.57$	$- 23.19 \pm 13.19$
	6	$- 31.10 \pm 13.58$	$- 19.70 \pm 10.10$	$- 34.66 \pm 12.02$	$- 33.56 \pm 12.53$

分别为 0.674 至 0.691 和 0.349 至 0.455。

我们还评估了模型预测风暴强度的性能。相对误差往往会随着预测准备时间的延长而增大。强烈风暴强度预测的相对误差通常小于中等风暴强度预测的相对误差。

致谢作者感谢SuperMAG合作者使用SMR和SMR-LT指数，这些指数可在https://supermag.jhuapl.edu/indices/中访问。OMNI数据来自GSFC/SPDF的OMNIWeb界面https://omniweb.gsfc.nasa.gov。特别感谢 Tang B B 博士、Li W Y 博士和 Guo X C 教授的讨论。

参考资料

[1] DUNGEY J W. 星际磁场和极光带[J].Physical Review Letters, 1961, 6(2)：47-48

[2] GONZALEZ W D, JOSELYN J A, KAMIDE Y, et al. What is a geomagnetic storm[J].Journal of Geophysical Research：Space Physics, 1994, 99(A4)：5771-5792

[3] BURTON R K, MCPHERRON R L, RUSSELL C T. 星际条件与 Dst 之间的经验关系[J].Journal of Geophysical Research, 1975, 80(31)：42044214

[4] DAGLIS I A, THORNE R M, BAUMJOHANN W, et al. The terrestrial ring current: origin, formation, and decay[J].Reviews of Geophysics, 1999, 37(4)：407-438

[5] KAMIDE Y, BAUMJOHANN W, DAGLIS I A, et al. Current understanding of magnetic storms: storm-substorm relationships[J].Journal of Geophysical Research：Space Physics, 1998, 103(A8)：17705-17728

[6] WANG C B, CHAO J K, LIN C H. 太阳风动压对环流衰减和注入的影响[J].Journal of Geophysical Research：Space Physics, 2003, 108(A9)：1341

[7] FENRICH F R, LUHMANN J G. 不同极性磁云的地磁响应[J].Geophysical Research Letters, 1998, 25(15): 2999-3002

[8] O'BRIEN T P, MCPHERRON R L. 实时预报环流指数 Dst[J].Journal of Atmospheric and Solar-Terrestrial Physics, 2000, 62(14)：1295-1299

[9] LUNDSTEDT H, WINTOFT P. 利用神经网络从太阳风数据预测地磁暴[J].Annales Geophysicae, 1994, 12(1)：19-24

[10] LUNDSTEDT H, GLEISNER H, WINTOFT P. 地磁 Dst 指数的业务预报[J].地球物理研究通讯，2002，29（24）：2181

[11] WU J G, LUNDSTEDT H. 利用 Elman 循环神经网络从太阳风数据预测地磁暴[J].地球物理研究通讯，1996，23（4）：319322

[12] WEI H L, ZHU D Q, BILLINGS S A, et al.Advances in Space Research, 2007, 40(12)：1863-1870

[13] LAZZÚS J A, LÓPEZ-CARABALLO C H, ROJAS P, et al.物理学报：会议系列，2016，720：012001

[14] GRUET M A, CHANDORKAR M, SICARD A, et al. 使用长短期记忆神经网络和高斯过程组合的Dst指数多小时前预报[J].Space Weather, 2018, 16(11): 1882-1896

[15] BOYNTON R J, BALIKHIN M A, BILLINGS S A, et al.Annales Geophysicae, 2011, 29(6)：965-971

[16] LI H, WANG C, TU C, et al. 太阳风分类的机器学习方法[J].地球与空间科学，2020，7（5）：e2019EA000997

[17] LU J Y, PENG Y X, WANG M, et al. Support Vector Machine combined with distance correlation learning for Dst forecasting during intense geomagnetic storms[J].行星与空间科学，2016，120：48-55

[18] LI H, WANG C, KAN J R. Contribution of the partial ring current to the SYMH index during magnetic storms[J].Journal of Geophysical Research：Space Physics, 2011, 116(A11)：A11222

[19] NEWELL P T, GJERLOEV J W. SuperMAG-based partial ring current indices[J].Journal of Geophysical Research：Space Physics, 2012, 117(A5)：A05215

[20] BENGIO Y, SIMARD P, FRASCONI P. Learning longterm dependencies with gradient descent is difficult[J].IEEE Transactions on Neural Networks, 1994, 5(2)：157-166

[21] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J].神经计算，1997，9（8）：1735-1780

[22] LETHY A, EL-ERAKI M A, SAMY A, et al. 利用神经网络预测Dst指数并分析其对太阳风参数的依赖性[J].Space Weather, 2018, 16(9)：1277-1290

[23] LAZZÚS J A, VEGA P, ROJAS P, et al. 使用蜂群优化神经网络预报Dst指数[J].Space Weather, 2017, 15(8)：1068-1089

- 国家自然科学基金资助项目（42022032、41874203、42188101）、民用航空 "十三五 "空间科学前期研究项目（D020301、D030202）、中科院战略优先研究计划（XDA17010301）、中科院前沿科学重点研究计划（QYZDJ-SSW-JSC028）、中科院国际合作伙伴-国家项目（183311 KYSB20200017）资助
2021 年 5 月 13 日收到。2022 年 2 月 17 日修订

电子邮件：hli@nssc.ac.cn
*https://supermag.jhuapl.edu/indices/
*https://omniweb.gsfc.nasa.gov
**https://supermag.jhuapl.edu/indices/