A hybrid sea surface temperature predicting method based on deep learning
-
摘要:
海表温度(SST)是海洋水文的重要参数,准确预测SST对海洋经济发展与极端天气的预防都有重大意义。首先,针对SST序列数据的多噪声特点,采用变分模态分解方法(VMD)预处理,以减少噪声对预测结果的影响。其次,将卷积神经网络(CNN)与长短时记忆网络(LSTM)结合,同时提取SST序列的空间与时间特征,以提高预测精度。最后,本文提出了一种基于深度学习并融合了去噪模块的SST预测模型,选取我国东海海域的SST进行实证研究。通过与基线模型、现有模型的对比,证明了本文模型不但在SST的预测精度方面提升明显,而且具有较好的鲁棒性。
Abstract:Sea surface temperature (SST) is an important parameter of ocean hydrology, and accurate prediction of SST is of great significance for ocean economic development and extreme weather prevention. For the characteristics of SST series with multiple noises, variational model decomposition (VMD) is used to pre-process the SST series and reduce the influence of noise on the prediction results. Furthermore, the convolutional neural network (CNN) is combined with the long short-term memory network (LSTM) extracting both spatial and temporal features in SST sequences to improve the prediction accuracy. Finally, a SST prediction model based on deep learning with incorporating the denoising module is proposed in this paper. The SST of China's East China Sea waters is selected for empirical study. Through comparison and analysis with the baseline models and existing models, it is proved that the model in this paper not only improves the SST prediction accuracy significantly, but also has better robustness.
-
海洋对气候变化、生态系统发展具有重要影响。作为反映海水冷热状况的物理量,海表温度(sea surface temperature,SST)不但可以影响大气与海洋之间的能量交换,而且与热带气旋的形成[1]、区域气候的变化[2]都密切相关。研究SST的时间分布规律,对其进行精准预测,不仅是海洋学的重要内容,而且对气象、航海等学科影响深远[3]。
目前SST的预测方法可以概括为两类,一类是数值预报方法,需要依靠专业知识建立复杂的热力和物理学方程来进行SST的预测[4];另一类是基于数据驱动的方法,不同于数值预报方法,不需要专业知识构建方程。基于数据驱动的方法,通过模型学习数据的内在特征和规律,实现对SST的精准预测。张玉荣等[5]建立自回归模型对海温变化趋势进行预测。此外,支持向量机(support vector regression,SVR)[6]、人工神经网络[7]、多层感知机[8]也被用于SST预测。上述基于数据驱动的模型无法充分捕捉SST序列的非线性关系。特别在处理大规模数据时,预测效果不尽如人意。近年来,随着深度学习的流行,循环神经网络及其扩展——长短时记忆网络(long-short term memory,LSTM) [9]、门控循环单元(gate recurrent unit,GRU) [10]成为SST预测的研究热点。
然而,单一循环神经网络预测模型的学习能力弱,易产生过拟合现象。已有研究表明[11],混合模型有助于提高预测精度。一方面,研究者尝试将循环神经网络与其他预测模型结合,以提高预测精度。Xiao等[12]构建了LSTM与自适应提升算法(adaptive boosting,AdaBoost)的组合模型,对我国东海海域取点进行预测。针对循环神经网络只考虑时间特性,而忽略了空间特性的缺点,Xiao等[13]将卷积神经网络(convolutional neural network,CNN)与LSTM结合,用于提高基于海温图像的SST预测精度。另一方面,考虑到SST呈现非线性、多噪声的特点[14],研究者尝试在SST预测模型中加入消除噪声的数据预处理模块来提高预测精度。贺琪等[15]在循环神经网络中引入基于局部加权回归的周期趋势分解法(seasonal-trend decomposition procedure based on Loess,STL)对SST序列进行预处理来提高预测精度。贺琪等[16]通过经验模态分解(empirical mode decomposition,EMD)进行信号主成分分析,分别提出了基于EMD-GRU和EMD-LSTM的SST复合预测模型,提高了GRU和LSTM的预测精度。
通过上述分析,有鉴于至今未见同时综合考虑SST序列时空特性和噪声影响的SST预测模型,并考虑到变分模态分解(variational mode decomposition,VMD)通过控制带宽抑制了EMD方法的模态混叠现象,具备鲁棒性,本文提出了一种新的VMD-CNN-LSTM的海温预测混合模型。首先,模型对SST序列进行VMD分解,减弱噪声的影响;其次,将分解后的分量输送到CNN-LSTM中,相对于单一模型,CNN-LSTM可以更好地提取序列中的时空特性,减少过拟合。为了证明模型的有效性和实用性,选取我国东海海域进行SST预测实例验证。结果表明,在预测精度方面,本文模型在选取的MAE、RMSE评价指标上不但优于SVR、LSTM、GRU等基线模型,也优于现有SST预测的EMD-LSTM、EMD-GRU、STL-GRU、STL-LSTM等混合模型。通过不同时间步长下预测精度的对比分析,进一步证明了本文算法的鲁棒性。
1 材料与方法
1.1 研究区域
本文研究区域为我国东海(23°00′N-33°10′N,117°11′E-131°00′E)。东海蕴含着丰富的石油资源和鱼类资源,不仅是重要的海上贸易航道,还是我国重要的海洋战略要地。对东海的SST进行精准预测,对我国海上贸易和战略巡防都有着重要的现实意义。为了验证该预测方法在不同海洋环境的适用性,本文分别从东海陆架浅海区域[T1(32.13°N,122.87°E);T6(26.7°N,122.13°E)]、岛屿周边区域[T3(31.87°N,127.93°E);T5(28.13°N,127.65°E);T7(25.31°N,124.78°E) ]以及开阔外海区域[T2(31.07°N,124.93°E);T4(28.26°N,124.85°E)]随机选择7个点进行研究。
1.2 数据描述
本文数据来自Remote Sensing Systems(REMSS),可在www.remss.com获得。REMSS提供了两种最佳插值SST日常产品,一种是25 km分辨率的微波数据(microwave,MW),另一种使用分辨率为9 km的微波和红外数据(microwave and infrared,MW_IR)。本文采用的是MW_IR数据集,选取了2002年6月1到2020年12月31日每日SST。每处标记点包含6785天的海温数据。
表1列出了选取的7个标记点SST的基本统计数据,可以清晰地观测到SST的范围、大小、波动趋势等。从表1我们可以看到,这些标记点既存在相似又存在差异。随着纬度的增高,标记点的平均温度逐渐降低,由于东海整体处在北回归线以北,所以各标记点的最高温度相差不大。但各标记点的最小值和其他指标存在较大差异,这些差异并不是离群值的表现,而是受极端天气、洋流以及海陆冷、热交换的影响,反而真实反映出不同区域SST的变化规律。T1处纬度偏高,且靠近内陆,受到海陆冷、热交换的影响,温度变化幅度较大。
表 1 各标记点的统计数据(℃)Tab. 1 Statistical data of each marker (℃)地点 平均值 标准差 最小值 50% 最大值 T1 18.12 5.44 9.35 17.41 30.96 T2 21.52 4.24 14.42 21.13 31.22 T3 21.14 4.27 12.45 20.65 31.32 T4 21.16 4.19 13.75 20.87 30.01 T5 23.56 3.73 15.88 23.51 31.04 T6 25.39 2.67 20.01 25.43 30.62 T7 25.82 2.53 21.09 25.82 31.01 1.3 VMD模型
VMD是一种完全非递归的模态变分和信号处理方法,解决了EMD对噪声和采样信号敏感的局限性。VMD可以确定模态分解的个数,并自适应地搜寻每种模态的最佳中心频率和有限带宽,实现固有模态分量(intrinsic mode functions,IMF)的有效分离和信号的频域划分。VMD的核心思想是构建和求解变分问题,具体步骤如下。
步骤1:构造变分问题
$$ x\left(t\right)=\left[{(\delta }_{t}+j/\pi t)*{u}_{k}\left(t\right)\right]{e}^{-j{\omega }_{k}t} $$ (1) $$ \underset{\left\{{u}_{k}\right\},\left\{{\omega }_{k}\right\}}{\text{min}}\left\{\sum\nolimits _{k}{\left\|{\partial }_{t}x\left(t\right)\right\|}_{2}^{2}\right\} $$ (2) $$ s.t.\text{}\sum\nolimits _{k=1}^{K}{u}_{k}=f $$ (3) 式中:
$ f $ 是初始信号;$ k $ 是分解模态的个数;$ \left\{{u}_{k}\right\} $ 、$ \left\{{\omega }_{k}\right\} $ 是分解后的第$ k $ 个模态分量和中心频率;$ \delta $ t为狄拉克函数;$ \mathrm{*} $ 为卷积运算。式(1)和式(2)是关于
$ \left\{{u}_{k}\right\} $ 、$ \left\{{\omega }_{k}\right\} $ 的多元函数,式(3)为各模态的约束条件。步骤2:求解变分问题
利用二次惩罚项和拉格朗日乘子法的优势,引入增广Lagrange函数,将构造的约束变分问题转化为非约束变分问题,得到增广Lagrange表达式如式(4)所示:
$$ \begin{split} L\left(\left\{{u}_{k}\right\},\left\{{\omega }_{k}\right\},\lambda \right)=&\alpha \sum\nolimits _{k}{\left\|{\partial }_{t}{x}_{t}\right\|}_{2}^{2}+{\left\|f\left(t\right)-\sum\nolimits _{k}{u}_{k}\left(t\right)\right\|}_{2}^{2}\\ &+\left\langle{\lambda \left(t\right),f\left(t\right)-\sum\nolimits _{k}{u}_{k}\left(t\right)}\right\rangle \end{split} $$ (4) 式中:
$ \lambda $ 为拉格朗日乘法算子;$ \alpha $ 为二次惩罚因子,可以降低高斯噪声的干扰。然后利用交替方向乘子迭代算法结合傅里叶等距变换,优化得到各模态分量和中心频率,并搜寻增广拉格朗日函数的鞍点,交替寻优迭代后的$ \left\{{u}_{k}\right\} $ 、$ \left\{{\omega }_{k}\right\} $ 和$ \lambda $ 的表达式如式(5)(6)(7)所示。$$ {\hat{u}}_{k}^{n+1}\left(\omega \right)=\frac{\hat{f}\left(\omega \right)-\displaystyle\sum\nolimits _{i\ne k}{\hat{u}}_{i}\left(\omega \right)+\dfrac{\hat{\lambda }\left(\omega \right)}{2}}{1+2\alpha {\left(\omega -{\omega }_{k}\right)}^{2}} $$ (5) $$ {\omega }_{k}^{n+1}=\frac{{\int }_{0}^{\mathrm{\infty }}\omega {\left|{\hat{u}}_{k}^{n+1}\left(\omega \right)\right|}^{2}d\omega }{{\int }_{0}^{\mathrm{\infty }}{\left|{\hat{u}}_{k}^{n+1}\left(\omega \right)\right|}^{2}d\omega } $$ (6) $$ {\hat{\lambda }}^{n+1}\left(\omega \right)={\hat{\lambda }}^{n}\left(\mathrm{\omega }\right)+\gamma \left(\hat{f}\left(\mathrm{\omega }\right)-\sum\nolimits _{\mathrm{k}}{\hat{u}}_{k}^{n+1}\left(\mathrm{\omega }\right)\right) $$ (7) 式中:
$ \gamma $ 为噪声容忍度,以确保信号分解后不失真;$ {\hat{u}}_{k}^{n+1}\left(\omega \right) $ 、$ {\hat{u}}_{i}\left(\omega \right) $ 、$ \hat{f}\left(\omega \right) $ 和$ \hat{\lambda }\left(\omega \right) $ 分别是原信号$ {u}_{k}^{n+1}\left(t\right) $ 、$ {u}_{i}\left(t\right) $ 、$ f\left(t\right) $ 、$ \lambda \left(\omega \right) $ 对应的傅里叶变换。最后根据最优解将初始信号分解为$ K $ 个模态分量。1.4 CNN原理
CNN在序列模型和自然语言领域应用广泛,与循环神经网络相比,CNN更擅长捕捉空间特征。其基本原理由式(8)—(10)给出。
$$ {y}_{i}^{l+1}\left(j\right)={K}_{i}^{l}\mathrm{*}{x}^{l}\left(j\right)+{b}_{i}^{l} $$ (8) $$ {a}_{i}^{\left(l+1\right)}\left(j\right)=f\left({y}_{i}^{\left(l+1\right)}\left(j\right)\right) $$ (9) $$ {p}_{i}^{l+1}\left(j\right)=\underset{\left(j-1\right)W+1\leqslant t\leqslant jW}{\text{max}}\left\{{a}_{i}^{l}\left(t\right)\right\} $$ (10) 式中:
$ \mathrm{*} $ 为卷积操作;$ {K}_{i}^{l} $ 、$ {b}_{i}^{l} $ 分别表示$ l $ 层中第$ i $ 个滤波器的权值和偏置;$ {x}^{l}\left(j\right) $ 表示$ l $ 层中第$ j $ 个区域;$ {y}_{i}^{l+1}\left(j\right) $ 表示$ l+1 $ 层中第$ i $ 个滤波器、第$ j $ 个神经元的输入;$ {a}_{i}^{(l+1)}\left(j\right) $ 是$ {y}_{i}^{l+1}\left(j\right) $ 的激活值;$ f $ 为激活函数;$ W $ 为池化内核的宽度;$ {p}_{i}^{l+1}\left(j\right) $ 表示池化后的神经元值。1.5 LSTM原理
LSTM针对循环神经网络短时记忆的缺点,引入门的结构,实现长期特征的学习。图1为LSTM的结构图。其中,
$ {x}_{t} $ 、$ {h}_{t-1} $ 为$ t $ 时刻的输入值和$ t-1 $ 的输出值,门结构通过Sigmoid层和逐点乘法运算组成,LSTM结构中包含了遗忘门、输入门、输出门,以此对输入信息进行选择性遗忘和输出信息选择性记忆。LSTM原理如式(11)~(16)所示:$$ {f}_{t}=\sigma \left({W}_{f}\cdot \left[{h}_{t-1},{x}_{t}\right]+{b}_{f}\right) $$ (11) $$ {i}_{t}=\sigma \left({W}_{i}\cdot \left[{h}_{t-1},{x}_{t}\right]+{b}_{i}\right) $$ (12) $$ {o}_{t}=\sigma \left({W}_{o}\cdot \left[{h}_{t-1},{x}_{t}\right]+{b}_{o}\right) $$ (13) $$ {C}_{t1}=\text{tanh}\left({W}_{c}\cdot \left[{h}_{t-1},{x}_{t}\right]+{b}_{c}\right) $$ (14) $$ {C}_{t}={C}_{t-1}\cdot {f}_{t}+{i}_{t}\cdot {C}_{t1} $$ (15) $$ {h}_{t}={o}_{t}\cdot \text{tanh}\left({C}_{t}\right) $$ (16) 式中:
$ {W}_{f} $ 、$ {W}_{i} $ 、$ {W}_{o} $ 、$ {W}_{c} $ 为遗忘门、输入门、输出门、细胞状态候选值的权值;$ {b}_{f} $ 、$ {b}_{i} $ 、$ {b}_{o} $ 、$ {b}_{c}{、f}_{t} $ 、$ {i}_{t} $ 、$ {o}_{t} $ 、$ {C}_{t1} $ 为对应的偏置和输出值;$ \sigma $ 为激活函数sigmoid;$ {C}_{t-1} $ 为$ t-1 $ 时刻的细胞状态;$ {C}_{t} $ 为$ t $ 时刻细胞状态更新后的值;$ {h}_{t} $ 为$ t $ 时刻的输出值。1.6 基于VMD-CNN-LSTM的SST预测模型
本文采用滑动窗口进行预测。对于选定的标记点,每一处都包含1个SST序列,通过指定步长的滑动窗口生成观测窗口和预测窗口,进而从原始时间序列中提取历史、未来海温序列,最终将提取到的海温数据输入VMD-CNN-LSTM模型中进行预测。图2为VMD-CNN-LSTM海温预测模型整体框架图。具体步骤如下。
步骤1:数据归一化
由于季节变化和气候影响,SST温度变化较大且短时间变化剧烈。因此,利用式(17)对初始SST序列归一化,将SST值限制在[0,1]内,有利于模型快速收敛:
$$ \mathrm{y}=\frac{x-{x}_{\text{min}}}{{x}_{\text{max}}-{x}_{\text{min}}}$$ (17) 式中:
$ x $ 为初始的SST序列;$ {{x}}_{\mathrm{m}\mathrm{i}\mathrm{n}} $ 、$ {{x}}_{\mathrm{m}\mathrm{a}\mathrm{x}} $ 为初始SST序列的最小值和最大值。步骤2:数据分解去噪
将归一化的数据输入VMD模块进行分解,经过分解,得到多个模态分量,每个分量代表不同频率的时间序列,同时具备不同的物理意义,能够减少噪声对预测模型的影响。
步骤3:基于CNN-LSTM的分量预测
CNN-LSTM神经网络由CNN层、LSTM层、Dropout层和Dense层共同组成。由于各模态分量的幅值差别较大,所以将各分量分别进行训练,通过CNN、LSTM进行特征提取,最后经过Dense层输出预测结果。
步骤4:预测结果输出
各模态分量的权值均为1,故将各模态分量的预测结果进行累加,并进行反归一化,最终得到SST序列的预测结果。
1.7 参数设置及评价指标
本文选取7条SST序列,该序列每天记录1次,共6785 d。模型为输入连续的前5 天SST预测后1 天的SST。每处标记点的数据维度为6785×1,通过滑动步长进行数据处理后,模型的输入维度为6780×5×1,输出维度为6780×1,Test_size选取0.2,将前80%的数据作为训练集,后20%作为测试集。经过VMD进行分解后得到3个6780×5×1的时间序列,然后采用CNN进行特征提取,维度变为6780×5×32,接着通过三层LSTM训练后,维度依次变为6780×5×32、6780×5×32、6780×16,最后通过Densec层进行预测,输出维度依次为6780×10、6780×1,最终将3个模态分量的预测结果相加,得到模型实际预测结果。其中模型的主要参数如表2所示。
表 2 算法参数表Tab. 2 Algorithm parameter table模型名称 参数名称 参数值 VMD K 3 Alpha 1 Tol 1e-6 CNN Kernel_size 5 Filters 32 LSTM Layers 3 Neurous {32,32,16} Dropout P 0.2 Layers 2 Dense Neurous {10,1} Batch_size 128 Epoch 200 本文采用MAE [式(18)]和RMSE[ 式(19)]作为评价指标,对模型的预测误差和精度进行评价。
$$ {M}{A}{E}=\frac{1}{N}\sum\nolimits _{i=1}^{N}\left|{y}_{i}-{x}_{i}\right| $$ (18) $$ {R}{M}{S}{E}=\sqrt{\frac{1}{N}\sum\nolimits _{i=1}^{N}{\left({y}_{i}-{x}_{i}\right)}^{2}} $$ (19) 式中:
$ {y}_{i} $ 为预测值;$ {x}_{i} $ 为初始值;$ N $ 为样本个数。2 结果与讨论
2.1 VMD分解模块分析
经过数据预处理后,对标记点T1进行VMD分解,选取前1000天数据绘图展示。图3为T1标记点VMD分解图。其中,Signal input为T1标记点预处理后的SST序列,IMF0、IMF1、IMF2为分解后的模态分量,IMF0反应SST的季节变化趋势,IMF1、IMF2为余项,表示各种残差噪声。从图3可以看出,季节分量变化幅度最大,其对应的频谱值最大,振动频率最小,残差余项IMF1变化幅度最小,振幅最大。
图4为IMF0分量的拟合效果图,从图4可以看出,神经网络对低频分量的预测效果较好,由于IMF0基本反应了初始数据的状况,并且它剔除了残差噪声,使得序列变得平滑,所以便于预测。从图5、图6可以看出,高频分量的波动大,模型很难精准预测温度变化趋势,拟合效果欠佳。表3为不同模态分量预测效果,从表3可以看出,仅将IMF0作为预测结果会导致较大的误差,而将不同分量的预测结果累加,模型会取得较高的预测精度。
表 3 不同模态分量预测效果Tab. 3 Prediction effect of different modal components模态分量 MAE REMSE IMF0 0.2639 0.3548 IMF0+IMF1 0.2318 0.3104 IMF0+IMF1+IMF2 0.1261 0.1607 最后为了证明VMD去噪模块的重要性和有效性,将本文模型与消融模型CNN-LSTM进行对比验证。对比结果如表4所示,加入VMD分解后,其RMSE和MAE分别降低了58.37%和54.77%,模型的预测精度取得有效提高。
表 4 消融模型对比Tab. 4 Ablation model comparison模型 MAE REMSE VMD-CNN-LSTM 0.1261 0.1607 CNN-LSTM 0.2788 0.3860 2.2 基线模型对比
为了证明本文模型的有效性,对选取的7个标记点分别进行SST预测,并将预测结果与传统基线模型SVR[6]、LSTM[9]、GRU[10]进行比较。以5 d时间步长预测结果为例,其中各标记RMSE和MAE的结果如图7所示。以T1标记点为例,本文模型的RMSE比SVR、LSTM、GRU分别减少了73.64%、63.07%、64.5%,MAE分别减少了74.31%、61.89%、64.01%。结果表明,本文模型表现最优,LSTM表现略微优于GRU,SVR表现最差,本文模型在T1标记点表现明显优于其他传统基线模型,并且在选取的其他6个标记点上仍表现最优,证明了本文模型具有较好的鲁棒性和预测效果。
2.3 现有模型对比
考虑到SST时间序列的周期性和非线性特征,现有模型同样从信号分解的角度出发,对初始SST序列进行分解,主要为STL和EMD两种分解方法。同样对选取的7个标记点进行SST预测,将本文模型对比STL-GUR[15]、STL-LSTM[15]、EMD-GRU[16]、EMD-LSTM[16]等模型,并将预测结果进行展示,以5 d时间步长预测结果为例,其中各标记点RMSE和MAE的结果如图8所示。以T1标记点为例,本文模型比EMD-LSTM、EMD-GUR、STL-GRU和STL-LSTM模型的RMSE分别减少了35.49%、46.02%、59.77%和54.32%,MAE分别减少了37.33%、50.18%、56.38%和53.19%。通过信号分解的方法,相比单一模型均得到了提升,其中EMD分解优于STL分解,本文采用的VMD分解预测结果最优,相比EMD分解,VMD的低频分量更容易表现出SST波动变化,有利于模型预测。
最后,选取测试集的部分预测结果进行可视化操作,以T1标记点为例,图9为本文模型与现有模型的预测效果图。从图9可以看出,在前20 d海温上升阶段,本文模型的拟合效果最佳,后30 d海温波动上升,特别在最后5 d海温骤增,与其他模型相比,只有本文模型能达到较好的拟合程度。
2.4 不同时间步长预测效果分析
选取1 d、5 d、7 d时间步长进行对比验证,以T1标记点为例,各模型的RMSE和MAE如表5所示。从表5可以看出,随时间步长的增加,各模型的预测效果随之降低。但本文模型在选取的时间步长上均表现最优,尤其是当时间步长延长时,其预测精度的优势更为显著。
表 5 不同时间步长模型预测精度对比Tab. 5 Algorithm parameter table模型结构 MAE(1,5,7) RMSE(1,5,7) LSTM[9] 0.2545 0.3309 0.3956 0.2845 0.4351 0.4956 GRU[10] 0.2589 0.3504 0.4015 0.3104 0.4527 0.5046 SVR[6] 0.3145 0.4908 0.6804 0.4112 0.6096 0.8063 EMD-LSTM[16] 0.0865 0.2012 0.2735 0.1187 0.2491 0.3045 EMD-GRU[16] 0.1448 0.2531 0.2965 0.1654 0.2977 0.3425 STL-GRU[15] 0.1856 0.2891 0.3623 0.2340 0.3995 0.4621 STL-LSTM[15] 0.1364 0.2694 0.2954 0.1854 0.3518 0.3845 CNN-LSTM 0.1744 0.2788 0.3274 0.2177 0.3860 0.4234 VMD-CNN-LSTM 0.0545 0.1261 0.1645 0.0886 0.1607 0.2316 3 结 论
(1)本文提出了结合VMD分解算法的CNN-LSTM组合预测模型。为减少噪声对于模型预测的影响,本文对初始SST的时间序列进行VMD分解,采用CNN-LSTM算法对分解的多个模态分量进行特征提取,以加快模型的收敛速度,提高预测精度。
(2)以我国东海海域的海温为例,对模型采用不同时间步长和不同标记点进行验证。结果表明,本文模型的预测精度优于其他模型,在时间和空间上具有很好的鲁棒性。
-
表 1 各标记点的统计数据(℃)
Tab. 1 Statistical data of each marker (℃)
地点 平均值 标准差 最小值 50% 最大值 T1 18.12 5.44 9.35 17.41 30.96 T2 21.52 4.24 14.42 21.13 31.22 T3 21.14 4.27 12.45 20.65 31.32 T4 21.16 4.19 13.75 20.87 30.01 T5 23.56 3.73 15.88 23.51 31.04 T6 25.39 2.67 20.01 25.43 30.62 T7 25.82 2.53 21.09 25.82 31.01 表 2 算法参数表
Tab. 2 Algorithm parameter table
模型名称 参数名称 参数值 VMD K 3 Alpha 1 Tol 1e-6 CNN Kernel_size 5 Filters 32 LSTM Layers 3 Neurous {32,32,16} Dropout P 0.2 Layers 2 Dense Neurous {10,1} Batch_size 128 Epoch 200 表 3 不同模态分量预测效果
Tab. 3 Prediction effect of different modal components
模态分量 MAE REMSE IMF0 0.2639 0.3548 IMF0+IMF1 0.2318 0.3104 IMF0+IMF1+IMF2 0.1261 0.1607 表 4 消融模型对比
Tab. 4 Ablation model comparison
模型 MAE REMSE VMD-CNN-LSTM 0.1261 0.1607 CNN-LSTM 0.2788 0.3860 表 5 不同时间步长模型预测精度对比
Tab. 5 Algorithm parameter table
模型结构 MAE(1,5,7) RMSE(1,5,7) LSTM[9] 0.2545 0.3309 0.3956 0.2845 0.4351 0.4956 GRU[10] 0.2589 0.3504 0.4015 0.3104 0.4527 0.5046 SVR[6] 0.3145 0.4908 0.6804 0.4112 0.6096 0.8063 EMD-LSTM[16] 0.0865 0.2012 0.2735 0.1187 0.2491 0.3045 EMD-GRU[16] 0.1448 0.2531 0.2965 0.1654 0.2977 0.3425 STL-GRU[15] 0.1856 0.2891 0.3623 0.2340 0.3995 0.4621 STL-LSTM[15] 0.1364 0.2694 0.2954 0.1854 0.3518 0.3845 CNN-LSTM 0.1744 0.2788 0.3274 0.2177 0.3860 0.4234 VMD-CNN-LSTM 0.0545 0.1261 0.1645 0.0886 0.1607 0.2316 -
[1] 王利亚. 海表面温度对热带气旋的影响[J]. 集成电路应用, 2021, 38(4): 182-183. [2] 周 倩, 凌铁军, 李 响, 等. 中国周边海域海面温度日变化对区域气候的影响[J]. 气候与环境研究, 2019, 24(2): 214-226. doi: 10.3878/j.issn.1006-9585.2018.18087 [3] 孙伟富, 张 杰, 孟俊敏, 等. 中国南海及邻近海域SST时空分布和变化特征分析[J]. 海洋科学进展, 2018, 36(3): 402-411. doi: 10.3969/j.issn.1671-6647.2018.03.007 [4] 张绪东, 张菀伦, 李云波. 北黄海海温分布变化的数值模拟分析[J]. 海洋预报, 2015, 32(5): 89-97. doi: 10.11737/j.issn.1003-0239.2015.05.011 [5] 张玉荣. 大连附近海域幼鲍安全越冬海水温度预报方法的研究[J]. 海洋环境科学, 1992, 11(1): 34-38. [6] LINS I D, ARAUJO M, DAS CHAGASMOURA M, et al. Prediction of sea surface temperature in the tropical Atlantic by support vector machines[J]. Computational Statistics & Data Analysis, 2013, 61: 187-198.
[7] PATIL K, DEO M C. Basin-Scale prediction of sea surface temperature with artificial neural networks[J]. Journal of Atmospheric and Oceanic Technology, 2018, 35(7): 1441-1455. doi: 10.1175/JTECH-D-17-0217.1
[8] WEI L, GUAN L, QU L Q. Prediction of sea surface temperature in the south China sea by artificial neural networks[J]. IEEE Geoscience and Remote Sensing Letters, 2020, 17(4): 558-562. doi: 10.1109/LGRS.2019.2926992
[9] 朱贵重, 胡 松. 基于LSTM-RNN的海水表面温度模型研究[J]. 应用海洋学学报, 2019, 38(2): 191-197. doi: 10.3969/J.ISSN.2095-4972.2019.02.005 [10] ZHANG Z, PAN X L, JIANG T, et al. Monthly and quarterly sea surface temperature prediction based on gated recurrent unit neural network[J]. Journal of Marine Science and Engineering, 2020, 8(4): 249. doi: 10.3390/jmse8040249
[11] XU H F, CHAI L, LUO Z M, et al. Stock movement predictive network via incorporative attention mechanisms based on tweet and historical prices[J]. Neurocomputing, 2020, 418: 326-339. doi: 10.1016/j.neucom.2020.07.108
[12] XIAO C J, CHEN N C, HU C L, et al. Short and mid-term sea surface temperature prediction using time-series satellite data and LSTM-AdaBoost combination approach[J]. Remote Sensing of Environment, 2019, 233: 111358. doi: 10.1016/j.rse.2019.111358
[13] XIAO C J, CHEN N C, HU C L, et al. A spatiotemporal deep learning model for sea surface temperature field prediction using time-series satellite data[J]. Environmental Modelling & Software, 2019, 120: 104502.
[14] 程泽梅. 1960~2013年华南沿海SST变化特征的相关分析[D]. 青岛: 中国海洋大学, 2015: 20-23. [15] 贺 琪, 查 铖, 宋 巍, 等. 基于STL的海表面温度预测算法[J]. 海洋环境科学, 2020, 39(6): 918-925. doi: 10.12111/j.mes.20190232 [16] 贺 琪, 胡泽煜, 徐慧芳, 等. 基于经验模态分解-门控循环模型的海表温度预测方法[J]. 激光与光电子学进展, 2021, 58(24): 2415005. -
期刊类型引用(2)
1. 韩莹,曹允重,张凌珺,赵芮晗,董昌明. 融合IVMD的海表温度时空智能预测方法. 海洋测绘. 2024(03): 53-57+61 . 百度学术
2. 周国良,周锋. 基于IWOA优化Res-BiGRU深度学习模型的海表温度预测方法. 海洋环境科学. 2024(05): 806-816 . 本站查看
其他类型引用(4)