这篇论文创新性地将深度学习中 CNN 和 LSTM 结合,提出了一种高效、自动化的滑坡时变风险评估框架,为滑坡风险管理提供了新思路和实用工具。
📌 研究背景与问题
- 滑坡风险具有显著的时间演化特征(即风险随时间变化),但传统的评估方法往往依赖复杂、耗时的物理建模和人工判断,难以动态、高效地评估滑坡随时间的风险水平。
- 此外,已有方法难以适应不同地质条件下滑坡体的动态风险演化特征。
📌 研究目标
- 开发一种以时间序列预测为基础的滑坡时变风险评估方法,实现高效、准确地预测未来滑坡风险水平。
- 比较不同深度学习模型的性能,找到最适合滑坡风险时序建模的模型。
🧠 所用方法
-
构建并训练了一个混合卷积神经网络与长短期记忆网络(CNN-LSTM) 的深度学习模型:
- CNN 提取滑坡风险时间序列中的局部空间特征。
- LSTM 捕捉风险随时间变化的长程依赖关系。
-
同时对比了四种其他模型(CNN、LSTM、Bi-LSTM、Bi-GRU)的预测性能。
🧪 应用实例
- 以Bazimen滑坡(Bazimen landslide)为案例进行实证研究。
- 使用实测或估算的滑坡风险时间序列,验证 CNN-LSTM 在预测未来滑坡风险趋势方面的能力。
✅ 研究发现
- CNN-LSTM 模型在预测精度上明显优于其他深度学习模型,能够较好地拟合滑坡风险的时间演化规律。
- 尽管模型整体表现优秀,但在捕捉部分关键峰值或局部细节变化方面仍有一定局限。
📈 研究意义
- 提出了一种新的、自动化、数据驱动、具时效性的滑坡时变风险评估手段,为替代传统方法提供了可行路径。
- 有助于地质灾害应急响应,如制定疏散策略或风险减缓工程措施。
🔮 未来研究方向
- 探讨该方法在其他滑坡案例中的迁移能力与泛化能力。
- 结合序列数据挖掘技术与更先进的混合建模方法,进一步提升预测精度。
作者
Lin Wang
Kangjie Yang
Chongzhi Wu
Yang Zhou
Junzhi Liu
Haoran Hu(通讯作者)
作者单位
北京师范大学珠海校区 国家安全与应急管理学院,珠海 519087,中国
北京师范大学珠海校区 灾害模拟与系统风险治理联合国际研究实验室,珠海 519087,中国
重庆大学土木工程学院,重庆 400045,中国
[1] Wang L, Yang K, Wu C, et al. Novel approach to quantitative risk assessment of reservoir landslides using a hybrid CNN-LSTM model[J]. Landslides, 2025, 22(3): 943-956.
文章目录
摘要
合理评估边坡安全状态为滑坡灾害防治提供了科学依据。三峡水库区(TGRA)是中国著名的滑坡多发区,众多滑坡案例均因降雨和/或水库水位变化诱发分布于该区域。尽管概率风险评估为定量评估边坡安全提供了合理方法,但现有研究多关注时间独立的滑坡风险评估,忽视了降雨和/或水库水位等时变外部环境的影响。
本研究旨在通过融合先进的深度学习算法——卷积神经网络(CNN)与长短时记忆网络(LSTM),提出一种新的滑坡风险定量评估方法。以Bazimen滑坡为例,系统比较分析了混合CNN-LSTM模型与其他四种深度学习算法的性能。结果表明,混合CNN-LSTM模型能够合理描绘时间依赖滑坡风险的时间演变规律,在五种候选模型中表现最佳。
关键词
定量风险评估 · 水库滑坡 · 深度学习 · 时间依赖失效风险 · CNN-LSTM
引言
滑坡可能导致严重的人员伤亡和巨大的经济损失,对附近居民的安全、岩土工程设施以及区域生态环境构成重大威胁(Tang 等,2019)。截至目前,许多因降雨和/或水库水位变化诱发的水库滑坡案例分布在三峡库区(TGRA)(Yin 等,2022),该区域被认为是中国的重点滑坡易发区。合理评估水库边坡稳定性及其失效风险,为实际工程中的滑坡灾害防治提供了科学依据。
概率风险评估通过合理整合潜在不确定性,以定量方式衡量地质结构安全性,同时兼顾岩土可靠性分析和后果分析(如 Huang 等,2013;Li 等,2016;Lei 等,2023)。近年来,概率风险评估受到了越来越多的关注(如 Cheng 等,2018;Li 等,2019;Huang 等,2021;Ng 等,2021;Cui 等,2022;Liao 等,2023;Yi 等,2023)。例如,Li 等(2019)将多条潜在失效滑动面纳入定量滑坡风险评估;Huang 等(2021)通过引入克里金技术开发了高效的风险评估方法;Ng 等(2021)研究了土壤方向性和 Copula 函数对边坡失效风险的影响;Cui 等(2022)模拟了滑坡风险评估中的整个滑坡过程;Liao 等(2023)应用随机有限元极限分析方法进行概率风险评估。
然而,上述大多数研究集中于时间独立的滑坡风险评估,忽略了降雨和/或水库水位等时变外部环境的影响。因此,针对三峡库区水库滑坡的时间依赖风险评估仍需深入研究。目前,针对时间依赖的水库滑坡风险评估的研究较少。相比常见的时间独立风险评估,时间依赖风险评估的计算复杂度大幅增加(Straub 等,2020;Zhang 等,2023b)。众所周知,滑坡应急管理策略的有效实施依赖于及时的定量风险评估(如 He 等,2023a),因此及时的滑坡风险评估对从业人员和决策者理解潜在滑坡灾害严重性并采取科学对策(如启动撤离计划或采用工程措施降低风险等级)至关重要。然而,传统时间依赖滑坡风险评估所需的巨大计算量极大地限制了其及时性,阻碍了实际应用。
这就需要探索一种新途径,以改革传统时间依赖滑坡风险评估框架。近年来,深度学习(DL)凭借其在数据挖掘和学习分析方面的卓越表现,为解决岩土相关问题开辟了新方向(如 Wei 等,2021;Guo 等,2022a;Soranzo 等,2023;He 等,2023b;Nava 等,2023;Wang 等,2023;Wu 等,2023;Feng 等,2024;Wang 等,2024)。例如,Wei 等(2021)应用三种循环神经网络(RNN)变体预测岩土工程中的孔隙水压力;Guo 等(2022a)引入 LSTM 结合隧道掘进机数据预测可能的坍塌区域;Soranzo 等(2023)提出基于 CNN 的随机层状边坡安全因子预测方法;Nava 等(2023)研究了不同深度学习算法在滑坡位移预测中的性能;Wu 等(2023)开发了 CNN 替代模型估计支撑开挖引起的墙体变形;Wang 等(2024)结合 CNN 与 U-Net 架构促进边坡可靠性分析。
值得注意的是,深度学习技术鲜少应用于受季节性降雨和周期性水库水位波动影响的水库滑坡的时间依赖风险评估中。本研究的目标是通过引入 LSTM 和 CNN,提出一种适用于复杂环境下水库滑坡时间依赖风险评估的新方法。首先介绍定量滑坡风险评估方法及几种流行的深度学习算法,随后提出基于混合 CNN-LSTM 的时间依赖滑坡风险评估方法及其实现流程。最后,系统评估所提方法及其他四种深度学习算法在Bazimen滑坡时间依赖风险评估中的有效性。
方法
滑坡的定量风险评估
概率风险评估通过将滑坡失效概率与失效后果合理结合,构建一种名为风险指数的定量评价指标。通常,在滑坡的定量风险评估中,风险指数被定义为边坡失效概率与相应后果的乘积(例如,Huang 等,2013;Li 等,2016)。数学表达为:
R f = P f × C f R_f = P_f \times C_f Rf=Pf×Cf
其中:
- R f R_f Rf:滑坡风险值
- P f P_f Pf:滑坡发生概率
- C f C_f Cf:滑坡造成的后果或损失(后果值)
如式 (1) 所示,滑坡的定量风险评估包含两个主要步骤:计算边坡失效概率 P _ f P\_f P_f 和评估相应失效后果 C _ f C\_f C_f。 P _ f P\_f P_f(或可靠性指标)源于岩土工程的可靠性分析,从概率的角度定量刻画边坡安全性,区别于传统确定性边坡稳定性分析中常用的安全系数(FS)指标。由于实际边坡工程中的性能函数通常是隐式且复杂的,因此在工程实践中难以通过解析方法求解失效概率(例如,Wang 等,2020a, 2020b)。
作为替代,蒙特卡洛模拟(MCS)方法被广泛应用于边坡、深基坑、隧道等岩土结构的可靠性分析中(例如,Jiang 等,2022;Zhang 等,2023a;Liao 等,2024)。尽管 MCS 效率不高,但由于其在灵活性和稳健性方面的优势,仍被广泛用作新兴岩土可靠性分析方法的基准工具(Liu 和 Wang,2023)。
众所周知,滑坡的后果通常与滑体体积和失效影响区域密切相关。Huang 等(2013)开创性地将滑体体积引入定量滑坡风险评估,用以衡量后果 C _ f C\_f C_f。此后,越来越多岩土研究人员和工程师采用滑体体积作为后果评价指标(例如,Li 等,2019;Huang 等,2021;Ng 等,2021;Cui 等,2022;Liao 等,2023)。受到前人研究的启发,本文也采用滑体体积作为风险评估中的后果指标。
需要注意的是,滑体体积适用于三维边坡分析情形,在二维问题中将简化为滑体面积。根据式 (1),可通过统计失效事件数量并提取相应滑体体积或面积,直接计算滑坡风险指数。
在实际应用中,若直接采用 MCS 进行时间依赖滑坡风险评估,工程人员可能会受到每个离散时刻计算任务繁重的困扰。因此,本文引入深度学习(DL)技术,开发了一种高效的时间依赖滑坡风险评估方法,详见下一节。
深度学习算法
门控循环单元(GRU)
GRU 是一种专门用于捕捉时间相关性的神经网络结构(Cho 等,2014),相比传统的 RNN 和 LSTM,其结构更为简洁,但性能更强。GRU 的核心结构包括两个部分:更新门(update gate)和重置门(reset gate)。
- 更新门决定是否更新记忆单元中的信息。它通过输入序列与上一个时间步的隐藏状态计算一个 0 到 1 之间的值,用以表示保留先前信息与吸收新信息的程度。
- 重置门决定上一个时间步的隐藏状态对当前时间步的影响程度。其也是通过输入序列与前一隐藏状态计算一个值,表示保留先前状态的比例。
然而,GRU 在处理长序列数据方面存在一定局限性,因此提出了双向 GRU(Bi-GRU)(Chung 等,2014)。Bi-GRU 是 GRU 的扩展形式,由两个独立的 GRU 组成:一个正向处理输入,另一个反向处理反向输入,从而同时融合过去和未来的时间信息,提高对时序依赖性的建模能力。
长短时记忆网络(LSTM)
LSTM 是一种进阶的循环神经网络(RNN)(Hochreiter 和 Schmidhuber,1997),与传统的前馈神经网络显著不同。其设计初衷是为了解决 RNN 在处理长期依赖问题时常出现的信息遗失问题。
LSTM 利用记忆单元(memory cell)有效地保留并传递长时间序列中的重要信息,同时避免遗忘,从而缓解梯度消失或爆炸的问题。LSTM 网络模型通过引入三个门控单元——输入门、遗忘门和输出门,实现对信息的有选择性保留:
- 输入门控制信息的流入;
- 遗忘门决定信息的保留比例;
- 输出门决定哪些信息将被传递到下一个时间步。
这些门由 sigmoid 函数和点乘运算组成。LSTM 的门控结构在一定程度上增加了梯度计算的复杂度,因此可采用反向传播加权技术(Lillicrap 等,2016;Saputra 等,2017)来优化训练过程。该方法通过输入和输出的乘积生成权重,然后与梯度相乘以提升门控单元对最终结果的影响力。
不过,LSTM 在并行处理能力上较弱,只能按时间顺序前向计算,因而计算代价较高。为此,可以结合双向结构(Bi-LSTM),利用两个分别沿正向和反向处理输入序列的独立 LSTM,拼接其输出向量形成最终特征表示,提升模型在有限数据下的预测准确性(Kavianpour 等,2023)。
卷积神经网络(CNN)
CNN 是一种广泛应用的特征提取模块,最初由 LeCun 等人于 1998 年提出,擅长从高层输入中提取局部特征,并逐层下传以构建复杂特征。尽管时空序列建模传统上由 RNN(如 LSTM、GRU)主导,近年来越来越多研究者开始探索 CNN 在时间序列数据挖掘中的潜力(Kavianpour 等,2023;Nava 等,2023;Wang 等,2023)。
CNN 能有效克服递归模型常见的梯度消失/爆炸及记忆受限问题,且支持并行计算输出,提升训练效率。经典 CNN 结构包括四个关键组成部分:卷积层、池化层、激活函数层和全连接层;输入层和输出层也是不可或缺的组成。
- 卷积层是 CNN 的核心,具备局部连接性和参数共享性(Albawi 等,2017)。卷积核通过滑动窗口计算局部区域卷积结果,从而提取时间序列的局部特征,逐层提取浅层到深层特征,最终形成完整的输入表示。
- CNN 的一维结构以三维张量为输入和输出,其输入张量形状为 ( sequence_length , input_length , input_size ) (\text{sequence\_length}, \text{input\_length}, \text{input\_size}) (sequence_length,input_length,input_size),输出张量为 ( sequence_length , input_length , output_size ) (\text{sequence\_length}, \text{input\_length}, \text{output\_size}) (sequence_length,input_length,output_size)。在单变量场景下,输入输出维度均为 1;多变量问题中,两者维度可不同。
- 池化层通常位于相邻卷积层之间,起到下采样作用,降低参数数量,防止过拟合,加快计算速度。
- 全连接层将前面提取的特征信息整合为最终输出。
- 激活函数用于筛选和映射神经元激活特征,增强网络的非线性建模能力。没有激活函数,即便拥有多个隐藏层,整个网络仍退化为单层结构。
因此,只有引入激活函数后,深层神经网络才具备多层非线性映射学习的能力,能有效解决线性模型无法处理的问题。
用于时间依赖滑坡风险评估的混合 CNN-LSTM 模型
为了避免传统时间依赖滑坡风险评估中计算负担过重的问题,本文从混合建模的角度出发,将 CNN 与 LSTM 相结合,提出一种新颖的时间依赖滑坡风险评估方法。混合 CNN-LSTM 模型融合了 CNN 与 LSTM 两种模型的优点,既具备卷积网络的特征提取能力,又具备循环网络中记忆单元的时序建模能力。
具体而言,卷积层可从高维输入中提取局部特征(局部感受野),并将其转化为更复杂的低维特征(Dehghan Shoorkand 等,2024);而 LSTM 层通过门控机制使信息在序列中得以传递,能够记忆并关联历史信息与当前数据,从而捕捉长时间序列中的远程相关性,提升预测性能(Chen,2018)。
图 1 展示了混合 CNN-LSTM 模型用于时间依赖滑坡风险评估的整体结构。该模型包含五个主要部分:输入层、卷积层、池化层、LSTM 层和全连接层,依照数据流动方向依次排列。
经过预处理后,数据首先由输入层送入模型。此时输入数据主要受时间步序列、时间步长度和特征维度的控制。在卷积层中,输入数据首先通过 Dropout 层,该层以一定概率随机“关闭”部分神经元的激活值,以防止过拟合,从而在一定程度上起到正则化作用(Hinton 等,2012)。随后,卷积操作大幅增加了训练参数的数量,而同一组卷积核参数在多个位置的复用有助于捕捉局部特征。
在池化层中,采用最大池化方法对 Relu 激活函数输出的若干特征值进行筛选,仅保留其中的最大值,其余特征值全部舍弃,从而降低模型参数数量(Masci 等,2013)。
接下来进入 LSTM 层,通过记忆单元对参数进行遗忘和存储训练模型的预测能力。然后,LSTM 层的输出经过非线性变换并输入至全连接层,提取预测值并映射至输出空间。
在本研究中,首先采用蒙特卡洛模拟(MCS)方法对每一个时间步的滑坡定量风险进行计算,以生成训练数据;随后,应用深度学习模型(如混合 CNN-LSTM 模型)构建时间序列预测模型。所提出的方法不仅有助于工程实践人员及时掌握复杂环境下的边坡安全裕度,还能为决策者在滑坡灾害防控中的科学决策(如启动撤离方案或采取工程减灾措施)提供可靠依据。
混合 CNN-LSTM 模型的详细实施流程将在下一节中介绍。
实施流程
图 2 展示了基于混合 CNN-LSTM 模型的时间依赖滑坡风险评估方法的实施流程。首先,在确定性建模阶段需明确一些基本信息,主要包括几何形状配置、土体参数(如抗剪强度参数与渗流参数)以及边界条件等。
随后,通过蒙特卡洛模拟(MCS)生成大量随机变量样本,利用岩土工程软件对每个离散时间步反复模拟,计算对应的安全系数(FS)值及滑体体积。接着,可根据公式 (1) 计算每个时间步的滑坡定量风险,从而构建时间序列形式的风险数据。
基于上述准备数据,便可对混合 CNN-LSTM 模型进行训练与校准。最后,在一步预测(one-step-ahead forecasting)框架下,应用该模型预测未来感兴趣时段内的时间依赖滑坡风险。
通常,数据准备阶段涉及大量确定性边坡稳定性分析。本文采用 GeoStudio 软件(GEO-SLOPE International, Ltd., 2012)中嵌入的极限平衡法(Limit Equilibrium Method, LEM)作为分析方法进行说明。
该方法及其实施流程可根据岩土工程实践中的具体情境与需求灵活调整,具有良好的适用性和推广价值。
Bazimen滑坡案例
作为三峡库区(TGRA)中典型的滑坡之一,Bazimen滑坡位于中国湖北省秭归县,如图 3a 所示。图 3b 显示了Bazimen滑坡的平面图,可以看出其边界条件明显,滑坡区域呈扇形分布。滑坡区域的高程范围为 110 至 250 米,表明其大部分区域处于淹没状态。滑坡宽度在 100 至 350 米之间变化,最大纵向长度约为 380 米,体积约为 200 万立方米。
根据图 3c 中展示的地质剖面示意图,初始滑动面位于土层与基岩的交界面上方,较高处为次级滑动面。为了监测Bazimen滑坡的稳定状态,设置了两个监测点:ZG111 和 ZG110。图 3d 绘制了这两个监测点的累积位移,以及记录的月降雨量和库水位。结果表明,滑坡的变形行为受库水位和降雨的显著影响,这进一步强调了在复杂环境下进行时间依赖滑坡风险评估的必要性。
滑坡风险时间序列数据的准备
一般而言,可以通过瞬态渗流分析来研究滑坡体内部渗流响应。在本研究中,采用通用岩土工程软件 GeoStudio 来模拟Bazimen滑坡的渗流情况。图 4 展示了该滑坡的实际降雨强度和库水位变化记录。
为了考虑参数的不确定性,本文将饱和渗透系数和抗剪强度参数作为随机变量进行建模。在实际工程项目中,由于时间和预算限制,现场试验数据通常稀缺,因此难以通过统计方法确定这些参数的变异系数(COV)和概率密度函数(PDF)。为此,本文参考文献(如 Cho 2012;Li 等,2015)中提供的数值,假定不同土层中的这三个不确定参数具有相同的 COV 和 PDF。表 1 总结了本研究中所使用的力学和水力参数,其中部分数据参考了三峡库区其他相似滑坡案例。
本研究首先采用蒙特卡洛模拟(MCS)生成这三个不确定参数的 1000 组随机样本。随后,使用 GeoStudio 软件对 2008–2018 年间的每组样本进行瞬态渗流分析和边坡稳定性分析,获得每个离散时间点的安全系数(FS)值和滑动体面积。接着,便可根据这些数据计算出滑坡的定量风险,如图 4 所示。
结果表明,Bazimen滑坡的风险随时间显著波动,表明周期性的库水位变化与季节性降雨对其稳定性具有较大影响。随着库水位上升,滑坡表面的静水荷载和动水压力增加,从而提升边坡稳定性,降低滑坡风险。而库水位迅速下降时,地表荷载减小、渗流作用增强,易诱发滑坡失稳。特别是在雨季与水位下降阶段重叠的时期,滑坡风险将进一步加剧。已有多项理论与实验研究指出,这两种外部环境因素对库岸稳定性具有显著影响(如 Tang 等,2019;Fang 等,2023)。因此,有必要在复杂环境下以高效且精确的方式评估滑坡的时间依赖风险。
根据图 4 所示的数据,可进一步校准混合 CNN-LSTM 模型以开展风险评估,具体将在下一节中讨论。
CNN-LSTM 模型的构建
在导入预处理数据后,首先进行标准化处理以便于模型训练。随后,采用滑动窗口法构建时间步序列,时间步设定为 10,以有效刻画时序动态。
本研究将数据集按 8:2 比例划分为训练集和测试集。预处理后的数据首先进入卷积层,宽卷积核可自适应提取特征。随后,使用最大池化层对特征进行降维,同时保留关键信息。降维后的数据被输入至 LSTM 层,通过神经网络训练自动学习时序特征。
在训练过程中,采用 Adam 优化器对误差进行反向传播并逐层更新模型参数(Kingma 和 Ba,2017;Zheng 等,2022)。最后,通过全连接层对特征进行整合,完成输入序列的时间预测任务。
考虑到滑坡风险随时间变化剧烈,预测其时序演变特征具有挑战性。为此,构建了混合 CNN-LSTM 模型以应对复杂环境下滑坡风险的时间依赖性问题。图 5 显示了 CNN-LSTM 模型预测的时间依赖风险结果。
图 5a 表明,该模型能有效捕捉滑坡失稳风险变化中的局部峰值,并准确刻画训练集中的整体趋势。在测试集上(图 5b),CNN-LSTM 模型也成功捕捉了大多数风险变化点,尽管存在个别未捕捉的突变点。这些异常值主要对应于风险骤降或局部最小值的时段。
总体而言,从时间序列预测角度看,CNN-LSTM 模型能够合理捕捉Bazimen滑坡风险的时间演变规律,展示了其在滑坡风险预测中的应用潜力。对于工程实践而言,该模型可作为地质工程师快速掌握滑坡风险状态的可靠工具。
不同深度学习方法的对比
为了进一步验证所提方法的有效性,本文在相同数据集基础上构建了另外四种深度学习模型进行对比,包括 CNN、LSTM、Bi-LSTM 和 Bi-GRU。
如图 6a 所示,虽然 CNN 模型可描绘数据点变化趋势,但对于部分局部峰值的刻画能力较弱,其预测误差明显大于混合 CNN-LSTM 模型(参见图 5a 和图 6a)。在测试集上,CNN 模型的预测结果与 MCS 方法存在偏差,部分局部变化趋势无法准确捕捉(图 6b)。
类似地,图 7 至图 9 分别展示了 LSTM、Bi-LSTM 和 Bi-GRU 模型的预测结果。尽管这三种模型能较好地刻画整体变化趋势,但对于某些关键点和局部趋势的刻画仍存在不足,导致其预测误差普遍大于混合 CNN-LSTM 模型。
综上,五种深度学习模型在表现上存在差异。图 10 表明,混合 CNN-LSTM 模型最合理地刻画了Bazimen滑坡风险的时间演变规律,整体预测性能最优。
为了定量衡量各模型的预测能力,本文引入了三种评估指标:均方根误差(RMSE)、平均绝对误差(MAE)和判定系数(R²)。RMSE 和 MAE 越小,模型精度越高;R² 越大,说明拟合效果越好。
表 2 所列结果显示,混合 CNN-LSTM 模型的 R² 值最高(0.9312),同时 RMSE(0.07)和 MAE(0.05)值最小,其次为 CNN 和 Bi-LSTM,LSTM 和 Bi-GRU 表现最差。这表明 CNN-LSTM 模型在复杂环境下能更有效地捕捉滑坡风险的时间演变规律。
上述五种深度学习模型均基于时间序列预测框架,智能挖掘潜在的时序演化规律,对Bazimen滑坡未来风险进行预测。本研究在显著降低水库边坡时间依赖风险评估计算复杂度的同时,为岩土工程师提供了一种实用、高效的深度学习方法,在不牺牲精度的前提下减轻了计算负担,具有较高的应用前景。
讨论
注意力机制的性能表现
注意力机制自 1990 年代以来就受到广泛研究,并于 2014 年首次应用于计算机视觉领域(Mnih 等,2014)。随着 Transformer 架构在 2017 年的出现,注意力机制迅速在自然语言处理和计算机视觉相关问题中得到广泛应用(Vaswani 等,2017)。视觉注意力机制是人类视觉特有的一种大脑信号处理机制,注意力机制正是受到该机制的启发,是一种类脑应用。
注意力机制能够快速扫描整个图像以识别需要关注的关键区域(即注意焦点),进而将更多的注意资源分配给这些区域以收集关于目标的详细信息,并抑制无关信息。在时间序列预测中,注意力机制通常与其他深度学习算法结合使用,以学习序列数据之间的相关性和权重,从而提高模型的准确性(Xiao 等,2021),这在基于 RNN(如 LSTM 或 GRU)的编码器-解码器模型中尤为常见。
本研究尝试将注意力机制与经典的深度学习技术结合,并通过对比分析 LSTM 模型与混合 CNN-LSTM 模型的性能,进一步探讨其在时变滑坡风险评估中的有效性。
在本研究中,基于注意力机制的 LSTM 模型包括五个层级:输入层、LSTM 层、注意力层、全连接层和输出层。其中,LSTM 层用于实现高层特征学习,注意力层强调关键时间步的信息,全连接层用于整合局部特征并完成最终预测。
同样地,基于注意力机制的 CNN-LSTM 模型由六个层级构成:输入层、CNN 层、LSTM 层、注意力层、全连接层和输出层。第一层是输入层,用于定义输入数据格式;第二层为卷积神经网络,提取特征之间的空间关系,从而弥补 LSTM 无法捕捉空间信息的不足;第三层为 LSTM 层,用于提取非线性序列数据中的时间变化信息;第四层是注意力机制,用于增强重要时间步的特征表现并减少模型误差。
图 11 比较了 LSTM 与基于注意力机制的 LSTM 模型的结果。可以观察到,这两种模型都能合理刻画滑坡风险序列的时间演变趋势,尽管对于某些关键峰值和局部变化趋势的捕捉能力有限。为进一步量化两者的预测性能,表 3 列出了相应的评价指标。根据表中数据,基于注意力机制的 CNN-LSTM 模型相比于单一 LSTM 模型具有更高的决定系数 R²(即 0.8699),更低的 RMSE(0.09)和 MAE(0.07),说明该模型在时变滑坡风险评估中表现更优。
此外,图 12 对比了 CNN-LSTM 与基于注意力机制的 CNN-LSTM 模型在测试集上的表现。同样地,两种模型均能较好地捕捉滑坡风险的时间演变规律,尽管在某些关键峰值和局部趋势上仍有不足。表 3 进一步展示了两者的评价指标。可以看出,在本研究中,注意力机制对混合 CNN-LSTM 模型的准确性提升作用较小,这可能是因为原有模型已具有较高性能。但可以确认的是,将注意力机制应用于单一 DL 模型(如 LSTM)可以显著提升预测准确性。
相比之下,在混合模型中的提升效果有限。因此,未来研究可继续探索注意力机制与不同模型的最优集成策略,或开发结构更简单、性能更优的注意力机制模型,用于时间序列预测任务(Guo 等,2022b)。
方法的优势与局限性
本研究初步探索了一种结合 CNN 与 LSTM 的混合建模方法,以提升时变滑坡风险评估的效率。该混合 CNN-LSTM 模型结合了卷积神经网络的特征提取能力和递归网络的记忆单元优势,能自动学习潜在的时间演变规律,并预测未来时间段的滑坡风险。
这一方法为从时间序列预测角度出发进行滑坡风险评估提供了新思路,既解决了复杂环境下(如季节性降雨、周期性库水位波动)及时风险评估的难题,又为地质工程师在滑坡防灾减灾实践中提供了可靠工具。此外,考虑到滑坡应急管理策略的有效性依赖于及时的风险评估,所提出的模型还可协助政府决策者及时了解潜在滑坡灾害的严重性,并制定有效的工程对策及科学的应急管理措施(如启动疏散预案)。
本方法可推广至其他水库滑坡案例的时变风险评估,前提是可获得相应的基本信息(如土壤参数和水文地质条件)。在新的工程场景中,模型可根据新的工况和数据进行重新校准,定制化适应新目标。
当然,除了上述优势,本研究也存在一些不足:
-
模型拟合局部趋势的能力有限:尽管混合 CNN-LSTM 模型能够合理预测Bazimen滑坡的整体风险演变趋势,但对部分关键转折点和局部趋势的拟合能力仍有待提高。
-
未考虑土体强度退化问题:越来越多的研究表明,由于库水位波动引起的地质材料强度弱化,对边坡稳定性构成了实质威胁(Li 等,2022)。由于缺乏相关测试数据,本研究暂未考虑土壤参数的退化效应。未来研究建议在风险评估框架中加入更多真实工况(如土体强度退化)以提升模型的实用性和精度。
-
案例研究的局限性:本研究以Bazimen滑坡为例进行说明,样本数量有限,可能影响研究方法的可推广性和结果的普适性。未来应进一步验证该方法在不同水文地质条件下的滑坡风险评估能力。
总结与结论
本研究提出了一种基于混合 CNN-LSTM 模型的高效库区滑坡时变风险评估方法,为滑坡风险评估开辟了从时间序列预测视角出发的全新方向,有别于传统复杂且耗时的计算方法。在所构建的 CNN-LSTM 模型辅助下,可基于一步预测框架便捷地评估未来感兴趣时段的滑坡时变风险。
本文以Bazimen滑坡为例,系统评估了混合 CNN-LSTM 模型与其他四种深度学习模型(即 CNN、LSTM、Bi-LSTM 和 Bi-GRU)的表现。结果表明,混合 CNN-LSTM 模型能够合理刻画滑坡时变风险的时间演化规律,并在该实例中显著优于其他四种模型。
该方法为滑坡时变风险的评估提供了一种创新思路,不仅有效应对了复杂环境下滑坡风险时变评估的挑战,还为岩土工程实践者和决策者提供了一种可靠工具,用于把握潜在滑坡灾害的严重程度。该方法可为工程实践中选择科学的滑坡应急管理策略(如采取工程措施降低风险等级或启动人员疏散计划)提供有价值的信息。
需要指出的是,尽管混合 CNN-LSTM 模型在总体上较好地捕捉了Bazimen滑坡风险的时间演化规律,但对某些关键峰值和局部变化趋势仍存在难以准确捕捉的情况。未来研究中,建议进一步探讨该方法在不同水文地质条件下滑坡案例中的可迁移性,并通过时间序列挖掘与混合建模等潜在可行手段进一步提升模型预测性能。