Time series prediction of surface displacement induced by excavation of foundation pits based on deep learning
-
摘要: 为更精准预测基坑工程中数据的时间特性,结合卷积神经网络CNN模型与两种单一时间序列神经网络模型长短期记忆网络LSTM模型、门控循环单元GRU模型,建立混合时间序列神经网络CNN-LSTM模型、CNN-GRU模型。基于杭州某邻近既有车站基坑开挖工程,采用滚动预测方法建立基坑开挖引起邻近地铁车站地表沉降数据集。通过平均绝对误差MAE、平均相对误差MAPE和均方根误差RMSE3种评价指标对预测结果进行评价。结果表明:CNN-GRU模型预测效果最优,CNN-LSTM模型次之,其次是GRU模型,最后是LSTM模型。CNN-LSTM混合网络模型相较于LSTM模型对3种评价指标分别降低了24.4%,53.8%,4.1%,CNN-GRU混合网络模型相较于GRU模型分别降低了13.9%,49.1%,1%。Abstract: To predict the time characteristics of data more accurately in foundation pit engineering, two single time series neural network models are combined, the convolutional neural network (CNN) and long short-term memory network (LSTM), as well as the gated recurrent unit (GRU), to establish a hybrid time series neural network model CNN-LSTM and CNN-GRU. An excavation project of a foundation pit adjacent to an existing station in Hangzhou is selected, and a rolling prediction method is used to create a dataset of surface settlement caused by excavation of the foundation pit in the adjacent subway stations. The predicted results are evaluated by three evaluation indexes: mean absolute error (MAE), mean relative error (MAPE) and root mean square error (RMSE). The results demonstrate that the CNN-GRU has the best prediction effects, followed by the CNN-LSTM, GRU and LSTM. Compared with the LSTM model, the CNN-LSTM hybrid network model reduces the three evaluation indexes by 24.4%, 53.8% and 4.1%, respectively, and the CNN-GRU hybrid network model decreases by 13.9%, 49.1% and 1%, respectively, compared with the GRU model.
-
0. 引言
随着中国软土地区城市地下空间工程的大规模建设,基坑工程朝着更大、更深、更复杂的趋势发展。基坑开挖卸荷作用会打破土体原有平衡状态,引起基坑周边土体应力重分布,进而导致地层产生位移和变形,最终对邻近既有建筑产生不利影响[1-2]。而软土由于物理力学特性差和结构性强等特点,受扰动后极易发生性能劣化,产生较大应力变化和变形[3]。因此,预测基坑开挖引起地表位移对确保既有建筑物的风险预警具有重要意义。
学者们对基坑开挖引起地表位移预测开展了深入研究,研究方法主要包括数值模拟[4]、解析解法[5]等。这些方法在一定程度上反映了土体本构关系和基坑开挖与土体之间的力学响应,但存在本构关系确定困难、计算成本高、推导过程复杂和效率较低等缺点。机器学习作为一种高效的代理模型,成为基坑开挖引起地表位移的一种高效方法[6]。赵华菁等[7]基于实测数据,对比反向传播算法BP和长短期记忆神经网络LSTM预测结果,得出LSTM模型具有较好的稳定性。张生杰等[8]基于LSTM模型对地下连续墙的变形预测,并与传统神经网络模型相比,证明了该模型的稳定性和可靠性。徐长节等[9]通过支持向量机SVM、多层感知器模型ANN、长短期记忆模型LSTM模型及门循环单元模型GRU模型对支护结构最大侧移预测,得出GRU模型总体预测效果最好。单一神经网络预测模型有较好的准确性和可靠性,但受限于数据特征提取能力,并不能很好的处理非线性和非平稳序列[10]。
综上所述,本文结合CNN模型和单一时序神经网络LSTM模型、GRU模型,建立混合神经网络CNN-LSTM模型、CNN-GRU模型。基于基坑开挖引起邻近地表位移实测数据,对比单一时序神经网络LSTM模型、GRU模型和混合时序神经网络CNN-LSTM模型、CNN-GRU模型的预测精度,并将混合时序神经网络CNN-LSTM模型、CNN-GRU模型的优化效果进行比较,为基坑开挖引起邻近地表位移预测提供参考。
1. 时序预测模型建立
1.1 卷积神经网络CNN模型
卷积神经网络CNN模型具有局部连接和权值共享特性,可高效实现输入特征的提取。其结构特征可分为输入层、卷积层、池化层、全连接层和输出层,如图 1所示。其中,卷积层通过卷积运算对数据特征提取,池化层通过去除数据进行特征降维,最后通过全连接层特征加权,提高数据特征质量。
1.2 长短期记忆神经网络LSTM模型
长短期记忆神经网络LSTM模型具有长效记忆能力和在必要时更新信息的特性,实现考虑时序性输入参数。其结构特征可分为遗忘门、输入门和传输门,如图 2所示。其中,输入门通过激活函数,决定输入信息,遗忘门选择信息保留,输出门控制信息输出,通过反向传播算法进行训练,以此适应数据特征。LSTM模型中参数计算公式为
ft=σ(Wfxxt+Wfhyt−1+bf), (1) it=σ(Wixxt+Wihyt−1+bi), (2) ˜St=tanh(Wcxxt+Wchyt−1+bc), (3) St=ft⊗St−1+ii⊗St, (4) Ot=σ(Woxxt+Wohht−1+bo), (5) ht=Ot⊗tanhSt。 (6) 式中:xt为输入特征;St,St-1为记忆单元中的状态向量;W为输出门的权重;b为输入门的偏置项;σ与tanh为激活函数;⊗为矩阵元素相乘。
1.3 门控循环单元GRU模型
门控循环单元GRU模型是LSTM模型的改进模型,实现少于LSTM模型输入参数,取得与LSTM模型相同效果。其结构特征可分为更新门和重置门,如图 3所示。其中,更新门控制保留多少前一时刻状态信息到当前状态程度。重置门控制当前状态与先前信息结合程度。GRU模型中各参数的计算公式为
zt=σ(Wz⋅[st−1,xt]), (7) r1=σ(Wr⋅[st−1,xt]), (8) ˜St=tanh(W⋅[st−1⋅r1,xt]), (9) st=(1−zt)st−1+zt˜St。 (10) 1.4 混合时序神经网络CNN-LSTM模型和CNN- GRU模型
混合时序神经网络CNN-LSTM模型是基于CNN模型的空间特征提取能力,将数据进行多次重复卷积和池化后,有效提取强化后的特征信息,通过LSTM模型中门的控制机制,对CNN模型提取的特征值进行长短期记忆训练。混合时序神经网络模型CNN-GRU模型是在CNN模型提取特征信息基础上,引入GRU模型中重置门和更新门,捕捉数据中的时序关系,实现对未来数据的预测,其结构特征如图 4所示。
2. 地表位移预测框架搭建
2.1 工程概况
本文选取杭州某邻近既有车站基坑开挖工程为依托。基坑开挖工程平面尺寸约为210 m×85 m,深度约为15 m。南、北基坑工程的正中间是地铁1号线从打铁关站至西湖文化站隧道运营段,地铁1号线车站主体结构紧邻基坑东侧,在车站主体结构中设有多个监测断面,站台两侧各设置两组监测棱镜,如图 5所示。
2.2 数据集建立
通过棱镜采集DM33断面中车站主体结构段地表位移数据,共计186组。为提高模型收敛速度,对数据集进行如下归一化处理:
x∗=x−xmin (11) 式中: {x^*} 为归一化后数据;x为归一化前数据;xmax为样本最大值;xmin为样本最小值。
将归一化后的数据集采用滚动预测方法,得到180组数据,滚动预测方法具体步骤如下:
(1)设置滚动窗口为7,输入层神经元数量为6,输出层为神经元数量为1。
(2)进行地表位移滚动预测,将ky-ky+6时刻实测数据作为ky+7时刻的数据的输入特征,ky+7时刻数据为输出层。
(3)重复上述步骤,进行滚动迭代,最终建立所有时刻的地表位移数据集,如图 6所示。
2.3 预测模型结构设计
将数据集以8︰1︰1比例分为训练集、验证集和测试集,分别输入到单一时序神经网络预测模型LSTM模型、GRU模型和混合时序神经网络预测模型CNN-GRU模型、CNN-LSTM模型中进行预测。
单一神经网络主要取决于神经元数目与层数对预测模型结果的影响。GRU模型网络模块:初始参数设置为1层GRU,神经元数目为32,随机失活系数为0.01。LSTM网络模块:设置为1层LSTM,神经元数目为32,随机失活系数为0.01。
混合神经网络中主要设置CNN模型卷积层数和时序预测中神经元目数对预测模型结果的影响[11]。混合时序神经网络预测模块初始设置如下:CNN模型特征提取模块为一层Conv1 D层,卷积核数为16,大小为2;LSTM模型模块:神经元目数为32,随机失活系数为0.01。GRU模型模块,神经元数目为32,随机失活系数为0.01。
2.4 模型预测精度
为检验模型预测精度,通过平均绝对误差MAE、平均相对误差MAPE和均方根误差RMSE对模型预测结果进行评价,计算公式为
\text{RMSE} = \sqrt {\frac{1}{N}\sum\limits_{i = 1}^N {{{\left( {{{\hat y}_i} - {y_i}} \right)}^2}} } \text{,} (12) \text{MAPE} = \frac{1}{N}\sum\limits_{i = 1}^N {\left| {\frac{{{{\hat y}_i} - {y_i}}}{{{y_i}}}} \right|} \text{,} (13) \text{MAE} = \frac{1}{N}\sum\limits_{i = 1}^N {\left| {{{\hat y}_i} - {y_i}} \right|} 。 (14) 式中:N为样本个数; {\hat y_i} 为输出预测值; {y_i} 为真实值。
3. 模型预测结果
3.1 模型预测结果分析
以180组实测地表位移数据为基础,分别通过LSTM模型、GRU模型、CNN-LSTM模型和CNN-GRU模型对数据集进行训练预测,4种模型预测结果如图 7所示。
由图 7可知,4种模型预测结果均能捕捉到地表位移实测数据的变化趋势。对于单一神经网络模型,LSTM模型和GRU模型均未能预测到地表由沉降到隆起的变化,且LSTM模型整体拟合度较差,这可能是预测误差随着时间序列长度增加而累积,引起LSTM模型预测值明显偏离实测值[12]。此外,地表由沉降到隆起的过程存在复杂的非线性关系,LSTM模型和GRU模型虽然能够处理非线性问题,但是在小样本数据情况下仍可能无法准确地捕捉到复杂的非线性变化,忽略了由沉降变为隆起的相关性特征。对于混合神经网络模型,CNN-LSTM模型和CNN-GRU模型预测效果均优于单一神经网络模型,且对于地表由沉降到隆起的变化也有较好的预测效果。这可能是在CNN模型数据空间特征提取作用下,LSTM模型[13]和GRU模型能够更好地捕捉数据中的空间特征和序列依赖关系。
3.2 预测精度及优化效果
图 8是4种模型预测结果的平均绝对误差MAE、平均相对误差MAPE和均方根误差RMSE对比。从图 8中可以看出,对于平均绝对误差MAE,4种模型预测结果均在0.1以下,即4种模型预测偏差较小。对于均方根误差RMSE,4种模型预测结果均处于0.1左右,即4种模型均有较好的拟合能力。对于平均相对误差MAPE,CNN-GRU最小,其次是CNN-LSTM模型,然后是GRU模型,最后是LSTM模型,即CNN-GRU模型具有最优的预测准确性。表 1是单一时序神经网络预测模型和混合时序神经网络预测模型预测精度对比。由表 1可知,相较于单一时序神经网络预测模型LSTM模型和GRU模型,混合时序神经网络预测模型CNN-LSTM模型和CNN-GRU模型具有较好优化效果。对于平均绝对误差MAE、平均相对误差MAPE和均方根误差RMSE,CNN-LSTM模型较LSTM模型分别降低了24.4%,53.8%,4.1%,CNN-GRU模型较GRU模型分别降低了13.9%,49.1%,1%。由此可见,特征提取后的LSTM模型和GRU模型均表现出较好的预测效果。
表 1 预测模型评价指标Table 1. Evaluation indexes of prediction models评判指标 LSTM CNN-LSTM 优化效果/% GRU CNN-GRU 优化效果/% MAE 0.1019 0.0819 24.4 0.0902 0.0782 13.9 MAPE 1.2779 0.5909 53.8 1.0970 0.5581 49.1 RMSE 0.1251 0.1199 4.1 0.1185 0.1174 1.0 4. 结论
以杭州某邻近既有车站基坑开挖工程为研究对象,分别建立LSTM模型、GRU模型、、CNN-LSTM模型以及CNN-GRU模型预测邻近基坑开挖引起地表位移实测数据,分析模型预测效果和预测精度。得到2点结论。
(1)模型预测效果中CNN-GRU模型预测效果最优,CNN-LSTM模型次之,其次是GRU模型,最后是LSTM模型。在CNN模型的数据空间特征提取作用下,LSTM模型和GRU模型能够更好地捕捉数据中的空间特征和序列依赖关系。
(2)CNN-LSTM模型和CNN-GRU模型相较于LSTM模型和GRU模型有较好的优化效果,对于平均绝对误差MAE、平均相对误差MAPE和均方根误差RMSE,CNN-LSTM模型较LSTM模型分别降低了24.4%,53.8%,4.1%,CNN-GRU模型较GRU模型分别降低了13.9%,49.1%和1%。
-
表 1 预测模型评价指标
Table 1 Evaluation indexes of prediction models
评判指标 LSTM CNN-LSTM 优化效果/% GRU CNN-GRU 优化效果/% MAE 0.1019 0.0819 24.4 0.0902 0.0782 13.9 MAPE 1.2779 0.5909 53.8 1.0970 0.5581 49.1 RMSE 0.1251 0.1199 4.1 0.1185 0.1174 1.0 -
[1] LIU Bo, WU Wenwen, LIU Haipei, et al. Effect and control of foundation pit excavation on existing tunnels: a state-of-the-art review[J]. Tunnelling and Underground Space Technology, 2024, 147: 105704. doi: 10.1016/j.tust.2024.105704
[2] 王卫东. 软土深基坑变形及环境影响分析方法与控制技术[J]. 岩土工程学报, 2024, 46(1): 1-25. doi: 10.11779/CJGE20231146 WANG Weidong. Analytical methods and controlling techniques for deformation and environmental influence of deep excavations in soft soils[J]. Chinese Journal of Geotechnical Engineering, 2024, 46(1): 1-25. (in Chinese) doi: 10.11779/CJGE20231146
[3] HU Y, LEI H Y, ZHENG G, et al. Assessing the deformation response of double-track overlapped tunnels using numerical simulation and field monitoring[J]. Journal of Rock Mechanics and Geotechnical Engineering, 2022, 14(2): 436-447. doi: 10.1016/j.jrmge.2021.07.003
[4] XU Q W, XIE J L, LU L H, et al. Numerical and theoretical analysis on soil arching effect of prefabricated piles as deep foundation pit supports[J]. Underground Space, 2024, 16: 314-330. doi: 10.1016/j.undsp.2023.09.011
[5] 胡之锋, 陈健, 邱岳峰, 等. 挡墙水平变位诱发地表沉降的显式解析解[J]. 岩土力学, 2018, 39(11): 4165-4175. HU Zhifeng, CHEN Jian, QIU Yuefeng, et al. Analytical formula for ground settlement induced by horizontal movement of retaining wall[J]. Rock and Soil Mechanics, 2018, 39(11): 4165-4175. (in Chinese)
[6] 薛艳杰. 基于机器学习算法的土岩复合地层深基坑变形时序预测[J]. 现代隧道技术, 2022, 59(增刊2): 77-85. XUE Yanjie. Deformation time series prediction of deep foundation pit in soil-rock composite stratum based on machine learning algorithm[J]. Modern Tunnelling Technology, 2022, 59(S2): 77-85. (in Chinese)
[7] 赵华菁, 张名扬, 刘维, 等. 基于神经网络算法的深基坑地连墙变形动态预测[J]. 地下空间与工程学报, 2021, 17(增刊1): 321-327. ZHAO Huajing, ZHANG Mingyang, LIU Wei, et al. Dynamic prediction of deformation of diaphragm wall in deep foundation pit based on neural network algorithm[J]. Chinese Journal of Underground Space and Engineering, 2021, 17(S1): 321-327. (in Chinese)
[8] 张生杰, 谭勇. 基于LSTM算法的基坑变形预测[J]. 隧道建设(中英文), 2022, 42(1): 113-120. ZHANG Shengjie, TAN Yong. Deformation prediction of foundation pit based on long short-term memory algorithm[J]. Tunnel Construction, 2022, 42(1): 113-120. (in Chinese)
[9] 徐长节, 李欣雨. 基于人工神经网络的深基坑支护结构侧移预测[J/OL]. 上海交通大学学报, 1-20. [2024-09-11]. https://doi.org/10.16183/j.cnki.jsjtu.2023.109. XU Changjie, LI Xinyu. Lateral Deformation Prediction of Deep Foundation Retaining Structures Based on Artificial Neural Network[J/OL]. Journal of Shanghai Jiao Tong University, 1-20[2024-09-11]. https://doi.org/10.16183/j.cnki.jsjtu.2023.109. (in Chinese)
[10] 方庆, 陈胜, 刘雪珠, 等. 基于变分模态分解的CNN-LSTM模型在基坑变形预测中的应用[J/OL]. 力学与实践, 1-8[2024-09-11]. http://kns.cnki.net/kcms/detail/11.2064.o3.20240314.2043.002.html. FANG Qin, CHEN Sheng, LIU Xuezhu, et al. Application of the variational mode decomposition-based CNN-LSTM model in predicting excavation deformation[J]. Mechanics in Engineering, 1-8[2024-09-11]. http://kns.cnki.net/kcms/detail/11.2064.o3.20240314.2043.002.html. (in Chinese)
[11] 满轲, 武立文, 刘晓丽, 等. 基于CNN-LSTM模型的TBM隧道掘进参数及岩爆等级预测[J/OL]. 煤炭科学技术, 1-19[2024-09-11]. http://kns.cnki.net/kcms/detail/11.2402.TD.20231026.1344.003.html. MAN Ke, WU Liwen, LIU Xiaoli, et al. The prediction of TBM tunnel boring parameters and rockburst grade based on CNN-LSTM model[J/OL]. Coal Science and Technology, 1-19[2024-09-11]. http://kns.cnki.net/kcms/detail/11.2402.TD.20231026.1344.003.html. (in Chinese)
[12] 王锋. 基于SSA-LSTM模型的软岩隧道变形特征智能预测及应用研究[J]. 现代隧道技术, 2024, 61(1): 56-66. WANG Feng. Study on intelligent prediction of the deformation characteristics of soft rock tunnel based on SSA-LSTM model and its application[J]. Modern Tunnelling Technology, 2024, 61(1): 56-66. (in Chinese)
[13] 洪宇超, 钱建固, 叶源新, 等. 基于时空关联特征的CNN-LSTM模型在基坑工程变形预测中的应用[J]. 岩土工程学报, 2021, 43(增刊2): 108-111. doi: 10.11779/CJGE2021S2026 HONG Yuchao, QIAN Jiangu, YE Yuanxin, et al. Application of CNN-LSTM model based on spatio-temporal correlation characteristics in deformation prediction of foundation pit engineering[J]. Chinese Journal of Geotechnical Engineering, 2021, 43(S2): 108-111. (in Chinese) doi: 10.11779/CJGE2021S2026
-
期刊类型引用(1)
1. 张洪芳,张世涛. 自旋式防基底隆起支护装置在基坑支护中的应用与效果评估. 中国水运. 2025(06): 151-154 . 百度学术
其他类型引用(0)