区域性股权市场是非上市企业直接融资的主渠道

ས་ཁོངས་རང་བཞིན་གྱི་རྐང་དབང་ཚོང་ར་ནི་ཚོང་རར་ཞུགས་མེད་པའི་ཁེ་ལས་ཀྱིས་ཐད་ཀར་མ་དངུལ་འདུ་འཁོར་གྱི་ཐབས་ལམ་གཙོ་བོ་ཞིག་རེད།

滑坡灾害:如何谨防这个高概率的“灰犀牛事件”

发布日期:2021-09-16
   截止2月28日早上10:25,在中国肆虐的新冠肺炎疫情已造成2791人伤亡,确诊人数愈7万人,造成了巨大的经济损失。

 

  如果说新冠肺炎疫情是一起发生概率低且损失严重的“黑天鹅事件”,那么,时常发生的滑坡灾害就像是“灰犀牛事件”,因习以为常而易被忽视。

 

  我国是世界上地质灾害最严重、受威胁人口最多的国家之一。据中国地质环境监测院发布的《全国地质灾害通报》,2005年——2018年,全国共发生地质灾害27万余起,其中滑坡灾害占比68.2%。

 

  有数据表明,滑坡是危险程度最严重的突发地质灾害之一,其严重程度和损害系数仅稍小于大型的地震灾害。

 

  但值得庆幸的是,滑坡灾害是可被预测的。通过前期有效的防治,可以降低危害带来的损失。本文将结合机器学习的典型问题,介绍如何利用人工智能的方法进行单体滑坡的变形预测。

 

  01

 

  单体滑坡变形(如GPS地表位移,裂缝计裂缝等)预测是综合考虑外界影响因素(如降雨量、土壤湿度、高程、土体岩性、植被覆盖率等参数),和预测变形量的历史值,对未来一段时间变形量的变化进行超前预测。从机器学习的角度出发,该问题可以归结为一个多元时间序列预测的问题。 另一方面,在不同的应用场景中,多元时间序列预测需要提取的特征和采用的算法也会有很大的不同。例如在网约车订单数预测中,主要由人的行为驱动的,其内在机理相对清楚;而滑坡变形预测中,主要是由自然因素驱动,其内在机理难以刻划。两者相比起来,前者相对简单,因人的行为具有明显的规律性(上下班高峰期订单多,其他时间段订单少)和周期性(每周的规律相似,节假日效应明显);而滑坡变形预测因涉及的自然因素较多且彼此关联密切,导致滑坡变形超前预测问题面临较大的挑战。

 

  02

 

  以多元时间序列预测的方式为例,单体滑坡变形预测的过程包括以下步骤:

 

  1)数据收集;

 

  2)数据预处理,包括:缺失值填补和异常值去除;

 

  3)特征工程,包括:自身变形特征提取,外界因素特征提取和特征选择;

 

  4)模型训练;

 

  5)结果预测。

 

  




图1 单体滑坡变形预测整体流程图

 

 

  03

 

  浙江省某高速公路连接线中部出现滑坡灾害, 2014年6月至2015年11月,滑坡周界逐渐形成贯通并发生缓慢蠕滑变形。考虑现场工程施工以及后续运营期存在整体性下滑的风险,业主单位委托鲁尔物联建立了一套基于自动化监测的全天候安全物联网监测体系。监测系统基于实时采集的地表位移、地表裂缝、深部位移、路堑挡墙倾斜、地下水位及降雨等信息,分析了边坡的稳定状况和变形的发展趋势。下面将以项目中GPS设备为例,按照上述流程进行单体变形预测。

 

  1、数据预处理

 

  数据预处理指的是在特征提取,模型训练之前对数据进行整理,清洗的工作。“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限”,数据的质量直接影响到最终模型的效果,因此数据预处理是非常重要的。数据预处理一般包含:数据格式统一、缺失值填充、异常值去除、滤波去噪等过程。在单体滑坡变形预测中,我们进行数据预处理主要是为了解决由于传感器原因产生的数据质量问题(如因信号传输问题造成的数据缺失),以及受外界因素(如高温等)影响造成的数据异常等问题。之所以不去进行滤波去噪的原因在于单体滑坡变形预测主要是进行短期的预测,滤波会使原数据过于平滑,导致无法进行有效的预测。

 

  2、特征工程

 

  特征工程是指最大限度的从原始数据中提取信息,并进行筛选以供模型和算法使用(特征的好坏直接影响最终模型的效果)。特征工程中一般包含特征提取和特征选择。特征提取是指从原始数据中提取信息,在对问题深入理解的基础上,从多角度去探究其产生或者变化的潜在因素。以单体滑坡变形为例,在连续的强降雨冲刷下,一个不稳定的土坡体,极有可能会产生剧烈变形,从而导致滑坡发生,因此提取连续一段时间降雨量的统计值(如累积值、均值、最大值等)作为特征。另一方面,如果该土体结构稳定,那么在连续的强降雨冲刷下,一般不会产生明显变形,所以滑坡体本身的属性也是影响变形量的特征。在单体滑坡变形预测中,根据数据性质分组为自身因素(如变形量位移、裂缝等)和外界因素(如雨量、水位等),最终可以从原始数据中提取数百维特征来描述滑坡变形情况。

 

  特征工程的另一步骤是特征选择,目的是为了从众多特征中选出对模型最有效的特征。常用的方法有基于树模型的特征选择、基于正则项的特征选择等。本项目采用基于随机森林的特征选择,从几百维的特征中选出最有效的几十维特征。

 

  3、模型训练

 

  传统的时间序列预测模型对于较长时间段内的数据之间的时间相关性难以捕捉,无法有效利用数据的时序信息进行预测。因此,本文介绍实际项目中采用的众多算法中的其中之一:基于深度学习中的Seq2Seq结构(编码器-解码器结构)结合注意力机制,同时构造了基于极值的损失函数来进行单体滑坡的变形预测。该模型能够有效解决一般的预测模型中的误差累积问题与突变值难以预测等问题。

 

  编码器通过注意力机制的引用,使得模型能够自适应的提取每个时刻的相关输入特征,把握长期时序依赖关系。解码器通过注意力机制的引用,使得模型能够在整个时间步长中选择相应的上下文向量。对于编码器和解码器的具体模型,可以选择LSTM、GRU等循环神经网络,模型整体框架如图2所示。

 

  


 

图2 模型框架图

 

 

  本项目使用了近290天的数据进行训练模型,模型的训练过程如图3所示。图中蓝线表示真实的监测值,橘线表示训练集上模型的输出值,绿线表示测试集上模型的输出值。可以看出:随着训练轮数的增加,模型先在整体上趋于真实值,之后再从局部细节上趋于真实值。

 

  


 

 

  图3 模型训练过程

 

  然后,取上述290天之后的30天的数据,对模型进行验证测试。最终得到的预测结果如图4所示,其中蓝线代表实际监测值,红线代表预测值,绿色区间代表当次预测值的预测区间。从图中可以发现:整体的预测结果与实际监测值较为相近,且在突变值上也能够预测的较为准确。

  


 

 

  图4 模型预测结果

 

  运用目前最新的AI技术,我们揭开了单体滑坡变形预测的神秘面纱,让我们能够更加从容地应对滑坡灾害这样的“灰犀牛事件”,也让AI技术在防灾减灾场景中的应用不再神秘。