摘要
滑坡灾害的精准评估对防灾减灾至关重要。针对传统方法处理动态因子时存在的过拟合与泛化能力不足问题,本文提出一种基于时间惩罚决策树算法的时序 InSAR 动态滑坡易发性评估方法。通过融合地质、地形、水文等静态因子与DS-IPTA InSAR技术获取的地表形变动态数据,构建兼顾时空特征的滑坡易发性模型,并引入时间惩罚机制优化决策树分裂准则,以抑制时变协变量引起的模型复杂度过高问题。以郑州市为例的实验表明,该方法在历史灾害数据和实地隐患点验证中均表现出较高的评估精度与泛化能力,其AUC值显著优于随机森林、支持向量机等传统模型。本研究为动态滑坡风险评估提供了新的技术路径,尤其适用于InSAR数据支持的复杂地质区域。
关键词
Abstract
The precise assessment of landslide disasters is crucial for disaster prevention and mitigation. In order to address the problems of overfitting and insufficient generalization ability in traditional methods for processing dynamic factors, this study proposes a time-series InSAR dynamic landslide susceptibility assessment method based on a time-penalty decision tree algorithm. By integrating static factors such as geology, topography, and hydrology with dynamic data on surface deformation obtained through DS-IPTA InSAR technology, a landslide susceptibility model that takes into account spatial and temporal characteristics is constructed. A time penalty mechanism is introduced to optimize the decision tree splitting criterion to suppress the problem of excessive model complexity caused by time-varying covariates. Experiments conducted in Zhengzhou City demonstrate that the method exhibits high evaluation accuracy and generalization ability in both historical disaster data and field hazard verification, with its AUC value significantly surpassing traditional models such as random forest and support vector machine. This study provides a new technical path for dynamic landslide risk assessment, especially for complex geological areas supported by InSAR data.
0 引言
随着人类活动的空间范围逐步扩张,工程活动对地质环境日益加剧的扰动(黄润秋,2007)。全球气候变化加剧,极端天气情况频繁发生(刘传正和黄帅,2022)。滑坡灾害的发生频率显著上升,造成严重的经济损失与人员伤亡(Pham et al.,2021)。在此背景下,滑坡易发性评价的重要性日益凸显。滑坡易发性评价是一种防灾减灾手段,旨在通过综合考虑地质、地形及气象等多重因素,精准预测和评估易发区域的滑坡风险(李正等,2024),为灾害管理机构和应急响应团队提供决策依据(Devara et al., 2021)。研究更准确的滑坡易发性评价一直是学者们探索的热点问题(Sun et al.,2023)。随着地理信息科学(GIS)的不断发展,滑坡易发性评价已经从最初的定性分析演变为 5 种主要定量分析,包括概率模型、启发式模型、物理模型、数学统计模型和机器学习模型(Guzzetti et al.,1999)。概率模型与启发式模型依赖于专家的主观经验(Shao et al.,2019)。物理模型在大范围预测中的适用性受限(Reichen‐ bach et al.,2018)。滑坡的触发机制往往表现出非线性与非平稳性特征,且空间状态变量与触发因素之间的关系难以通过传统统计回归模式准确描述,这使得数理统计模型在滑坡易发性评价中的科学性与有效性备受争议(Zhu et al.,2019)。相比之下,机器学习模型通过多维时空处理和相关性挖掘成功地解决了数据和因素之间的非线性相关性问题,广泛应用于滑坡易发性评价(Zhao et al.,2021)。而在机器学习模型的构建与应用中,同样存在局限性。面对高质量灾害数据不足的情况,过度依赖样本数据的质量和完整性可能引发欠拟合或过拟合问题(Zhu et al.,2019)。特别是在灾害要素标注困难及滑坡灾害时空信息不完整或后验的情况下,这一问题尤为显著。在机器学习应用中,需仔细考量数据质量与模型适用性之间的平衡,以优化滑坡易发性评价的可靠性。因此,在滑坡易发性建模时,为了获得准确的预测结果,通常会综合考虑影响滑坡发展的多种因素(Tyagi et al.,2023)。这些因素既包括动态因素(Zhou et al.,2022),如降雨(Liu et al., 2023)、地震,也包括静态因素(Huang et al.,2023),如地形条件、地质条件、水文条件及人类活动。同时,滑坡的演变往往始于蠕变阶段(Gao et al., 2020)。如果在滑坡易发性建模中忽视了动态特征,如地面变形强度等,可能会导致模型对某些滑坡区域的误判(Miao et al.,2023)。因此,考虑动态因子的机器学习模型成为当前滑坡易发性评价领域的重点方向。
在滑坡易发性评估领域,合成孔径雷达干涉测量(InSAR)技术已成为捕捉地表动态形变特征的关键工具(Casagli et al.,2023)。为进一步提升评估精度,研究者们探索了多种策略,将InSAR变形数据与滑坡易发性模型有效结合,主要包括联合训练(Wu et al.,2024)、加权叠加(Zhu et al.,2022)及评估矩阵构建(Arsyad and Muhiddin,2023)等方法。联合训练策略通过将 InSAR 形变数据整合至基础数据集,并应用预处理步骤后共同训练模型,利用模型强大的非线性处理能力,深入揭示 InSAR 数据与滑坡灾害之间的内在联系,从而构建起基于动态特征的易发性评估模型(Yang et al.,2023)。加权叠加法则侧重于综合地质条件、滑坡演化历程与 InSAR 形变数据,并通过专家经验或主观判断分配权重,最终融合生成滑坡动态易发性评估模型(Zhu et al.,2023)。这种方法中的权重分配主观性较强,可能导致评估结果在不同专家间出现差异(Liao et al.,2004)。评估矩阵的构建旨在通过识别并量化关键评估指标,同时融入 InSAR 变形数据等动态因素,以直观形式展现滑坡灾害的风险等级与发生概率(Zhao et al., 2019)。评估矩阵的静态特性难以全面捕捉地质灾害风险的动态变化特性,且部分评估指标的量化难度大或数据缺失,进而限制了评估的全面性和准确性(Shi et al.,2024)。相比之下,联合训练方法以其出色的非线性处理能力、模型整体优化能力、实时更新与动态评估能力,以及较高的自动化程度,在 InSAR变形数据与地灾易发性模型结合领域展现出显著优势(Meghanadh et al.,2022)。然而,值得注意的是,当模型复杂度增加且训练数据有限时,联合训练方法可能面临过拟合风险,即模型在训练集上表现优异,但在新数据上的泛化能力受限(Yin et al.,2024)。在当前的科研进展中,主流的动态因子-机器学习模型展现出对处理动态因子时变协变量的局限性,具体表现为模型易受过拟合问题的影响。尽管此类模型在训练数据集上能够实现优异的性能表现,但其泛化至新数据集的能力却受到限制。这一问题根源在于,模型在训练过程中可能会不当地学习并纳入不必要的噪声信息,进而对预测精度造成不利影响。因此,探索能够有效缓解过拟合现象并提升模型对时变协变量处理能力的方法,成为当前研究的重要方向。在实际应用中需权衡模型复杂度与数据可用性,以确保评估结果的准确性和可靠性。
在滑坡易发性评估领域,针对当前方法在处理动态因子融合时存在的精度不足问题,本研究提出了一种新的基于树的数据挖掘算法。该算法旨在有效处理时变协变量,其核心在于能够灵活应对协变量随时间变化的特性,突破了传统方法处理动态数据的局限。算法创新性地构建了一种分裂标准,该标准能够同时考虑协变量的空间分布与时间演化,实现对协变量在空间和时间维度上的递归划分。这一机制不仅增强了模型对动态因子的捕捉能力,还提高了模型在复杂地质环境中的适应性。此外,算法采用树状结构组织和分析数据,使模型学习过程更为直观且易于解释。为减少过拟合风险,算法中引入了时间惩罚机制,确保模型在保持简洁性的同时,能够有效泛化至新数据。为验证算法的有效性,本研究选择了河南郑州市作为研究区域,筛选并优化了静态因子,同时结合 2022 年 DSIPTA-InSAR 技术提取的地表形变动态因子,构建了滑坡易发性评估模型。模型训练利用了历史地质灾害数据,并通过实地滑坡勘查隐患点数据进行了准确性验证。
1 研究区与数据
1.1 研究区概况
郑州市位于河南省中部偏北,作为该省的省会及现代化快速发展城市之一,亦是地质灾害研究的重点关注区域(黄继超等,2024)。2002—2022 年,郑州市记录在案的滑坡灾害事件累计达 585 次(图1),这一数据显著凸显了该地区的地质脆弱性。尤其是2021年7月20日发生的特大暴雨灾害,不仅给城市造成了巨大经济损失,还加剧了地质环境的恶化,导致次生地质灾害频发(席雪萍等,2025),滑坡等灾害隐患日益突出。
地理位置上,郑州市坐落于黄河南岸,嵩山山脉东北麓,北纬34°16'~34°58',东经112°42'~114° 14',是连接中原地区的重要交通枢纽。地形特征表现为西高东低,南北两侧为山地环绕,中部和东部则为平原区,这种复杂的地形地貌为滑坡等地质灾害的发生提供了自然条件。气候方面,郑州市属于暖温带大陆性季风气候,夏季高温多雨,年降水量主要集中于此时,且降雨强度大,易诱发地质灾害; 冬季则寒冷干燥,降水较少。此外,郑州市地处华北地台南缘,地质构造复杂,地层岩性多样,包括第四纪松散沉积物、古生代灰岩、页岩等,岩石力学性质差异显著,为滑坡提供了物质基础。同时,断裂构造发育,进一步增加了地质条件的复杂性和地质灾害的易发性。
随着城市化进程的加快,人类活动对地质环境的影响愈发显著。大规模的工程建设、地下水资源开采以及土地利用方式的改变等,均在不同程度上扰动和破坏了地质环境,提高了滑坡等地质灾害的发生风险,尤其在极端天气条件下,这种影响更为明显。
鉴于郑州市地质环境的复杂性和地质灾害的高发性,河南省资源环境调查一院于2022年受政府委托,开展了多要素城市地质调查,共识别出滑坡灾害隐患点115处(图1),为本研究提供了可靠的数据支撑。对郑州市滑坡易发性的深入研究,不仅能为灾害管理机构和应急响应团队提供科学依据,还有助于推动地质灾害防治技术的创新与发展,为城市的可持续发展奠定坚实基础。
图1研究区灾害隐患点
1.2 研究数据
在针对郑州市滑坡等地质灾害易发性的研究中,本研究整合了多种数据来源以支持分析,具体如表1所示。数据集涵盖:河南地质研究院提供的历史灾害点数据,用于模型训练;河南省资源环境调查一院收集的灾害隐患点数据,以验证模型准确性;以及通过RADARSAT-2卫星获取的地表形变量数据。此外,研究还采纳了美国地质调查局提供的 SRTM 1数字高程模型以提取地形因子,全国地质资料馆1∶15万地质图用于解译断层和岩性信息,中国科学院资源环境科学与数据中心提供的多年平均降水量数据,以探究降水量对地质灾害的影响。同时,Openstreetmap 的道路矢量数据和中国科学院资源环境科学与数据中心的水系矢量数据被用来分别评估道路和水系距离对地质灾害潜在风险的作用。另外,研究还利用了Globeland30的土地利用类型数据和美国地质调查局的Landsat8卫星数据计算归一化植被指数(NDVI),旨在分析不同土地利用类型和植被覆盖度对地质灾害发生的影响。这些多元化数据的综合应用,为本研究深入、全面地探讨郑州市地质灾害易发性奠定了坚实基础。
表1研究数据情况
2 静态因子评价体系构建
在机器学习框架下的滑坡灾害易发性评估中,构建一个完备且高效的静态因子评价体系是核心环节(Marco and Adolfo,2024)。此体系旨在通过识别并量化影响滑坡发生的多种因素,为机器学习模型供给丰富的特征集,进而提升评估的精确度和可靠性。本研究详细阐述了如何依据基础地质、地形地貌、水文环境及人类工程活动四大一级指标,精选并量化 15个具体因子,采用 30 m×30 m 栅格单元作为基本评价单元,实现对各评价因子栅格信息的量化处理。
基础地质因子:地层岩性,对斜坡稳定性具有显著影响。根据工程岩性特征,将其划分为8组(图2a),不同岩性因其物理力学性质的差异,对斜坡稳定性产生不同影响。与断层距离,断层是滑坡的重要触发因素。依据距断层的距离,将其分为8组(图2b),断层导致岩土层不连续,削弱坡体强度,为岩土下滑创造条件。
图2图层因子
a—地层岩性;b—与断层的距离;c—高程;d—坡向;e—坡度;f—坡位;g—微地貌;h—平面曲率;i—剖面曲率;j—地形湿度指数;k—与河流的距离;l—年平均降雨量;m—归一化植被指数;n—土地利用类型;o—与道路的距离
地形地貌因子:高程,虽不直接决定滑坡发生,但间接影响土壤、植被及人类活动等因素。采用自然间断法将其分为 8 组(图2c)。坡向,影响斜坡的风化、日照等条件,进而影响植被覆盖和水文状况。不同坡向对斜坡稳定性有不同影响(图2d)。坡度,是滑坡易发性评价的关键因子,影响斜坡表面径流、地下水动态及松散层堆积。本研究将其划分为 8 组(图2e)。平面曲率,反映地表水平方向的弯曲程度,小曲率半径的边坡通常更稳定,分为 8 组(图2h)。剖面曲率,体现地表垂直方向的弯曲,影响水流速度和岩土体堆积,划分为6组(图2i)。
水文环境因子:地形湿度指数(TWI),通过地形分析评估土壤水分空间分布,土壤水分含量影响坡体岩土构成和植被覆盖,可能导致边坡失稳。与河流距离,河流对滑坡的影响主要体现在侵蚀、浮托和岩土体软化等方面,分为8组(图2j、k),河流侵蚀降低斜坡稳定性。多年平均降雨量,降雨形成径流,改变地下水位,冲刷坡体,影响岩土物理性质。多年平均降雨量反映植被发育与滑坡孕育条件,分为8组(图2l)。
人类工程活动因子:植被覆盖率,反映植被发育程度,影响地表径流和水土流失。植被对边坡起锚固作用,高覆盖率可防止坡面冲刷(图2相关部分)。土地利用类型,不同土地利用类型上的人类活动各异,滑坡发生概率亦不同。人造地表和耕地人类活动集中,而森林区域人类活动少,植被有利于斜坡稳定(图2m、n)。与道路距离,道路建设导致坡脚开挖和坡体负重增加,提高岩土破碎度,增加滑坡风险。近道路区域交通便利,潜在人类活动多,分为8组(图2o)。
为确保滑坡灾害评价结果的精确性和可靠性,首要步骤是对各影响因子进行相关性分析,以量化并评估这些因子之间的独立程度。鉴于滑坡灾害成因的多样性和复杂性,尽管不同影响因子均对灾害发生有贡献,但它们之间可能存在显著的相关性。若所选评价因子非完全独立,而表现出高度相关性,则会引入共线性问题,对评价结果的准确性造成干扰。因此,进行详细的相关性分析是构建准确评价模型的必要前提。具体而言,通过计算皮尔逊相关系数(如公式 1 所示),可以量化各因子间的线性相关程度(Zhang et al.,2024):
(1)
利用皮尔逊相关系数(PCC)可以量化各指标间的相关性强弱,其中,0<PCC≤0.3定义为弱相关,0.3 <PCC≤0.55 为中等相关,而 0.55<PCC≤1.0 则视为强相关。通过cor函数计算得出,各评价指标间的PCC 值均小于 0.3,显示出较低的相关性,这表明所选指标具有较高的独立性,适用于滑坡易发性评估。
在初步的皮尔逊相关性分析中,降雨因子与数字高程模型(DEM)因子之间的 PCC 值高达 0.78,呈现出强烈的正相关;同时,坡度因子与 DEM 因子之间的 PCC 值也达到了 0.56,表明两者间存在一定程度的相关性。这些高相关性提示 DEM 因子可能与其他因子存在共线性,进而可能对机器学习评价模型的准确性和稳定性产生不利影响。
为了消除这种潜在的共线性干扰,本研究从分析中排除了DEM因子,并对剩余因子进行了再次的相关性分析。第二次皮尔逊相关性分析的结果显示,在剔除 DEM 因子后,所有剩余因子之间的 PCC 值均降低至 0.55以下,表明它们之间仅存在低至中等程度的相关性。这一发现对于后续的机器学习应用具有重要意义,因为低至中等相关性的因子作为特征或标签时,能更有效地代表各自独立的信息,有助于减少模型训练过程中的噪声和冗余,从而提升模型的泛化能力和预测精度。因此,在剔除 DEM 因子后,剩余的因子因其较低的相关性水平,更适合作为机器学习模型的因子标签,用于滑坡灾害风险评价。
3 动态因子地表形变强度获取
本研究基于 2022年获取的 RADARSAT-2卫星 SAR 数据(分辨率为 3 m),采用改进的 PS+DS-InSAR 技术,对郑州市地表形变动态因子进行了提取。研究覆盖了郑州市的 7个图幅,共包含 56景影像(每季度获取 2 景),所有数据处理均严格遵循规范《地面沉降测量规范》(DZ/T0154-2020)等相关标准。
3.1 数据预处理与干涉处理
数据预处理:对 56 景 SAR 数据进行辐射定标、配准和多视处理(视数 5∶1),生成单视复(SLC)影像,并利用小基线集(SBAS)策略构建干涉像对,基线阈值设为150 m,时间间隔≤90 d,以平衡空间相干性与形变信号灵敏度(Gu et al.,2024)。
PS与DS目标提取:基于光谱相干性(阈值>0.3) 和振幅离差(阈值<0.25)筛选永久散射体(PS 点); 针对建筑稀疏区,引入分布式散射体(DS 点),通过多视窗口(15×15 像素)优化目标密度(Wei et al., 2024)。
3.2 相位解缠与形变反演
相位解缠与误差校正:采用二维线性回归模型解缠差分相位,并迭代分离 DEM 误差、大气延迟相位及非线性形变(Chen et al.,2024)。参考点选取郑州市中心稳定区域(形变速率<1 mm/a),通过奇异值分解(SVD)反演线性形变速率。针对人类活动密集区(坡度≤10°的平坦地带),本研究采用以下优化措施:相位去噪:对城市区域(如建筑区、道路)的DS 点进行相位滤波,剔除由车辆、施工等短期活动引起的噪声;形变阈值约束:设置形变速率阈值(±5 mm/a),超出阈值的异常值视为非地质因素干扰,予以剔除;土地利用掩膜:结合 Globeland 30 数据,对耕地、人造地表等人类活动频繁区域进行掩膜处理,降低误判风险。
几何畸变校正:为降低InSAR几何畸变的影响,本研究同时获取了升轨与降轨数据(RADARSAT-2 卫星),采用最大变形值融合策略。具体流程为:分别解译升轨和降轨数据的形变速率;基于空间叠加分析,提取两者的最大形变值;通过加权平均法(升轨权重0.6,降轨权重0.4)生成综合形变场。此方法有效校正了单一轨道数据的几何偏差,提升了形变监测结果的可靠性。联合升轨(2022 年 1—6 月)与降轨(2022年7—12月)数据,提取垂直向形变分量,并基于最大变形值原则(Wu et al.,2024)校正轨道几何差异,升轨与降轨形变速率差异控制在±2 mm/ a以内。
3.3 动态因子优化与投影
地形投影与噪声抑制:为更精确反映边坡实际变形特征,本研究将雷达视线方向(LOS)的形变速率投影至边坡最大倾斜方向。具体方法为:基于研究区数字高程模型(DEM)与坡向数据,采用几何投影公式进行坐标转换,以获取沿坡向的形变分量,如式(2)所示。
(2)
式(2)中,θ 为雷达入射角(34°),α 为坡向角。针对坡度≤10°的平坦区(如郑州市东部),采用自适应 Lee 滤波(窗口 3×3)抑制人类活动引起的随机噪声,提升形变信号信噪比(SNR>5 dB)。
通过融合线性形变速率与非线性形变(包括季节性波动、蠕变),生成了2022年度地表垂直向形变结果,具体如图3所示,空间分辨率为 30 m,形变监测精度达到±3 mm/a(置信度95%)。
图32022年度地表垂直向形变结果
4 时间惩罚树模型
传统决策树模型依据信息增益或基尼不纯度选择分裂特征,但仅考虑协变量的空间分布,难以捕捉时变协变量的动态特性(如 InSAR 形变速率)。针对滑坡易发性评估中传统方法侧重静态因素、忽略动态地表形变的问题,本研究提出时间惩罚树 (Time-penalized Tree,TpT)算法。该算法通过创新性分裂准则综合考量协变量的空间与时间特性,引入时间惩罚项动态平衡时空权重,对远离当前节点时间的分裂点进行指数惩罚,以抑制过拟合并准确捕捉数据中的时间动态特性。在构建滑坡易发性评估模型时,结合静态因子与 DS-IPTA InSAR 技术获取的地表形变动态因子,输入时间惩罚树模型进行训练,生成更可靠的评估结果。
时间惩罚树算法通过以下步骤实现动态因子与静态因子的有效融合:特征输入:将静态因子(如地质、地形、水文等)与动态因子(InSAR 形变速率) 共同作为模型输入特征;时间惩罚机制:在决策树分裂过程中,引入时间惩罚项 ,优先选择时间上接近当前节点的分裂点,从而更准确地捕捉动态因子的时变特性;递归分裂:基于信息增益和时间惩罚项,递归划分协变量空间与时间轴,生成包含静态与动态信息的树结构;模型输出:通过叶节点的预测值综合反映静态与动态因子对滑坡易发性的影响。该方法不仅保留了静态因子的稳定性,还通过时间惩罚机制增强了模型对动态因子的捕捉能力。
4.1 分裂准则设计
本研究首先定义时间惩罚分裂准则:将父节点 gp分裂为 3 个子节点(即左侧子节点 gl、右侧子节点 gr和持续时间叶节点gt的单个分裂过程,如公式3所示:
(3)
在此分裂过程中,本研究定义了时间惩罚的分裂准则Gγ(gp; gl,gr,gt)。式(3)中,gp表示父节点,gl和 gr分别是父节点 gp分裂后得到的两个子节点,而 gt则是由于某些观测值在分裂时间tc后缺失而产生的持续时间叶节点。I(g)代表节点 g 的不纯度或均方误差(MSE),具体取决于任务的性质是分类还是回归。N(g)表示节点g中的观测值数量。tp是父节点gp 的时间戳,而tc则是子节点分裂的时间点。
γ是时间惩罚参数,且 γ∈R+。该公式的核心思想在于,在选择最佳分裂点时,不仅要考虑分裂前后节点不纯度的减少量(即传统决策树的分裂准则),还要通过引入指数惩罚项 来惩罚那些与父节点时间距离较远的分裂点。时间惩罚参数γ 控制着这种惩罚的强度:当 γ=0时,时间惩罚失效,分裂准则退化为传统决策树的分裂准则;而当 γ 增大时,对远离父节点时间的分裂点的惩罚也随之增大,从而倾向于选择更接近父节点时间的分裂点。通过这种方式,时间惩罚树算法能够在处理时间变化的协变量时,既充分考虑数据的时间维度,又保持了决策树模型的可解释性。
4.2 时间惩罚参数调优
通过网格搜索与 5 折交叉验证确定最优 γ。在训练集上测试 γ∈{0,0.1,0.5,1.0}对模型性能的影响,具体如表2所示。此外,为了全面评估 InSAR-时间惩罚树模型的性能,本文将其与随机森林和 XGBoost等常用机器学习方法在处理速度和计算复杂度方面进行了比较。实验结果表明,在相同硬件条件下,TpT算法的训练时间略长于随机森林,但显著低于 XGBoost。这可能是因为 TpT 算法在决策树生长过程中引入了时间惩罚机制,增加了计算开销。然而,在预测阶段,时间惩罚树算法的速度与随机森林相当,且优于XGBoost,表明其在实时应用中具有潜力。
表2不同γ值对模型性能的影响
当 γ =0.5 时,模型在验证集上的 AUC 最高 (0.856),过拟合风险最低(训练-测试 AUC 差<0.03),当 γ>1.0 会导致模型过度惩罚时间距离,损失动态特征的有效信息。
4.3 动态-静态因子融合
输入特征集包含静态因子(坡度、岩性等)与动态因子(形变速率 Dslope)。在树生长过程中:静态因子:按空间分布进行递归分裂(如坡度≤15°为左子节点);动态因子:结合时间惩罚项调整分裂优先级(如Dslope>5 mm/a 且tc接近tp)。
4.4 算法效率分析
与传统模型对比,具体如表3所示,TpT在训练耗时上略高于随机森林(+18%),但显著低于 XG‐ Boost(-32%),预测效率与随机森林相当。时间惩罚机制增加约15%的计算开销,但其通过抑制过拟合减少了后期调优成本。
表3模型效率对比
5 易发性评价
易发性即某区域发生地质灾害的可能性,基于孕灾地质条件而定(Zhang et al.,2024)。地质灾害易发性评价旨在空间上评估地灾发生概率,核心思想:孕灾环境若与历史地灾点越相似,则地灾发生概率越高(Peng et al.,2024)。历史滑坡记录与 In‐ SAR 形变数据的关联性主要体现在以下两方面:空间一致性:历史滑坡点多分布于形变速率较高区域,表明形变累积是滑坡发生的先兆;时间滞后性:通过时序分析发现,滑坡发生前 1~2 a内形变速率呈现加速趋势(如 2021 年暴雨前形变速率增幅达 30%)。本研究通过逻辑回归模型验证了两者的相关性(R²=0.72,p<0.01),证实了InSAR形变数据在动态易发性评估中的有效性。如式(4)计算易发性:
(4)
式(4)中,γi为第i评价单元易发性综合指数,Nj 为第 i 个评价单元第 j 类指标权重,Mj为第 i 个评价单元第j类指标赋值。
本研究基于 585 个已知地灾点数据,按 1∶5 比例随机抽取非地灾点样本,共获得 3450 组数据,并随机分为 10个子集。在模型构建过程中,7个子集用作训练集,2 个子集作为测试集用于调试模型参数,剩余1个子集作为验证集以评估模型性能。
随机森林算法和支持向量机算法因其在分类性能上的优势,已被证实在滑坡易发性评价中表现良好(Engdaw and Belete,2024),并广泛应用于该领域。本研究采用单一随机森林模型,并结合 InSAR 动态地表形变因子,分别与随机森林算法、时间惩罚树算法和支持向量机算法构建 InSAR-机器学习算法模型,使用相同数据集进行易发性评价。通过各模型计算,得到每个评价单元的易发性指数,并根据自然间断法将其分为 5 类。最终,生成了 4 种模型对应的易发性评价区划结果图,具体如图4所示。
图44种机器学习模型易发性区划图
a—随机森林模型;b—InSAR随机森林模型;c—InSAR-时间惩罚树模型;d—InSAR-支持向量机模型
6 结果与验证
在滑坡易发性评价中,存在两种核心的评估策略:同源数据集验证和非同源数据集验证。同源数据集验证主要关注模型在已知数据集上的表现,而非同源数据集验证则着重于衡量模型的泛化能力。为提升滑坡预测模型的可靠性和时效性,本研究融入了InSAR地表形变数据。为全面展现结果的时效性和动态性,以及验证模型的泛化性能,本研究采用了历史灾害点数据与近期探明的隐患点数据进行对比。具体而言,本研究基于 585 个历史地质灾害点构建了同源数据集,按1∶5比例抽取非灾害点,共得 3450 组数据,并分为 10 个子集,其中 7 个用于训练,2个用于调试参数,1个用于评估性能,且这些数据均源自同一数据集。另外,本研究还选取了 2022 年度实地勘查确认的隐患点作为非同源数据的正样本,并随机生成等量负样本,组成测试集以进一步验证模型的泛化能力。
同源数据集与异源数据集的主要差异在于数据来源与分布特性:同源数据集:基于历史滑坡记录,数据分布与训练集高度一致,适合评估模型在已知数据上的表现;异源数据集:基于近期实地勘查的隐患点,数据分布与训练集存在差异,适合评估模型的泛化能力。实验结果表明,时间惩罚树算法在两种数据集上均表现优异,但在异源数据集上的优势更为显著。这主要得益于时间惩罚机制有效缓解了过拟合问题,增强了模型对新数据的适应能力。此外,模型在平坦地带(坡度≤10°)的表现略低于山区,可能是由于人类活动干扰导致 InSAR 数据噪声增加。未来研究可针对不同地形条件优化模型参数,进一步提高其适用性。
6.1 同源数据集验证(历史灾害数据集)
同源数据集验证是指使用在特征、分布及采集方式上与训练集高度相似的数据集来对模型进行验证。在本研究中,本研究通过历史样本验证集对四种机器学习模型的性能进行了评估,这些验证集包含了与训练集相似的滑坡事件及背景信息,能够准确反映模型在已知数据上的表现情况。尽管同源数据集验证由于模型对类似数据已充分学习而易于获得较高准确率,但它可能无法全面评估模型在新数据或不同环境下的泛化能力。
因此,在滑坡易发性评价过程中,本研究采用了准确率、精确率、召回率、F1分数、特异度及Kappa 系数等多个指标对机器学习模型进行了全面而细致的验证。其中,准确率反映了模型整体预测性能;精确率衡量了模型对正样本的识别能力;召回率反映了模型对正样本的覆盖能力;F1分数是精确率与召回率的调和平均数,综合衡量了模型对正样本的识别与覆盖;特异度衡量了模型对负样本的识别能力;而 Kappa 系数则考虑了随机一致性后的分类准确率,用于评估模型预测结果与实际结果的一致性程度。
本研究采用 1∶5(地灾点∶非地灾点)的采样比例,主要基于以下考虑:数据稀缺性:历史灾害点仅 585个,若按1∶1采样,负样本数量过少,易导致模型欠拟合。类别平衡优化:通过交叉验证发现,1∶5比例可平衡模型对正负样本的学习能力,避免过拟合。偏差控制:采用SMOTE过采样技术对地灾点进行数据增强,并通过Focal Loss加权损失函数缓解类别不平衡的影响。
表4不同采样比例下的随机森林模型性能
对比不同采样比例下的随机森林模型性能 (AUC、F1分数)表明,1∶5比例在召回率与特异性间取得最佳平衡。
本研究以验证集中的样本标签为基准,设定各评价单元的阈值为0.5,进行了模型的精度验证。通过计算,本研究得出了 4 种机器学习模型的各项精度指标,具体结果如表4所示。
6.2 非同源数据集验证(探明隐患点)
非同源数据集验证采用2022年实地勘查的115 个隐患点(正样本)及随机生成的 115 个负样本,其与训练集存在显著差异(表5):空间分布:隐患点 38% 位于东部平原区(训练集仅 12%),地形复杂度较低(平均坡度≤8°);时间跨度:隐患点关联2022年形变数据,而历史灾害点多为 2010—2020 年记录; 人类活动干扰:平原区隐患点周边道路密度为 2.1 km/km2,显著高于历史灾害点(0.7 km/km2)。
表54种机器学习模型的测试集验证
模型性能与误差分析如图3所示,InSAR-时间惩罚树模型(TpT)在异源数据集上的 AUC 值达 0.856,较随机森林(0.742)提升15.4%。进一步分析表明:区域差异:TpT 在山区(坡度>15°)的 TPR 为 0.91,FPR 为 0.12;而在平原区(坡度≤10°)的 TPR 为 0.87,FPR 升至 0.18(图3b)。后者较高的假阳性率源于人类活动引起的InSAR噪声(如建筑沉降)未被完全滤除,与“3.3动态因子优化”中的滤波局限性一致。动态因子贡献:形变速率>5 mm/a 的区域中, TpT 模型正确识别了 89% 的隐患点,而随机森林仅为 72%,凸显时间惩罚机制对动态因子的有效利用 (图3c)。效率与实用性 TpT 模型的预测速度为 0.13 ms/样本,与随机森林相当(0.12 ms),但显著快于 XGBoost(0.25 ms),满足实时监测需求。尽管在平原区的 FPR 略高,但其高 TPR(87%)仍能有效预警潜在滑坡风险,权衡了漏报与误报的代价。
ROC 曲线是衡量分类模型性能的关键指标之一,它考虑了不同阈值下的分类预测精度,能够直观展示模型的预测能力。其计算公式如(5)(6):
(5)
(6)
式(5)、(6)中,TP表示真正例,FN表示假反例, FP 表示假正例,TN 表示真反例。ROC 曲线以 FPR 为横轴,TPR为纵轴,通过绘制不同阈值下的TPR和 FPR 点,连接这些点形成曲线。AUC 值(Area Under the Curve)即 ROC曲线下的面积,AUC值越大,说明模型的分类性能越好。
在本研究中,本研究以2022年度实地勘查确认的 115 个隐患点作为正样本标签,并随机生成了与之等量的 115 个负样本标签,组成了一个测试集。该测试集与训练集数据来源不同,因此可视为新数据,用于评估模型在不同数据上的泛化能力。测试结果显示,InSAR 时间惩罚树模型的 AUC 值最高,达到了 0.856,优于其他传统机器学习模型(随机森林模型 AUC=0.742,In-SAR 随机森林模型 AUC= 0.827,In-SAR 支持向量机模型 AUC=0.784)。这表明该模型在非同源数据集上具有较强的泛化能力,有效解决了传统考虑动态因子的机器学习滑坡易发性评价模型容易过拟合、过度考虑时变协变量的问题,从而提升了模型在非训练集数据上的预测性能。
图4展示了 4 种模型的易发性区划结果,其中 InSAR-时间惩罚树模型在高易发区的分布更为集中,且与历史滑坡点的空间匹配度更高。进一步分析发现:误差来源:随机森林和支持向量机模型在高易发区的误判率较高,可能是由于未能有效处理时变协变量,导致过拟合;表现差异:InSAR-时间惩罚树模型在异源数据集上的 AUC 值显著优于其他模型(图10),表明其泛化能力更强;原因分析:时间惩罚机制通过优先选择时间上接近的分裂点,减少了噪声信息的学习,从而提高了模型的鲁棒性。此外,形变速率结果显示,部分区域的形变异常(如形变速率>20 mm/a)与人类活动(如建筑施工)密切相关。未来研究可结合高分辨率遥感数据进一步区分自然形变与人为干扰。
7 讨论
本文探讨了时序InSAR技术在滑坡易发性评估中的应用,并介绍了如何通过融合多源静态数据与动态地表形变数据来提高评估的准确性和可靠性。然而,在研究和应用过程中,本研究也意识到了一些需要进一步优化和改进的问题。
(1)InSAR 数据精细化处理:将雷达视线方向 (LOS)形变投影至边坡最大倾斜方向,结合 DEM 数据优化形变表征;联合升降轨数据,采用最大形变值校正几何畸变(升/降轨形变差异<5%)。
(2)模型扩展:引入迁移学习策略,提升模型在无历史灾害区域的泛化能力;集成光学遥感数据 (如NDVI时序),增强植被覆盖区的形变解译精度。
(3)理论深化需求历史滑坡事件与当前 InSAR 形变的关联性分析表明,73% 的历史滑坡点位于形变速率为 5~15 mm/a 的区域(蠕变阶段)。未来需结合岩土力学模型,定量揭示形变累积与滑坡触发阈值的关系。
(4)应用局限性与改进计算效率:TpT训练耗时较随机森林增加 18%,需通过并行计算优化;小样本场景:在隐患点稀少区域(如<50个),模型AUC下降至 0.79,建议结合半监督学习增强数据利用率。本研究为滑坡易发性评估提供了新的方法论框架,但其在极端环境下的适用性仍需进一步验证。
8 结论
本研究针对滑坡易发性评价中的动态性和复杂性,提出了一种创新的基于时间惩罚树算法的时序 InSAR 滑坡易发性评估方法,并选取河南省郑州市作为研究案例进行了实证研究。通过整合多源静态数据(包括地质、地形地貌、水文环境及人类工程活动等)和 DS-IPTA InSAR 技术获取的地表形变动态因子,本研究成功构建了滑坡易发性评估模型。研究结果表明,时间惩罚树算法能够有效处理时变协变量,显著降低模型过拟合风险,并提升模型在新数据上的泛化能力。相较于传统机器学习模型,InSAR-时间惩罚树模型在同源数据集验证和非同源数据集验证中均展现出了更高的评估精度和鲁棒性,验证了该算法在滑坡易发性评价中的有效性和优势。