摘要:机器学习(MachineLearning,ML),特别是深度学习(DeepLearning,DL),在 最 近 几 年发展迅速,在数据挖掘、计算机视觉、自然语言处理、数据特征提取和预测等方面的应用中取得了令人振奋的进展。地震预测是复杂、涉及面广、不成熟而且充满争议的科学问题;其发展受到尚不清楚的地震机理和孕震结构、不完备的观测数据与真伪不清的地震现象等方面的限制。但是,机器学习有可能改善复杂地震数据的挖掘和发现,推动地震预测科学的发展。本文回顾了机器学习在地震预测的应用,包括强震、强余震和岩石破裂失稳等方面的预测,并展望了机器学习在地震预测方面的研究趋势。
关键词:地震预测;地震前兆;机器学习;深度学习
引言
地震是世界上最具破坏力的自然灾害之 一,其 直 接 和 次 生 灾 害 会 导 致 巨 大 的 人 员 伤亡、心理伤害和经济损失。减轻地震灾害的主要途径有两种:一是进行地震场地的安全性评估和建筑设防等抗震准备,二是有效的地震预报或者震时非常短暂的地震预警。以1975年的海城 MS7.3地震为例,鉴于地震局系统对地震形势的预测,政府下达了疏散命令,有效地降低了人员的伤亡[1];该地震因此成为有史以来为数不多成功预测的地震之一,也是历史上毁灭性地震发生前唯一成功疏散大量人员的地震[2]。
然而,地震预测仍然是一门不成熟的学科,预测方法更多是基于经验分析,而非物理机理。目前相对有效的方法有:识别显著的地震前兆,或识别大地震发生之前的某种地球物理趋势或地震活动模式[3]。地震预测通常被划分为长、中、短临不同的时间阶段,短临阶段的地震预测往往和地震前兆密切相关,也是地震是否可以预测的主要焦点[4]。
持地震不可预测观点的学者认为,地震是非线性随机过程。1996年在伦敦召开的“地震预测框架评估”(AssessmentofSchemesforEarthquakePrediction)国际会议认为:地球处于自组织的临界状态,任何特定的小地震是否会演变成大地震取决于大量物理条件,而不仅仅是在断层的附近;这种演变是高度敏感、非线性的,其初始条件不明,很难预测;难以精确地知道地震大范围物理状况的所有细节;因此,地震本质上是不可预测的[5,6]。震源孕育,无论是否达到失稳阶段,都难以看到确定性的前兆[4]。
持地震可以预测观点的学者认为,地震发生是有规律可循的,目前地震中长期趋势判断具有一定的可信度。同时,随着对监测技术的改善、新方法的出现和地震机理认识的不断提高,短临预测最终可能实现[4]。20世纪60年代地震预测研究刚起步的时候,人们认为能找到一些作为“前兆”的物理量,这些物理量的“异常”变化达到一定程度往往预示着即将发生地震[7]。通过分析大量的观测资料,地震前出现的异常非常复杂,仅有少数几个现象被认为是可信的地震前兆[8,9]。
新技术的涌现可能改变人们对震前活动的认识,甚至发现更普遍的地震前兆。例如,海城地震前几个月至几小时的前震活动,被认为是可信的前兆[10]。基于传统方法产出的地震目录,只有约10%的主震存在前震。通过地震波形模板扫描方法,Trugman等[11]发现南加州72%的主震存在几天到几星期的前震序列,表明前震可能具有普遍性。因此,地震预测有可能在新技术的推动下获得新的发展。
传统的对于“前兆”的预测大多是经验性的,往往凭专家的“直觉”。这些预测难以用清晰的、定量的物理图像来描述,其意义是有限的[7]。假若要进行程序化表达,则需要建立一些预测模型。机器学习(ML)是人工智能的核心研究领域之一,通过对大量数据的学习发现其隐含的规律和特征信息,进一步理解事物本质,并自动做出预测或决策。借助大量的地震数据,机器学习方法可以提高对地震机理的认识,显著改善地震预测的准确性。
本文首先介绍人工智能、机器学习和深度学习之间的关系,阐述了机器学习的分类方法及主要的发展进程。其次,回顾了利用机器学习进行地震预测的最新研究进展。最 后,展望了机器学习在地震预测领域的可能应用。
1 机器学习背景介绍
人工智能(ArtificialIntelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。人工智能研究的范围非常广,包括演绎、推理和解决问题、知识 表 示、学 习、运 动 和 控 制、数 据 挖 掘 等 众 多 领 域。机 器 学 习[12](Ma-chineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析和算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。深度学习[13](DeepLearning,DL,也称为深度结构化学习)是机器学习领域中一个新的研究方向,是为了提高机器学习能力,更好地实现人工智能。三者的关系如图1所示。
机器学习根据学习系统的“反馈”性质可以分为三大类:有监督学习,无监督学习以及强化学习(图2)。有监督学习是通过已有的输入、结果数据集(标签数据),学习输入至输出的映射规则,主要用于分类和回归。其中代表性的有 K 近邻算法、决策树、朴素贝叶斯、逻辑回归和随机森林等分类方法;线性回归、多项式回归和岭回归等回归模型;还有可用于分类或回归任务的支持向量机、神经网络和梯度提升决策树等模型。无监督学习需要从无标签数据中学习到相应的表示或隐藏模式,主要 用 于 聚 类(如 层 次 聚 类、谱 聚 类、密度聚类和模型聚类等)和降维(如 主 成 分分析和自编码器等)。强化学习是通过交互和反馈,在 价 值、策 略 或 模 型 的 迭 代 中 改进学习的过 程。机器学习的主要发展历程如图3所示。
从图3可以看到,人工神经网络(Arti-ficialNeuralNetworks,ANN)在机器学习发展历程中具有重要的地位。ANN 是比较类似于大脑神经结 构 的 一 种 模 型,很 早 就用于机器学习。但早期的 ANN 是较为简单的浅层神经 网 络,表示复杂函数的能力有限,导致其在繁复的场景下泛化能力不足。随着计算和 存 储 能 力 的 大 幅 度 增 长,以 及开 源 学 习 框 架 的 推 出 (如 Tensorflow、Torch等软件),可 以 很 容 易 构 建 出 更 多、更深层次的神经网络进行深度学习,实现复杂函数逼近,提高泛化能力,深度学习也因此在最近几年获得全新的突破[13,14]。
2 机器学习在地震预测中的应用
2.1 机器学习地震预测的数据和方法
地震过程涉及地下物质物理或化学变化,震前现象复杂多变,如地震活动性、地表形变、电磁场、地温、重力、地下流体和地球化学等。在众多观测数据中,地震目录可能是目前比较可靠和相对完备的数据集,也是机器学习中最为常用的输入数据。
地震目录包含震级、空间和时间三个方面的信息。一般通过简单的预处理或使用先验地震规律对地震目录进行转换后,作为机器学习的输入来训练、建 模 和 预 测。如 Alarifi等[16]将地震的发生时间转换为序号,地震的位置(经纬度和深度)以及震级转换为预先划分好的网格,用于训练和预测。Panakka等[17]和 Adeli等[18]基于古登堡-里克特幂律(G-R关系)和特征地震模型两个先验统计模型,将地震目录转换为8个地震活动性参数作为指标(表1)。这些活动性参数甚至被演化为更多的地震参数,如 Asim 等[19]提出60个地震参数;也有部分研究仅用其中的一个或几个指标[20]。
常规台网产出的地震目录通常只是离散地记录了断裂带失稳破裂的信息,缺失更多微弱的或非常规的(如断裂颤动、蠕滑等)断裂带活动。目前,基于模板检测或机器学习在连续记录的地震波形中发现了部分缺失的地震、颤动或慢地震,取得了显著的成 效[11]。所以,直接挖掘地震波形记录,可以获得更丰富的地震活动信息进行预测研究。Rouet-Leduc等[21]通过实验室声发射(AE)连续波形数据,提取每个时间窗大约100个潜在相关统计特征(如均值、方差、峰度和自相关),然后递归选择最有用的特征输入。Ren等[22]在滤波器预处理后,将地震信号上的滑动时间窗口导出的特征作为输入。马士振等[23]输入三分量地震波形提取地脉动特征。
其他类型数据用于模型训练和预测目前相对较少。Corbi等[24]将94个描述模拟模型的表面变形特征作为输入;Nicolis等[25]将研究区域内过去30d的强度函数的最大值作为输入;DeVries[26]将主震周围三维网格化的同震静态库伦应力变化作为训练和预测的输入。
可操作的地震预测/预报需要同时给出震级、时间和地点三要素的概率性或确定性结果;但大部分关于机器学习对预测的研究都把复杂的问题进行降维,只对震级、时间和地点三要素之一的单要素或其中双要素进行预测。在实际应用中,这些要素还需要进一步对时间或震级离散化,或进行空间网格化,从而使预测简化为分类或回归问题。训练和预测输出结果一般为一个概率向量。在二分类地震预测任务中,输出的发震概率与指定阈值进行比较,当预测概率高于阈值时,认为发生地震。
基于神经网络的方法,特别是深度学习,对复杂问题表现出更优的解决能力,在地震预测研究中应用最为广泛。Mignan等[27]对1994—2019年77篇有关人工神经网络地震预测的研究文章总结发现两个趋势:一是近年来将人工神经网络应用于地震预测的兴趣逐渐增加,二是尝试搭建更复杂的深度学习神经网络去预测地震。基于数据驱动的机器学习模型涉及的输入、输出和架构如表2所示。
2.2 模型评价体系
建立合理的评估框架对于预测问题非常重要,有利于预测模型的性能评估和不同模型的对比。考虑到研究的初始阶段和预测问题的复杂性,大部分研究把地震预测问题简化成二分类问题,并通过混淆矩阵(ConfusionMatrix)进行评测,表3是四个基础指标。
通常混淆矩阵中 TP与 TN 的数量越大,FP与 FN 的数量越小表示预测效果越好。但是混淆矩阵的数据很难衡量模型的好坏,因此从混淆矩阵又延伸出5个指标将矩阵转化为0到1之间的比率(表4),以便于进行标准化的衡量。此外,由于受试者工作特征曲线(ReceiverOperatingCharacteristic,ROC)能给出比较稳定的评价,在工程应用中使用较多。ROC以假阳率为 X轴坐标,以真阳率为 Y 轴坐标,曲线 越 靠 近 左 上 角 则 说 明 模 型 算 法 性 能 越 好,其对角线对应于“随 机 猜 测”模 型 的 性 能。ROC曲线下的面积(AreaUnderCurve,AUC)被用于衡量模型的算法性能。AUC值范围为0~1,值越大模型算法的性能越好,其中值为0.5表示模型等价“随机猜测”,为1时说明模型达到理想状态。
2.3 不同情景的地震预测
地震序列中,主震突发性显著,震级大破坏性强;攻克强主震预测,能够显著减少人员伤亡和降低经济损失。但是强震,特别是针对某条断裂带的强震,面临着地震复发周期长,可用于机器学习的数据样本少等问题。在此情况下,发展余震或实验室岩石破裂的预测,对地震预测研究也很重要。
余震预测研究具有更好的数据基础和经验模型约束。全世界范围内余震占地震总数为30%~40%[28],可以为预测研究提供大量的训练样本。主震发生后,后续强震主要发生在余震区及周边,现有的经验定律可以很好地解释余震的最大强度及其随时间衰减规律和空间分布[29]。这些基础将更有利于机器学习对地震预测研究的开展和改进。
小尺度的岩石破裂实验可以分离断层快速破裂或慢速蠕滑的影响因素,是识别地震主要机理的重要研究手段。相对于自然界的断层破裂,在可控环境下的岩石破裂行为更为简单。对岩石破裂的预测,也许可对预测天然地震指出方向,也可为预测方法对比提供参照基础。
2.3.1 强主震预测
Alves[30]认为地震活动的混沌特性和经济预测相似,受 此 启 发 提 出 用 人 工 神 经 网 络(ANN)进行地震预报。通常,对地震影响的评估可以采用地震震级或者强度。前者与释放能量成比例,但有一个缺点:可用的数据序列只从20世纪开始,而要预测破坏性地震,需要研究相当长时间的跨度。因此,此文采用半定量的强度数据评估地震的影响(用 MMI表示[31])。将地震的时间、地点、MMI代入7个金融学上的数学计算表达式,计算预测趋势并输入人工神经网络中,输出为预测的时间、地点以及 MMI范围,实现了输入和输出的一致性,且将输出定量化。通过在葡萄牙亚速尔群岛地区进行测试,该方法正确预测了1998年7月(MMI=8)和2004年1月(MMI=5)地震。虽然,此文对预测结果没有进行系统评估,而且预测的地震烈度略有出入,但两个震例预测的时间窗口都是准确的(±5个月内),表明了神经网络在预测上的潜力。
Panakkat等[17]和 Adeli等[18]将地震预测问题描述为一个分类任务,目标是在指定区域内预测下个月最大震级。2007年Panakkat等[17]采用了前馈反向传播神经网络(LMBP)、递归神经网络(RNN)和径向基函数神经网络(RBF)三种不同的方法对问题进行建模,在南加州和旧金山湾地区进行了训练和测试。总体而言,与 LMBP和 RBF相比,RNN 可产生最佳的预测精度。以此为基础,2009年提出了概率神经网络(PNN)并使用南加州地震带的数据进行 了 测 试。结 果 表 明,对4.5~6.0 级 事 件 有 较 好 的 预 测 精 度,而 当 震 级 大 于6.0时,性能则表现一般。这两篇文章的研究相辅相成,Adeli等[18]建议使用 RNN 预测大地震,PNN 预测中小地震。
Moustra等[32]通过使用不同类型的输入数据来评估 ANN 在希腊地区地震预测的准确性。采用两个不同的研究案例。第一个研究仅使用震级作为神经网络的输入,输出为第二天的震级。预测的平均准确率为80.55%,大地震的准确率只为58.02%。第二个案例使用震电信号(SeismicElectricSignals,SES)作为神经网络的输 入。此案例又分为两个部分,区别是如何构造缺失的SES。第一部分随机构造,预测的准确率略高于60%;第二部分利用 ANN 构造数据,震级预测的准确率提升至83.56%。这说明了在恰当的数据上训练模型的重要性。Alarifi等[16]基于多隐含层前馈神经网络提出智能震级预测模型系统,在北部红海地区如亚喀巴湾、苏伊士湾和西奈半岛进行测试。采用均方误差(MAE)和平均绝对误差(MSE)衡量不同方法的性能,结论为神经网络模型比其他方法至少要好32%。
Cortés等[33]研究了机器学习在克罗地亚不同孕震区的震级预测性能,计算了精确率、灵敏度和特异性等评价指标,认为该技术可以很好改善预测效能。同年,Cortés等[34]探究了人工神经网络(ANN)在东京及其周围200km 区域中对于大地震震级预测的准确性。预测范围设定为7d,使用了16个地震活动性参数。通过应用统计,发现人工神经网络比其他方法有明显的优越性。Cortés[20]等进一步应用四个回归器(广义线性模型、梯度提升机、深度学习和随机森林)及其组合预测未来7d内最大地震事件的震级。研究发现,使用更复杂的回归器组合具有最好的准确性。——论文作者:袁爱璟1,王伟君1,彭 菲1,闫 坤2,寇华东2
* 稍后学术顾问联系您