ggy423.pdf
TL;DR 精炼摘要
随着地震传感器数量的激增,手动拾取地震相位变得愈发困难,现有自动方法仍难以超越经验分析师的表现。本文提出基于深度神经网络的PhaseNet,能准确拾取P波和S波的到达时间,显著提高拾取准确度和召回率,为地震定位和速度模型的改进提供了新方法。
摘要
Geophys. J. Int. (2019) 216, 261–273 doi: 10.1093/gji/ggy423 Advance Access publication 2018 October 13 GJI Seismology PhaseNet: a deep-neural-network-based seismic arrival-time picking method Weiqiang Zhu and Gregory C. Beroza Department of Geophysics, Stanford University, CA 94035-2215, USA. E-mail: zhuwq@stanford.edu Accepted 2018 October 11. Received 2018 October 9; in original form 2018 March 08 S U M M A R Y As the number of seismic sensors grows, it is becoming increasingly difficult for analysts to pick seismic phases manually and comprehensively, yet such efforts are fundamental to earthquake monitoring. Despite years of improvements in automatic phase picking, it is difficult to match the performance of experienced analysts. A more subtle issue is that different sei…
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
PhaseNet: a deep-neural-network-based seismic arrival-time picking method (PhaseNet: 一种基于深度神经网络的地震到达时间拾取方法)
1.2. 作者
- Weiqiang Zhu 和 Gregory C. Beroza
- 隶属机构: Department of Geophysics, Stanford University, CA 94035-2215, USA.
- 通讯作者邮箱: zhuwq@stanford.edu
1.3. 发表期刊/会议
- 期刊: Geophys. J. Int. (Geophysical Journal International)
- 声誉与影响力: Geophysical Journal International 是地球物理学领域内享有盛誉的国际期刊,专注于地球物理学的各个方面,包括地震学。在该期刊上发表的论文通常代表了该领域的高水平研究。
1.4. 发表年份
2019年 (Advance Access publication 2018年10月13日)
1.5. 摘要
随着地震传感器数量的增加,分析师手动全面拾取地震相位变得越来越困难,然而这项工作对于地震监测至关重要。尽管自动相位拾取方法多年来不断改进,但仍难以匹敌经验丰富的分析师的性能。一个更微妙的问题是,不同的地震分析师可能会以不同的方式拾取相位,这可能导致地震定位引入偏差。本文提出了一种基于深度神经网络的到达时间拾取方法,名为 PhaseNet,用于拾取 波和 波的到达时间。深度神经网络在特征学习方面取得了快速进展,并在充分训练后在许多应用中实现了超人类的性能。PhaseNet 使用三分量地震波形作为输入,并生成 波到达、 波到达和噪声的概率分布作为输出。PhaseNet 被设计成其概率分布的峰值能够提供精确的 波和 波到达时间。PhaseNet 利用北加州地震数据中心提供的、由分析师标注的 波和 波到达时间所构成的大量可用数据集进行训练。所使用的数据集包含从超过30年的地震记录中提取的700,000多个波形样本。研究表明,将 PhaseNet 应用于已知地震波形时,其拾取准确率和召回率远高于现有方法,这有望显著增加目前可用的 波观测数量。这将有助于改进地震定位和剪切波速度模型。
1.6. 原文链接
/files/papers/6927b30cbcbf7a4beb0d661b/paper.pdf (该论文已于2019年在 Geophys. J. Int. 正式发表,2018年10月13日在线提前发布)
2. 整体概括
2.1. 研究背景与动机
-
论文试图解决的核心问题: 随着全球地震监测网络日益密集,地震传感器数量呈爆炸式增长,使得传统的地震相位( 波和 波)手动拾取方法面临巨大挑战。手动拾取不仅耗时、劳动强度大,而且不同分析师的判断差异还会引入系统性偏差,影响地震目录的质量和地震定位的准确性。尽管现有自动拾取方法已取得一定进展,但在准确性和鲁棒性上仍远不及经验丰富的分析师,尤其在复杂、噪声大的波形条件下,对 波的拾取性能尤为不佳。
-
为什么这个问题在当前领域是重要的:
- 地震监测基础: 相位到达时间拾取是地震检测、定位、震级测定等地震学基本任务的基石。
- 数据量激增: 密集地震台网(例如拥有数千个传感器)产生了海量连续波形数据,手动处理已不可持续。
- 数据质量提升潜力: 准确的 波到达时间对于减少震源深度-原时 (depth-origin trade-off) 之间的权衡至关重要,能显著提升地震定位精度。同时,高质量的 波数据对于构建更精细的剪切波速度模型和预测强地面运动也具有关键意义。
-
现有研究存在的具体挑战或空白 (Gap):
- 人工瓶颈: 无法跟上数据流,且主观性引入偏差。
- 传统自动方法的局限: 基于振幅、统计特征(如
STA/LTA、峰度、偏度)的方法易受噪声影响,对复杂波形(特别是淹没在 波尾波中的 波)精度低。这些方法通常依赖于手动定义的特征和预处理步骤(如滤波),限制了其泛化能力。 - 波拾取难度: 波不是首波到达,且常常从 波的尾波中 emergent (涌现),导致其到达时刻不清晰,拾取难度远高于 波。
-
这篇论文的切入点或创新思路: 论文利用深度神经网络 (Deep Neural Network,
DNN) 在特征学习方面的强大能力。DNN能够直接从原始、未经过滤的三分量地震波形中自动学习识别 波、 波和噪声的复杂特征,从而避免了传统方法对手动特征工程和预处理的依赖。通过大规模、分析师标注的真实地震数据进行训练,PhaseNet旨在达到甚至超越人类分析师的拾取性能。
2.2. 核心贡献/主要发现
- 提出了
PhaseNet方法: 引入了一种基于U-Net架构变体的深度神经网络模型PhaseNet,用于自动拾取地震 波和 波的精确到达时间。 - 端到端特征学习:
PhaseNet能够直接从原始三分量地震波形中学习特征,输出 波、 波和噪声的概率分布,避免了传统方法中繁琐且易受限的手动特征工程和数据预处理(如滤波)。 - 显著提升拾取性能: 在北加州地震数据中心的大规模测试集上,
PhaseNet在 波和 波的拾取准确率 (Precision)、召回率 (Recall) 和F1分数上均显著优于现有的AR picker方法,尤其在对更具挑战性的 波拾取方面,性能提升更为显著。 - 鲁棒性强: 即使在不同仪器类型、低信噪比 (SNR) 或波形被削波 (
clipped waveforms) 等复杂条件下,PhaseNet也能保持稳定的高性能。 - 可视化特征学习能力: 通过主成分分析 (Principal Component Analysis,
PCA) 可视化,证明了PhaseNet的深层神经元能够有效地学习并区分 波、 波和噪声的特征。 - 应用潜力广阔:
PhaseNet能够生成连续的 和 波概率序列,具有应用于连续数据进行地震检测和相联的潜力,从而大幅增加 波观测数量,改进地震定位精度和剪切波速度模型。
3. 预备知识与相关工作
3.1. 基础概念
- 地震相位 (Seismic Phases): 地震发生时,地震波从震源向四周传播,由于介质特性不同,会产生不同类型和传播速度的波。这些波到达地震台站时,形成了不同的“相位”。
- 波 (Primary Wave / 纵波): 速度最快,是地震台站记录到的首个到达的地震波。它是一种压缩波,质点振动方向与波传播方向平行。 波通常具有清晰的初至,易于识别。
- 波 (Secondary Wave / 横波): 速度次之,在 波之后到达。它是一种剪切波,质点振动方向与波传播方向垂直。 波的能量通常比 波大,但由于常淹没在 波的尾波中,其初至识别难度较高。
- 到达时间拾取 (Arrival-Time Picking): 指的是识别地震波(主要是 波和 波)何时到达地震台站的过程。这是地震学中一个基础但关键的任务,直接影响地震定位、震级测定和地球内部结构研究的准确性。
- 深度神经网络 (Deep Neural Networks - DNN): 是一种包含多个隐藏层的人工神经网络。相较于只有少量隐藏层的“浅层”网络,
DNN能够学习更复杂、更抽象的特征表示,从而在图像识别、语音识别、自然语言处理等领域取得突破性进展。其优势在于无需手动设计特征,而是通过大规模数据训练自动从原始输入中提取有用的特征。 - U-Net 架构:
U-Net(Ronneberger et al., 2015) 是一种专门用于图像分割的卷积神经网络架构。其名称来源于其独特的“U”形结构,包含一个用于特征提取的下采样路径(编码器,encoder)和一个用于精确定位的上采样路径(解码器,decoder)。- 下采样路径 (Encoder): 逐步缩小特征图的空间维度,同时增加通道数,用于捕捉上下文信息。
- 上采样路径 (Decoder): 逐步恢复特征图的空间维度,同时减少通道数,用于精确分割。
- 跳跃连接 (Skip Connection):
U-Net的一个关键特性是在编码器和解码器之间存在直接连接,将编码器路径中的特征图直接传递给解码器路径的对应层。这有助于保留空间细节信息,防止在深层网络中因下采样而丢失。 在本文中,PhaseNet将U-Net架构从二维图像处理改编为一维时间序列数据处理,用于定位地震波形中的 波和 波到达点。
3.2. 前人工作
- 基于振幅和能量的方法:
- 短期平均/长期平均 (Short-Term Average/Long-Term Average - STA/LTA): (Allen 1978) 是一种广泛使用的经典方法。它通过计算短时间窗(
STA)和长时间窗(LTA)内信号能量的比值来检测地震信号的突变。比值超过预设阈值则标记为地震到达。- 优点: 计算高效,概念简单。
- 缺点: 易受噪声影响,对弱信号或 emergent (涌现) 信号(如 波)拾取精度较低,容易产生延迟。
- 基于包络线改进: (Baer & Kradolfer 1987) 改进了
STA/LTA方法,使用包络线作为特征函数,以提高检测效果。
- 短期平均/长期平均 (Short-Term Average/Long-Term Average - STA/LTA): (Allen 1978) 是一种广泛使用的经典方法。它通过计算短时间窗(
- 统计学方法:
- 自回归 (Autoregressive - AR) 模型: (Sleeman & Van Eck 1999) 应用噪声和地震信号的联合自回归建模,并使用
Akaike Information Criterion (AIC)(赤池信息准则) 来确定地震信号的起始。 - 高阶统计量: (Saragiotis et al. 2002; Küperkoch et al. 2010) 开发了基于峰度 (
kurtosis) 和偏度 (skewness) 等高阶统计量的方法,用于识别从高斯性到非高斯性的转变,这通常与地震事件的发生相吻合,即使在存在噪声的情况下。
- 自回归 (Autoregressive - AR) 模型: (Sleeman & Van Eck 1999) 应用噪声和地震信号的联合自回归建模,并使用
- 传统浅层神经网络:
- (Gentili & Michelini 2006) 尝试使用传统浅层神经网络拾取 和 相位。这些方法通常依赖于手动定义的特征(如方差、偏度绝对值、峰度以及偏度和峰度的组合),在滑动窗口上进行预测。
- 极化分析 (Polarization Analysis):
- (Ross & Ben-Zion 2014) 利用极化分析来区分 波和 波,主要目的是改进 波到达时间的测量。极化分析通过分析地震波在不同方向上的振动特性来识别波的类型。
3.3. 技术演进
地震相位拾取技术的发展经历了从早期依赖经验和人工判断,到基于数学统计和信号处理的自动化方法,再到近年来利用机器学习特别是深度学习的智能化方法的演变。
- 早期 (人工/经验): 完全依赖经验丰富的分析师,效率低下且存在主观偏差。
- 传统自动化 (特征工程):
STA/LTA、包络、AR模型、高阶统计量等方法通过设计特定的信号特征来自动化拾取过程。这些方法虽然提高了效率,但对复杂波形和噪声的鲁棒性有限,且性能高度依赖于特征选择和参数调优。 - 浅层机器学习: 引入浅层神经网络等机器学习模型,但仍需要手动提取特征。
- 深度学习 (自动特征学习): 以
PhaseNet为代表的深度学习方法,利用其强大的特征学习能力,直接从原始波形数据中自动提取高层抽象特征,避免了手动特征工程的瓶颈,从而在复杂环境和大规模数据上展现出更优越的性能和鲁棒性。
3.4. 差异化分析
PhaseNet 与上述前人工作的核心区别和创新点在于:
- 特征学习方式:
- 传统方法: 依赖于手动定义的特征(如振幅比、统计量、极化特性)和预处理步骤(如带通滤波)。这些特征可能无法充分捕捉地震波形的复杂性,且对噪声敏感。
PhaseNet: 采用端到端的深度学习方法,直接从原始、未经过滤的三分量地震波形中自动学习识别 波、 波和噪声的判别性特征。这种“特征学习”能力使得模型能够适应多种复杂的波形特征,并对噪声具有更强的鲁棒性。
- 波拾取性能:
PhaseNet在 波拾取上的性能提升尤为显著。传统方法在 波尾波干扰下难以准确拾取 波,而PhaseNet能够学习区分 波尾波和 波初至的微妙特征,这表明其学习到的特征比手动定义的特征更有效。 - 鲁棒性:
PhaseNet对不同仪器类型、宽泛的信噪比范围、甚至振幅削波的波形都能保持稳定的高性能,而传统方法往往需要针对不同情况进行参数调整或额外的预处理。 - 输出形式: 传统方法通常输出一个拾取点或一个触发信号,而
PhaseNet输出的是 波、 波和噪声的概率分布序列,这为后续的地震检测和相位关联提供了更丰富的信息,并且其峰值直接对应精确的到达时间,阈值仅用于决定是否为有效拾取,不会像STA/LTA那样系统性地引入时间偏差。
4. 方法论
4.1. 方法原理
PhaseNet 的核心思想是利用深度学习模型从原始地震波形中自动学习识别 波、 波和噪声的特征,并输出这些类别的概率分布。该方法借鉴了 U-Net (Ronneberger et al., 2015) 的架构,并对其进行了修改以适应一维时间序列数据。PhaseNet 不依赖于手动设计的特征或预处理(如滤波),而是通过在大量分析师标注数据上进行训练,直接从三分量地震图输入中生成 波、 波和噪声的概率分布序列。这些概率分布的峰值被设计为精确的 波和 波到达时间。
4.2. 核心方法详解 (逐层深入)
PhaseNet 的架构如图 Figure 5 所示,主要包括数据准备、网络结构和训练优化三个方面。
4.2.1. 数据准备与预处理
-
输入波形获取:
- 从北加州地震数据中心目录中收集三分量数字地震波形数据。
- 每个样本随机选择一个包含 波和 波到达时间的 30 秒时间窗口作为模型的输入。这种随机性有助于确保算法不会仅仅学习窗口的位置。
- 所有数据统一采样率为 。因此,30 秒的输入波形在每个分量上有
3001个数据点。总输入维度为 (三个分量,每个分量3001个时间点)。
-
波形归一化:
-
对每个分量波形进行独立归一化,具体步骤是:
- 去除其均值 (mean)。
- 除以其标准差 (standard deviation)。
-
目的: 消除不同波形之间的振幅差异和直流偏移,使网络更容易学习波形的形态特征,并有助于训练过程的稳定性和收敛。 下图 (Figure 4) 展示了波形预处理的示例:
VLM 描述: 该图像是一个包含多个分图的波形图,其中三幅图(a、b、c)显示了不同方向(E、N、Z)的地震波的幅度变化,标记出P波和S波到达的时间,第四幅图(d)则展示了在不同时间点对应的概率分布。
-
-
真实概率分布掩码生成:
- 手动拾取的时间点( 和 波到达)被视为“地面真值” (Ground Truth)。然而,手动拾取存在不确定性。
- 为解决这个问题,作者不直接使用一个精确的时间点,而是为每个手动拾取点应用一个概率掩码 (mask)。这个掩码的形状是一个截断的高斯分布 (truncated Gaussian distribution)。
- 高斯分布参数:
- 均值 (): 设为手动拾取的到达时间。
- 标准差 (): 设为 。
- 目的: 使得手动拾取点具有最高的概率,而附近的点概率逐渐降低。这反映了拾取固有的不确定性,并允许算法在训练时减少拾取误差的影响。
- 噪声概率计算: 噪声的概率分布
Prob(noise)是根据 波和 波的概率计算得出的,确保所有类别的概率之和为 1:Prob(noise): 噪声类别的概率。Prob(P): 波类别的概率。Prob(S): 波类别的概率。- 目的: 定义了每个时间点属于噪声类别的概率,与 和 波概率共同构成完整的三类别概率分布。
- 好处: 这种概率表示方式增加了 和 拾取相对于噪声的信息量,有助于加速网络的收敛。
4.2.2. 网络架构 (PhaseNet)
PhaseNet 的网络架构是基于 U-Net (Ronneberger et al., 2015) 针对一维时间序列数据进行修改的,如图 Figure 5 所示。
VLM 描述: 该图像是一个示意图,展示了PhaseNet深度神经网络的架构。输入为30秒的三分量地震波形,采样频率为100 Hz,维度为。图中蓝色矩形代表神经网络内的层,箭头表示各层间的操作。输出为与输入相同长度的三个概率,分别对应P-pick、S-pick和噪声。图中还标示了各层的维度,采用“通道数 每个通道的长度”的格式。
-
输入层:
- 接收 30 秒的三分量地震图,采样率为 。
- 输入维度为 (3 个分量,每个分量 3001 个数据点)。
-
下采样路径 (Encoder,左侧):
- 由四个下采样阶段组成。
- 操作: 每个阶段内部应用一维卷积 (1-D convolutions) 和线性整流单元 (
ReLU) 激活函数。卷积核大小设置为 7 个数据点。 - 下采样: 步长 (stride step) 设置为 4 个数据点。这意味着在每个下采样操作后,通道的长度会压缩为原来的四分之一。例如,从 到 ,再到 ,以此类推。
- 目的: 提取地震数据中的有用信息,并逐步将其压缩到更低维度的表示中。每个在最深层的神经元都对应着一个更广阔的感受野 (receptive window)。
-
上采样路径 (Decoder,右侧):
- 由四个上采样阶段组成,与下采样路径对称。
- 操作: 使用反卷积操作 (deconvolution operation,也称为转置卷积,Noh et al., 2015) 来扩展被压缩的层。每个反卷积操作将通道长度扩展四倍,以恢复到之前的长度。
- 目的: 将从深层提取的抽象信息逐步扩展并转换为 波、 波和噪声的概率分布,对应每个时间点。
-
跳跃连接 (Skip Connections):
- 在每个深度,下采样路径的输出(左侧蓝色矩形)直接通过跳跃连接 (skip connection) 与上采样路径的对应层(右侧蓝色矩形)进行拼接 (concatenate),而无需经过更深的网络层。
- 目的: 这种连接有助于在训练过程中改善收敛,并保留下采样过程中可能丢失的精细空间细节信息,对于精确的定位任务(如相位拾取)至关重要。
-
输出层:
- 网络的最终输出是三个概率分布序列,长度与输入序列相同 (
3001个数据点)。 - 这三个序列分别代表了每个时间点属于 波、 波和噪声的概率。
- 网络的最终输出是三个概率分布序列,长度与输入序列相同 (
4.2.3. 激活函数与损失函数
-
输出层激活函数 (Softmax):
- 在网络的最后一层,使用
softmax归一化指数函数将网络的原始输出值 (unscaled values, 也称为 logits) 转换为概率分布。 - 公式:
- : 在时间点 处,类别 的预测概率。
- : 类别索引,取值为
1, 2, 3,分别代表噪声、 波和 波。 - : 在时间点 处,最后一层网络输出的、未经过缩放的、对应类别 的值 (logit)。
- : 的指数函数,确保输出为正值。
- : 对所有三个类别(噪声、 波、 波)的指数化输出求和,用于归一化,确保在时间点 处所有类别的预测概率之和为
1。
- 目的: 将网络输出转换为可解释的、介于
[0, 1]之间的概率值,便于判断每个时间点属于哪个类别。
- 在网络的最后一层,使用
-
损失函数 (Cross-Entropy Loss):
- 训练过程中,使用交叉熵 (Cross-entropy) 作为损失函数来衡量预测的概率分布
q(x)与真实的概率分布p(x)之间的差异。 - 公式:
H(p, q): 交叉熵损失值,表示两个概率分布 和 之间的散度。- : 类别索引,取值为
1, 2, 3,分别代表噪声、 波和 波。 - : 时间序列中的每个数据点索引。
- : 在时间点 处,类别 的真实概率。这些真实概率是由前述的高斯分布掩码生成的。
- : 在时间点 处,类别 的预测概率 的自然对数。
- 目的: 最小化此损失函数将促使网络学习生成与真实标签(高斯掩码)尽可能接近的概率分布。
- 训练过程中,使用交叉熵 (Cross-entropy) 作为损失函数来衡量预测的概率分布
4.2.4. 拾取到达时间
- 一旦网络训练完成并生成了 波和 波的概率分布,就可以从这些概率分布的峰值中提取精确的 波和 波到达时间 (Duarte, 2015)。
5. 实验设置
5.1. 数据集
-
来源: 实验数据基于北加州地震数据中心目录 (Northern California Earthquake Data Center Catalog,
NCEDC 2014)。 -
规模与特点:
- 收集了包含 波和 波到达时间标注的三分量数字地震波形数据。
- 总共包含
779,514条记录,这些记录是从超过 30 年的地震记录中提取的。
-
数据集划分:
- 为了确保评估的公正性,数据集按照台站进行分层采样 (stratified sampling based on stations),划分为训练集、验证集和测试集:
- 训练集:
623,054个样本,用于模型训练。 - 验证集:
77,866个样本,用于训练过程中的参数微调和模型选择。 - 测试集:
78,592个样本,仅用于评估PhaseNet的最终性能和结果,确保其在未见过数据上的泛化能力。
- 训练集:
- 为了确保评估的公正性,数据集按照台站进行分层采样 (stratified sampling based on stations),划分为训练集、验证集和测试集:
-
数据多样性:
-
仪器类型: 数据集包含北加州地震台网中多种类型的仪器,如下图 Figure 2 所示。这包括高频宽带 ()、甚短周期 () 和短周期 () 等不同频带的仪器,以及加速度计 ()、甚短周期地震仪 ()、高增益地震仪 () 和低增益地震仪 () 等不同仪器类型。这种多样性增加了数据集的复杂性,但也使得
PhaseNet能够学习在不同仪器类型下通用的特征。
VLM 描述: 该图像是一个饼图,展示了不同仪器类型在数据集中的比例。不同的类别包括高频宽带、短期地震仪和加速度计,标示了各类型的相对比例,例如HHE、HNN和HHZ占比20.5%。 -
信噪比 (SNR): 数据集覆盖了广泛的信噪比范围,如下图 Figure 3 所示。
SNR的计算方法是 波到达后 5 秒窗口内标准差与 波到达前 5 秒窗口内标准差的比值。SNR的多样性使得模型能够在各种信号质量条件下进行训练和评估。
该图像是一个直方图,展示了信噪比 (SNR) 的分布情况。SNR 是通过计算 到达前后的两个5秒窗口标准差的比值得到的,图中的横坐标为 ,纵坐标为样本数量,显示出在不同 SNR 值下的样本分布。
VLM 描述: 该图像是一个直方图,展示了信噪比 (SNR) 的分布情况。SNR 是通过计算 到达前后的两个5秒窗口标准差的比值得到的,图中的横坐标为 ,纵坐标为样本数量,显示出在不同 SNR 值下的样本分布。
-
-
选择原因: 数据集的复杂性和多样性为自动相位拾取带来了挑战,但也提供了更全面的性能评估,确保了
PhaseNet在实际应用中的鲁棒性。
5.2. 评估指标
论文使用了以下评估指标来衡量 PhaseNet 的性能,并将其与分析师的拾取结果进行比较。对于每一个指标,都提供了概念定义、数学公式和符号解释。
- 真阳性 (True Positive, ): 模型正确识别为 或 波到达,且拾取时间与分析师标注时间残差 小于 的样本数量。
- 假阳性 (False Positive, ): 模型错误识别为 或 波到达,或者拾取时间残差 大于 的样本数量。
- 假阴性 (False Negative, ): 模型未能识别出分析师标注为 或 波到达的样本数量。
- 判断标准:
- 预测概率峰值高于
0.5被计为正拾取 (positive picks)。 - 拾取时间残差 被计为真阳性 (true positive)。
- 预测概率峰值高于
-
精确度 (Precision, ):
- 概念定义: 衡量模型报告为正例的拾取中,有多少是真正的正例。它关注的是模型在发出“拾取”信号时的准确性,即模型预测为正的结果中有多少是正确的。
- 数学公式:
- 符号解释:
- : 真阳性数量。
- : 假阳性数量。
-
召回率 (Recall, ):
- 概念定义: 衡量所有真实正例的拾取中,有多少被模型成功识别。它关注的是模型捕捉所有正例的能力,即模型漏掉了多少真实的拾取。
- 数学公式:
- 符号解释:
- : 真阳性数量。
- : 假阴性数量。
-
F1 分数 (F1 score,
F1):- 概念定义: 精确度和召回率的调和平均值。它提供了一个综合性的评估指标,在精确度和召回率之间取得平衡。当精确度和召回率都较高时,F1 分数才高,因此它对阈值选择的敏感性较低,能够更准确地评估算法的整体性能。
- 数学公式:
- 符号解释:
- : 精确度。
- : 召回率。
-
时间残差的均值 () 和标准差 ():
- 概念定义: 表示
PhaseNet拾取时间与分析师标注时间之间的差异(残差)。- 均值 (): 衡量拾取结果的系统性偏差。接近
0表示没有明显的系统性超前或滞后。 - 标准差 (): 衡量拾取结果的离散程度或一致性。值越小表示拾取越稳定、越精确。
- 均值 (): 衡量拾取结果的系统性偏差。接近
- 数学公式: (论文正文未直接给出,这里补充标准定义)
- 均值:
- 标准差:
- 符号解释:
- : 第 个有效拾取(残差 )的时间残差。
- : 参与计算的有效拾取总数。
- 概念定义: 表示
5.3. 对比基线
论文将 PhaseNet 的结果与一个开源的基线方法进行了比较:
- AR picker (Akazawa 2004): 这是一种基于自回归 (Autoregressive) 模型的拾取器,用于自动检测地震 波和 波的初至。该方法在
Obspy(Beyreuther et al. 2010) 中有实现。- 代表性:
AR picker是一种基于统计信号处理的传统自动化拾取方法,具有一定的代表性,可以作为衡量深度学习方法改进效果的基准。
- 代表性:
6. 实验结果与分析
6.1. 核心结果分析
6.1.1. 整体性能评估
以下是原文 Table 1 的结果:
| Evaluation indicator | Phase | PhaseNet | AR picker |
| Precision | P | 0.939 | 0.558 |
| S | 0.853 | 0.195 | |
| Recall | P | 0.857 | 0.558 |
| S | 0.755 | 0.144 | |
| F1 score | P | 0.896 | 0.558 |
| S | 0.801 | 0.165 | |
| µ(∆t)(ms) | P | 2.068 | 11.647 |
| S | 3.311 | 27.496 | |
| σ(∆t)(ms) | P | 51.530 | 83.991 |
| S | 82.858 | 181.027 |
- 显著改进: 从 Table 1 可以看出,
PhaseNet在所有评估指标上都显著优于AR picker。- F1 分数:
PhaseNet在 波拾取上获得0.896的F1分数, 波获得0.801。相比之下,AR picker的 波和 波F1分数分别为0.558和0.165。这表明PhaseNet在精确度和召回率之间取得了更好的平衡,性能优势巨大。 - 波拾取:
PhaseNet对 波的改进尤为显著。其 波的精确度 (0.853vs0.195) 和召回率 (0.755vs0.144) 都远高于AR picker。这强调了PhaseNet学习到的特征在区分复杂 波初至方面的优越性。 - 时间残差:
PhaseNet的时间残差均值 () 和标准差 () 都远小于AR picker,意味着PhaseNet的拾取更准确、更稳定。例如, 波残差标准差从AR picker的 降低到PhaseNet的 , 波则从 大幅降低到 。
- F1 分数:
6.1.2. 残差分布
下图 (Figure 6) 展示了 PhaseNet (上部) 和 AR picker (下部) 在测试数据集上的时间残差分布:
VLM 描述: 该图像是一个图表,展示了PhaseNet(上部)和AR picker(下部)在测试数据集上的时间残差分布。图中显示了P波和S波的拾取结果,残差用时间单位(秒)表示,目的是比较两种方法的拾取表现。
PhaseNet的 波和 波残差分布明显更窄,并且没有明显的系统性偏差 (均值接近 0)。- 波的残差分布通常比 波窄,这与 波初至通常更清晰、更容易拾取的预期一致。
AR picker的残差分布更宽,且存在一定的拖尾,表明其拾取误差更大,稳定性较差。
6.1.3. 不同仪器类型下的性能
下图 (Figure 7) 展示了 PhaseNet 在不同仪器类型上的性能:
VLM 描述: 该图像是柱状图,展示了不同仪器类型在地震波相位检测中的表现。左侧(图 a)显示了 波和右侧(图 b)展示了 波的检测结果,分别以精准度(Precision)、召回率(Recall)和 F1 分数(F1 score)为指标。各项数据均在0到1之间,反映了不同仪器的总体性能。
PhaseNet在所有仪器类型上都表现出鲁棒的性能,即使在不改变任何参数或阈值的情况下。- 尽管短周期仪器和宽带仪器、高增益和低增益、加速度计和地震仪之间的波形特征存在差异,但
PhaseNet依然能够学习到检测 和 相位并拾取正确到达时间的通用特征。
6.1.4. 不同信噪比 (SNR) 下的性能
下图 (Figure 8) 展示了 PhaseNet 随不同 SNR 值变化的性能:
VLM 描述: 该图像是图表,展示了不同信噪比(SNR)下的检出率指标。左侧(a)为 相的精确度、召回率和 F1 分数,右侧(b)为 相的相应指标。数据表明,随着信噪比的变化,模型在精确度和召回率方面的表现均保持稳定。
- 随着
SNR的提高,所有三个评估指标(精确度、召回率和F1分数)均有所增加,这是符合预期的。 - 当 超过
0.5时, 波的F1分数超过0.9, 波的F1分数超过0.8。 - 即使在低
SNR数据中,PhaseNet的精确度依然较高,但召回率相对较低。这表明在噪声严重的情况下,地震信号可能被噪声淹没而变得难以检测。
6.1.5. 拾取示例
-
好拾取示例 (Figure 9): 展示了测试数据集中 的成功拾取案例。对于不同的波形特征和
P-S时间间隔,PhaseNet都能成功拾取 和 波的到达。预测概率分布的峰值与分析师标注的 和 拾取精确对齐。
VLM 描述: 该图像是图表,展示了测试数据集中 的假设实例。上部子图显示了地震波的 "ENZ" 分量,下部则为 波 和 波 的预测概率分布及分析师选定的到达时间。 -
坏拾取示例 (Figure 10): 展示了一些看似失败的案例。在这些波形中, 波和 波的初至更难区分,波形也比 Figure 9 中的更嘈杂和复杂。
VLM 描述: 该图像是包含多种地震信号的图表,展示了不同通道(E、N、Z)中的幅度和概率变化。每个子图(a, b, c, d)均包含时间与幅度关系的曲线图,以及对应的概率曲线,其中概率由 和 表示。 -
手动拾取可能不准确的示例 (Figure 11): 展示了一些有趣案例,其中分析师手动拾取的 波或 波到达时间可能不准确。在这种情况下,
PhaseNet的预测似乎更合理和一致,这凸显了自动拾取方法在提供客观、一致结果方面的优势,能够减少分析师主观性带来的偏差。
VLM 描述: 该图像是图表,展示了六组三个分量的地震波形数据和对应的相位选取概率。左侧(a)、(c)、(e)部分和右侧(b)、(d)、(f)部分均为不同事件的波形,同时标注了手动选取的P波和S波的时间点,红线表示选取位置,蓝线和绿色虚线代表不同的概率分布。这些示例显示了手动选取的模糊性,特别是在P波和S波的识别上。
6.1.6. 特征学习可视化
下图 (Figure 12) 展示了 PCA 可视化结果,其中深层神经元的权重向量根据输入类型( 波、 波或噪声)进行了聚类:
VLM 描述: 该图像是一个散点图,展示了不同类型的地震波相位(如 P 和 S 波)的分布情况。不同颜色的点代表不同的相位,红色、蓝色和橙色区域显示了各自特征的相位分布;此图可用于分析地震到达时间的自动选择技术。
- 为了分析
PhaseNet学习到的表示,作者训练了另一个没有跳跃连接的模型,并对最深层的神经网络权重(图 Figure 5)应用了主成分分析 (PCA)。 PCA可视化结果显示,当输入分别为 波、 波或仅有噪声的地震数据时,最深层中凝聚的向量分别聚类到不同的区域。- 这表明神经网络成功地从原始数据中提取了区分 波、 波和噪声的特征,并将其编码在深层的神经网络权重中。
6.1.7. 连续数据上的检测潜力
下图 (Figure 13) 展示了 PhaseNet 在连续地震数据上的运行结果:
VLM 描述: 该图像是一个包含三部分的示意图,用于展示震相到达时间的拾取过程。图 (a) 显示了地震信号的振幅随时间变化的曲线;图 (b) 表示短期与长期平均比率(STA/LTA)的变化;图 (c) 则显示了对于震相P和S的到达概率的估计,分别用虚线表示。整体上,这些图形为深度神经网络地震到达时间拾取方法提供了可视化结果。
- 作者通过堆叠八个不同事件的波形(将相邻事件的到达时间间隔设置为 6 秒)创建了连续地震数据。
- 将
PhaseNet与Obspy中实现的STA/LTA方法进行了比较。STA/LTA方法的短窗和长窗分别设置为 和 。 PhaseNet直接处理 60 秒的完整波形,输出 波、 波和噪声的三个概率序列。- 结果显示,
PhaseNet产生了与STA/LTA类似的尖峰,但PhaseNet能够进一步区分 波和 波的到达。 - 这种区分能力对于减少误报非常有用,因为同时具有 和 拾取的事件更可能是真正的地震,而非
STA/LTA无法区分的噪声尖峰。
6.1.8. 对削波波形和低 SNR 数据的处理
-
削波波形 (Figure 14):
PhaseNet即使在振幅严重削波的情况下,也能成功拾取 波到达。这表明PhaseNet学习到的特征不仅限于振幅,还包括波形的其他形态特征。
VLM 描述: 该图像是图表,展示了多个波形的振幅剪切示例(子图 a、b、c、d)。每个子图呈现了不同时间段内的振幅变化,并标记了 P 波和 S 波的到达时间。同时,图中还给出了与振幅相关的概率曲线,以此帮助分析地震数据。 -
低 SNR 数据 (Figure 15) 和背景噪声 (Figure 16):
PhaseNet无需像AR picker那样进行带通滤波预处理,就能在低SNR和强低频背景噪声的数据上准确拾取 和 相位。这是因为它不仅学习了 波和 波的特征,还学习了噪声的特征。
VLM 描述: 该图像是图表 (Figure 15),展示了低信噪比 (SNR) 数据的示例。每个子图分别展示了不同方向 (E、N、Z) 的振幅变化及其对应的概率分布,纵轴表示振幅或概率,横轴表示时间。红色竖线表示信号到达时间,蓝色竖线表示P波到达时间,绿色和粉色虛線代表不同的概率曲线。
VLM 描述: 该图像是图表,展示了不同时间段内的地震波形(包括E、N、Z方向的幅度和概率)。图中分为四个部分(a到d),每部分展示了来自不同信号的响应,带有明显的P波和S波标记。还给出了波到达时间的概率分布。
6.1.9. 阈值敏感性
PhaseNet输出的是介于[0, 1]之间的概率分布,拾取阈值(本文中设为0.5)仅用于判断是否为有效拾取,而不会系统性地影响拾取时间(拾取时间取决于概率分布的峰值)。这与STA/LTA方法形成对比,后者对阈值敏感,过高的阈值可能导致拾取时间延迟。
6.2. 数据呈现 (表格)
以下是原文 Table 1 的结果,详细展示了 PhaseNet 与 AR picker 在测试数据集上的性能比较:
| Evaluation indicator | Phase | PhaseNet | AR picker |
| Precision | P | 0.939 | 0.558 |
| S | 0.853 | 0.195 | |
| Recall | P | 0.857 | 0.558 |
| S | 0.755 | 0.144 | |
| F1 score | P | 0.896 | 0.558 |
| S | 0.801 | 0.165 | |
| µ(∆t)(ms) | P | 2.068 | 11.647 |
| S | 3.311 | 27.496 | |
| σ(∆t)(ms) | P | 51.530 | 83.991 |
| S | 82.858 | 181.027 |
6.3. 消融实验/参数分析
论文中没有进行典型的、全面的组件消融实验(如去除某个模块并比较性能),但通过以下方式间接验证了模型的某些设计选择或学习能力:
-
跳跃连接 (Skip Connection) 对特征表示的影响:
- 作者训练了另一个没有跳跃连接的模型。这个修改强迫所有信息都必须通过最深层。
- 随后,对这个修改后模型的最深层神经元的权重进行了主成分分析 (
PCA)。 PCA可视化结果 (Figure 12) 显示, 波、 波和噪声对应的凝聚向量能够清晰地聚类到不同的区域。- 分析: 这间接证明了
PhaseNet即使在信息路径受限的情况下,也能够学习到区分不同地震相位的核心特征,并将高维原始波形中的知识凝练为低维的神经权重。跳跃连接在U-Net架构中通常用于保留空间信息和加速收敛,虽然这里没有直接的性能对比,但PCA结果支持了网络特征学习的有效性。
-
阈值选择对拾取性能的影响:
- 论文提到,在评估中将概率峰值高于
0.5计为正拾取。作者指出,调整此阈值可以进一步改善性能,但效果不显著。 - 分析: 这表明
PhaseNet预测的概率分布本身是高质量的,对阈值选择的敏感度较低。与STA/LTA方法不同,PhaseNet的阈值仅用于判断是否报告拾取,而不会系统性地影响拾取时间,因为精确的到达时间是从概率分布的峰值中提取的。
- 论文提到,在评估中将概率峰值高于
7. 总结与思考
7.1. 结论总结
本论文成功开发并验证了 PhaseNet,一种基于深度神经网络的地震 波和 波到达时间自动拾取方法。该方法利用 U-Net 架构的变体,直接从三分量原始地震波形数据中学习特征,并输出 波、 波和噪声的概率分布。通过在北加州地震数据中心的大规模数据集上进行训练和测试,PhaseNet 展现出显著优于传统 AR picker 方法的性能,尤其在最具挑战性的 波拾取方面取得了突破性进展。其高准确率、高召回率以及对不同仪器类型、低 SNR 和削波波形的鲁棒性,证明了深度学习在地震学应用中的巨大潜力。PhaseNet 的能力有望大幅增加高质量 波观测数量,从而改进地震定位精度,发展更精确的剪切波速度模型,并支持未来对连续数据进行地震检测和相位关联。
7.2. 局限性与未来工作
- 连续数据检测的局限: 尽管
PhaseNet能够生成连续的 和 概率序列,并显示出用于地震检测的潜力,但当前模型主要在已知地震波形的数据集上进行训练,旨在准确拾取相位。若要将其直接应用于连续数据进行地震检测,需要一个包含更多非地震信号(如各种环境噪声、人为干扰)的新数据集进行训练,以使其学习区分这些“噪声尖峰”和真正的地震相位。 - 其他相位的应用: 作者指出,
PhaseNet的框架具有通用性,可以扩展应用于拾取其他类型的地震相位,前提是存在相应的、由分析师标注的训练数据集。 - 进一步的对比测试: 论文虽然与
AR picker进行了对比,但也承认仍需针对其他现有先进方法进行更广泛的测试和比较,以全面评估PhaseNet的相对优势。
7.3. 个人启发与批判
7.3.1. 个人启发
- 深度学习的力量: 这篇论文再次展示了深度学习在复杂时间序列分析中的强大能力,尤其是其自动特征学习的优势。在地震学这类拥有大量标注但波形高度复杂的领域,深度学习能够有效克服传统手动特征工程的瓶颈,实现“超人”性能。
- 数据驱动的价值: 大规模、高质量的标注数据集 (
analyst-labelled data) 是深度学习成功的基石。地震学领域多年积累的地震目录和波形数据为这种数据驱动的范式创新提供了得天独厚的条件。 U-Net架构的泛化性:U-Net作为一种在图像分割领域表现卓越的架构,经过适当改造后,能够成功应用于一维时间序列的“定位”任务(即识别特定事件的起始点),这表明其编码器-解码器和跳跃连接的设计理念具有很强的普适性。- 概率输出的优势: 输出概率分布而非单一阈值触发,为地震检测和相位关联提供了更丰富、更可靠的信息,且其峰值作为到达时间,不受阈值设置的系统性偏差影响,提高了结果的鲁棒性。
7.3.2. 批判与潜在改进
- 泛化能力限制:
- 地理区域: 模型主要在北加州地震数据上训练和测试。北加州具有特定的地质构造和地震活动特征。
PhaseNet在其他地质环境(如火山区、俯冲带、大陆裂谷)或不同类型地震事件(如冰川地震、诱发地震)下的泛化能力可能需要进一步验证。 - 事件类型: 模型主要训练于常规构造地震。对于一些特殊地震(如慢地震、低频地震),其波形特征可能与训练数据有显著差异,
PhaseNet的性能可能下降。
- 地理区域: 模型主要在北加州地震数据上训练和测试。北加州具有特定的地质构造和地震活动特征。
- 计算效率与实时性: 论文虽然提到可以应用于连续数据,但未详细讨论在处理大规模连续数据流时的计算资源消耗和实时性挑战。部署在实际地震台网中可能需要考虑硬件加速或模型剪枝/量化等优化策略。
- 缺乏不确定性量化: 尽管
PhaseNet输出了概率分布,但这些概率通常是点估计,不直接提供拾取时间的置信区间或不确定性度量。在地震定位等对精度要求高的应用中,能够量化拾取不确定性将非常有价值(例如,通过贝叶斯深度学习方法)。 - 数据偏差与噪声标签: 分析师手动拾取虽然是“地面真值”,但也可能包含其主观偏差甚至错误(如 Figure 11 所示)。虽然
PhaseNet通过高斯分布掩码减轻了这种影响,但如果训练数据中存在大量系统性的人工偏差,模型仍可能学习到这些偏差。 - 可解释性: 深度神经网络通常被认为是“黑箱”模型。尽管
PCA可视化显示了深层特征的聚类能力,但其内部如何理解地震波物理特征并做出判断,仍有待更深入的解释性研究。 - 无监督/半监督学习的潜力: 尽管现有大量标注数据,但无标签的连续地震波形数据更为庞大。未来的工作可以探索结合无监督预训练或半监督学习方法,以进一步提升性能或减少对昂贵手动标注数据的依赖。
- 多相位的联合拾取与关联: 论文主要关注 和 波。未来的方法可以考虑开发能够同时拾取和关联更多地震相位(如
Lg、Pg、Sn等)的模型,从而构建更完整的地震事件描述。
相似论文推荐
基于向量语义检索推荐的相关论文。