Graph Segmentation and Contrastive Enhanced Explainer for Graph Neural Networks
TL;DR 精炼摘要
本文提出了一种新颖的图神经网络(GNN)解释器,结合图分割与对比学习。通过将输入图分割为解释性和冗余子图,并进行边扰动以生成正负例,该方法有效增强了解释的忠实度,在图分类和节点分类任务中显示出优越的性能。
摘要
Graph Segmentation and Contrastive Enhanced Explainer for Graph Neural Networks Zhiqiang Wang, Jiayu Guo, Jianqing Liang * , Jiye Liang, Shiying Cheng, Jiarong Zhang Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education, School of Computer and Information Technology, Shanxi University, Taiyuan 030006, Shanxi, China wangzq@sxu.edu.cn, guojiayu0618@foxmail.com, { liangjq, ljy } @sxu.edu.cn, { 202322404006, 202222404033 } @email.sxu.edu.cn Abstract Graph Neural Networks are powerful tools for modeling graph-structured data but their interpretability remains a sig- nificant challenge. Existing model-agnostic GNN explainers aim to identify critical subgraphs or node features relevant to task predictions but often rely on GNN predictions …
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
Graph Segmentation and Contrastive Enhanced Explainer for Graph Neural Networks
中文标题:图神经网络的图分割与对比增强解释器
1.2. 作者
Zhiqiang Wang, Jiayu Guo, Jianqing Liang, Jiye Liang, Shiying Cheng, Jiarong Zhang
隶属机构: Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education, School of Computer and Information Technology, Shanxi University, Taiyuan 030006, Shanxi, China
1.3. 发表期刊/会议
论文未明确指出具体的发表期刊或会议名称,但从行文风格和引用格式来看,其结构符合学术会议或期刊论文的规范。
1.4. 发表年份
2025年4月11日 (根据提供的 UTC 发布时间 2025-04-11T00:00:00.000Z)
1.5. 摘要
图神经网络 (Graph Neural Networks, GNNs) 是对图结构数据进行建模的强大工具,但其可解释性 (interpretability) 仍然是一个重大挑战。现有的模型无关 (model-agnostic) GNN 解释器旨在识别与任务预测相关的关键子图 (subgraphs) 或节点特征 (node features),但它们通常依赖 GNN 的预测作为监督信号,这导致缺乏真实标注数据 (ground-truth explanations)。这种局限性可能引入偏差 (biases),导致解释无法准确反映 GNN 的决策过程。
为了解决这个问题,本文提出了一种新颖的 GNN 解释器,结合了图分割 (graph segmentation) 和对比学习 (contrastive learning)。该模型引入了一个图分割学习模块,将输入图分割为解释性子图 (explanatory subgraphs) 和冗余子图 (redundant subgraphs)。接下来,通过边扰动 (edge perturbation) 对这些子图进行数据增强 (augment),生成多个正例 (positive pairs) 和负例 (negative pairs),用于解释性子图和冗余子图之间的对比学习。最后,开发了一个对比学习模块,通过拉近具有相同解释性子图的正例对,同时推远具有不同解释性子图的负例对,来指导解释性子图和冗余子图的学习。这种方法能够更清晰地区分关键子图,增强了解释的忠实度 (fidelity)。本文在图分类 (graph classification) 和节点分类 (node classification) 任务上进行了广泛实验,验证了所提方法的有效性。
1.6. 原文链接
/files/papers/6926f38783c593e836d1a86a/paper.pdf
发布状态: 根据提供的发布时间为未来日期,该论文目前应处于预印本 (pre-print) 或即将发表状态。
2. 整体概括
2.1. 研究背景与动机
核心问题: 图神经网络 (GNNs) 在处理图结构数据方面表现出色,但在许多关键应用中,GNNs 的决策过程缺乏透明度和可解释性,这严重阻碍了它们的广泛采用。现有的 GNN 解释器,特别是模型无关 (model-agnostic) 的方法,通常通过识别对预测结果至关重要的子图或节点特征来提供解释。
问题的重要性与现有挑战: 解释 GNN 的决策对提高其在医疗诊断、金融风控等敏感领域的信任度和可靠性至关重要。然而,当前的模型无关解释器面临一个核心挑战:它们往往依赖 GNN 的预测结果作为监督信号来生成解释。这意味着它们在训练过程中没有真实的、人类可理解的决策依据(即真实标注数据 (ground-truth explanations))来指导学习。
具体挑战或空白 (Gap): 这种对 GNN 预测的依赖可能引入偏差。例如,如果训练数据中存在某种统计关联而非真正的因果关系(如分子结构中碳环和硝基团的共现),解释器可能会过度依赖这种关联,从而生成“貌似合理”但未能准确反映 GNN 真实决策机制的解释。这导致解释结果可能与 GNN 的预测保持一致,但无法真正揭示模型做出特定决策的原因。
论文的切入点/创新思路: 为了解决缺乏真实标注数据导致解释偏差的问题,本文引入了“冗余子图 (redundant subgraphs)”的概念,并设计了一种新颖的数据增强 (data augmentation) 方法。其核心思想是利用对比学习 (contrastive learning) 来生成自监督信号:扰动解释性子图会显著改变模型预测,而扰动冗余子图则不会。通过比较这两种扰动对模型预测的影响,模型可以学习区分真正重要的决策依据。
2.2. 核心贡献/主要发现
本文提出了 GSCExplainer,一个结合图分割 (graph segmentation) 和对比学习 (contrastive learning) 的 GNN 解释器,其主要贡献如下:
- 提出集成图分割与对比学习的解释器: 论文提出了一种新颖的 GNN 解释器框架,通过将输入图分割为解释性子图 (explanatory subgraphs) 和冗余子图 (redundant subgraphs),并结合对比学习来增强对重要子图和非重要子图的区分能力,从而提高了解释的忠实度 (fidelity)。
- 开发鲁棒的数据增强和对比学习框架: 设计了一个通过扰动冗余子图和解释性子图来生成正例 (positive examples) 和负例 (negative examples) 的数据增强机制,并结合对比损失 (contrastive losses) 有效地区分关键子图之间的差异。这为子图学习提供了超越简单 GNN 预测的额外自监督信号。
- 在多任务上验证方法有效性: 通过在图分类 (graph classification) 和节点分类 (node classification) 任务上进行全面的实验,证明了所提方法能够显著提高预测准确性,验证了其有效性。
3. 预备知识与相关工作
本节旨在为读者提供理解本文方法所需的基础概念和相关研究背景。
3.1. 基础概念
- 图神经网络 (Graph Neural Networks, GNNs): 是一类设计用于处理图结构数据的深度学习模型。它们通过在图的节点及其邻居之间传递和聚合信息来学习节点、边或整个图的表示 (representation)。GNNs 在社交网络分析、推荐系统、分子结构预测等领域取得了巨大成功。
- 可解释性 (Interpretability): 指的是模型决策过程的透明度和可理解性。对于 GNNs 而言,可解释性意味着能够理解模型为什么会做出某个特定预测,例如识别出图中哪些节点、边或子结构对最终预测结果起到了关键作用。
- GNN 解释器 (GNN Explainers): 专门用于揭示 GNNs 决策机制的工具或方法。它们通常旨在识别对模型预测有贡献的关键子图、节点或特征。
- 模型无关 (Model-Agnostic): 一种解释器类型,意味着它可以在不访问目标 GNN 内部参数或结构的情况下工作,仅通过观察 GNN 的输入-输出行为来生成解释。这使其具有很强的通用性,适用于各种 GNN 架构。
- 模型特定 (Model-Specific): 另一种解释器类型,它需要访问目标 GNN 的内部结构(例如权重、激活值或梯度)来生成解释。
- 子图 (Subgraph): 图的一部分,由原图中的一些节点和连接这些节点的边组成。在 GNN 解释中,通常指对模型预测起关键作用的局部结构。
- 图分割 (Graph Segmentation): 将一个大图划分为若干个子图的过程。在本文中,特指将输入图划分为对预测重要的
解释性子图 (explanatory subgraph)和不重要的冗余子图 (redundant subgraph)。 - 对比学习 (Contrastive Learning): 一种自监督学习范式,通过构建“正例对 (positive pairs)”和“负例对 (negative pairs)”来学习数据的表示。正例对是相似或相关的样本,负例对是不相似或不相关的样本。对比学习的目标是让模型学习到的表示能够拉近正例对,同时推远负例对。在本文中,它用于区分解释性子图和冗余子图。
- 边扰动 (Edge Perturbation): 一种数据增强技术,通过随机地添加、删除或修改图中的边来改变图的结构。在本文中,用于生成对比学习中的正负样本。
- 真实标注数据 (Ground-Truth Explanations): 指的是那些经过专家验证或通过明确的因果关系得出的、真正描述模型决策原因的解释。在许多实际的图学习任务中,这种真实的解释往往是稀缺的。
3.2. 前人工作
本文将现有的可解释 GNN 方法分为两大类:模型特定方法 (model-specific methods) 和 模型无关方法 (model-agnostic methods)。
3.2.1. 模型特定方法
这类方法利用 GNN 的内部参数或特征表示来确定节点、边或特征的重要性。
- 梯度基方法 (Gradient-based methods): 通过计算输入特征相对于目标预测的梯度来评估特征重要性。
SA (Baldassarre and Azizpour 2019):计算平方梯度值作为重要性分数,反映输入-输出敏感性,但存在饱和问题。BP (Baldassarre and Azizpour 2019):在SA基础上改进,忽略负梯度。CAM (Pope et al. 2019)和Grad-CAM:将特征重要性映射到输入空间,但主要限于图分类任务。
- 扰动基方法 (Perturbation-based methods): 生成掩码来表示边或特征的重要性。
PGExplainer (Luo et al. 2020):使用基于节点嵌入的参数化边掩码预测器,通过最大化原始预测和修改后预测之间的互信息来优化预测器。GraphMask (Schlichtkrull, De Cao, and Titov 2021):为每个隐藏层生成边掩码,提供对 GNN 的全面理解。
- 分解基方法 (Decomposition-based methods): 使用反向传播将层分解回输入空间,推导出特征重要性。
-
LRP (Schlichtkrull, De Cao, and Titov 2021):将LRP适应于深度图模型,侧重于节点重要性。 -
GNNLRP (Schwarzenberg et al. 2019):评估图游走 (graph walks) 的重要性,但计算复杂度高。模型特定方法的优点是提供可信的解释,但缺点是通常需要预先了解 GNN 的内部配置。
-
3.2.2. 模型无关方法
这类方法根据 GNN 的输入和输出提供解释,不依赖于 GNN 的内部工作机制,因此具有更广泛的适用性。
- 扰动基方法 (Perturbation-based methods): 生成掩码以表示边、节点或特征的重要性,而无需了解模型结构。
GNNExplainer (Ying et al. 2019):通过最大化原始图和修改图上预测之间的互信息来优化掩码,以识别基本子图。SubgraphX (Yuan et al. 2021):使用蒙特卡洛树搜索 (Monte Carlo Tree Search, MCTS) 探索各种子图结构,并应用 Shapley 值评估其重要性,最终识别最优子图作为解释。
- 代理基方法 (Surrogate-based methods): 使用更简单、更可解释的模型来近似复杂的 GNN 预测。
GraphLIME (Huang et al. 2022):将LIME (Ribeiro, Singh, and Guestrin 2016)扩展到图,使用HSIC Lasso (Yamada et al. 2018)选择重要特征。PGM-Explainer (Vu and Thai 2020):构建概率图模型来解释 GNNs,但忽略了重要的拓扑信息。
- 因果基方法 (Causal-based methods): 使用因果推断来解释 GNNs。
-
:使用 Granger 因果关系 (Granger causality) 识别最重要的边。
-
OrphicX (Lin et al. 2022):采用因果图和基于信息流的指标来阐明预测。 -
:引入必要性概率 (Probability of Necessity, PN) 和充分性概率 (Probability of Sufficiency, PS) 等指标来平衡事实 (factual) 和反事实 (counterfactual) 推理。
模型无关方法的优点是灵活性强,适用范围广,即使 GNN 模型发生变化也能有效工作。
-
3.3. 技术演进
GNN 可解释性技术从最初的梯度和扰动方法(关注局部特征的重要性)逐步发展到更复杂的子图和因果推理方法。早期方法如 SA 和 GNNExplainer 主要集中在识别单个节点、边或特征的重要性。随着研究深入,人们意识到孤立的特征可能无法全面解释 GNN 的决策,因此出现了识别关键子图的方法,如 SubgraphX。更进一步,为了解决“相关性不等于因果性”的问题,研究引入了因果推断的概念,如 Gem 和 OrphicX,旨在揭示更深层次的因果关系。 则尝试在事实和反事实推理之间取得平衡,以提供更全面的解释。
3.4. 差异化分析
本文提出的 GSCExplainer 与上述现有工作相比,核心创新点和区别在于:
- 解决“缺乏真实标注数据”问题: 许多模型无关解释器依赖 GNN 预测作为监督信号,当缺乏真实标注数据时,这可能导致解释产生偏差。
GSCExplainer并非直接依赖 GNN 预测,而是通过引入冗余子图和对比学习机制来生成自监督信号,从而避免了这种偏差。 - 图分割与对比学习的结合: 现有的方法可能专注于识别重要子图,但
GSCExplainer不仅识别重要解释性子图,还明确地定义和利用冗余子图。通过对这两种子图进行边扰动并进行对比学习,模型能够学习到两者之间的本质差异,即解释性子图对预测的不可或缺性。 - 自监督信号增强解释忠实度: 这种对比学习的方式提供了一种更强大的自监督信号,它强调了
解释性子图的“不可破坏性”——对其的微小扰动会导致预测的显著变化,而冗余子图则不然。这种内在机制有助于模型学习到更忠实于 GNN 决策过程的解释,而不仅仅是与预测结果相关的统计关联。
4. 方法论
本节将详细阐述 GSCExplainer 的方法原理及其核心组件。GSCExplainer 旨在通过图分割和对比学习来生成忠实于原始图的解释,同时充分利用图中的重要信息和冗余信息。
4.1. 方法原理
GSCExplainer 的核心思想是:一个图可以被分解为对预测任务至关重要的 解释性子图 (explanatory subgraph) 和不相关或不必要的 冗余子图 (redundant subgraph)。为了克服现有解释器缺乏真实标注数据 (ground-truth explanations) 导致的偏差,GSCExplainer 不直接依赖 GNN 预测进行监督,而是利用 对比学习 (contrastive learning) 生成自监督信号。
其直觉是:如果 解释性子图 被改变,GNN 的整体预测结果将显著变化;而如果 冗余子图 被改变,GNN 的预测结果则基本不变。基于这个直觉,模型通过 边扰动 (edge perturbation) 对这两种子图进行数据增强,创建出能够区分它们差异的正例和负例,并利用对比损失函数来指导学习,从而让模型能够识别出对 GNN 决策真正关键的子结构。
4.2. 核心方法详解
GSCExplainer 包含三个关键组件:图分割 (graph segmentation)、图对比 (graph contrastive) 和 学习损失 (learning loss)。
下图(原文 Figure 2)展示了 GSCExplainer 的整体框架:

该图像是示意图,展示了用于图神经网络(GNN)解释的过程。图中左侧的图经过可解释GNN处理后被划分为重要边(解释子图)和不重要边(冗余子图)。接着,通过多层感知机(MLP)将数据输入目标GNN,生成正例和负例。这一过程最终通过对比损失(Contrastive Loss)和预测损失(Predicted Loss)来优化学习。整体结构展示了GNN解释的步骤与目的。
Explalainset SG iv ca loss, it forms the final model loss.
4.2.1. 图分割 (Graph Segmentation)
图分割的目的是将输入图 分割成两个互不相交的子集:解释性子图 和 冗余子图 。其中, 包含对预测任务有贡献的节点和边,而 包含不相关或不必要的节点和边。
1. 选择图划分方法:
图划分通常指将大图划分为多个小图。根据划分方式,可以分为 边切 (edge-cut) 和 顶点切 (vertex-cut)。
-
边切将节点划分为子图,从而有效地划分边。 -
顶点切将边划分为子图,从而有效地划分节点。本文选择
边切方式,专注于边的重要性,以避免破坏图的完整性。下图(原文 Figure 3)直观展示了边切和顶点切的区别:
该图像是示意图,展示了输入图和两种不同的切割方式:边切(edge-cut)和顶点切(vertex-cut)。图中,通过红色虚线标示了节点 b 在边切和顶点切下的分布情况。
Figure 3: Edge Cut (left) and Vertex Cut (right)
2. 节点表示学习: 给定一个计算图 (在图分类任务中是整个图,在节点分类任务中是 跳邻域子图),首先使用一个三层图卷积网络 (GCN) 作为 GNN 编码器来获取节点表示:
其中:
-
是输入图。
-
表示经过训练的 GCN 编码器。
-
是节点表示矩阵,其中 是节点数量, 是表示维度。
每个 GCN 层计算如下:
其中:
- 是第 层的节点特征矩阵。 通常是原始节点特征。
- 是带有自环 (self-loops) 的归一化邻接矩阵 (normalized adjacency matrix)。
- ,其中 是原始邻接矩阵, 是单位矩阵,添加自环是为了让节点在聚合邻居信息时也能包含自身信息。
- 是 的度矩阵,其中 。
- 是第 层的可学习权重矩阵。
- 是激活函数(例如 ReLU)。
3. 边表示与重要性概率计算:
在获得每个节点的嵌入表示后,为了生成 解释性子图 的边嵌入,将每条边 (i, j) 两端节点的表示 和 进行拼接 (concatenate),然后输入到一个多层感知机 (MLP) 中,以生成边表示。最后,通过 sigmoid 函数 得到该边作为解释性子图一部分的概率 :
其中:
- 和 分别是节点 和节点 的表示。
[;]表示拼接操作。- 是得到的边表示。
- 是多层感知机,用于将拼接后的节点表示转换为边表示。
- 是 sigmoid 激活函数,将边表示映射到 (0, 1) 区间,表示边
(i, j)属于解释性子图的概率。
4. 子图划分:
根据计算出的边概率 ,将图中的所有边进行降序排序。选择概率最高的 条边形成 解释性子图 ,其余的边形成 冗余子图 。
其中:
- 是原始输入图。
- 和 分别是解释性子图和冗余子图。
- 和 是与 和 中的边相关联的节点集合。
- 是解释性子图的边集,包含概率最高的 条边。
- 是冗余子图的边集,包含剩余的边。
- 表示排序后第 条边。
- 是原始图的总边数。
5. 稀疏度控制:
参数 控制着 解释性子图 的稀疏度 (sparsity)。稀疏度定义为:
其中:
-
是解释性子图中的边数。
-
是原始图中的总边数。
选择合适的 值至关重要:过小的 可能导致解释性子图信息不足,而过大的 则可能使解释性子图与原始图过于相似,失去解释的意义。
4.2.2. 图对比 (Graph Contrastive)
图对比模块通过数据增强生成正负样本,以指导模型学习区分 解释性子图 和 冗余子图。
1. 数据增强策略:
本文采用 边扰动 (edge perturbation) 作为数据增强方法,这与区分解释性子图和冗余子图的目标相吻合。核心思想是:
- 扰动
解释性子图会显著影响图的语义和表示,进而影响 GNN 预测。 - 扰动
冗余子图对 GNN 预测的影响最小。 通过比较这种影响差异,可以增强解释的可信度。
2. 生成正负样本:
在 图分割 步骤后,我们得到了 解释性子图 和 冗余子图 。基于这些子图,生成正例和负例:
-
正例图 : 由
扰动后的冗余子图与未扰动的解释性子图组合而成。由于 未被扰动,且 的扰动对预测影响较小,因此 应该与原始图在预测方面保持高度相似性,可以视为一个“正例”。 -
负例图 : 由
扰动后的解释性子图与未扰动的冗余子图组合而成。由于 被扰动,这会显著改变图的语义,导致预测结果与原始图差异较大,因此 可以视为一个“负例”。形式化表示为:
其中, 是数据增强函数,通过随机移除一定比例的边来实现:
其中:
-
是边扰动比率 (edge perturbation ratio),表示每条边被保留的概率。
-
是伯努利随机变量,决定一条边是否保留。
在模型中,通常设置多个正例和负例。例如,正例的数量通常设置为 2,负例的数量 是一个超参数。
3. 图表示学习: 获得增强后的图 和 后,它们同样通过一个三层 GCN 编码器 获取节点表示,然后通过一个池化 (pooling) 操作(例如均值池化或求和池化)将节点表示聚合为图级表示。最后,一个 MLP 将池化后的表示处理成紧凑的最终图表示 和 :
其中:
- 是 GCN 编码器。
- 是池化操作,将节点表示聚合成图表示。
- 是多层感知机,用于进一步处理图表示。
4.2.3. 模型学习 (Model Learning)
模型的学习目标由一个综合损失函数构成,它结合了 有效性损失 (effectiveness loss) 和 对比损失 (contrastive loss),以确保解释性子图的可靠性和可解释性。
1. 有效性损失 (Effectiveness Loss):
为了验证 解释性子图 的有效性,引入了一个有效性损失函数,旨在使其分类结果与原始图的真实标签保持一致。这通过计算目标 GNN 在 解释性子图 上的预测结果与真实标签之间的交叉熵 (cross-entropy) 来实现:
其中:
-
是有效性损失。
-
是数据集中类别的数量。
-
表示一个特定的类别。
-
是一个指示变量 (indicator variable):如果类别 是计算图 的正确类别,则 ,否则 。
-
表示当
解释性子图输入到目标 GNN 后,被分类为类别 的概率。这个损失函数确保了
解释性子图能够保留足够的关键信息,使得目标 GNN 仍能做出正确的预测。
2. 对比损失 (Contrastive Loss): 为了有效地在相关和不相关子图元素之间进行区分,模型设计了一个对比损失:
其中:
-
表示每个计算图的对比损失。
-
和 表示来自同一个
解释性子图的两个不同正例图(通过对冗余子图不同的扰动生成)的图表示。 -
表示第 个负例图的图表示(通过对
解释性子图进行扰动生成)。 -
表示余弦相似度 (cosine similarity),用于衡量两个图表示之间的相似性。
-
代表负例的数量。
这个对比损失函数的目标是:拉近具有相同
解释性子图的正例对的表示,同时推远具有不同解释性子图(即扰动了解释性子图的负例)的负例对的表示。这引导模型学习区分关键子图与非关键子图的本质差异,从而提高解释的忠实度。
3. 总损失 (Total Loss):
总损失函数整合了 有效性损失 和 对比损失,以平衡解释的准确性和忠实度:
通过这些步骤,GSCExplainer 能够学习到更有效、更具泛化能力的解释性子图。在没有真实标注数据作为监督信息的情况下,这种结合图分割和对比学习的方法能够提供更丰富的自监督信号,有助于防止模型过拟合目标 GNN 的预测结果,并提高解释的泛化能力。
5. 实验设置
本节将详细介绍论文在验证 GSCExplainer 性能时所采用的数据集、评估指标和对比基线。
5.1. 数据集
实验使用了四种数据集,包括两种图分类任务数据集和两种节点分类任务数据集。
以下是原文 Table 1 的结果:
| Datasets | MUTAG | NCI1 | BA-Shapes | Tree-Cycles |
|---|---|---|---|---|
| #Graphs | 4337 | 4110 | 1 | 1 |
| #Nodes | 29 | 29 | 700 | 871 |
| #Edges | 32 | 32 | 1020 | 1950 |
| #Labels | 2 | 2 | 4 | 2 |
- 注意: 对于
MUTAG和NCI1,#Nodes和#Edges是每个图的平均值;对于BA-Shapes和Tree-Cycles,它们指的是单个图的总节点数和总边数。
-
MUTAG:
- 来源: 化学分子数据集 (Debnath et al. 1991)。
- 特点: 包含 4,337 个分子图,每个节点代表一个原子,每条边代表原子间的化学键。
- 任务: 图分类任务,根据分子对鼠伤寒沙门氏菌的致突变效应,将其分为致突变或非致突变两类 (#Labels = 2)。
- 选择原因: 经典的图分类数据集,常用于评估 GNN 模型和解释器的性能。
-
NCI1:
- 来源: 美国国家癌症研究所 (National Cancer Institute) 的化合物数据集 (Debnath et al. 1991)。
- 特点: 包含 4,110 个化合物实例,每个实例代表一个化合物分子。
- 任务: 图分类任务,基于化合物是否促进癌细胞生长进行分类 (#Labels = 2)。
- 选择原因: 与
MUTAG类似,是另一个广泛使用的图分类基准。
-
BA-Shapes:
- 来源: 合成数据集,由
GNNExplainer (Ying et al. 2019)构建。 - 特点: 包含一个大图 (#Graphs = 1),节点数 700,边数 1020。该图通过在 Barabasi-Albert (BA) 图上附加“房屋”结构图案生成。
- 任务: 节点分类任务,根据节点在“房屋”结构中的角色(顶部节点、中间节点、底部节点)或非房屋节点进行分类 (#Labels = 4)。
- 选择原因: 经典的节点分类数据集,尤其适用于评估解释器识别特定结构图案的能力。
- 来源: 合成数据集,由
-
Tree-Cycles:
-
来源: 合成数据集 (Ying et al. 2019)。
-
特点: 包含一个大图 (#Graphs = 1),节点数 871,边数 1950。
-
任务: 节点分类任务,节点标签指示该节点是否属于树结构中的循环 (#Labels = 2)。
-
选择原因: 与
BA-Shapes类似,用于测试解释器在识别图拓扑结构特征方面的能力。这些数据集的选择覆盖了图分类和节点分类这两种主要的图学习任务,且包含了真实世界分子数据和合成结构数据,能够全面验证所提方法的通用性和有效性。
-
5.2. 评估指标
论文采用了两个关键指标来评估实验结果:稀疏度 (Sparsity) 和 预测准确率 (Prediction Accuracy)。
-
稀疏度 (Sparsity):
- 概念定义: 稀疏度衡量的是解释性子图的大小。一个好的解释应该足够小(高稀疏度),以便人类理解,但又不能太小以至于丢失关键信息。稀疏度是评估解释器可解释性的重要指标。
- 数学公式:
- 符号解释:
- :解释性子图的稀疏度。
- :解释性子图中的边数。
- :原始图中的总边数。
-
预测准确率 (Prediction Accuracy, ):
- 概念定义: 预测准确率 (Explanation Accuracy) 衡量的是解释性子图在保持稀疏性的同时,能够保留原始图用于预测的关键信息的程度。它反映了 GNN 在原始图上的预测结果 () 与在解释性子图上的预测结果 () 之间的一致性。该值越高,说明解释性子图越能忠实地代表 GNN 的决策。
- 数学公式:
- 符号解释:
- :解释准确率。
- :目标 GNN 在原始图 上的预测结果。
- :目标 GNN 在解释性子图 上的预测结果。
- :计算原始图和解释性子图的预测结果相匹配的样本数量。
- :测试集中样本的总数量。
5.3. 对比基线
为了验证所提方法 GSCExplainer 的有效性,论文将其与四种现有的、具有代表性的 GNN 解释方法进行了比较。
-
OrphicX (Lin et al. 2022): 一种基于因果推理的模型无关解释方法。它通过构建生成模型来学习潜在的因果关系,从而解释 GNN 的预测。
-
GNNExplainer (Ying et al. 2019): GNN 解释领域的一个经典模型无关方法。它通过优化一个掩码 (mask) 来识别对特定实例预测至关重要的子图或特征。
-
PGExplainer (Luo et al. 2020): 一种模型特定方法,它引入了一个参数化的预测器来学习生成边掩码,以解释 GNN 的预测。它能够对多个实例进行解释。
-
Gem (Lin, Lan, and Li 2021): 另一种模型无关的因果推理方法。它利用 Granger 因果关系来识别对 GNN 预测最重要的边。与
GNNExplainer类似,Gem训练后也能解释多个实例。这些对比基线涵盖了模型特定和模型无关解释方法的不同范式(如优化掩码、因果推理、参数化模型),使得
GSCExplainer的评估结果具有较强的说服力。
6. 实验结果与分析
本节将详细分析 GSCExplainer 在图分类和节点分类任务上的实验结果,包括与基线的性能比较、消融实验以及参数分析。
6.1. 核心结果分析
论文通过在 MUTAG、NCI1(图分类)和 BA-Shapes、Tree-Cycles(节点分类)数据集上,对不同稀疏度(通过边比率或边数量控制)下的 预测准确率 (acc_exp) 进行比较,来评估 GSCExplainer 的性能。
以下是原文 Table 2 的结果:
| Methods | MUTAG | NCI1 | ||||||
| Edge Ratio | Edge Ratio | |||||||
| 0.5 | 0.6 | 0.7 | 0.8 0.9 | 0.5 | 0.6 | 0.7 | 0.8 0.9 | |
| Orphicx | 71.4 | 71.2 77.2 | 78.8 | 83.2 | 66.9 | 72.7 | 77.1 | 81.3 85.4 |
| TGem | 666.4 67.7 | 71.4 | 76.5 | 81.8 | 61.8 | 68.6 | 70.6 74.9 | 83.9 |
| GNNExplainer | 65.0 6.6 | 6.4 | 71.0 | 788.3 | 644.2 | 65.7 | 68.6 75.2 | 81.8 |
| Expliner | 59.3 58.9 | 65.1 | 70.3 | 74.7 | 57.7 | 60.8 | 665.2 69.3 | 71.0 |
| GSCplainer | 75.1 78.4 | 81.1 | 83.8 | 87.2 | 70.6 | 73.5 | 78.1 8211 | 84.5 |
以下是原文 Table 3 的结果:
| Methods | BA-SHAPES | TREE-CYCLES | ||||||||
| # of Edges | # of Edges | |||||||||
| 5 | 6 | 7 | 8 | 9 | 6 | 7 | 8 | 9 | 10 | |
| Orphicx | 82.4 | 97.1 | 97.1 | 97.1 | 100 | 85.7 | 91.4 | 100 | 100 | 100 |
| ThGem | 664.7 | 94.1 | 91.2 | 91.2 | 91.2 | 74.3 | 8.6 | 100 | 100 | 10 0 |
| GNNEexplainer | 67.6 | 67.6 | 82.4 | 88.2 | 853 | 20.0 | 54.3 | 74.3 | 888.6 | 97.1 |
| Eepliner | 9.5 | 559.5 | 59.5 | 9.5 | 64.3 | 6.2 | 81.5 | 91.3 | 954 | 97.1 |
| GSCExplainer | 94.1 | 95.6 | 98.6 | 997.1 | 98.6 | 100 | 100 | 100 | 100 | 100 |
主要发现:
-
图分类任务 (MUTAG, NCI1):
- 在
MUTAG和NCI1数据集上,GSCExplainer在所有边比率 (Edge Ratio)(稀疏度)设置下,其预测准确率几乎都超过了所有对比方法。 - 在
MUTAG数据集上,GSCExplainer的平均表现比次优方法OrphicX高出超过 4 个百分点,这表明其在分子图分类任务中识别关键子结构的能力更强。 - 这些结果证明了
GSCExplainer在处理图分类任务时的优越性,尤其是在需要精细识别关键子图来保持预测一致性时。
- 在
-
节点分类任务 (BA-Shapes, Tree-Cycles):
-
在
BA-Shapes数据集上,GSCExplainer在大多数边数量设置下表现优异。例如,当边数量为 5 和 6 时,GSCExplainer分别达到了 94.1% 和 95.6% 的准确率,远超其他基线。 -
在
Tree-Cycles数据集上,GSCExplainer更是实现了所有稀疏度设置下的 100% 预测准确率,显著优于次优方法OrphicX。这尤其令人印象深刻,因为Tree-Cycles任务要求解释器能够准确识别节点是否属于循环结构,这需要对图的拓扑信息有深刻理解。总结: 综合来看,
GSCExplainer在图分类和节点分类任务上都展现出了强大的性能,其解释性子图能够更忠实地保留原始 GNN 的预测决策信息。这验证了将图分割与对比学习结合来生成自监督信号的有效性。
-
6.2. 消融实验/参数分析
6.2.1. 消融实验 (Ablation Study)
为了验证 图对比学习 (Graph Contrastive Learning, GCL) 模块对 GSCExplainer 性能的贡献,论文进行了消融实验,比较了完整模型与移除 GCL 模块后的模型 (-GCL) 的性能。
以下是原文 Table 4 的结果:
| Methods | MUTAG | NCI1 | ||||||
| Edge Ratio | Edge Ratio | |||||||
| 0.5 | 0.6 | 0.7 | 0.8 0.9 | 0.5 | 0.6 | 0.7 | 0.8 0.9 | |
| GSCExplainer | 75.1 668.2 | 78.4 72.8 | 81.1 73.5 | 83.8 76.0 | 87.2 82.8 | 70.6 73.5 65.4 63.3 | 78.1 65.7 | 82.1 84.5 74.8 73.8 |
注: Table 4 的 GSCExplainer 行数据似乎包含了两行数字,推测第一行是完整模型的结果,第二行是 -GCL 的结果。鉴于原文的排版,我将 GSCExplainer -GCL 视为一行数据,并分析其对性能的影响。具体来看,应该是:
GSCExplainer 行:75.1, 78.4, 81.1, 83.8, 87.2 (MUTAG); 70.6, 73.5, 78.1, 82.1, 84.5 (NCI1)
-GCL 行:66.8, 72.8, 73.5, 76.0, 82.8 (MUTAG); 65.4, 63.3, 65.7, 74.8, 73.8 (NCI1)
以下是原文 Table 5 的结果:
| Methods | BA-SHAPES | TREE-CYCLES | ||||||||
| # of edges | # of edges | |||||||||
| 5 | 6 | 7 | 8 | 9 | 6 | 7 | 8 | 9 | 10 | |
| GSCExplainer GCL | 94.1 95.6 98.6 97.1 63.2 63.2 94.1 92.7 94.1 100 | 98.6 100 | 100 100 100 100 100 100 | 100 | 100 | |||||
注: Table 5 的 GSCExplainer GCL 行数据同样存在排版问题,但从文字描述来看,GSCExplainer GCL 应该是指完整模型,并与移除 GCL 的模型进行比较。鉴于原文的文字描述,我将专注于文字描述中的关键对比信息。
消融实验结果分析:
- 显著性能下降: 移除
GCL模块后,GSCExplainer的预测准确率出现显著下降。在MUTAG和NCI1图分类数据集上,准确率分别下降了 6.4 和 9.1 个百分点。在NCI1数据集上,下降幅度甚至超过了 10 个百分点。 - 节点分类任务上的影响: 在
BA-Shapes节点分类数据集上,尤其是在解释性子图边数较少(如 5 或 6 条边)时,GCL的积极影响更为明显。 - GCL 的关键作用: 这些结果强调了
GCL在GSCExplainer中的关键作用。通过对比解释性子图和冗余子图的差异,GCL为子图学习提供了丰富的自监督信息,超越了简单依赖 GNN 预测的监督信号。这种对比损失引导模型识别更有效的解释性子图。 - 稀疏解释的重要性: 当
解释性子图稀疏度高(即包含的边更少)时,GCL生成的数据增强正负样本变得尤为重要,为准确解释提供了更丰富、更具指导性的训练数据。
6.2.2. 参数分析
论文分析了两个关键超参数对图分类数据集性能的影响:边扰动比率 (edge perturbation ratio) 和 负样本数量 (number of negative samples) 。
1. 边扰动比率 :
下图(原文 Figure 4)展示了 对 MUTAG 和 NCI1 的影响:

该图像是图表,展示了不同 eta 值对 MUTAG 和 NCI1 数据集准确率的影响。在图 (a) 中,MUTAG 数据集的准确率随着 eta 值的变化呈现出不规则波动,而在图 (b) 中,NCI1 数据集的准确率则表现出更连续的上升趋势。
Figure 4: The impact of on MUTAG and NCI1.
- 概念: 决定了数据增强过程中移除边的比例。
- 影响: 随着 的增加,图对比学习任务变得更具挑战性,这通常可以提高训练效果。然而,过高的 可能会破坏关键的图语义信息(如结构信息),因此找到一个最优的 至关重要。
- 观察:
Figure 4显示模型解释效果随 值变化而变化,存在一个最优的 值。随着稀疏度的增加,最优的 值也随之增加,这意味着在构建更稀疏的解释时,需要移除更多的边才能产生有意义的扰动。但如果移除过多,解释性子图可能变得过小而失去效用。
2. 负样本数量 :
下图(原文 Figure 5)展示了 对 MUTAG 和 NCI1 的影响:

该图像是图表,展示了 对 MUTAG 和 NCI1 数据集准确率的影响。从图中可以看出,随着 值的变化,不同参数设置的准确率存在显著差异,MUTAG 和 NCI1 的趋势变化也各具特点。
Figure 5: The impact of on MUTAG and NCI1.
- 概念: 表示图对比学习中负样本的数量。
- 影响:
Figure 5显示,当 为 6 或 10 时,模型能达到最佳的预测准确率。 - 观察:
- 负样本过多: 如果负样本过多,模型可能会过度强调与负样本之间的差异,而这些负样本是通过扰动
解释性子图生成的。这可能导致模型过度关注不重要的细节,从而产生较差的解释。 - 负样本过少: 如果负样本过少,模型将难以有效区分
解释性子图和冗余子图,从而降低解释质量。
- 负样本过多: 如果负样本过多,模型可能会过度强调与负样本之间的差异,而这些负样本是通过扰动
- 结论: 选择适当数量的负样本对于提高模型的可解释性至关重要。
6.2.3. 案例研究 (Case Study)
下图(原文 Figure 6)展示了图实例的视觉解释:

该图像是一个插图,展示了不同稀疏度下的输入图的视觉解释。图中包含两个输入图示例,分别标记为1和2,展示了当稀疏度为0.5到0.9时图的变化情况。
Figure 6: Visual Explanations of Graph Instances
Figure 6展示了MUTAG数据集中两个图实例的视觉解释。- 通过观察原始图和
GSCExplainer在不同稀疏度(0.5 到 0.9)下生成的解释性子图(图中以深色节点和边突出显示),可以看出模型有效地识别了原始图中最关键的部分(图中以浅蓝色突出显示)。 - 值得注意的是,在不同稀疏度下生成的
解释性子图之间存在共同性,这符合逻辑:对于同一个原始图,不同稀疏度下的解释性子图应该有重叠部分,而不是完全互斥,这表明模型捕捉到了核心的解释结构。
7. 总结与思考
7.1. 结论总结
本文提出了 GSCExplainer,一种新颖的图神经网络解释器,它巧妙地整合了图分割 (graph segmentation) 和对比学习 (contrastive learning) 机制。该方法的核心在于解决现有模型无关 GNN 解释器因缺乏真实标注数据 (ground-truth explanations) 而引入偏差的问题。通过将输入图精确地划分为对预测决策至关重要的 解释性子图 和相对不重要的 冗余子图,GSCExplainer 能够有效地隔离关键信息并减少噪声干扰。
引入的对比学习模块利用 边扰动 对这两种子图进行数据增强,生成了丰富的正负样本对。通过最小化具有相同 解释性子图 的正例对的表示距离,并最大化与 解释性子图 不同的负例对的表示距离,模型获得了强大的自监督信号。这使得模型能够学习到对 GNN 决策过程更忠实的解释,而非仅仅是表面的统计关联。
在图分类和节点分类任务上的广泛实验证明了 GSCExplainer 的卓越性能,其在预测准确率方面显著优于多个最先进的基线方法。消融实验也明确证实了对比学习模块对于模型效果的关键贡献。
7.2. 局限性与未来工作
论文作者指出,未来的工作将探索 解释性子图 的大小和稀疏度与图分割和对比学习之间更深层次的关系,以进一步增强框架的可解释性。这暗示了当前方法可能仍需在以下方面进行优化:
- 稀疏度选择的敏感性: 论文中提到了 值(控制稀疏度)的选择很关键,过大或过小都会影响解释效果。目前 值可能仍依赖于经验设置或超参数调优。未来可以探索自适应或动态地确定最佳稀疏度的方法。
- 扰动策略的鲁棒性:
边扰动是一种相对简单的增强策略。虽然有效,但可能未能捕捉到更复杂的图结构变化对 GNN 决策的影响。未来可以研究更复杂的、考虑结构语义的扰动方式。 - 计算效率: 虽然论文未直接讨论计算效率,但图分割、数据增强和对比学习可能引入额外的计算开销,尤其是在处理大规模图时。优化这些步骤的效率将是重要的研究方向。
- 泛化到更广泛的 GNN 任务: 当前实验主要集中在分类任务。将解释器泛化到回归、链接预测等其他 GNN 任务中,并评估其性能,也是一个值得探索的方向。
7.3. 个人启发与批判
- 自监督解释范式: 本文最主要的启发在于其提出的自监督解释范式。在缺乏真实标注数据 (ground-truth explanations) 的场景下,通过巧妙地设计任务(区分解释性子图和冗余子图),并利用对比学习生成强烈的自监督信号,为 GNN 解释提供了一个非常有效的替代方案。这种思路不仅限于 GNN,对于其他同样面临解释真实标注数据稀缺的复杂模型,也具有借鉴意义。
- 冗余子图的价值: 明确定义并利用
冗余子图是一个简洁而强大的想法。传统解释器可能只关注“什么是重要的”,而GSCExplainer通过同时考虑“什么是不重要的”来增强对比,从而更清晰地界定“重要性”。这种负面信息 (negative information) 的利用,在信息论和机器学习中常被证明是有效的。 - 可视化解释的潜力: 论文中的案例研究通过可视化展示了
解释性子图,这对于非专业用户理解 GNN 决策非常有帮助。未来可以将这种可视化能力进一步提升,例如,不仅突出关键结构,还能解释这些结构是如何导致特定预测的,甚至提供反事实 (counterfactual) 解释。 - 潜在问题与改进:
- MLP 的能力限制: 在图分割阶段,将两个节点表示拼接后输入 MLP 来预测边重要性,这种方法可能在捕捉复杂高阶拓扑结构方面存在局限性。如果关键解释不是简单的“边连接”关系,而是更复杂的“结构模式”,MLP 可能难以有效识别。可以考虑引入更复杂的边特征学习或图结构感知模块。
- 扰动参数的敏感性: 论文的参数分析显示 \alpha$$ 和
负样本数量对模型性能有显著影响。这意味着在实际应用中,用户需要仔细调整这些超参数以获得最佳解释,这可能增加使用难度。研究自适应的参数调整策略或更鲁棒的扰动方法将是改进方向。 - GNN 编码器的选择: 论文中使用 GCN 作为编码器,但 GNN 家族中存在多种架构(如 GAT、GraphSAGE 等),它们在处理不同图结构时有不同的优势。
GSCExplainer是否对不同的 GNN 编码器都具有鲁棒性,以及如何针对特定 GNN 架构优化解释器,是值得探讨的问题。 - 解释的忠实度与可信度: 尽管
acc_exp衡量了忠实度,但一个高忠实度的解释不一定总是“可信”的(即与人类直觉相符)。在某些情况下,GNN 可能基于“次优”但统计显著的模式进行预测。GSCExplainer捕捉的是 GNN 实际的决策过程,但如果 GNN 本身就存在缺陷,解释器也会忠实地反映这些缺陷。未来可以考虑引入一些人类先验知识或领域专家反馈来辅助评估和指导解释的生成,使其不仅忠实,而且更具可信度。
相似论文推荐
基于向量语义检索推荐的相关论文。