Negative Feedback Really Matters: Signed Dual-Channel Graph Contrastive Learning Framework for Recommendation
TL;DR 精炼摘要
提出了一个符号双通道图对比学习框架(SDCGCL),专注于负反馈的利用,以提高推荐系统的性能。其核心包含了双通道图嵌入、跨通道分布校准和自适应预测策略,解决了模型兼容性差、信息交换不足和计算效率低等问题。实验结果显示,该方法在多个数据集上显著优于现有模型。
摘要
Traditional recommender systems have relied heavily on positive feedback for learning user preferences, while the abundance of negative feedback in real-world scenarios remains underutilized. To address this limitation, recent years have witnessed increasing attention on leveraging negative feedback in recommender systems to enhance recommendation performance. However, existing methods face three major challenges: limited model compatibility, ineffective information exchange, and computational inefficiency. To overcome these challenges, we propose a model-agnostic Signed Dual-Channel Graph Contrastive Learning (SDCGCL) framework that can be seamlessly integrated with existing graph contrastive learning methods. The framework features three key components: (1) a Dual-Channel Graph Embedding that separately processes positive and negative graphs, (2) a Cross-Channel Distribution Calibration mechanism to maintain structural consistency, and (3) an Adaptive Prediction Strategy that effectively combines signals from both channels. Building upon this framework, we further propose a Dual-channel Feedback Fusion (DualFuse) model and develop a two-stage optimization strategy to ensure efficient training. Extensive experiments on four public datasets demonstrate that our approach consistently outperforms state-of-the-art baselines by substantial margins while exhibiting minimal computational complexity. Our source code and data are released at https://github.com/LQgdwind/nips25-sdcgcl .
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
负反馈真的很重要:用于推荐的符号双通道图对比学习框架 (Negative Feedback Really Matters: Signed Dual-Channel Graph Contrastive Learning Framework for Recommendation)
1.2. 作者
Leqi Zheng, Chaokun Wang, Zixin Song, Cheng Wu, Shannan Yan (清华大学); Jiajun Zhang (中国科学技术大学); Ziyang Liu (清华大学)。Chaokun Wang 为通讯作者。
1.3. 发表期刊/会议
该论文提交至 NeurIPS 2025 (神经信息处理系统大会)。NeurIPS 是人工智能和机器学习领域的顶级会议(CCF A类),具有极高的学术影响力和声誉。
1.4. 发表年份
2025年(预印本/提交稿)。
1.5. 摘要
传统的推荐系统高度依赖正反馈(如购买、点赞)来学习用户偏好,而现实场景中大量的负反馈(如不喜欢、低评分)却未得到充分利用。现有利用负反馈的方法面临模型兼容性差、信息交换效率低和计算效率低三大挑战。为此,本文提出了一个模型无关的 符号双通道图对比学习 (Signed Dual-Channel Graph Contrastive Learning, SDCGCL) 框架。该框架包含:(1) 分别处理正负图的双通道图嵌入 (Dual-Channel Graph Embedding);(2) 保持结构一致性的跨通道分布校准 (Cross-Channel Distribution Calibration);(3) 结合双通道信号的自适应预测策略 (Adaptive Prediction Strategy)。此外,作者还提出了 DualFuse 模型和两阶段优化策略。实验证明,该方法在四个数据集上均显著优于现有最先进的模型。
1.6. 原文链接
https://github.com/LQgdwind/nips25-sdcgcl (包含代码与数据)。
2. 整体概括
2.1. 研究背景与动机
推荐系统旨在从海量信息中过滤出用户感兴趣的内容。
- 核心问题: 现有的图神经网络 (Graph Neural Networks, GNNs) 推荐方法主要利用正反馈(Positive Feedback)。然而,负反馈(Negative Feedback)提供了用户明确“厌恶”的信号,能更精准地指导偏好修正。
- 挑战 (Gaps):
- 模型兼容性受限: 现有的负反馈处理方法往往是定制化的,无法无缝集成到目前主流的图对比学习 (Graph Contrastive Learning, GCL) 框架中。
- 信息交换不足: 负反馈常被视为辅助信号,缺乏与正反馈深度的交互。
- 训练效率低下: 全量处理带符号图(包含正负边)计算开销巨大。
- 创新思路: 提出一种“双通道”架构,将正负反馈拆分又耦合,使其既能适配主流模型,又能通过分布校准解决负反馈分布不稳的问题。
2.2. 核心贡献/主要发现
-
模型无关框架: 提出了
SDCGCL,可以像插件一样集成到SGL、LightGCL等主流模型中。 -
DualFuse 模型: 设计了专用的双通道融合模型,通过跨通道扰动增强表示。
-
两阶段训练策略: 结合全图学习与基于流行度引导的随机游走采样,在保证精度的前提下极大提升了训练速度。
-
理论证明: 从数学上证明了分布校准对消除预测偏差的必要性,以及采样策略的稳定性。
3. 预备知识与相关工作
3.1. 基础概念
- 图对比学习 (Graph Contrastive Learning, GCL): 一种自监督学习方法。通过对原始图进行增强(如节点丢弃、边掩码)产生不同的“视图”,并要求模型最大化同一节点不同视图之间的一致性,从而学习更稳健的表示。
- 符号图 (Signed Graphs): 边不仅代表连接,还带有正负号(+1 表示喜欢,-1 表示讨厌)。
- 协同过滤 (Collaborative Filtering): 核心思想是“物以类聚,人以群分”,通过分析用户和物品的历史交互来预测未来兴趣。
3.2. 前人工作
- 无符号推荐 (Unsigned RS): 如
LightGCN,利用图卷积捕获高阶协同信号。- 核心公式补充 (LightGCN 传播公式): 解释:用户 在第 层的嵌入是由其邻居物品 在第 层的嵌入通过归一化加权求和得到的。
- 符号化推荐 (Sign-aware RS): 如
SiReN、SiGRec。这些方法尝试引入平衡理论(如“朋友的朋友是朋友,敌人的敌人是朋友”)来建模负反馈,但往往计算复杂度高。
3.3. 差异化分析
相较于以往方法,本文不再强求遵循复杂的平衡理论,而是通过双通道 (Dual-Channel) 的方式解耦正负信号,利用对比学习的强大建模能力来捕捉偏好,解决了传统符号图模型难以扩展到大规模图数据的问题。
4. 方法论
4.1. 方法原理
SDCGCL 的核心思想是将正反馈和负反馈分别建模为两个独立的图通道。正向通道捕捉“什么是用户喜欢的”,负向通道捕捉“什么是用户避讳的”。通过跨通道的校准和自适应预测,实现两者的协同。
4.2. 核心方法详解
4.2.1. 双通道图嵌入 (Dual-Channel Graph Embedding)
系统首先将交互图拆分为正向图 和负向图 。对于每一层 ,嵌入更新如下:
-
符号解释: 是用户在正向通道第 层的嵌入; 是消息传播函数(如
LightGCN); 是丢弃策略。 -
目的: 独立提取两种反馈类型的特征。
经过 层后,进行聚合:
为了生成对比视图,应用增强机制 : 这里 和 是用于对比学习的增强表示。
4.2.2. 跨通道分布校准 (Cross-Channel Distribution Calibration)
由于负反馈通常比正反馈更稀疏且不稳定(Theorem 1 证明了其方差更高),直接融合会导致预测偏差。作者提出了分布校准。
- 通道内对比 (Intra-Channel CL): 确保每个通道内部的表示是稳健的(见原文公式 5, 6)。
- 通道间分布对齐 (Inter-Channel Alignment):
- 符号解释: 是分布差异度量(如 JS 散度); 表示哈达玛积或内积操作。
- 逻辑: 该步骤强制正负通道在结构上保持一致性,防止负通道的噪声干扰整体学习。
4.2.3. 自适应预测策略 (Adaptive Prediction Strategy)
最终的预测分数 结合了双通道:
- 符号解释: 是超参数,控制负反馈的影响权重。
- 直觉: 如果用户对某物品在正向通道得分高且在负向通道得分低,则最终推荐分会很高。
4.2.4. DualFuse 特有机制:跨通道图融合
在 DualFuse 模型中,作者引入了互扰动机制来生成对比视图(Figure 3):
解释:用负通道的归一化特征作为正通道的“结构化噪声”,增强模型对负反馈模式的感知。
5. 实验设置
5.1. 数据集
实验使用了四个公开数据集,作者对评分进行了二值化处理(评分 为正, 为负)。
以下是原文 Table 4 的统计数据:
| Dataset | #Users | #Items | #Interaction | #Pos/#Neg |
|---|---|---|---|---|
| Yelp | 29,601 | 24,734 | 2,074,594 | 66.3%/33.7% |
| Amazon | 35,736 | 38,121 | 1,960,674 | 80.6%/19.4% |
| ML-1M | 6,040 | 3,706 | 1,000,209 | 57.5%/42.5% |
| ML-10M | 69,878 | 10,677 | 10,000,054 | 58.9%/41.1% |
5.2. 评估指标
论文使用了推荐系统最通用的两个指标:
- 召回率 (Recall@K):
- 概念定义: 量化模型找回用户真正感兴趣物品的能力。
- 数学公式:
- 符号解释: 分母是用户测试集中实际交互过的物品总数,分子是模型推荐的前 个物品中命中的数量。
- 归一化折损累计增益 (NDCG@K):
- 概念定义: 衡量推荐列表的排序质量,命中物品的位置越靠前,得分越高。
- 数学公式: ,其中
\mathrm{DCG}_K = \sum_{i=1}^K \frac{2^{rel_i}-1}{\log_2(i+1)} - 符号解释: 是位置 物品的相关度; 是理想状态下的最大 。
5.3. 对比基线
-
无符号模型:
MF,LightGCN,XSimGCL等。 -
带符号模型:
SiReN,SIGFormer,NFARec(SIGIR'24) 等。
6. 实验结果与分析
6.1. 核心结果分析
SDCGCL-DualFuse 在所有指标上均达到了 最先进的 (state-of-the-art) 水平。特别是在负反馈较多的 Yelp 数据集上,其提升幅度惊人(Recall 提升约 28%)。
以下是原文 Table 1 的完整转录(精简核心对比部分):
| Group | Models | ML-1M | Yelp | Amazon | |||
|---|---|---|---|---|---|---|---|
| Recall | NDCG | Recall | NDCG | Recall | NDCG | ||
| U-RS (无符号) | LightGCN | 0.1993 | 0.2632 | 0.0662 | 0.0539 | 0.0728 | 0.0631 |
| XSimGCL | 0.2729 | 0.3087 | 0.0867 | 0.0758 | 0.0963 | 0.0707 | |
| LightGCL | 0.2730 | 0.3035 | 0.0697 | 0.0675 | 0.0967 | 0.0728 | |
| S-RS (符号化) | SiReN | 0.3093 | 0.3338 | 0.0873 | 0.0635 | 0.1017 | 0.0924 |
| NFARec | 0.2840 | 0.3212 | 0.0971 | 0.0808 | 0.1136 | 0.1020 | |
| Ours | SDCGCL-XSimGCL | 0.3050 | 0.3401 | 0.1112 | 0.0881 | 0.1142 | 0.1014 |
| SDCGCL-DualFuse | 0.3282* | 0.3693* | 0.1243* | 0.0959* | 0.1342* | 0.1113* | |
6.2. 消融实验分析
通过移除 Fusion (融合)、CL (对比学习) 和 Align (对齐),作者发现:
- 推荐损失 (Rec Loss) 最关键,没有它模型无法收敛。
- 图融合 (Fusion) 对稠密数据集(如 ML-1M)至关重要。
- 分布校准 (Align) 稳定了训练过程。
6.3. 训练效率
作者提出的采样策略 () 仅使用 1% 的负反馈数据,就能达到甚至超过全量数据的效果,且训练时间缩短了约 28%。这验证了 Theorem 3 中关于采样稳定性的结论。
7. 总结与思考
7.1. 结论总结
论文成功证明了负反馈在图对比学习中具有巨大的未开发潜力。通过 SDCGCL 框架,研究者可以轻松地将负反馈引入现有的推荐模型中。其设计的双通道校准机制解决了负反馈带来的噪声和分布不稳定问题,在性能和效率之间取得了极佳平衡。
7.2. 局限性与未来工作
- 动态性: 目前模型是静态的,未考虑用户反馈随时间的动态演化。
- 冷启动: 在用户几乎没有负反馈的冷启动阶段,效果可能受限。
- 工业落地: 虽然采样提升了效率,但在超大规模工业级实时系统中的表现仍需验证。
7.3. 个人启发与批判
- 启发: 该论文展示了“大道至简”的设计哲学。与其用复杂的数学理论去强行解释“敌人的敌人是朋友”,不如直接用两个通道解耦正负信号,让深度学习模型自己去学习复杂的交互模式。
- 批判: 论文对负反馈的定义较为单一(仅基于评分)。在实际应用中,点击但不购买、快速跳过等隐式负反馈更为常见。如果能将这些异构的负信号引入双通道框架,该研究的普适性将更强。此外,自适应预测中的 值在不同用户身上可能应该是动态变化的,而非全局统一。
相似论文推荐
基于向量语义检索推荐的相关论文。