1. 论文基本信息

1.1. 标题

VoRec: Enhancing Recommendation with Voronoi Diagram in Hyperbolic Space （VoRec：在双曲空间中利用 Voronoi 图增强推荐性能）

1.2. 作者

Yong Chen (陈勇): 厦门大学人工智能研究院
Li Li (李力): 深圳职业技术大学人工智能学院
Wei Peng (彭微): 斯坦福大学精神医学与行为科学系
Songzhi Su (苏松志, 通讯作者): 厦门大学人工智能研究院

1.3. 发表期刊/会议

SIGIR '25: 第 48 届国际计算机学会信息检索研究与发展会议 (The 48th International ACM SIGIR Conference on Research and Development in Information Retrieval)。SIGIR 是推荐系统和信息检索领域的顶级会议（CCF-A 类）。

1.4. 发表年份

2025年7月13日 (Published at SIGIR '25, Padua, Italy)

1.5. 摘要

推荐系统常受困于用户-物品交互数据的交互稀疏性 (Interaction Sparsity)。现有方法虽引入标签信息，但忽略了嵌入空间的结构化特征，如语义分布和逻辑关系。本文提出 VoRec 框架，首次将 Voronoi 图 (Voronoi Diagram) 引入双曲空间 (Hyperbolic Space)。该框架利用标签分类树将双曲空间划分为逻辑相关的子空间，并结合超几何图卷积网络 (HGCN)。此外，设计了主动（对比学习）和被动（自适应冻结）的站点更新策略来优化空间划分。实验表明，VoRec 在四个基准数据集上较现有最先进模型在 Recall 和 NDCG 指标上平均提升了 $16.35\%$ 。

1.6. 原文链接

PDF 链接 (ACM Digital Library) 发布状态：正式发表。

2. 整体概括

2.1. 研究背景与动机

核心问题: 推荐系统面临严重的交互稀疏性 (Sparsity)。用户和物品之间的已知交互极少，导致模型难以学习到高质量的向量表示（嵌入）。
现有挑战:
1. 传统的协同过滤 (Collaborative Filtering) 仅依赖交互矩阵，在数据稀疏时表现不佳。
2. 虽有研究引入标签 (Tags)，但通常将其视为扁平特征，忽略了标签之间的层级关系 (Hierarchical Relations)（如“欧洲”属于“历史”范畴）。
3. 欧几里得空间 (Euclidean Space) 的体积随半径多项式增长，难以承载指数级增长的树状层级结构，容易产生高失真 (High Distortion)。
创新思路: 利用双曲几何 (Hyperbolic Geometry) 天然适合建模层级结构的特性，并引入数学中的 Voronoi 图 (Voronoi Diagram) 概念，将整个嵌入空间划分为互不重叠但逻辑相关的“标签领地”，使物品能根据其标签属性精准定位。

2.2. 核心贡献/主要发现

首创性框架: 首次提出在双曲空间中结合 Voronoi 图进行推荐，通过空间划分捕捉标签与物品间的“成员、排除、层级”关系。
双模型融合: 无缝集成了庞加莱模型 (Poincaré Model)（用于 Voronoi 划分）和洛伦兹模型 (Lorentz Model)（用于图卷积优化），发挥各自在计算和稳定性上的优势。
动态更新策略: 提出了主动 (Active) 对比学习和被动 (Passive) 熵控冻结策略，解决了 Voronoi 划分在训练过程中的不稳定性问题。
性能突破: 在 Ciao、CD、Clothing 和 Book 四个数据集上均取得显著提升，尤其在极度稀疏的 Clothing 数据集上 Recall@10 提升高达 $38.68\%$ 。

3. 预备知识与相关工作

3.1. 基础概念

双曲几何 (Hyperbolic Geometry): 一种具有恒定负曲率的非欧几里得几何。其核心特性是“空间指数级扩张”。在双曲空间中，圆的周长和面积随半径呈指数级增长。这使其非常适合表示树状结构，因为树的节点数也是随深度指数增加的。
Voronoi 图 (Voronoi Diagram): 空间划分的一种方式。给定一组“站点（Sites）”，空间中每个点都归属于离它最近的那个站点，从而形成多个“单元格（Cells）”。
标签分类法 (Tag Taxonomy): 标签之间的层级结构，如 电影 -> 动作片 -> 漫威。

3.2. 前人工作与技术演进

度量学习 (Metric Learning): 如 CML。通过拉近用户与其交互物品的距离来学习嵌入。
图神经网络 (GNN): 如 LightGCN。通过在用户-物品图上进行消息传递捕捉高阶兴趣。
双曲推荐: 如 HGCF、HRCF。将 GNN 迁移到双曲空间以减少层级结构的失真。
差异化: 本文不仅使用双曲空间，还通过 Voronoi 图引入了显式的空间边界。这不仅考虑了“距离近”，还考虑了“属于哪个逻辑区域”，增强了可解释性和表示能力。

4. 方法论

下图（原文 Figure 4）展示了 VoRec 的整体架构，包含空间映射、HGCN 聚合以及 Voronoi 划分三大部分：

该图像是示意图，展示了论文《VoRec: Enhancing Recommendation with Voronoi Diagram in Hyperbolic Space》的核心内容。图中左侧为用户-物品图和标签-物品图，展示用户、物品与标签之间的关系。中间部分描述了在洛伦兹和庞加莱空间中的映射与超几何图卷积网络（Hyperbolic GCN）的使用。右侧则展示了Voronoi图的构建及其在推荐系统中的应用。整体流程强调了联合学习和更新机制。

4.1. 超双曲加权 Voronoi 图 (HWVD)

VoRec 的核心是将标签视为双曲空间中的站点 $\mathcal{T} = \{t_1, t_2, ..., t_s\}$ 。为了体现层级，作者采用了乘法加权 Voronoi 图 (Multiplicative WVD)。

庞加莱模型下的距离定义: 在 $n$ 维庞加莱球 $\mathcal{P}^n$ 中，两点 $\pmb{x}, \pmb{y}$ 的测地线距离为： $d_{\mathcal{P}}(\pmb{x}, \pmb{y}) = \frac{2}{\sqrt{c}} \mathrm{arctanh}(\sqrt{c} \| -\pmb{x} \oplus_c \pmb{y} \|)$ 其中 $\oplus_c$ 是 Möbius 加法 (Möbius addition)，定义为： $\pmb{x} \oplus_c \pmb{y} = \frac{(1 + 2c \langle x, \pmb{y} \rangle + c \| \pmb{y} \|^2) \pmb{x} + (1 - c \| \pmb{x} \|^2) \pmb{y}}{1 + 2c \langle x, \pmb{y} \rangle + c^2 \| \pmb{x} \|^2 \| \pmb{y} \|^2}$

加权距离与划分: 为了让上级标签覆盖更大的区域，引入权重 $w$ 。加权距离 $D_{\hat{P}}$ 定义为： $D_{\hat{P}}(x, y, w) = \frac{d_{\mathcal{P}}(x, y)}{e^w}$ 由此确定的 Voronoi 单元 (Voronoi Cell) 为： $Vor(\pmb{t}_i) = \{ \pmb{x} \in \mathcal{P}^n : D_{\hat{P}}(\pmb{x}, \pmb{t}_i, w_i) \leq D_{\hat{P}}(\pmb{x}, \pmb{t}_j, w_j), \forall \pmb{t}_j \in \mathcal{T} \}$

Voronoi 损失函数: 为了使物品嵌入 $v^{\mathcal{P}}$ 落在其对应标签 $t_o$ 的单元格内，使用铰链损失 (Hinge Loss)： $\mathcal{L}_{vor} = \sum_{v^{\mathcal{P}} \in \mathcal{V}} \sum_{t_i \in \mathcal{T}} [D_{\mathcal{P}}(v^{\mathcal{P}}, t_o, w_o) - D_{\mathcal{P}}(v^{\mathcal{P}}, t_i, w_i) + m_1]_+$

解释: 该公式强制物品到其真实标签站点的加权距离比到其他任何标签站点的距离至少小一个边际值 $m_1$ 。

4.2. 基于洛伦兹模型的 HGCN 推荐

虽然 Voronoi 划分在庞加莱模型下直观，但图卷积 (GCN) 在洛伦兹模型 (Lorentz Model) 下更稳定。

空间映射: 将庞加莱球中的物品嵌入 $\pmb{v}^{\mathcal{P}}$ 映射到洛伦兹流形 $\pmb{v}^{\mathcal{L}}$ ： $p^{-1}(x_1, \dots, x_n) = \frac{(1 + c\|\pmb{x}\|^2, 2x_1, \dots, 2x_n)}{1 - c\|\pmb{x}\|^2}$
切空间聚合: 由于双曲空间不是向量空间，无法直接求平均。需先通过对数映射 $\log_{\pmb{o}}^c$ 映射到原点 $\pmb{o}$ 的切空间 (Tangent Space)： $\pmb{h}_u^{\mathcal{L}, 0} = \log_{\pmb{o}}^c(\pmb{u}^{\mathcal{L}}), \quad \pmb{h}_v^{\mathcal{L}, 0} = \log_{\pmb{o}}^c(\pmb{v}^{\mathcal{L}})$
邻域消息传递: $h_u^{\mathcal{L}, l+1} = h_u^{\mathcal{L}, l} + \frac{1}{|N_u|} \sum_{v \in \mathcal{N}_u} h_v^{\mathcal{L}, l}$
映射回流形: 使用指数映射 $\exp_{\pmb{o}}^c$ ： $\pmb{u}^{\mathcal{L}} = \exp_{\pmb{o}}^c(\pmb{h}_u^{\mathcal{L}})$

推荐损失函数: 基于洛伦兹距离 $d_{\ell}$ 的 BPR 损失： $\mathcal{L}_{rec} = \sum_{(u, v_p) \in \mathcal{I}} \sum_{(u, v_q) \notin \mathcal{I}} [d_{\ell}(\pmb{u}^{\mathcal{L}}, \pmb{v}_p^{\mathcal{L}}) - d_{\ell}(\pmb{u}^{\mathcal{L}}, \pmb{v}_q^{\mathcal{L}}) + m_2]_+$

4.3. 站点更新策略

Voronoi 边界对站点位置极度敏感。为了稳定训练，作者设计了两种策略：

主动更新（对比学习）: 使用 InfoNCE 损失 优化站点分布，拉近父子标签，推开不相关标签： $\mathcal{L}_{cl} = - \sum_{t_i \in \mathcal{T}'} \log \frac{\exp(d_{\mathcal{P}}(t_i, t_p) / \tau)}{\sum_{t_j \in \mathcal{T}, j \neq i} \exp(d_{\mathcal{P}}(t_i, t_j) / \tau)}$
被动更新（自适应冻结）: 通过计算信息熵 (Entropy) $H$ 来评估系统稳定性： $H = - \sum_{v^{\mathcal{P}} \in \mathcal{V}} \pi_v^\top \log(\pi_v)$ 如果信息增益 $IG = H' - H$ 为正（不确定性降低），则增加冻结周期 $N$ ，让物品有更多时间在当前单元格内探索。

5. 实验设置

5.1. 数据集

实验使用了四个真实世界的公开数据集：

Ciao: 消费点评数据集，标签较少（28个）。

CD, Clothing, Book: 来自最新的 Amazon Reviews'23，具有复杂的标签层级和极高的稀疏性。

以下是原文 Table 1 的统计信息：

Dataset	# Users	# Items	# Interactions	# Tags	Density
Ciao	5,180	8,836	104,905	28	2.3e-3
CD	22,170	20,089	519,283	375	1.2e-3
Clothing	47,252	25,885	720,242	272	5.9e-4
Book	56,832	50,370	1,337,594	392	4.7e-4

5.2. 评估指标

Recall@K (召回率): 量化模型在推荐的前 K 个物品中找回用户真正感兴趣物品的能力。 $\mathrm{Recall@K} = \frac{|\mathrm{Recommended@K} \cap \mathrm{Relevant}|}{|\mathrm{Relevant}|}$
NDCG@K (归一化折扣累计增益): 不仅关注是否找回，还关注感兴趣物品的排名。排名越靠前，得分越高。 $\mathrm{NDCG@K} = \frac{\mathrm{DCG@K}}{\mathrm{IDCG@K}}, \quad \mathrm{DCG@K} = \sum_{i=1}^K \frac{2^{rel_i}-1}{\log_2(i+1)}$

5.3. 对比基线

包含了 14 种模型，如传统的 BPRMF、欧式 GNN LightGCN、双曲模型 HGCF、HRCF 以及最新的标签增强模型 $LogiRec++$ 。

6. 实验结果与分析

6.1. 核心结果分析

以下是原文 Table 2 的完整性能对比结果：

Method	Ciao		CD		Clothing		Book
Method	Recall@10	NDCG@10	Recall@10	NDCG@10	Recall@10	NDCG@10	Recall@10	NDCG@10
BPRMF	0.0320	0.0224	0.0581	0.0435	0.0126	0.0103	0.0721	0.0572
LightGCN	0.0520	0.0422	0.0872	0.0746	0.0203	0.0131	0.0864	0.0621
HGCF	0.0598	0.0481	0.0914	0.0759	0.0196	0.0135	0.0915	0.0670
LogiRec++	0.0667	0.0521	0.0979	0.0830	0.0210	0.0145	0.0953	0.0786
VoRec (Ours)	0.0771	0.0629	0.1037	0.0894	0.0294	0.0214	0.1012	0.0853
Improvement	15.59%	20.73%	5.92%	7.58%	38.68%	40.79%	6.19%	8.52%

结论:

VoRec 在所有数据集上均显著优于基线。
在 Clothing 数据集上表现最为惊人，这说明在数据极度稀疏（Density 仅 5.9e-4）时，显式的空间划分（Voronoi）能提供最强的归纳偏置。

6.2. 可视化分析

下图（原文 Figure 7）展示了训练过程中物品嵌入的演变。从最初的混乱聚类（Warm-up），到探索阶段（Exploring），最后在 Voronoi 划分下达到收敛（Converging），形成了清晰的语义边界。

该图像是示意图，展示了推荐系统在超曲面空间中使用Voronoi图的不同阶段，包括热身阶段、探索阶段和收敛阶段。图中细节表现了多种不同颜色和标记的点，分别代表不同的数据聚类和阶段变化。

6.3. 消融实验

消融实验验证了各组件的必要性：

w/o. VD: 去掉 Voronoi 图后性能大幅下降，证明空间划分是核心。
w/o. H: 移至欧几里得空间后，性能下降，证明了双曲几何在建模标签层级上的优越性。
w/o. Fz: 不使用冻结策略会导致熵值快速下降并陷入局部最优，证明了动态平滑更新的重要性。

7. 总结与思考

7.1. 结论总结

VoRec 是一项极具创新性的研究，它巧妙地将经典的计算几何工具 Voronoi 图 引入到前沿的 双曲深度学习 推荐场景中。通过将空间划分为逻辑相关的标签子空间，VoRec 能够精准捕捉标签与物品之间的包含与排斥关系，从而在数据稀疏的情况下依然保持强大的推荐能力。

7.2. 局限性与未来工作

标签依赖: 模型性能高度依赖于标签分类法的质量。如果标签系统本身混乱，Voronoi 划分可能会引入噪声。
计算开销: 虽然文中提到计算高效，但计算物品到所有站点的双曲距离在标签数量极巨（如数万个）时可能面临扩展性挑战。
未来方向: 作者提出可以进一步探索 Voronoi 单元内部的细分，考虑单元内的分布密度以捕捉同标签物品间的细微差异。

7.3. 个人启发与批判

启发: 这篇论文展示了“几何偏置”的力量。在深度学习时代，我们往往倾向于增加参数，而本文告诉我们，通过合理的数学约束（如空间划分）来规范嵌入空间的结构，往往比单纯增加模型深度更有效。
批判: 论文中虽然使用了两种双曲模型，但对于两者的切换点（从庞加莱到洛伦兹的映射）对梯度的影响讨论较少。此外，对于非层级结构的标签，Voronoi 图是否依然优于传统的注意力机制，仍值得进一步探讨。

VoRec: Enhancing Recommendation with Voronoi Diagram in Hyperbolic Space

TL;DR 精炼摘要

摘要

思维导图

论文精读

中文精读约 10 分钟读完 · 6,565 字