论文

登录后可查看剩余解析次数。
标签筛选
近似最近邻搜索
HARMONY: A Scalable Distributed Vector Database for High-Throughput Approximate Nearest Neighbor Search
发表:2025/6/18
近似最近邻搜索分布式向量数据库负载均衡与通信优化多粒度划分策略高吞吐量数据处理
本文提出Harmony,针对高吞吐量近似最近邻搜索(ANNS)设计的可扩展分布式向量数据库。采用新颖的多粒度分区策略,有效解决负载不平衡和通信开销问题,通过基于维度和基于向量的组合确保各节点间负载均衡,并引入提前停止剪枝机制,降低计算和通信成本,实验结果表明整体性能显著提高。
01
Recommender Systems with Generative Retrieval
发表:2023/5/9
生成式推荐系统基于语义ID的推荐模型Transformer序列到序列模型近似最近邻搜索用户行为预测
本文提出了一种新颖的生成式检索方法,通过自回归解码目标候选的语义ID,以提升推荐系统的性能。基于Transformer的序列模型可有效预测用户下一个互动的物品。实验显示,该方法在多数据集上超过了现有的最先进模型,并增强了对新物品的检索能力。
02
Optimized Product Quantization for Approximate Nearest Neighbor Search
发表:2013/6/1
优化产品量化近似最近邻搜索高维向量编码量化失真最小化参数化与非参数化方法
本文提出了一种优化产品量化的方法,以提高近似最近邻搜索(ANN)的准确性。通过最小化量化失真,研究者提出了两种优化方式:一种非参数方法解决两个小问题,另一种参数方法确保在高斯分布数据下达到最优解。实验结果显示,优化后的产品量化显著提升了ANN搜索性能。
02
Unleashing the Full Potential of Product Quantization for Large-Scale Image Retrieval
发表:2023/11/2
基于产品量化的深度哈希框架大规模图像检索近似最近邻搜索ImageNet100 数据集ImageNet1K 数据集
本文提出了一种基于乘积量化的深度哈希框架,克服了现有深度哈希方法在大规模真实世界数据集中的计算成本和精度不足问题。该框架通过可微分的PQ分支高效学习类级码,验证了其在多个大规模数据集上的优越性,展示了强大的检索性能。
03