标签筛选：分布式训练优化 - 论文列表

ZeRO-Infinity: Breaking the GPU Memory Wall for Extreme Scale Deep Learning

发表：2021/4/16

大规模深度学习模型训练ZeRO-Infinity 系统技术跨级存储层异构计算分布式训练优化超大参数模型微调

ZeROInfinity提出异构系统技术，整合GPU、CPU和NVMe内存，突破GPU内存瓶颈，实现万亿参数级超大模型训练和微调，无需重构模型代码。系统展现出高吞吐量和超线性可扩展性，基于DeepSpeed开源提供，极大提升极限规模深度学习的可及性与效率。