DeepSpeed是一个深度学习优化库,它使分布式训练和推理变得简单、高效、有效。
DeepSpeed是一个深度学习优化库,它使分布式训练变得简单、高效、有效。
这个库的目标是让你完成如下的任务:
DeepSpeed为每个人提供极端规模的模型培训,从在大型超级计算机上培训的数据科学家到在低端群集上甚至在单个GPU上训练的数据科学家:
为什么选择DeepSpeed
训练高级深度学习模型具有挑战性。除了模型设计,模型科学家还需要设置最先进的训练技术,如分布式训练、混合精度、梯度累积和检查点。然而,科学家们可能无法达到预期的系统性能和收敛速度。大模型大小更具挑战性:大模型在纯数据并行性下很容易耗尽内存,而且很难使用模型并行性。DeepSpeed解决了这些挑战,以加快模型开发和培训。
是否开源: 是
许可协议: MIT license
官方地址: https://www.deepspeed.ai/
GitHub地址: https://github.com/microsoft/DeepSpeed
初始贡献者: Microsoft Developers
官方使用指南:https://www.deepspeed.ai/getting-started/
TensorFlow - 深度学习
MindSpore - 深度学习