据《科创板日报》1 月 9 日报道,近日,蚂蚁集团宣布开源大模型分布式训练加速扩展库 ATorch,可针对不同模型和硬件资源,实现深度学习自动资源动态优化和分布式训练稳定性提升,帮助提升深度学习的智能性。据了解,在大模型训练中,ATorch 千亿模型千卡级别训练的算力利用率可达 60%。目前,ATorch 已集成到蚂蚁集团大模型训练开源产品 DLRover 中,这是蚂蚁集团基于云原生技术打造的智能分布式深度学习系统。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货