据称,人工智能超级计算机将使用“数万个” NVIDIA A100和H100 GPU。
上图:英伟达和微软正在合作开发一台AI云超级计算机。
周三,英伟达(Nvidia)宣布与微软(Microsoft)合作,打造专注于人工智能的“大规模”云计算机。据报道,它将使用数以万计的高端 Nvidia GPU 用于深度学习和大型语言模型等应用。两家公司的目标是使其成为世界上最强大的人工智能超级计算机之一。
这台新的超级计算机将配备数千个可说是世界上最强大的GPU —— Hopper H100,这是英伟达去年10月推出的。英伟达还将提供其第二强大的GPU A100,并利用其 Quantum-2 InfiniBand 网络平台,该平台可以在服务器之间以400 Gb/秒的速度传输数据,将它们连接成一个强大的集群。
与此同时,微软将贡献其 Azure 云基础设施以及ND和NC系列虚拟机。英伟达的AI企业平台将把这一切联系在一起。两家公司还将在微软的深度学习优化软件 DeepSpeed 上展开合作。
英伟达在一份声明中提到了联合超级计算机可能提供的应用:
“作为合作的一部分,NVIDIA 将利用 Azure 的可伸缩虚拟机实例来研究并进一步加速生成性人工智能的进展,这是一个迅速崛起的人工智能领域,在这个领域,像威震天图灵NLG 530B(Megatron Turing NLG 530B)这样的基础模型是无监督的自我学习算法的基础,以创建新的文本、代码、数字图像、视频或音频。”
在过去的一年里,生成性人工智能模型迅速崛起,如稳定扩散(Stable Diffusion)和Dall-E,它们可以按需合成新的图像。类似的模型已经出现,除了其他用途外,还可以创建视频、合成声音和执行转录。随着对生产性人工智能的计算需求增加,英伟达和微软打算满足这一需求。
上图:英伟达 H100 Tensor Core GPU。
英伟达表示,一旦英伟达和微软的云计算机上线,客户可以在单个集群中部署数千个GPU,以“训练即使是最庞大的大型语言模型,大规模构建最复杂的推荐系统,并实现大规模的生成性人工智能”。
目前,两家公司并没有提供新的超级计算机何时准备就绪的细节,但提到这一声明标志着“多年合作”的开始。随着时间的推移,云计算的容量很可能会扩大。
如果朋友们喜欢,敬请关注“知新了了”!
领取专属 10元无门槛券
私享最新 技术干货