财联社5月19日讯(编辑 黄君芝)当地时间周四(18日),Facebook母公司Meta分享了其数据中心项目的新细节,以更好地支持人工智能(AI)工作,包括一款内部开发的定制芯片“家族”的新成员。
Meta表示,它在2020年设计了第一代芯片,作为元训练和MTIA计划的一部分。MTIA全称为Meta训练和推理加速器。所谓推理是指运行经过训练的模型。这是一种ASIC(专用集成芯片),也就是将不同电路集成在一块板上的芯片,可以将它进行编程,执行一项或多项任务。
根据该公司的说法,打造第一代芯片的目的是提高推荐模型的效率,那些模型服务于广告和其他新闻推送内容。Meta并未披露配置新芯片的时间表,也未说明具体有什么计划开发训练模型的芯片。
Meta的软件工程师Joel Coburn在介绍新芯片时表示,Meta最初使用图形处理单元(GPU)来完成推理任务,但结果发现它们不太适合这种工作。
“尽管进行了重大的软件优化,但实际模型的效率很低。这使得在实践中部署它们具有挑战性且成本高昂。这就是我们需要MTIA的原因。”他说。
在高管们意识到缺乏硬件和软件来支持产品团队构建人工智能功能的需求后,Meta在过去一年里一直在进行一项大规模的项目,以升级其人工智能基础设施。
Meta在博客文章中承认,它的首款MTIA芯片在处理高复杂性的AI模型时遇到了挫折,但也指出,它在处理中低复杂性模型方面比竞争对手的芯片更有效。据它介绍,MTIA采用开源芯片架构RISC-V,它的功耗仅有25瓦,远低于英伟达等主流芯片厂商的产品功耗。
不过该公司也称,芯片在内存和网络领域的工作还未完成,随着AI模型发展,这些工作会出现瓶颈。目前,MTIA 的重点放在Meta应用家族的推理,而不是训练。但Meta强调,MTIA“大大”提高了单位瓦特的推荐负载运行效率,让公司能运行加强版的、更尖端的AI工作负载。
此外,Meta还提供了以AI为核心的网络和冷却系统、重新设计其数据中心的最新计划,并称首个相关数据中心的设施将于年内破土动工。该公司员工在演示时称,新设计的成本将降低31%,而且建造速度是公司目前数据中心的两倍。
最后,Meta还介绍了旗下的一种AI驱动系统,它可帮助Meta的工程师编写电脑代码。Meta的AI助力代码工具名为CodeCompose,目前没有对外公开。公司团队内部用它获取Python 和其他语言的代码建议。
(财联社 黄君芝)
领取专属 10元无门槛券
私享最新 技术干货