全球最强GPU芯片已量产、下一代Rubin曝光，老黄继续打破摩尔定律

机器之心

发布于 2024-06-04 11:09:44

1320

发布于 2024-06-04 11:09:44

文章被收录于专栏：机器之心机器之心

机器之心报道

机器之心编辑部

黄仁勋：我家的 GPU 芯片一年一更新，其他家怎么追？

昨晚，英伟达创始人、CEO 黄仁勋在 2024 年 COMPUTEX 科技大会上又为全球发烧友们、显卡买家们带来了一场重磅演讲。

经典皮肤（皮衣）老黄亮相。

在会上，黄仁勋分享了有关 AI 芯片及架构、加速计算、AI 理解物理世界、机器人的成果和洞见。

量产版 Blackwell 亮相

下一代 AI 平台 Rubin 两年后到来

今年 3 月，英伟达在其一年一度的 GTC 大会上官宣了 2080 亿晶体管的 Blackwell 芯片。它是英伟达首个采用 MCM（多芯片封装）设计的 GPU，在同一个芯片上集成了两个 GPU。

近三个月过去了，Blackwell 芯片发展到了哪一步了？

老黄现场果然没让人失望，拿出了最新量产版的 Blackwell。他表示，这款当今世界上最强大的 GPU 已经投入了生产。

黄仁勋称，短短八年时间，英伟达使得 AI 算力从 2016 年 Pascal 的 19 TFLOPS 提升到了 2024 年 Blackwell 的 20000 TFLOPS，整整提升了 1000 倍。这一速度几乎超越了摩尔定律在最佳时期的增长。

AI 算力提升的同时，成本也在逐年下降。

黄仁勋以训练 GPT-4（1.8 万亿参数）为例，八年时间，该模型的能耗从 2016 年的 1000+GWh 下降到了如今的 3GWh，下降了 350 倍。这里他甚至还为 token 定了一个中文译名 —— 词元。

集成了 Blackwell 芯片的最新 DGX 超算系统在各方面都实现了质的提升。

与上一代 Hopper 系统相比，Blackwell 系统的 NVLink 域集成 72 个 GPU、性能提升了 9 倍，NVLink 带宽增加了 18 倍，AI 算力提升了 45 倍，供能提高了 10 倍。

此外，黄仁勋还公开了 Blackwell 后三代芯片路线图，即 Blackwell Ultra（2025 年）、Rubin（2026 年）和 Rubin Ultra（2027 年）。这也是下一代 AI 平台 Rubin 首次亮相。

黄仁勋表示，英伟达将保持一年一次的更新节奏，确保所有产品实现 100% 架构兼容。不过，他并没有透露关于 Rubin 的更多细节。

可以看到，英伟达推出全新 GPU 的速度始终跑在了其他公司的前头。有人对此表示，由于缺少强有力的竞争对手，现在英伟达只能与摩尔定律展开竞争了。

图源：X@Sentdex

当然，英伟达这些年的成功在其股票市值上得到了很好地体现。最近几天的市值一度达到了 2.8 万亿美元，与市值第一的苹果之间的差距越来越小。

游戏助手 Project G-Assist

Project G-Assist 是一个由 RTX 驱动的 AI 助手，为 PC 游戏和应用提供上下文感知的帮助。

一般来讲，PC 游戏拥有广阔的世界和复杂的机制，即使是高级玩家也会感到挑战。Project G-Assist 旨在让玩家能够方便地获取游戏和系统方面的知识。

Project G-Assist 可以接收玩家的语音或文本输入，同时还可以获取游戏窗口中的快照。这些快照被输入到 AI 视觉模型中，从而提供上下文感知和特定于应用程序的理解。之后 LLM 输出一个富有洞察力和个性化的响应 —— 要么是文本，要么是 AI 语音。

为了展示 Project G-Assist 的潜力，英伟达还和 Studio Wildcard 展开合作，上新了一系列演示：例如通过按下快捷键或使用唤醒短语，AI 助手可以帮助玩家解答问题。

AI 助手还能建议玩家是否应该避开游戏中的恐龙，或者提供建议来驯服特定的野兽。

此外，Project G-Assist 在性能调优方面也非常有用。

通过一个简单的提示，Project G-Assist 可以评估玩家的系统配置和性能，并立即调整以获得最佳体验。

通过一个简单的提示，Project G-Assist 可以评估您的系统配置和性能，并立即进行调整以获得最佳体验。

AI 助手还能够跟踪并绘制帧率、功率使用、PC 延迟以及其他硬件统计数据的图表，并在被提示时提出改善这些指标的方法。

NVIDIA NIM 彻底改变了模型部署方式

现在，全球 2800 万开发者都可以借助 NVIDIA NIM 轻松地创建生成式 AI 应用。NIM 是一种推理微服务，通过以经过优化的容器的形式提供模型，以部署在云、数据中心或工作站上。

NIM 还能帮助企业实现基础设施投资的效果最大化。例如，与未使用 NIM 的情况相比，在 NIM 中运行 Meta Llama 3-8B 所能生成的加速基础设施 AI token 可以提升 3 倍。

Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近 200 家技术合作伙伴正将 NIM 集成到他们的平台中，加快生成式 AI 部署到特定领域应用中的速度，例如 copilots、代码助手、数字人虚拟形象等。从 Meta Llama 3 开始，在 Hugging Face 上现已开始提供 NIM。

NVIDIA 机器人技术

NVIDIA 正在引领价值 50 万亿美元的工业数字化变革，其通过开发者计划提供对 NIM 的访问权限，以促进 AI 创新。

黄仁勋展示了 Foxconn 如何利用 NVIDIA Omniverse、Isaac 和 Metropolis 创建数字孪生，通过结合视觉 AI 与机器人开发工具来实现增强的机器人设施。

NVIDIA Isaac 平台为开发者构建 AI 机器人提供强大的套件，包括由 AI 模型以及 Jetson Orin、Thor 等超级计算机驱动的 AMR、工业机械臂和人形机器人。

「机器人和物理 AI 正在成为现实，而不仅是出现在科幻小说。这真的令人兴奋，」黄仁勋补充道。