前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >为什么说NVIDIA 黄仁勋 CES演讲引领人工智能未来五年发展方向?

为什么说NVIDIA 黄仁勋 CES演讲引领人工智能未来五年发展方向?

原创
作者头像
GPUS Lady
发布2025-01-07 21:17:19
发布2025-01-07 21:17:19
1570
举报
文章被收录于专栏:AIOTAIOT

北京时间1月7日早上10点30,NVIDIA黄仁勋身穿新皮衣等上CES的讲台,发表CES开幕演讲。将近1个小时40分钟的演讲里,黄仁勋再次给大家描述了人工智能未来发展蓝图。

本文将呈献台湾顾家祈先生对黄仁勋演讲的精彩提炼。顾家祈先生于2016年创立hiHedge,并在首届新加坡Fintech Festival Hackcelerator中脱颖而出,荣膺全球前20金融科技初创团队之列。

此次转载已获顾家祈先生本人授权。

#黄仁勋 CES 演讲实在太精彩,直接定义了接下来 5 年的 AI 重点发展方向。

简单来说,就是三大 AI 趋势、三大硬件支持跟三大软件支持:  

三大AI趋势

1. Agentic AI:指的是用在「信息工作」上的软件型 AI 助手或代理人(agents),可处理文本、文件、对话、客服、知识管理等事务。

2. Autonomous Vehicle(自动驾驶):透过大规模训练与合成资料,可实现自动驾驶功能。

3. Humanoid Robot(人形机器人):可适应人类现有环境的通用机器人,无需为机器人改造空间。 

三大硬件支持

1. DGX:资料中心级的 AI 训练超级计算机,负责「模型训练」阶段,适合大型企业、研发机构、资料科学中心,需要庞大算力进行 AI 模型训练者。

2. RTX Blackwell:消费者级 RTX 5070~5090(含笔电版),5070 就有现在最强 4090 的算力,而价格竟然只要 $549!(4090 要 $1599,直接降到 1/3 ,真的太过分了!)

3. Project Digits (尚未真正命名,欢迎大家去提案):使用 Grace Blackwell 架构(GB110),给研究员、工程师的「个人超级计算机」,与联发科合作开发,预计五月开卖。(黄仁勋密码?)

三大软件支持

1. NIMs(NVIDIA AI Microservices):预先训练好的 AI 模型与微服务,涵盖影像、语音、语言等。适合中小型企业、开发者、IT 团队:快速导入各种 AI 功能,不必从头建置。

2. Nemo:企业「数位员工 Agent」管理系统,用于训练、微调、监管 AI Agent。适合需要自建 AI 助手的大公司或组织:可将「AI 员工」纳入企业流程,建立专属语料、定义行为守则。

3. Blueprint:提供打造自定义 AI Agent 的开发模板。适合开发者、生态系合作伙伴、创业团队:可在 Blueprint 基础上快速二次开发,实作客制化功能。

演讲全文整理

▋第一部分:开场与前言 (00:28:03)

1. CES 2025 开场与主题

- 宣传短片强调 CES 不只是展示未来,更是科技与人性的交融处。

- 科技不仅解决问题,更创造机会,并透过智慧城市、健康医疗、生活体验等角度,彰显可能性。

2. Gary Shapiro 登场

- Gary Shapiro(CTA 执行长兼副董事长)欢迎所有人来到 CES 2025。

- 特别提到「当科技与人性结合,任何事情都可能发生」,是 CES 的核心精神。

- 说明本次演讲将由 NVIDIA 创办人兼 CEO Jensen Huang(黄仁勋)带来,强调他的远见与对产业的巨大影响。

- 回顾 Jensen Huang 早年在 Denny’s 的工作经历,并赞扬他如何靠努力与坚持,带领 NVIDIA 成为世界最具影响力的科技公司之一。

▋第二部分:Jensen Huang(黄仁勋)开场

1. 幽默开场

- Jensen Huang 上台问候观众,并展示他在拉斯维加斯穿的「闪亮外套」。

- 点出观众所在的画面是「NVIDIA 的数位孪生(digital twin)」,全部由 AI 生成。

2. NVIDIA 成立与 GPU 演进

- 回顾 1993 年推出的 NV1,试图将游戏主机功能带进 PC。

- 1999 年推出可程序化 GPU,开启长达 20 年以上的图形处理革命。

- 2006 年发表 CUDA;2012 年因 AlexNet 应用 GPU 深度学习,催生近年 AI 大爆发。

3. AI 四大阶段

- 感知 AI(Perception AI):理解影像、语音、文字。

- 生成式 AI(Generative AI):可生成文字、图像、影片、语音。

- 代理式 AI(Agentic AI):能够推理、计划并执行动作。

- 物理 AI(Physical AI):能在真实世界移动、操控、互动。

▋第三部分:Transformer 与全新运算典范

1. Transformer 的重要性

- 2018 年 Google BERT 发表,Transformer 模型大幅提升 AI 能力。

- AI 不仅是新增应用,而是「根本改变了整个计算模式」。

- 所有层次(软件、硬件、云端、推论、训练)都受到深度学习与 Transformer 影响。

2. 多模态应用

- AI 如今可理解图像、文字、声音、甚至蛋白质序列与物理规律。

- 引发跨领域、跨产业的应用爆炸。

▋第四部分:GeForce 与 AI 的双向关系

1. 游戏视觉革命

- 过去 GeForce 帮助深度学习普及,现在 AI 也大幅改造 GeForce。

- 例:实时光线追踪 + DLSS + 生成帧技术,可用少量像素计算生成高分辨率、拟真画面。

2. 全新 RTX Blackwell 系列

- RTX 5070~5090(含笔电版),采用 Blackwell 架构。

- 性能较前代 Ada Lovelace 跃进数倍,并支援神经材质压缩等 AI 融合技术。

▋第五部分:AI 大规模需求与「三大 Scaling Law」

1. Pre-training、Post-training、Test-time Scaling

- 扩增资料与模型规模 → 微调与强化学习 → 推理阶段动态决定计算量。

- 对 GPU 与云端算力需求持续增长。

2. Blackwell 资料中心级产品

- 72 颗 Blackwell GPU + NVLink 超级系统,可达 1.2 吨、1.4 exaFLOPS。

- 性能/功耗比提升 4 倍,性能/成本比提升 3 倍。

3. 企业 AI:NIMs、Nemo、Blueprint

- NIMs:封装好的影像、语音、文字等 AI 模型微服务。

- Nemo:企业「数位员工」管理系统,训练、评估、布署各种 AI agent。

- Blueprint:开源蓝图,快速打造客制化 Agent。

▋第六部分:NVIDIA Cosmos ─ 世界基础模型(Physical AI)

1. Cosmos 概念

- 目标是理解与模拟真实物理,包括重力、惯性、摩擦、空间几何、因果关系。

- 与 Omniverse 结合可产生大量合成资料,用于机器人与自动驾驶训练。

- Cosmos 采开放授权,上传至 GitHub。

2. Cosmos 模块

- Auto-Regressive、Diffusion、不同比例模型,以及强大 Tokenizer。

- 可作影片生成、视觉理解、Caption、Robot 动作预测等多种应用。

▋第七部分:自动驾驶(AV)──三计算机策略

1. 三计算机架构

- DGX:训练 AV AI 模型。

- Omniverse + Cosmos:合成资料与数位孪生。

- Drive AGX:车载 AI 超级计算机。

2. 合作伙伴与技术

- Waymo、Tesla、BYD、Jaguar Land Rover、Mercedes、Toyota 等皆与 NVIDIA 合作。

- Thor 车用芯片:新一代 Orin 升级,效能增至 20 倍。

- Drive OS 获得 ISO 26262 ASIL-D 功能安全等级。

3. 合成资料助力 AV

- Omniverse 中重建真实道路,配合 Cosmos 产生天气、光线、突发状况等。

- 几千小时实录可放大成数十亿英里虚拟驾驶数据,极大加速自动驾驶训练。

▋第八部分:General Humanoid Robot 与 Isaac Groot

1. 通用机器人三大类型

- Agentic AI(信息工作者)、自动驾驶车、人形机器人。

- 人形机器人可直接适应人类现有环境,无需大幅改造设施,但示范动作不易大量收集。

2. Isaac Groot

- 少量人类示范 + Omniverse 合成数据 + Domain Randomization → 大幅增加训练样本。

- 提供四大模块:Robot Foundation Models、Data Pipeline、Simulation Framework、Thor Robotics Computer。

▋第九部分:Project Digits ─ 个人化 AI 超级计算机

1. DGX1 历史回顾

- 2016 年发表 DGX1,让研究者、新创开箱即用 AI 超级计算机。

- 第一台交付 OpenAI。

2. Project Digits 目标

- 希望所有工程师、研究员、创作者皆可拥有「桌上型 AI 超级计算机」。

- 采用 Grace + Blackwell SoC(GB110),支援完整 NVIDIA AI 方案。

- 预计 2025 年 5 月上市。

▋第十部分:总结与回顾

1. 三大 Blackwell 系统、Cosmos 上线

- MVLink 72(资料中心级)、消费级 RTX、Project Digits(个人超级计算机)皆量产或即将推出。

- Cosmos 世界基础模型开源,助力 Robotics/自动驾驶等物理应用。

2. 三大机器人形态

- Agentic AI、Autonomous Vehicle、Humanoid Robot。

- 透过 DGX + Omniverse + AGX(三计算机策略)协助工业与自动化发展。

3. 演讲结尾

- Jensen Huang 向观众致谢,祝大家 CES 愉快。

- 播放回顾影片,展示 NVIDIA 过去一年成就与未来展望。

总结

- AI 已改变整个计算模式,Blackwell 世代 GPU 全面登场。

- Omniverse + Cosmos 将推进机器人与自动驾驶应用。

- 三大机器人形态:Agentic、AV、人形机器人;未来将透过高效能 AI 与数位孪生技术全面落地。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档