英伟达发布2026财年第一财季(对应2025年第一季度)财报,财报显示,英伟达第季度营收441亿美元,同比增长69%,市场预期432.9亿美元。
其中,数据中心收入391亿美元,预估为392.2亿美元,净利润187.8亿美元,同比增长26%。数据中心收入占了最大营收比重,贡献近89%。
(英伟达财报)
这样一个业务板块对英伟达如此重要,那么英伟达的数据中心到底是什么?
英伟达的数据中心是什么
在AI的发展中,基础设施是底层支撑和核心驱动力的双重角色,尤其是数据的作用更加显著,没有数据,AI算法将就是无米之炊,数据的规模、质量与多样性,直接决定了AI的天花板。
显然,英伟达的数据中心就是作为AI基础设施而建设的,这是一个端到端的加速计算平台,集硬件和软件于一体。
硬件方面,有基于 Hopper、Grace 等架构的 CPU、GPU、DPU,如专为大规模 AI 和 HPC 设计的 Grace CPU、处理严格 HPC 和超大规模数据中心工作负载的数据中心 GPU,还有 DGX 系统等先进 AI 系统。高性能的硬件,将支持更高的数据处理能力和模型训练能力。
软件方面,包含 NVIDIA AI 等软件套件、NVIDIARiva 等应用框架、Magnum IO 等系统软件。通过整合高性能芯片、高速网络、CUDA 软件栈及合作伙伴生态,支持AI 训练、实时推理和大规模数据处理等需求。
数据中心目前进展
| Physical AI 全栈解决方案
Physical AI是指将人工智能技术与物理实体进行深度融合,例如机器人、传感器、执行器等,使机器能够感知、理解并主动干预物理世界的技术。
在2025 NVIDIA GTC 大会上,黄仁勋宣布开源Physical AI 数据集。这是一个用于机器人训练的数据集,数据量达到15TB,包含数千小时的多摄像头视频,超过 32W条机器人训练轨迹,以及多达 1,000 个通用场景描述(OpenUSD)。同时,英伟达官方表示,该数据集将随时间推移不断扩增。
Physical AI数据集地址:
https://go.hyper.ai/mkTKR
一同开源的还有用于模仿人类推理及其他技能的基础模型 NVIDIA Isaac GR00T N1,和面向机器人仿真的开源物理引擎 Newton。
| Cosmos 世界基础模型平台
Cosmos是由 NVIDIA 开发的一个集成平台,目标在于支持物理AI的开发和应用,特别是在自动驾驶和机器人领域。
此次,Cosmos 世界基础模型升级后,引入三大功能模块:
Cosmos Transfer:生成可控合成数据,支持从分割图、激光雷达扫描等结构化输入生成逼真视频。
Cosmos Predict:预测多帧中间动作,实现智能世界动态生成。
Cosmos Reason:优化数据标注流程,提升视觉 - 语言 - 动作模型训练效率。该平台已被小鹏汽车、Uber 等企业用于自动驾驶和机器人开发。
| AI 数据处理工具链
NVIDIA cuOpt 是英伟达推出的基于 GPU 加速的决策优化求解器,可以为任何企业提供用于库存水平、工厂产量、运输延迟、燃料成本、风险因素和法规方面的加速优化。
目前可通过动态评估数十亿变量实现实时决策,线性规划速度较 CPU 方案快 70 倍,车辆路线优化加速 240 倍。
NVIDIA 还推出了 NVIDIA AI 数据平台,这个平台是为了将企业数据存储与 NVIDIA 的加速计算技术相集成,为 AI 智能体提供近乎实时的业务洞察力。
同时,还有一个Dynamo 推理框架,主要通过智能资源调度、请求路由、优化的内存管理和加速的数据传输,来服务于生成式AI模型。
| 合成数据
2025 年 3 月,英伟达以九位数美元的价格收购了合成数据初创公司 Gretel。
Gretel 公司开发了用于合成人工智能训练数据的平台,为缺乏足够训练数据或对使用真实人物数据存在隐私顾虑的客户,提供合成数据解决方案。在被英伟达收购前,Gretel 已多家投资机构筹集了超过 6700 万美元的风险投资。
Gretel 支持生成文本、表格、图像等多种数据形式,并通过统计方法或生成式 AI 模拟真实数据特征,确保合成数据在质量与分布上与真实数据高度接近。
这体现了英伟达在合成数据领域的持续投入,补充自身在数据基础设施领域的竞争地位。
黄仁勋的数据观点
(黄仁勋演讲)
在CES2025进行的一场主题演讲中,谈到自动驾驶合成数据,黄仁勋介绍了Cosmos集成平台,表示:
“生成合成驾驶场景,将训练数据的规模提升数个量级。”
“数百次驾驶扩展为数十亿英里的有效里程”
近期,在COMPUTEX2025(2025台北国际电脑展)发表演讲。在机器人开发上,面临着数据挑战。他说到:
“机器人需要在真实世界的数据上学习,这既昂贵又耗时。”
为此,NVIDIA 提出了利用 AI“梦想”数据的方法,将基于 Cosmos物理 AI基础模型,在虚拟环境中生成大量的合成动作轨迹数据,从而大幅减少人工数据采集的需求。这项技术用36小时生成的合成数据量,相当于人工采集 3 个月的数据量。
谈及企业如何利用大量的非结构化数据时,黄仁勋表示:
“AI数据平台使得企业能够利用AI,发掘其90%的非结构化数据中的价值,通过自然语言的方式与企业知识库互动。”
结语
大模型随着持续迭代而不断增强,正是由于模型充分学习到了数据中的知识,数据对AI发展的作用不言而喻。而scaling law依然有效,模型能力的提升仍然需要海量的数据喂养。英伟达的AI数据中心的持续扩张,也表明了未来数据存在无限的价值潜力。
以上就是全文内容
小伙伴有什么想说的,欢迎评论区见
1
领取专属 10元无门槛券
私享最新 技术干货