首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

英伟达的AI数据中心正持续扩张,数据的价值潜力无限

英伟达发布2026财年第一财季(对应2025年第一季度)财报,财报显示,英伟达第季度营收441亿美元,同比增长69%,市场预期432.9亿美元。

其中,数据中心收入391亿美元,预估为392.2亿美元,净利润187.8亿美元,同比增长26%。数据中心收入占了最大营收比重,贡献近89%。

(英伟达财报)

这样一个业务板块对英伟达如此重要,那么英伟达的数据中心到底是什么?

英伟达的数据中心是什么

在AI的发展中,基础设施是底层支撑和核心驱动力的双重角色,尤其是数据的作用更加显著,没有数据,AI算法将就是无米之炊,数据的规模、质量与多样性,直接决定了AI的天花板。

显然,英伟达的数据中心就是作为AI基础设施而建设的,这是一个端到端的加速计算平台,集硬件和软件于一体。

硬件方面,有基于 Hopper、Grace 等架构的 CPU、GPU、DPU,如专为大规模 AI 和 HPC 设计的 Grace CPU、处理严格 HPC 和超大规模数据中心工作负载的数据中心 GPU,还有 DGX 系统等先进 AI 系统。高性能的硬件,将支持更高的数据处理能力和模型训练能力。

软件方面,包含 NVIDIA AI 等软件套件、NVIDIARiva 等应用框架、Magnum IO 等系统软件。通过整合高性能芯片、高速网络、CUDA 软件栈及合作伙伴生态,支持AI 训练、实时推理和大规模数据处理等需求。

数据中心目前进展

| Physical AI 全栈解决方案

Physical AI是指将人工智能技术与物理实体进行深度融合,例如机器人、传感器、执行器等,使机器能够感知、理解并主动干预物理世界的技术。

在2025  NVIDIA GTC 大会上,黄仁勋宣布开源Physical AI 数据集。这是一个用于机器人训练的数据集,数据量达到15TB,包含数千小时的多摄像头视频,超过 32W条机器人训练轨迹,以及多达 1,000 个通用场景描述(OpenUSD)。同时,英伟达官方表示,该数据集将随时间推移不断扩增。

Physical AI数据集地址:

https://go.hyper.ai/mkTKR

一同开源的还有用于模仿人类推理及其他技能的基础模型 NVIDIA Isaac GR00T N1,和面向机器人仿真的开源物理引擎 Newton。

| Cosmos 世界基础模型平台

‌Cosmos是由 NVIDIA 开发的一个集成平台,目标在于支持物理AI的开发和应用,特别是在自动驾驶和机器人领域。

此次,Cosmos 世界基础模型升级后,引入三大功能模块:

Cosmos Transfer:生成可控合成数据,支持从分割图、激光雷达扫描等结构化输入生成逼真视频。

Cosmos Predict:预测多帧中间动作,实现智能世界动态生成。

Cosmos Reason:优化数据标注流程,提升视觉 - 语言 - 动作模型训练效率。该平台已被小鹏汽车、Uber 等企业用于自动驾驶和机器人开发。

| AI 数据处理工具链

NVIDIA cuOpt 是英伟达推出的基于 GPU 加速的决策优化求解器‌,可以为任何企业提供用于库存水平、工厂产量、运输延迟、燃料成本、风险因素和法规方面的加速优化。

目前可通过动态评估数十亿变量实现实时决策,线性规划速度较 CPU 方案快 70 倍,车辆路线优化加速 240 倍。

NVIDIA 还推出了 NVIDIA AI 数据平台,这个平台是为了将企业数据存储与 NVIDIA 的加速计算技术相集成,为 AI 智能体提供近乎实时的业务洞察力‌。

同时,还有一个Dynamo 推理框架,主要通过智能资源调度、请求路由、优化的内存管理和加速的数据传输,来服务于生成式AI模型。

| 合成数据

2025 年 3 月,英伟达以九位数美元的价格收购了合成数据初创公司 Gretel。

Gretel 公司开发了用于合成人工智能训练数据的平台,为缺乏足够训练数据或对使用真实人物数据存在隐私顾虑的客户,提供合成数据解决方案。在被英伟达收购前,Gretel 已多家投资机构筹集了超过 6700 万美元的风险投资。

Gretel 支持生成文本、表格、图像等多种数据形式,并通过统计方法或生成式 AI 模拟真实数据特征,确保合成数据在质量与分布上与真实数据高度接近‌。

这体现了英伟达在合成数据领域的持续投入,补充自身在数据基础设施领域的竞争地位。

黄仁勋的数据观点

(黄仁勋演讲)

在CES2025进行的一场主题演讲中,谈到自动驾驶合成数据,黄仁勋介绍了Cosmos集成平台,表示:

“生成合成驾驶场景,将训练数据的规模提升数个量级。”

“数百次驾驶扩展为数十亿英里的有效里程”

近期,在COMPUTEX2025(2025台北国际电脑展)发表演讲。在机器人开发上,面临着数据挑战。他说到:

“机器人需要在真实世界的数据上学习,这既昂贵又耗时。”

为此,NVIDIA 提出了利用 AI“梦想”数据的方法,将基于 Cosmos物理 AI基础模型,在虚拟环境中生成大量的合成动作轨迹数据,从而大幅减少人工数据采集的需求。这项技术用36小时生成的合成数据量,相当于人工采集 3 个月的数据量。

谈及企业如何利用大量的非结构化数据时,黄仁勋表示:

“AI数据平台使得企业能够利用AI,发掘其90%的非结构化数据中的价值,通过自然语言的方式与企业知识库互动。”

结语

大模型随着持续迭代而不断增强,正是由于模型充分学习到了数据中的知识,数据对AI发展的作用不言而喻。而scaling law依然有效,模型能力的提升仍然需要海量的数据喂养。英伟达的AI数据中心的持续扩张,也表明了未来数据存在无限的价值潜力。

以上就是全文内容

小伙伴有什么想说的,欢迎评论区见

1

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OPiq9Am6NFyBt_6s6PDis_BA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券