首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >297 AI工厂的万亿豪赌:J曲线下的挑战与机遇

297 AI工厂的万亿豪赌:J曲线下的挑战与机遇

作者头像
数据存储前沿技术
发布2025-11-20 14:00:24
发布2025-11-20 14:00:24
190
举报

全文概览

在人工智能浪潮席卷全球的今天,“AI工厂”正成为新一代数字基础设施的核心,吸引着全球数万亿美元的资本竞相涌入。然而,这股投资热潮背后,却隐藏着一个深刻的经济学悖论:巨额的资本支出与漫长的投资回报周期之间存在着巨大的鸿沟。这正是经济学中著名的“生产力J曲线”在AI时代的生动体现——新技术初期投入巨大,但由于学习曲线、数据质量、人才短缺以及电力、水资源等物理限制,其生产力提升和商业化回报往往滞后,甚至可能出现短期内的“负生产力”现象。

那么,AI工厂真的是一门稳赚不赔的生意吗?我们该如何理解并穿越这条漫长的J曲线?作为技术从业者,我们又该如何应对这些挑战,抓住AI工厂带来的巨大机遇,实现真正的价值爆发?本文将深入剖析AI工厂的经济学曲线、关键制约因素以及未来的发展趋势,旨在为您的技术决策和职业发展提供前瞻性的洞察。

阅读收获

  • 洞察AI基础设施投资逻辑:理解AI工厂建设所需的数万亿美元资本支出及其长达十年以上的盈亏平衡周期,有助于技术决策者在规划AI项目时,更理性地评估投资风险和预期回报,避免短期主义陷阱。
  • 识别AI工厂核心瓶颈:明确电力、水、土地、专业人才和高质量数据是AI工厂规模化部署的关键制约因素,为技术团队在选址、资源获取、数据治理和人才培养方面提供明确的战略方向。
  • 掌握AI商业化新范式:了解“软件即服务”(SaSo)模式、分布式AI和生态系统建设如何成为AI工厂实现价值捕获的关键,指导技术人员关注这些领域的创新实践,以推动AI应用从技术突破走向商业成功。
  • 优化AI平台运营策略:认识到提高GPU利用率、网络效率和数据管道治理对压缩AI工厂盈亏平衡周期的重要性,为AI平台工程师和运维团队提供优化运营、加速价值实现的具体路径。

👉 划线高亮 观点批注


BREAKING ANALYSIS | 作者:David Vellante, David Floyer, Jackie McGuire, Scott Hebner and Christophe Bertrand[2]

我们最新的预测表明,人工智能工厂运营商和模型构建者需要十年或更长时间才能收回其巨额资本支出并实现盈亏平衡。

我们的预测显示,到2030年,累计资本支出将接近4万亿美元,而同期累计AI收入将略低于2万亿美元。我们预计盈亏平衡点将在下一个十年初期(2032年按运行率计算)出现,随后到2030年代中期,收益将远远超过初始投资。尽管此类预测不可避免地会不断修订,但我们认为,初始投资的规模和速度,加上大规模盈利性商业化AI所面临的挑战,将需要有耐心的资本和长远的思维才能实现持久的业务成果。

背景

在我们发布首份AI工厂收入展望[3]后不久,OpenAI Group PBC首席执行官Sam Altman和微软公司首席执行官Satya Nadella公布了关于BG2 Pod[4]的新数据。此外,在11月4日,The Information[5]发表了Anthropic的预测文章,其中还包含了基于多个匿名来源的OpenAI财务预测。

这些最新信息使我们有机会重新审视我们的数据,并将其置于经济学家Erik Brynjolfsson的生产力J曲线[6]背景下。J曲线解释了为什么像电力、蒸汽机、计算和AI这样的新型通用技术(GPT)最初生产力增长有限,因为组织必须学习、适应和重组才能实现效益。随着时间的推移,这些创新往往会超出预期。

重要的是,我们的预测侧重于AI工厂运营商的商业案例,他们目前正在为大规模AI建设提供资金——特别是那些大额资本支出者,包括超大规模云服务商(hyperscalers)、新云服务商(neoclouds)和正在构建当今大型语言模型的AI研究实验室。我们在此次分析中并未试图深入探讨预测企业消费AI服务的投资和生产力产出。然而,这两者是相关的,因为消费者和企业AI的采用速度最终将推动AI工厂运营商实现的商业化。

在此次Breaking Analysis中,我们分析了这些新数据点,并讨论了AI工厂经济曲线的形态。我们将简要介绍生产力J曲线,分享Sam和Satya声明中的片段,这些片段在许多方面都说明了AI生产力悖论。然后,我们将重新审视我们的AI工厂预测和假设;讨论行业必须克服的一些阻力才能达到我们的预测;最后展望AI和“软件即服务”(service as software)的未来。

生产力J曲线

生产力J曲线是一种现象,即在采用新的通用技术(GPT)后,传统的生产力增长衡量指标最初会下降,然后才会上升。这是因为一项新颖的技术,如AI,需要大量但难以衡量的无形投资,例如员工培训和业务流程再设计。这些初始投资可能导致暂时的负面生产力影响,但一旦组织学会有效地应用该技术,就能实现全部效益,生产力增长就会出现,而且往往以相当显著的方式。

生产力J曲线
生产力J曲线

生产力J曲线

生产力J曲线的概念由经济学家Erik Brynjolfsson、Daniel Rock和Chad Syverson开发并建模[7]。最近,在UiPath Fusion的theCUBE节目中,我们请Erik Brynjolfsson解释了当今AI繁荣背景下的生产力J曲线:

观看斯坦福经济学家Erik Brynjolfsson描述生产力J曲线及其与AI的关系[8]

“当我还是波士顿的一名年轻学生时,我想我们是在那里第一次见面,我与诺贝尔奖得主Bob Solow一起工作,他指出计算机时代无处不在,除了生产力统计数据。所以他让我调查此事,我们看到的一件事是,所有这些公司都在投资这些真正令人惊叹的技术,但并没有产生太多有价值的东西。然后,正如我们所知,在1995年,事情开始真正腾飞。所以我做了一些研究,发现许多早期技术也发生了同样的模式。对于电力,实际上花了大约30年才出现大繁荣。蒸汽机也是如此。所以当我分析它时,我们看到的是,这些很酷的技术,要真正获得它们的益处,你必须重新思考你的业务流程。你必须投资于人力资本培训等等,所有这些都需要时间和精力。而当你这样做的时候,并没有很多新的产出。 所以你有更多的投入,但产出不多。根据定义,这就是较低的生产力。但一旦你弄清楚了这一点,事情就会真正腾飞。所以对我来说,它看起来像一个J,我们把它画出来。我们在《美国经济学杂志》上发表了一篇关于它的论文,来计算它的数学原理。现在我们看到,我认为,AI也出现了同样的情况。”

在我们看来,生产力J曲线至少部分解释了当今AI的投资回报悖论。通用技术的早期采用是混乱的,利用率不均衡,工作流和数据尚未准备就绪,传统的生产力衡量指标往往在持久收益出现之前显示出下降。最新的MIT和最近的企业技术研究数据[9]表明,近期投资回报率影响不大——只有个位数到低两位数的企业看到了大规模的持续投资回报率。

我们常说,代理式AI(agentic AI)需要近十年才能成熟并广泛渗透到企业中。如果我们将投入计算为AI资本支出,产出计算为AI工厂收入,那么当前的生产力是负的,这有助于解释市场波动和泡沫论。我们认为近期的怀疑情绪不足为奇,回报取决于提高利用率、改善数据质量以及将受治理和安全的代理投入运营,从而使支出转化为tokens,tokens生产转化为收入。

Sam Altman对OpenAI收入数据持防御态度

行业共识认为OpenAI的收入约为130亿美元。在与Altman的对话中,Brad Gerstner提出了一个显而易见的问题:“一家拥有130亿美元收入的公司,如何能做出1.4万亿美元的支出承诺?” 这激怒了Altman,以至于他透露了一些此前未曾分享的收入估算。

观看Altman对批评的回应[10]

具体来说,Altman表示:

  • OpenAI的收入“远超”130亿美元;
  • Altman暗示他们将在2027年达到1000亿美元的收入,而不是大多数估计的2028年或2029年。

我们进一步研究表明,这两个估算都是运行率收入预测。因此,我们预计OpenAI 2025年的收入为150亿美元。此外,在上面的片段中,Nadella通过声称他从未见过OpenAI未能达到或超越的商业计划,为Altman的声明增添了可信度。

theCUBE Research的Jackie McGuire对Altman和Nadella的评论有以下看法:

“我认为他们的语气很大程度上说明了信息。对我来说,Sam在说‘我们远超130亿’时听起来有点防御性。在我看来,一方面是说我们做得比那好得多。另一方面是说,‘我告诉你们,这绝对是稳赚不赔的。就像道奇队在世界大赛中,我从没见过他们输球。’上周《连线》杂志有一篇文章叫做AI是所有泡沫的终结者[1]。它谈到了泡沫的不同特征,以及人们如何谈论它。是的,我不知道。我只是觉得这种语气比我预期的,一个对自己的收入非常非常有信心的人,要防御得多。”

正如《连线》文章提醒我们的那样,这种叙述与1920年代RCA的炒作如出一辙。Andrew Ross Sorkin在推广他的新书《1929》时也做了类似的比较,将OpenAI比作今天的RCA。但OpenAI拥有更快的执行力、更大的用户基础和更成熟的通信基础设施等优势。将OpenAI的收入预测提前,意味着该公司将迎来显著更高的发展轨迹。

1920年代RCA的背景

  1. 公司成立与背景
    • 美国无线电公司(RCA) 成立于1919年。
    • 成立目的是为对抗英国马可尼公司在无线电领域的垄断,确保美国主导这一战略性新兴产业。
    • RCA由通用电气主导,整合了AT&T、西屋电气等多家公司的无线电专利。
  2. 核心业务与市场地位
    • 在1920年代,RCA是美国无线电和广播业的绝对巨头。
    • 它不仅销售收音机,还拥有并运营着美国第一个全国性广播网络——NBC(1926年成立),在技术和内容分发上占据主导地位。
  3. “炒作”的性质
    • 1920年代(“咆哮的二十年代”)无线电是革命性新技术,极大地改变了生活。
    • 作为行业领军者,RCA股票在华尔街备受追捧,股价飙升,是当时市场对新兴技术潜力巨大预期的典型“炒作”代表。
    • 这种“炒作”反映了公众对无线电将带来巨大变革的乐观情绪。

Nadella的评论将OpenAI描绘成一台“执行机器”,令人鼓舞。再加上约8亿月活跃用户以及该公司声称的100万企业API客户,这展示了惊人的发展速度,并预示着下一家伟大的软件公司可能是什么样子。

更新AI工厂预测

在下图中,我们更新了早期的AI工厂预测[11],该预测以加速的步伐重新构建了数据中心的建设。其相关性在于,这代表了最终支付AI账单的资本支出。数据中心投资需要土地、电力、水、分销、散热系统以及加速堆栈本身——计算、存储和网络。预测中的AI部分(深棕色条)令人震惊,并正在迫使堆栈向极致并行化转变。

AI工厂预测更新
AI工厂预测更新

AI工厂预测更新

以下几个关键附加点值得注意:

  • 数据中心平台总支出加速增长,到2031年达到约1万亿美元,到2035年达到1.69万亿美元,这意味着复合年增长率(24-35年)约为17%;
  • AI工厂支出在2024年超过传统数据中心(约1800亿美元对约1700亿美元),此后占据主导地位,到2035年达到总支出的约97%;
  • AI工厂支出以约38.6%的复合年增长率(22-35年)增长,而传统数据中心支出以约12.1%的复合年增长率下降,这证明了堆栈的全面翻转;
  • 到本十年末(2030-2031年),传统数据中心将成为一个小的残余部分(数百亿到数十亿美元),因为AI平台几乎驱动了所有增长;通算市场的危机有多大?未来5年数据中心业务的发展有哪些机遇与挑战
  • 这种转变是由数量、价值和速度驱动的:持续的两位数总增长几乎完全由AI工厂的增长解释,而不是传统平台。

相对于我们4月的预测,建设速度加快,这反映了近期财报披露和交易签署,表明OpenAI获得了不成比例的先进封装/图形处理单元容量份额,而Google LLC以及其他超大规模云服务商和Meta Platforms Inc.也加大了承诺。总而言之,这些投入证明了AI工厂支出的提前。正如我们将在下面展示的,在评估累计支出与累计收入时,收入增长在模型中滞后。

最新的预测意味着,尽管超大规模云服务商、新云服务商和专业提供商将运营大部分容量,但企业最终将需要通过消费来承担大部分经济成本。这将通过云、新云和托管渠道以及选择性的本地部署广泛发生,尤其是在边缘AI成熟之后。

尽管华尔街正确地指出超大规模云服务商和新云服务商的GPU资产“灯火通明”,但运行1000多个GPU集群的企业利用率往往低于30%,原因是并行计算的肌肉记忆薄弱、工作流不成熟和数据摩擦。这种利用率不足因硬件快速折旧而加剧;与2000年的暗光纤不同,GPU价值流失很快。在我们看来,如果企业无法将容量转化为tokens和生产力,投资回报率将累积到价值链的其他地方,直到运营纪律跟上。

终端设备是一个潜在的利好,因为AI PC的更新周期将把更多的推理推向边缘,并且随着组织平衡经济性、延迟、隐私和数据移动的实际限制,回归务实的混合模式可能会出现。运营现实是,我们生活在一个12到18个月的更换周期中,电子垃圾和劳动力挑战意味着对基础设施的行和机架进行永久性的“粉刷金门大桥”式的更新节奏。

混合AI也将由企业部署。因此,跨本地/托管/公共的选择和灵活性将很重要,升级时间表也会有所不同,这需要一种架构,让团队能够“利用公共云”,同时本地容量不断发展(劳动力和人才限制在我们后面介绍的劳动力数据中可见)。

数据引力和存储经济学也在发挥作用。我们预计很大一部分成本将用于存储和数据管理,而不仅仅是GPU。我们可能会看到对深度、经济型存储层(包括磁带)的重新兴趣,以及存储供应商之间的军备竞赛,以更接近加速器,因为数据准备、血缘和代理工作流的元数据是规模化的限制因素。总而言之,支出是真实且更早的,但盈亏平衡将延长到十年以上,利用率、结构效率和受治理的数据管道的改进需要时间。

在我们看来,运营议程是筹集资金、达成交易、快速建设、确保电力和GPU、提高利用率、压缩网络延迟、强化受治理的数据平面,并对混合容量进行排序,以使折旧曲线不会超过价值实现。

预测AI工厂产生的收入

下图显示了AI工厂运营商的收入产出。它不代表主流企业通过提高生产力并为宏观国内生产总值提升做出贡献所创造的价值。预测这种影响是一项单独的工作,需要对公司层面的生产力影响做出假设。相反,此预测旨在帮助我们模拟AI大规模资本支出所带来的收入回报,我们认为这将推动一场巨大的生产力繁荣。

AI工厂收入预测
AI工厂收入预测

AI工厂收入预测

数据传达了以下五个关键信息:

  • AI工厂收入增长:惊人的115%复合年增长率(24年至30年);
  • AI工厂收入到2030年将爆炸式增长至约7800亿美元(从2024年的约80亿美元),2026年后曲线急剧变陡,因为已部署的容量开始商业化;
  • OpenAI主导领先地位,从2024年的约40亿美元增长到2030年的约3420亿美元,并在2027年突破1000亿美元的运行率,这得益于卓越的资金/计算资源获取、深度合作以及基于前沿模型的高质量软件;
  • 中国崛起成为强大的阵营,从2024年的约10亿美元增长到2030年的约1950亿美元,反映了国内巨头(阿里巴巴、百度、腾讯、字节跳动)将国内需求转化为大型AI工厂业务;
  • Google + Anthropic作为联合增长引擎:Google的张量处理单元(TPU)和平台护城河,加上Anthropic的模型/软件实力,共同产生了强劲的联合发展轨迹(到2030年达到约1300亿美元)。在此情景下,微软、亚马逊网络服务公司(AWS)、xAI Holdings Corp.和其他公司也在增长,但绝对规模较小;
  • 主流企业收入主要为间接收入:大多数组织通过应用程序编程接口(API)消费AI,而不是构建大规模AI工厂;收入集中在工厂运营商(超大规模云服务商、新云服务商、OpenAI、中国主要公司和少数其他公司)。

我们更新后的收入预测反映了AI工厂更陡峭的商业化曲线,OpenAI的轨迹根据新信息设定得更高。今年近200亿美元的运行率以及到2027年达到1000亿美元的路径,最初由消费者/专业用户需求推动增长,然后通过快速迭代的API和连接企业数据的软件加速。我们将Google和Anthropic视为联合伙伴关系,因为TPU容量和紧密的技术协同使得联合扩展成为可能,即使它们各自保持独立的渠道;Anthropic与AWS也有紧密的合作关系。我们假设中国的阵营因美国技术限制而崛起,这集中了国内投资和需求。

theCUBE Research团队的核心争论是,垂直整合的、更“封闭”的方法能否维持领导地位,而不是标准化工厂间集成的“开放网格”。一方面,我们认为如果没有开放标准和协议,多公司企业对企业(B2B)工作流可能会碎片化为专有适配器的拼凑,重蹈早期云的覆辙,并减缓“智能经济”的发展。

信任要求(透明度、问责制)以及数据移动和治理的成本强化了开放性的理由;统一的企业数据将是限制因素,并为数据移动供应商抢占市场份额创造了空间。另一方面,我们注意到事实标准(de facto standards)一再引领市场——IBM/360、商品PC上的Windows、AWS、iPhone、CUDA等——其中专有控制加上生态系统引力创造了实际中重要的互操作性。在这种观点下,幸存的工厂将双边和大规模地定义接口,然后正式标准随之而来。

关键假设:企业将主要通过API消费AI;互操作性将通过事实接口和选择性开放标准的结合而改善;统一、受治理的数据是价值捕获的真正先决条件。

总而言之,预测支持OpenAI目前在竞争中处于领先地位。得益于资金、计算资源获取、快速的软件/API速度和深度合作,我们认为这将复合式地带来市场份额增长,即使其姿态比纯粹主义者所希望的更为封闭。我们承认开放性可能赢得长期竞争的风险;然而,历史表明事实标准通常首先占据主导地位,正式的开放性随后才赶上。

因此,我们的基本情况是OpenAI保持领先,同时关注持久开放协议的证据,这将使市场份额转向更开放的运营商。

长达十年的J曲线:资本支出领先于AI工厂收入

下图显示了我们预测的建设AI工厂所需的累计资本支出(橙线)以及这些工厂产生的tokens收入(绿线)。正如您所看到的,这项业务不适合胆小的人,具体如下所述。

累计资本支出与AI工厂收入
累计资本支出与AI工厂收入

累计资本支出与AI工厂收入

  • 巨大的差距正在拉开:到2030年,累计AI工厂资本支出将达到约3万亿至4万亿美元,而累计收入在整个十年中将显著滞后;
  • 盈亏平衡遥遥无期:这些曲线直到约2032年(从建设开始算起10多年)才按运行率交叉——这凸显了漫长的J曲线;
  • 早期J曲线拖累:由于学习曲线、企业数据质量差以及端到端代理服务解决方案所需的时间,收入起步缓慢;
  • 物理和运营阻力电力/土地/水资源限制、熟练劳动力、治理和监管减缓了tokens的产出速度,并使利用率低于潜力;
  • 运营商纪律决定回报利用率、结构效率和终端客户层面的受治理数据管道是缩小差距的因素;
  • 丰厚回报:对于那些能够实现盈亏平衡的运营商来说,将获得丰厚的回报。绿线的斜率代表了我们的假设,即广泛的生产力改进将开始在宏观层面显现,并显示出持续的持久性——推动有史以来最重要的技术浪潮。

我们认为,累计支出与累计收入的预测强调了AI生产力悖论,即2024年开始的数万亿美元资本支出浪潮,但收入滞后十年以上,导致早期J曲线中衡量的生产力看起来很低甚至为负。支出线反映了完整的工厂建设——土地、电力、水、分销、散热和加速堆栈——而收入线则捕捉了商业化,商业化起步缓慢,只有在端到端解决方案成熟后才会加速。

在我们的分析中,三个抑制因素在早期占据主导地位:1)数据质量差——网络数据嘈杂,企业数据也充满挑战——需要耗时的清理、协调和策略控制;2)行业需要打包并交付一个统一、值得信赖的代理软件层,企业无需定制集成即可采用;3)纯粹的分母问题——前期投入如此多的资本支出,即使利用率提高,追赶也需要时间。

人们普遍认为,随着运营杠杆的发挥,价值创造最终会飙升;悬而未决的问题是速度。一些人认为,对于有针对性的、高价值的工作流,盈亏平衡点可能会更快到来,而不是全面企业采用,而另一些人则认为,仅凭资本支出的规模就将盈亏平衡点推迟了约11年。

我们看到的阻力:土地/电力/水资源限制;熟练劳动力和运营节奏;数据质量差/碎片化和治理;不断演变的法规(和地缘政治摩擦)使数据移动复杂化;以及建立代理控制平面的学习曲线。总而言之,预测与我们的主要结论相符——巨大的近期差距、漫长的盈亏平衡期、早期J曲线阻力、沉重的物理/运营限制,以及通过确保能源、提高利用率、收紧结构和强化受治理的数据管道来缩小差距的途径。

电力、水和AI工厂的地理分布

我们认为德勤的 “美国基础设施能否跟上AI经济的步伐?[12]” 报告阐明了我们论点的一个核心制约因素:能源和水的可用性——以及电网扩张的速度——将决定建设的步伐。

AI工厂的地理分布与基础设施
AI工厂的地理分布与基础设施

AI工厂的地理分布与基础设施

AI机架比传统设备运行温度更高、密度更大,推动了从蒸发冷却到液体/机械冷却的结构性转变,并迫使运营商将设施选址在双路公用事业供电可行的地点以实现冗余。这正在推动建设向内陆市场发展,这些市场拥有有利的土地和互联互通,但当地人才库有限,同时在大型部署后的两到三年内造成了明显的局部电价上涨。

短期内,备用发电仍主要依赖柴油,电网结构仍偏向化石燃料;企业购电协议(PPA)和新能源有助于解决问题,但建设周期漫长。核能正在重新进入讨论,作为少数几种可扩展的、全天候的选项之一,能够在未来十年内匹配多吉瓦的AI集群。

在我们看来,这种能源现实与J曲线经济学相吻合,即使资本可用,电力采购、水权和冷却改造的节奏也会减缓tokens的产出速度,并对收入实现构成阻力。实际的启示是,盈亏平衡点随着基础设施而非仅仅硅芯片而移动。

启示:运营商将优先选择具有双路供电能力和水源的地点;锁定长期购电协议,同时探索核能选项;预计局部公用事业费率压力;规划液体冷却技能和供应链;将能源采购视为与网络和数据治理同等重要的项目办公室。

谁来建造AI工厂?人才的严重制约

德勤的研究阐述了建设AI基础设施的许多挑战和解决方案。其中一个可能最被低估的是熟练劳动力。我们认为,继电力之后,一个关键的障碍是人才。

AI工厂人才挑战
AI工厂人才挑战

AI工厂人才挑战

德勤的调查显示,对熟练劳动力的竞争和数据中心特定技能的短缺是劳动力面临的最大挑战。建设和运营AI工厂需要利基行业——核工程师、柴油发电机技术员、高容量冷却器机械师和专业焊工——而不是普通的IT人员。这些工人稀缺、分布不均,并且往往不愿搬迁到拥有双路供电和水资源的内陆地区,这给工资上涨和调度风险带来了压力。

数据强调了这一点,受访者指出与其他行业的竞争(约53%)、数据中心相关熟练劳动力短缺(约51%)、人才地理限制(约43%)和高流失率(约42%)是主要障碍。劳动力法规也增加了摩擦;值得注意的是,电力公司高管比数据中心建设者更频繁地将法规视为挑战,这反映了各州和欧盟式的差异。在此背景下,超大规模云服务商、新云服务商和资金充足的运营商将为最优秀的人才支付高薪,而政府也在争夺人才——进一步加剧了市场紧张。

在我们看来,解决人才缺口需要多年的努力——国家和区域项目来再培训失业工人;从高中开始为高级焊接、机械和电气行业、了解高级管道的流体工程师建立职业培训管道;以及增加使用机器人来服务占地相当于足球场大小的多建筑园区。如果没有这种劳动力增长,资本支出-收入交叉点将推迟,无论芯片出货速度有多快。

软件:从零边际成本到软件即服务

Satya Nadella发表了以下声明:

“所以新的SaaS应用程序,正如你所说,是智能应用程序,它们针对一组评估和一组结果进行了优化,然后知道如何最有效地利用tokens工厂的输出。有时延迟很重要,有时性能很重要。而知道如何以智能方式进行这种权衡,就是SaaS应用程序的价值所在。但总的来说,这次软件确实会产生真实的边际成本。在云时代也是如此。当我们制作CD-ROM时,边际成本并不高。有了云,就有了。而这次,边际成本要高得多。因此,商业模式必须调整,你必须分别为代理工厂和tokens工厂进行这些优化。”

AI再次改变了边际成本的计算方式。CD-ROM时代将边际成本推向塑料的价格;SaaS重新引入了云运营支出税;AI带来了迄今为止最沉重的负担——快速折旧的GPU、电力和专业劳动力——因此,即使销量潜力爆炸式增长,表面毛利率也会压缩。这些动态与最近关于边际成本压力的评论相符,并为我们认为更重要的转变——George Gilbert的软件即服务(service-as-software,简称SaSo) 理论——奠定了基础。在SaSo中,工厂将代理能力作为可编程服务暴露,企业通过API和轻量级本地运行时消费它们,“软件式”经济效益不成比例地归属于买家(生产力)和少数实现规模、利用率和分销的卖家。

我们认为,尽管近期存在成本压力,但有三种力量正在加速SaSo。首先,算法和系统效率将补充蛮力扩展——更好的数据选择、稀疏性、编译和工作负载整形可以显著降低计算成本。其次,分布式AI将合理地分配工作:边缘(包括设备上)进行预处理和后处理,工厂推理和训练通过API进行;存储层(包括磁带)和机器人将降低运营大规模园区的成本。第三,拥有最深厚生态系统的工厂将交付智能系统(SoI)代理控制平面、软件开发工具包和适配器,企业可以“按原样”采用,而不是构建定制堆栈。在我们看来,这意味着大多数组织将优先拥有和管理其数据,同时从少数几个高容量、改进最快的工厂获取智能。

总结:AI工厂的建设是真实的、前期投入巨大的,并遵循长达十年的J曲线。电力、人才和数据质量/治理决定了盈亏平衡点。收入捕获将归属于那些 1)提高利用率,2)赢得网络和系统效率竞争,3)支持以服务形式交付可信赖的代理平台,4)动员开发者生态系统,以及5)不懈努力供应链的运营商。

AI的买家将看到软件般的边际经济效益。这形成了一个赢家通吃的市场。目前,势头和证据表明OpenAI和英伟达公司处于领先地位,超大规模云服务商和选定的合作伙伴紧随其后,由一个正在为2030年代的巨大回报而动员的供应链生态系统所滋养。


延伸思考

这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~

  1. 面对AI工厂的巨额投入和漫长回报周期,作为技术团队的负责人或核心成员,您认为在设计和实施AI基础设施时,应如何在短期效益和长期战略价值之间取得平衡?
  2. 文章指出电力、人才和数据质量是AI工厂的关键制约,在您实际参与的AI项目中,是否也遇到了类似瓶颈?您是如何通过技术创新或跨领域协作有效缓解这些挑战的?
  3. “软件即服务”(SaSo)模式被认为是AI工厂价值捕获的关键,您认为未来的AI应用和平台将如何演进,以更好地适应这种模式并实现规模化效益?

原文标题:AI factories face a long payback period but trillions in upside[13]

---【本文完】---


  1. https://www.wired.com/story/ai-bubble-will-burst/ ↩
  2. https://siliconangle.com/author/guestauthor/ ↩
  3. https://thecuberesearch.com/296-breaking-analysis-ai-factories-data-centers-of-the-future/ ↩
  4. https://www.youtube.com/watch?v=Gnl833wXRz0 ↩
  5. https://www.theinformation.com/articles/anthropic-projects-70-billion-revenue-17-billion-cash-flow-2028?rc=nxigdx ↩
  6. https://www.nber.org/system/files/working_papers/w25148/w25148.pdf ↩
  7. https://www.nber.org/system/files/working_papers/w25148/w25148.pdf ↩
  8. https://video.cube365.net/c/985286? ↩
  9. https://thecuberesearch.com/294-breaking-analysis-the-zero-loss-enterprise-data-resilience-as-an-ai-service-layer// ↩
  10. https://video.cube365.net/c/985331? ↩
  11. https://thecuberesearch.com/271-breaking-analysis-mapping-jensens-world-forecasting-ai-in-cloud-enterprise-and-robotics/ ↩
  12. https://www.deloitte.com/us/en/insights/industry/power-and-utilities/data-center-infrastructure-artificial-intelligence.html ↩
  13. https://siliconangle.com/2025/11/09/ai-factories-face-long-payback-period-trillions-upside/ ↩
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 背景
  • 生产力J曲线
  • Sam Altman对OpenAI收入数据持防御态度
  • 更新AI工厂预测
  • 预测AI工厂产生的收入
  • 长达十年的J曲线:资本支出领先于AI工厂收入
  • 电力、水和AI工厂的地理分布
  • 谁来建造AI工厂?人才的严重制约
  • 软件:从零边际成本到软件即服务
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档