
全文概览
当前,一个有趣的悖论正在行业中上演:芯片设计者、云厂商、AI研究机构在AI技术演进上加速狂奔,而广大企业用户却陷入了"试点陷阱"——尽管几乎所有企业都在部署AI,但真正实现规模化ROI的不足20%。
这个差距的本质是什么?为什么企业投入巨资却收效甚微?
答案不在于AI模型的能力不足,而在于软件架构的失配。当前的企业IT栈是为应用中心设计的,而AI工作流需要的是一个完全不同的、以智能为中心的架构。从前沿模型、认知表面、交易系统到边缘计算,整个技术栈正在被重新定义。更深层的变革是经济模式的转变——从按许可付费到按Token消费,从固定成本到可变成本,从硬件采购到算力租赁。
对于存储从业者、系统架构师和行业分析师来说,这次变革触及了基础设施的核心。企业数据如何在AI时代重新流动?存储层在认知表面中扮演什么角色?成本模型如何重塑存储技术选型?这些问题正在塑造下一代基础设施的竞争格局。
本文通过ETR最新调查数据,揭示企业与供应商之间的认知鸿沟,并提出一个四层架构框架,帮助理解AI采用的真正制约因素——以及这个制约因素如何催生新的商业机会。
阅读收获
对存储从业者的收获:
对行业分析师的收获:
对技术决策者的收获:
👉 划线高亮 观点批注

深度分析 由 David Vellante 和 David Floyer[1] 撰写
正在冲击股票市场的地缘政治动荡,正以不确定性增加的形式渗透到信息技术预算中。
似乎每一个季度的预算乐观情绪,都会被某个外部事件所抵消,导致组织收紧腰带。具体而言,我们观察到,继1月份首席信息官支出情绪调查显示增长势头后,预期已从4.6%的增长率回落至3.6%。战争、油价、通胀威胁,甚至美联储收紧政策的预期,如今都构成了更大的压力。
尽管大型科技公司继续进行大规模资本支出——且本月英伟达GTC和RSAC活动带来的真正热情仍在延续——但主流企业再次在其支出意向中表现出谨慎。除了经济形势和世界局势,人工智能的成功仍让大多数主流组织望而却步。
我们的观察是,科技行业正处于AI浪潮的第三局,这一浪潮始于上世纪10年代中期,以DeepMind及其他重要研究里程碑为起点,最终催生了ChatGPT以及随后Claude Code和OpenClaw等时刻。与此同时,组织仍处于第一局,对大规模部署AI持谨慎态度,这是合理的。
数据显示,尽管几乎所有企业都在拥抱AI,但能在大规模实现投资回报的仍仅为中等至低水平的 teens 百分比。尽管像英伟达公司首席执行官黄仁勋这样的领军人物建议不要关注投资回报率,让创新不受硬性美元回报的束缚而蓬勃发展,但现实是,在企业客户领域,有形的回报和风险管理仍然是支出的关键制约因素。
在这篇深度分析中,我们分享了来自企业技术研究(ETR)的新调查数据,该数据量化了宏观支出和AI在企业中的采用情况。我们提出了一个论点,解释AI热情与企业采用之间存在差距的原因,以及软件栈将如何演变以简化AI的采用和安全保障。最后,我们借鉴了2026年GTC的洞察,以及黄仁勋所称的其主题演讲中“最重要的幻灯片”。它提出了一个可能释放新一轮企业价值的新收入模式。
第一张图表是我们不断回归的图表,因为它显示了宏观支出情绪的时间序列。数据来自ETR自COVID时代以来进行的季度详细调查(样本量 N = 1,543)。其故事是乐观与谨慎之间的剧烈波动——以及当世界事件介入时,情绪变化的速度有多快。

走出COVID后,上图显示预算灵活性大幅提升。IT支出预期飙升至7.3%至7.5%的区间。随后,随着利率上升和不确定性占据主导,热潮消退。到2022年,预期压缩,最终在2.9%触底,与利率成反比。这提醒我们,当宏观环境收紧时,IT预算也会随之收紧。
从那时起,该图表成为信心冲击的地图。随着美联储开始降息,支出预期改善,但复苏并不顺利。我们看到了周期性峰值——4.3%,然后升至5.3%——随后因新的不确定性(如乌克兰和关税)而出现回落。最近的例子是,从12月底的4.0%升至1月的4.6%,然后在其中东冲突中回落至3.6%。我们认为,在AI整体势头强劲的背景下,短期内出现如此有意义的波动是显著的。
我们相信,正确的解读方式是:IT支出对商业环境敏感,而商业环境正受到利率、地缘政治、政策噪音和头条新闻的塑造。仅凭一张图表可能无法证明因果关系,但经过多个周期,市场数据似乎一致——当不确定性上升时,预算信心减弱,IT支出随之呈现这一趋势。
下图是对组织在当前环境下如何使用AI的核查(N = 1,573),自2025年7月以来一直持续提问。首要答案是意料之中的——通过自动化或任务增强来提升员工生产力。这一答案一直稳定在低70%的范围内,并在多个季度中保持持久。我们看到组织提出的问题是:我们如何取得超越早期用例的新突破?换句话说,企业看到了早期胜利,但它们渴望看到这些胜利复合增长。

最令人印象深刻的变动是支持员工使用AI驱动的分析和洞察进行决策的稳步上升。这是生产力之后的逻辑下一步,因为它建立在组织已经进行的分析现代化工作之上。当数据被组织且可访问时,AI可以快速放大其价值。
这是现代数据栈参与者看到真正顺风的地方——像Snowflake Inc.和Databricks Inc.这样的厂商是将分析整合到可用平台的典型代表,而Oracle Corp.以及IBM Corp.等其他厂商在更广泛的市场中也具有相关性。数据显示,现在有更多组织正在将AI推向“洞察”层,而不仅仅是“自动化”层。
另外两点值得关注:
数据的底线是AI正在建设中。生产力仍是主要用例,决策支持正在获得动力,而就业影响首先出现在招聘计划中,而非突然的大规模削减。我们的看法是,这些是可预测且相对直接的早期胜利,但它们并非改变游戏规则的。在这篇文章的后面,我们提出一个正在出现的新架构,可以支持更剧烈的组织变革,因为AI变得更简单、更安全以被采用。
我们在之前的深度分析片段[2]中曾主张,当我们从本地永久软件模型转向软件即服务时,它改变了公司的技术、运营和商业模式。我们进一步主张,随着AI的到来,一个更深刻的变革即将来临,它不仅会影响IT部门,还会影响整个组织。我们已经广泛撰写了关于从通用计算向加速架构的基础设施转变的文章。
在本节中,我们进一步向上游价值链迈进,深入探讨正在出现的新AI软件栈。在这里,我们具体预测了我们看到的技术层,这些技术层将支持更快速的AI采用。
下图将ROI数据与更深层的架构转变联系起来——企业正在从以应用为中心的世界转向以智能为中心的世界。该图展示了一个四层拓扑结构,在我们看来,它解释了当今软件栈中缺失什么,以及必须出现什么来帮助简化采用、支持新业务模式并帮助那些困在试点中的组织。组织对AI充满热情,他们正在为此提供资金。这不是制约因素。问题是,大多数企业正试图将智能体工作流拼凑到昨天的软件栈上,而软件栈本身正在被重新排列。

顶部是前沿模型——稀缺、资本密集的层,生产token。它在最先进的硬件上运行,快速改进,并日益集中在少数提供商手中(OpenAI Group PBC、Anthropic PBC、Google LLC和xAI Holdings Corp.)。对于大多数企业来说,构建这一层并非可行目标。经济现实是,前沿模型由AI工厂支持——大多数公司将消费它们,而非复制它们。
更被低估的层是认知表面。我们经常将此层称为智能系统或SoI[3]。这是意图被塑造、上下文被组装、约束被执行、输出被转化为行动的地方。这也是企业需求存在的地方——安全、策略、合规、可审计性、延迟控制以及与现有系统的集成。
这是将“智能模型”转变为受监管企业内部可操作事物的层。它也是决定转换成本的层,因为策略、语义和工具集成在这里被固化。因此,我们认为,转换供应商将变得更加困难。
我们预计这一层将是分布式的——但受控的。大型企业会希望实例更靠近其数据,以降低延迟、满足主权和监管要求。但它们不会拥有认知表面的演进。它们将配置、操作和集成它——在前沿模型提供商定义的护栏内。这保留了企业对数据和策略的控制,同时防止语义漂移。
其下是交易性底层——记录系统。这一层至关重要,因为它存储真相并执行交易。我们预测的变化是,智能向上迁移。应用和数据库不会消失,但它们的角色专注于状态、服务级别协议保证和执行。
最后,边缘最终变得重要,因为感知和物理执行发生在那里。边缘的能力最初会滞后,但随着智能体和自动化需要本地行动和本地自主权(在断开连接时),它变得具有战略意义。这是我们看来较小语言模型将蓬勃发展的地方。
另一个关键点是,成熟认知表面的缺乏加剧了智能体AI差距。我们在ROI数据中看到了这一点。企业正被要求转向一个由AI工厂作为token生产智能、通过API访问、并通过认知表面治理的世界。直到组织(和SaaS参与者)在这一中间层建立控制、治理和集成的肌肉记忆,它们将继续推出试点——并难以将其转化为可重复的大规模ROI。
我们看到这一模型正在演变,四个前沿实验室将支持这一新软件栈。我们相信OpenAI、Anthropic和Google将积极竞争企业牵引力,而xAI在我们看来最适合边缘工作负载——利用埃隆·马斯克的特斯拉、Optimus和SpaceX的飞轮。
我们认为,正在发生的更深层转变不仅是架构上的——它是经济上的。AI正在催化一种模式,其中智能在AI工厂中作为token制造,通过API访问,并作为一线项目付费。从宏观上看,今天企业大约将收入的4%用于技术。我们相信,这一数字将在未来十年内升至10%或更高。支出将从通用计算转向加速计算——由CPU、GPU和网络之间的极端协同设计支持——以电力为制约约束。
这就是为什么黄仁勋称GTC上的这张幻灯片是最重要的。纵轴是归一化能源的吞吐量(每兆瓦每秒token数)。横轴是交互性——比简单延迟更广泛的响应性,但延迟是用户体验的驱动因素。在受电力约束的世界中,在纵轴上沿曲线向上移动意味着运营商的美元。这就是我们在之前深度分析[4]中所写的“黄氏新定律”。
获得来自英伟达的最新技术可能是AI项目停滞还是规模化的区别。超大规模数据中心、AI云和前沿实验室多年来已知这一点。进入英伟达技术曲线对领导力至关重要。从Hopper到Blackwell到Rubin的年度节奏是关键——在12个月周期内实现巨大的阶跃改进,而非18至24个月的摩尔定律时钟。幻灯片中调用的35倍改进,如果你有固定的电力预算,这种差异可以在一夜之间改变单位经济性。大资本支出者知道这一点,这种动态将如黄仁勋所述迁移到企业,并显示在横轴上。

这就是图表中业务模型开始演变的部分。训练主要在纵轴上货币化——最大化每兆瓦吞吐量,客户“买得多,省得多”或“买得多,造得多”,取决于他们是构建模型还是向模型构建者出售容量。
交互性是横轴上的第二个货币化机会。它创造层级——免费、中等、高、高级、超高级——用户为更好的响应性支付更多费用,而最苛刻的工作负载驱动最高的支付意愿。低延迟推理成为定价产品并通过软件交付的服务。
这就是Groq整合和英伟达200亿美元Groq投资开始有意义的地方。Rubin + LPX进一步将曲线向右延伸——在保持吞吐量的同时改善交互性。其含义是,能够在不降低曲线的情况下将曲线向右移动的平台,可以为对响应性敏感的使用案例收费,特别是在智能体工作流和边缘推理中。范围从免费增值(免费ChatGPT)到付费(20美元/月)到更高付费层级(200美元/月)再到编码辅助到超低延迟智能体——超级昂贵但值得,因为它驱动收入。
对企业而言,其要点是这不是它们能一夜之间吸收的。它们必须选择重要的用例,构建系统,验证安全性和控制,使其运营化,证明ROI,然后规模扩大。与此同时,成本模型发生变化。Token支出成为销售成本的一部分——就像云成本成为SaaS COGS一样——组织开始将token预算作为核心运营纪律进行管理。
这就是为什么谨慎的IT预算情绪可以与AI热情共存。客户不想在遗留支出上过度投资,在理解它们在曲线上的位置以及如何将吞吐量和交互性转化为单位经济性、结果和可预测的回报之前,它们不想在新支出上过度倾斜。
展望未来,这将创造新的收入模型,并开始分解今天因技术约束而存在的组织孤岛。许多部门构建自己的自定义技术栈以支持其特定使命。流程围绕此技术栈开发和组织。数据存在于他们孤立的部门,人类然后通过提取/转换/加载流程、数据管道、数据科学工作流等整合数据。
越来越多地,我们相信这些孤岛将在很大程度上解散,因为组织能够以token形式获取智能,为其智能体企业提供动力。它们将构建组织的数字表示,运营模型将演变以支持这一新现实。
黄仁勋在GTC上说了些深刻的话。每位CEO必须理解他们在这一帕累托曲线[5]上的位置。你是在纵轴、横轴还是两者上货币化?今天,新员工获得一台笔记本电脑和系统访问权限。未来他们将获得一个token预算来指导其创收智能体。一个年薪30万至50万美元的软件工程师,每年仅花费5000美元的token,就好比芯片设计师拒绝使用现代设计工具,而使用方格纸。他们会失业。
这听起来很荒谬,但这个类比对于未来业务是成立的。利润和损失经理、销售专业人士、运营人员、物流规划者、财务专业人士等都将管理智能体大军并消耗token。弥合智能体差距需要新的技术、业务和运营模型,能够安全、安全地执行。
这一天即将到来。你在帕累托曲线上的哪个位置,你能多快到达那里?
延伸思考
这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~
问题1:架构与ROI的因果关系 文章指出企业试点难以规模化的根本原因是软件栈失配,而非模型能力不足。那么,对于已经投入大量资源构建现有应用中心架构的企业,如何在保护存量投资的前提下,逐步向以智能为中心的架构迁移?这个过程中,存储层应该如何充当"过渡桥梁"?
问题2:Token经济下的成本悖论 当AI模型从资本密集转向Token消费型时,企业的单位经济性看似更优(按需付费)。但文章提到需要管理"Token预算"——这意味着企业仍需对算力消费进行严格控制。那么,这种新的成本管理纪律会如何改变IT部门的组织结构和决策权力?存储团队在Token预算管理中应该扮演什么角色?
问题3:供应商生态的重构机遇 文章暗示当前的软件栈还不成熟,特别是"认知表面"层尚缺乏成熟的开源或商业解决方案。这是否意味着,那些能够在认知表面层(特别是与存储、数据治理深度集成)提供完整解决方案的新兴厂商,可能会打破现有的云计算垄断格局?
原文标题:The agentic AI gap: Vendors sprint, enterprises crawl[6] ---【本文完】---