首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >303| 2026数据预测:上下文智能与AI代理的落地之战

303| 2026数据预测:上下文智能与AI代理的落地之战

作者头像
数据存储前沿技术
发布2026-01-28 16:06:43
发布2026-01-28 16:06:43
430
举报

全文概览

生成式AI的“幻觉”期已过,企业正从对演示的惊叹转向对成果的审视。我们已进入AI时代的“第三局”:核心矛盾不再是模型参数的大小,而是数据上下文的深度。当40%的首席数据官仍在为数据质量和整合而战时,行业却在热议“上下文图谱”和“大型行动模型(LAM)”。

为什么OpenAI在坐拥数亿用户的同时,会被视为高风险赌注?为什么说2026年企业AI的停滞并非因为模型无能,而是治理滞后?本文深度复盘了行业专家的最新预测,剖析了从语义层到代理式工作流的演进路径。对于存储从业者和分析师而言,理解Postgres如何成为代理的状态存储库,以及为何系统集成商正挤压SaaS供应商的生存空间,将是把握未来两年行业脉搏的关键。

阅读收获

  • 存储从业者:识别Postgres作为代理状态存储库的新兴机会,理解Iceberg与向量数据库如何从“加分项”演变为存储架构的“入场门槛”。
  • 行业分析师:评估OpenAI高昂推理成本与融资规模背后的财务风险,洞察AI栈切换成本上升对市场竞争格局的深远影响。
  • 学术界:厘清从LLM到LAM的技术演进逻辑,掌握语义层(OSI)在解决SQL表达力不足及业务规则捕捉中的核心作用。

👉 划线高亮 观点批注


深度分析 作者:Dave Vellante[1]

现代人工智能时代已走过八年多,行业已经超越了生成式人工智能1.0时代的惊叹。

新奇感已经消失,取而代之的是审视。企业对演示的印象越来越淡,对成果的耐心却越来越强。市场观察者对模糊的叙事越来越持怀疑态度,评论已经从"看看AI能做什么"转变为"给我看看实际价值,给我可见性和可控性。"

这一动态的根本前提是:人工智能的关键是数据;特别是上下文中的数据。 2010年代的现代数据栈——以云为中心、计算与存储分离、流水线、仪表板等——现在显得微不足道。目标已经转向支持代理系统,这些系统能够在企业中行动、协调和学习,处理大量结构化和非结构化数据、复杂工作流、冲突策略、多个身份以及业务流程内部的细微语义。

行业依然兴奋,同时也矛盾重重。用一个常被引用的棒球比喻来说:第一局是2017年前后的学术发现——解释Transformer和扩散模型的论文。但大多数人并未关注。第二局是ChatGPT时刻和人工智能传遍世界的时刻,这带来了兴奋,也带来了大量炒作。

张钹院士在 2026-AGI-Next前沿峰会对LLM计算的底层理解

究竟现在大语言模型用的什么原理?实际上用了分布式语义的原理,也就是把语义翻译成Firth说的这句话,用它周围贡献频率最高的词,来作为这个词的语义,他是这么来定义的。

从这出发,我们就有条件把贡献的词变成从贡献中学习语义,我们现在就是这么做的,实际上是把原来离散空间里贡献的词,变成高维空间里头稀疏的空间,帮它变成致密的向量空间的几何结构,这是一个重大的进步,使得我们语言变成可计算的。因为原来稀疏的贡献的空间是不能计算的,现在变成稠密的向量空间就可以计算。所以把语言处理的问题完全变成数学计算问题。

可以证明,只要你用的数据量足够多,用的上下文足够长,这个空间就会出现语义关系空间。如果我们有了足够的数据,有了足够长的文本,就会使这个越接近它。

欢迎来到现代人工智能时代的第三局。在本次特别深度分析中,我们评估从"这是什么生成式AI?"的震惊到"我们如何让它为我们服务?"的转变,以及如何让代理可靠地采取行动,实现科技行业所承诺的生产力提升?

为此,我们很高兴举办第五届年度数据预测专家小组会议,与Cube Collective的 collaborators、Data Gang成员以及行业领先的数据分析师合作。今天与我们一起的是五位专注于数据和相关主题的行业专家:Sanjmo的Sanjeev Mohan、DB Insight的Tony Baer、ISG Software Research的Dave Menninger、BARC的Kevin Petrie,以及Blue Badge Insights的Andrew Brust。

按照惯例,在开始之前,我们想分享一些来自Enterprise Technology Research朋友的调查数据,以强调行业发生了多少变化。ETR每季度对1700多名信息技术决策者进行支出意向调查。我想单独分析机器学习/人工智能领域,向您展示情况的变化。

这张图表显示了各行业的支出情况。纵轴是行业内的净得分或支出动能,横轴是基于账户渗透率的各数据集普及率。这是回到2024年4月的情况。那条40%的红线表示支出速度极高,如果您还不知道这一点——机器学习/人工智能位居所有行业之上,尽管最近支出动能略有放缓。

动能的放缓或许表明我们仍然需要更好的人工智能。本周的一项Workday调查显示,85%的受访者表示人工智能每周节省了一到七个小时,但超过三分之一的时间节省被用于纠正错误、重写和验证内容,只有14%的人报告了人工智能的一致积极结果。

尽管如此,ETR数据显示过去六个月持续稳步推进。

当被问及如何利用人工智能时,超过1700名客户继续将生产力、决策支持和业务转型列为主要益处,引用率逐渐增加。但看看自去年7月以来对避免未来人员编制需求的显著增长。从仲夏时样本的21%上升到今天的30%。

最后让我们看看一些参与者的表现——其中几位我们今天会讨论。

同样的维度,Y轴是支出速度,X轴是账户渗透率;但有一些显著变化。我们在右下角插入了一个图表,以便您可以看到点的分布方式——净得分和调查中的样本量——请记住,任何高于那条红色虚线的位置都表示高度活跃的动能。

  1. OpenAI Group PBC和微软公司,尽管近期出现一些负面情绪,但在账户渗透率和支出速度方面仍处于领导地位。
  2. Meta Platforms Inc.的Llama从第一动能玩家直线下降,远低于红线——与此同时Anthropic PBC正在蓬勃发展。
  3. 亚马逊网络服务公司和谷歌公司仍然不相上下,正如我们过去报道的那样,谷歌正在缩小与AWS的差距。
  4. Snowflake Inc.两年前不在机器学习/人工智能的视野中,它和Databricks Inc.现在不相上下,Databricks看到更多支出速度,Snowflake的账户渗透率略高。
  5. Tensorflow不是供应商,所以忽略它,您可以看到传统厂商挤在一起,在市场上争夺相关性。

关键是行业在我们眼前继续转变,客户必须在噪音中眯着眼睛并在混乱中下注。

回顾2025年预测

好的,背景介绍完毕,让我们进入2025年预测回顾。下面的图表将所有2025年Data Gang预测整合在一张表中。

它显示了预测以及分析师对自己评分的自我评估——直接命中为绿色,擦边为黄色,未命中为红色。快速浏览热力图显示Data Gang在2025年预测中表现参差不齐。我们每位分析师都将进行回顾,您可以自行决定评分。

2025年预测回顾:Sanjeev Mohan关于AI代理的崛起——黄色/绿色

Sanjeev Mohan在2025年预测回顾中首先重新审视了他关于AI代理将崛起并普及的预测。在他看来,这个预测结果喜忧参半,主要是因为"代理"的定义高度弹性,取决于回答问题的人。

Mohan的核心观点是,市场显然已经朝着他预期的方向发展——代理无处不在——但这种广度伴随着语义漂移和品牌重塑。他观察到"每个人都重新命名了","现在每个人都有一个代理在做各种事情",造成了过度普及的印象。换句话说,标签传播得比实质内容快,这使他很难给自己一个"干净的绿色"评分。

与此同时,他指出在狭窄领域有切实的胜利。Mohan提到了单任务代理,编码是最明显的例子。他引用了Anthropic首席技术官的一个说法,即"Claude 100%的新功能都是由Claude Code完成的",称之为"非凡的"。他还提到了客户服务领域的早期进展以及其他一些领域,强化了专注的代理开始产生有意义成果的观点。

他划清界限的地方是更雄心勃勃的目标,即代理将被嵌入复杂工作流中,自主运行并端到端地做出决策。在这一点上,Mohan的评估是这个故事还不完整,"我们还没有到那一步"。市场已经证明可以推出有用的点解决方案;尚未在多步骤、决策密集型企业工作流中展示广泛的可靠自主性。

Mohan还回顾了他先前展望的第二个组成部分,即到今年的小组会议,每个人都将拥有个人代理。他坚持认为方向上他仍然相信这会发生,但他调整了时机,说这项技术仍然太难主流化,这个里程碑可能不得不等到明年。

2025年预测回顾:Tony Baer关于"数据复兴"——黄色

Tony Baer重新审视了他2025年的预测,即行业将看到数据复兴,基于一个简单的前提:如果人工智能聚光灯,那么好的数据就成为燃料,供应商和客户都将被迫相应地重新定向注意力。Baer给自己评分为黄色,不是因为方向错了,而是因为结果参差不齐,取决于你看待供应商活动还是客户执行。

在供应商方面,Baer认为这一年发出了明确的信号,数据变得"至关重要"。在他看来,最显著的指标是围绕模型上下文协议的快速凝聚。他强调了这种速度的不寻常:一个"2024年末"宣布的框架,在大约一年内成为事实上的行业标准,然后"在Linux基金会下"进入开源管理。对于Baer来说,MCP的采用速度表明行业广泛认识到与数据标准化连接的重要性。

然后他指出了Postgres强劲的一年,引用了"三个新的"Postgres平台条目,并强调了他称之为"Snowbricks"的东西——他对Snowflake和Databricks的简称——每家公司都购买了一个Postgres平台来补充其分析栈。Baer建议一个主要用例可能是代理的状态存储库或状态存储——持久化代理状态的地方。关注pg在持久化代理状态数据场景的应用。他说微软用HorizonDB提出了类似的论点,强化了操作数据底层正在被重新定位为代理驱动系统的基础组件的主题。

除了Postgres和MCP,Baer引用了几个其他指标,表明"数据复兴"在产品方面是真实的:

  • Apache Iceberg牢固地成为事实上的标准,Databricks让它与Delta"平起平坐",甚至称其为首选平台;
  • 向量成为"勾选框功能"和"入场门槛";
  • 早期趋势显示语言模型不仅用于数据库,还帮助管理它们——以及数据库代理的出现用于操作管理。

当被追问既然有这些,为什么仍然选择黄色时,Baer说 "世界不仅仅是供应商公告。" 他的期望包括客户"迎接挑战",在这方面他看到了显著差距。他强调数据治理和人工智能治理在很大程度上仍然是孤岛化,太多组织仍在运行"同样的旧做法"。他还点名知识图谱作为一个他预期会看到更多进展的领域;相反,他看到了"很多讨论",但没有达到他预期的采用水平。

Baer用AWS发布的一项研究中一个具体数据点来强化这一谨慎:40%的首席数据官仍然引用数据质量和数据整合的长期问题。在他看来,这些"同样的小战役"的持续存在正是他拒绝"宣布胜利并打道回府"的原因。Baer记分卡的头条不是复兴论失败了——而是行业的工具和供应商叙事比客户治理和采用模式推进得更快。

出现这种体感差异的主要原因是小企业和大企业(或者说C端和B端)数据治理的问题意识差异,且面临的困境也不同,现阶段为AI呐喊多数是C端或许小企业,数据体量不大,且没有复杂的部门墙。

2025年预测回顾:Carl Olofson关于知识图谱的崛起——黄色/绿色

小组回到知识图谱的话题,背景是Carl Olofson在2025年做了一个预测,但他因退休未能出席。Carl预测知识图谱的崛起,本文作者说他最初给这个预测评分为绿色,作为"知识图谱粉丝"。然而,这种乐观的评分在小组讨论中遇到了现实检验,包括早些时候表达的怀疑,表明企业采用可能没有加速。

为了给辩论提供基础,Kevin Petrie提供了额外背景。Petrie引用了他同事即将完成的BARC Research分析。他将关键发现总结如下:在人工智能采用者中,2025年底有27%将知识图谱投入生产,而2024年初为26%——在大约一年半的时间里几乎没有增长。Petrie补充说,下降的是早期阶段活动——评估和概念验证减少了——这表明知识图谱实现的管道已经放缓。

Petrie指出这种放缓令人惊讶,因为他相信知识图谱"有很多价值可以提供"。但他也指出了他认为是主要限制因素的东西——复杂性——特别是"输入的组装和准备"构建和运营知识图谱所需的东西。在他看来,这种实施阻力正在实质性地限制动能,即使概念价值主张仍然强劲。

在听到Petrie的数据和理由后,我们实时修订了Carl的评分,将Olson的预测从绿色改为更有资格的黄绿色。

2025年预测回顾:Dave Menninger关于"从LLM到LAM"以及为什么他给自己红色/黄色

Dave Menninger重新审视了他2025年关于从LLM到"LAM"(大型行动模型) 转变的预测。在回顾时,他将这个预测定位为讨论中早前提出的相同主题的延伸——单任务胜利与可以在多步骤工作流中协调行动的复杂代理之间的差距。

Menninger的出发点是他先前对LLM缺失什么的评估。在他看来,LLM过去是——现在很大程度上仍然是——擅长生成文本,但本质上不擅长规划和执行一系列任务。这个缺陷是相关的,因为代理的未来取决于协调行动,而不仅仅是流畅的输出。基于此,他预测会出现一类专门解决执行和规划问题的新模型,他称之为大型行动模型。

在评分方面,Menninger对自己很苛刻,说 "LAM被屠杀了。" 这是他记分卡的红色部分——他预测的"LAM"模型作为一个独立类别会出现——并没有按他预期的方式发展。

然而,他论证说基本前提得到了验证,这就是为什么他在红色之外给了自己黄色。市场确实在他估计中不得不面对规划/执行差距,并且它得到了解决——只是不是通过一个独立的模型类别。相反,前进的道路是主流模型被扩展,具备支持代理行为所需的能力。Menninger将这些扩展描述为包括:

  • 推理和任务编排能力
  • 遵循目标和约束的能力;
  • 以及支持技术如思维链提示思维树搜索来评估多个选项。

Menninger的结论是问题确实是真实的,但行业得出了一个不同于他预测的解决方案。在他看来,正确问题框架和错误解决方案形式因子之间的不匹配,正是他认为预测获得红色和黄色而不是干净的通过/失败的原因。

结束2025年回顾:Brad Shiman的"安全是扫兴的东西"——绿色

我们用Brad Shimmin的最后一个参考点结束了2025年回顾,回顾他"泼了一盆冷水"在前一年的会议上,论证安全将成为人工智能的阻碍。小组一致同意安全不是附带问题,成为塑造人工智能可能性以及大多数企业市场中可能性的关键引力。

过渡:从评分2026年预测格式到2026年预测

随着2025年回顾的完成,我们现在将讨论转向节目的核心——2026年预测。格式是指定分析师提出每个预测,然后由一两个其他分析师评论。如下所示,2026年预测都与数据相关或至少相邻,涵盖上下文、语义层和服务软件,同时对OpenAI和治理作为阻碍持怀疑态度。有了这个设置,让我们深入探讨。

2026年预测:Sanjeev Mohan说"上下文是强制性的"——但2026年将浪费在争论"上下文图谱"上

Sanjeev Mohan将他的2026年展望框定为中期修正的产物。他的最初直觉是预测"统一"叙事的延续——更多整合和并购——援引Snowflake购买Observe等例子,论证故事不再只是"数据作为基础设施"。但在年初,他看到了一个不同的线索。灵感来自LinkedIn上流传的一篇论文,题为 "下一个万亿美元的机会是上下文图谱" ,突然平台上"炸开了",每天都有关于上下文图谱的帖子。这种话语转变驱使他所谓的"双极"预测。

关于第一个极端,Mohan说"绝对100%"大型语言模型——以及他也提到的大型行动模型——将需要上下文来做好他们的工作并取得成功。在另一个极端,他预测行业将浪费这一年,2026年将花在争论和辩论上下文图谱上,"我们将不会拥有它。"在他看来,模式看起来很熟悉——大概念、明确的瓶颈和薄弱的实施现实。他将其比作数据网格——一个吸引人的想法引发了广泛讨论,但缺乏持久、可重复的采用模式。

Mohan的批评集中在基本基础的缺失——没有公认的标准,没有一致的实施模型,没有稳定的定义。他提出了尖锐的问题,旨在暴露修辞和工程之间的差距。例如:我怎么知道我有一个"首席上下文图谱"?有标准吗?有存储东西的方法吗? 他论证说行业无法就定义达成一致,甚至今天"上下文图谱"这个术语被广泛定义,为最大的供应商和社区噪音奠定基础,而没有相应的进展。

如何定义语义是大模型在行业落地更大的挑战,清晰的语义是注意力机制的要点,而上下文是搜索要点的修辞网络。语义很难被定义,关键在于:意志不是机械教条,语言有天然的模糊性,商业模式的底层逻辑是人性

为了使概念具体化,Mohan在知识图谱和他相信LLM会受益的上下文种类之间做出了区分。他论证说,知识图谱可以帮助遍历传统交易数据——谁在什么时候买了什么——但它通常遗漏"为什么"。这个为什么存在于交易系统之外,在网络搜索、日志、电子邮件和支持交互中。在他的框架中,当这些信号被关联回传统企业数据时,上下文就出现了,产生了更丰富的画面。然而,他的预测不是这将在2026年广泛解决;而是每家公司都会声称拥有一个上下文图谱,但行业"不会成功"。

Tony Baer的回应:上下文是滑溜的,可能需要人工智能来帮助构建它,但挑战是真实的

Tony Baer同意Mohan的诊断,并用隐喻增加了批评。他论证说"上下文非常滑溜",难以在操作上定义。你"看到它时"能识别它,但难以提前清晰地指定。Baer说Mohan的预测反映了行业与知识图谱同样的挣扎——试图理解知识是什么以及如何构建它。

Baer从他播客合作伙伴Sudhir Hasbe(Neo4j,前谷歌)那里引入了一个适度乐观的音符。据Baer说,这次交流的要旨是人工智能可以帮助指导组装过程。他将其类比为语言模型如何检查数据库并产生关于模式、索引和相关操作决策的想法。在Baer看来,人工智能可能在帮助构建和组织上下文方面发挥作用,但他"完全"同意Mohan的观点,即行业将花费一年时间努力定义上下文是什么。

小组评论:辩论与实施以及构建企业"4D地图"的难度

额外的小组评论强化了概念与执行之间的差距。小组的情绪是大量讨论,少量实施,与Sanjeev的前提一致。

讨论随后扩展到研究社区内部观点的具体例子,一个阵营论证企业必须做艰苦的工作来构建知识图谱或"4D地图"的企业——人、地点、事物和过程——类似于企业的数字表示,援引与Palantir相关的方法并引用Celonis。另一个极端的论点是问题太复杂,无法手动规模化解决,人工智能需要做更多的重活——呼应Baer的建议,即人工智能可以帮助指导结果。

2026年预测:Tony Baer说语义层比上下文"更可实现",将固化为"语义势力范围"

Tony Baer将他的2026年预测定位为对上下文图谱辩论的务实 counter。在他看来,语义比上下文更可实现,主要是因为语义是"已知量",有数十年的先例。他追溯到BusinessObjectsUniverse时代来证明语义层的功能就像一个指标存储,旨在防止团队每次做报告时"重新发明轮子"。

Baer的论点不是语义端到端地解决上下文。相反,他说,语义"走了很大一部分",但"不能完成建立上下文"的全部工作。他强调的实践洞察是,去年对"好数据"的关注被证明是不够的——重要的是正确的数据,这不可避免地重新引入了对显式意义和关联性的需求。他将商业智能时代的语义层与现代人工智能要求进行对比。商业智能在围墙花园内运营(仓库/市场),其中关联性是隐式的,因为数据是为被询问的问题策划的。人工智能时代,边界消失了——系统超越围墙花园——因此上下文必须是显式的,Baer描述语义是朝着将能力投入运营的一步。

从那里,Baer预测对语义层和指标存储的新关注,他将这与现代企业应用程序供应商如何在必须与其他系统互操作的人工智能时代扩展其影响力联系起来。他的论点是,SAP SE、ServiceNow Inc.、Salesforce Inc.和Workday Inc.等供应商"一直有自己的语义",但历史上他们"像保护源代码一样 jealous guard"。

他论证说这正在改变。作为证据,他指出了SAP在其应用程序组合中协调其数据模型的工作,并将其打包成SAP称之为数据产品的东西——不能简单导出的资产,但可以在保持"驻留在SAP内部"的同时共享。Baer将这定位为SAP-Databricks关系的核心,强调这是"两个高度独立的公司",而这种机制是相关的。

小组催促他"切入正题",讨论OSI。OSI是开放语义交换框架——Baer将其比作开放系统互连模型,旨在使语义在各方之间可移植和可解释。在Baer看来,OSI使一个组织能够定义诸如"客户"之类的东西,并让另一个系统按预期解释它,有效地校准定义。他说OSI基于dbt Labs Inc.开发的框架,"有点像暴露指标存储"。在他看来,OSI"不会发生"除非语义正在成为定义人工智能系统使用的大部分上下文的核心。

Baer还注意到了两个相邻运动——本体论方面的早期进展(他将其定位为自然延伸),以及微软在Fabric IQ中正在做的有趣工作。但头条预测是方向性的——语义势力范围不仅仅是正在出现;在2026年它们将巩固,这些势力范围将塑造组织如何使用数据和人工智能。

Tony Baer的底线是语义层是行业可以采取的最可操作的"下一步",比上下文图谱更容易实现。获胜者将不仅使用语义来标准化指标,还要在人工智能时代跨生态系统扩展互操作性和持久影响力。

Dave Menninger的回应:语义是关键的,但以SQL为中心的方法无法捕捉业务规则

Dave Menninger同意Baer关于语义和上下文对人工智能成功的重要性的观点,但增加了一个警告。他引用了他团队的数据和人工智能研究,说组织面临的第一大数据挑战是人工智能的数据可用性,语义和上下文是这一挑战的一部分(尽管不是全部问题)。Menninger承认取得了进展,多个供应商声称支持语义模型,许多人正在宣布OSI支持。

他的批评集中在这类努力使用的大多数机制——SQL作为捕捉语义的语言。在Menninger看来,SQL"不足以"表达大多数企业运营背后的业务规则。没有更丰富的表达语言,他论证说,就不可能提供人工智能系统所需的全部上下文。他的结论是语义正在成为流行的投资,进展是真实的,但行业在问题解决之前还有"一段路要走"。

小组评论:语义层作为抽象、LLM的护栏以及迈向完整上下文的中间步骤

小组评论强化了语义层既古老又重新相关。一个评论论证今天的语义模型与几十年前被称为OLAP立方体的东西没有显著不同,它们的价值在于当许多数据源产生歧义时,语义层提供抽象层和单一组定义——防止LLM"随意发挥"在竞争性解释中选择。在这个意义上,语义层是实用的护栏,因为LLM"有编造意义的坏习惯"除非定义是显式的。

语义被视为迈向完整上下文的"好的第一步"——超越指标存储,包括维度、类别和实体定义(产品、客户、订单)。但小组也强调了语义不涵盖的内容,包括时间元素和更丰富的关系,呼应Menninger的担忧,即SQL是不够的。尽管如此,小组观点是语义层是许多客户甚至还没有采取的中间步骤,而那些已经建立语义卫生的人在启动重大举措之前在人工智能方面处于领先地位。

2026年预测:Dave Menninger说SaaS供应商被挤压,服务提供商蓬勃发展

Dave Menninger的2026年预测集中在他相信即将变得更加普遍的市场紧张:代理人工智能需求加速速度快于商业软件工具可以可靠支持,创造了服务提供商——尤其是全球系统集成商——蓬勃发展的空间,而传统软件即服务供应商感到压力。

Menninger的预测从一个现实检查开始。他同意行业正在取得"巨大进步",但强调关键能力"需要时间","我们还没有到那一步"。与此同时,"代理人工智能无处不在",它最直接出现的地方之一是在软件平台本身内部。Menninger注意到供应商正在将代理嵌入他们的产品中以自动化任务或帮助用户完成工作,他说这种方法"进展相当顺利"并且"正在成功"。

在他看来更难的问题是从嵌入式产品代理到可以跨任何组织做任何事的通用代理能力。那,他说,是"一个真正的挑战"。

他用他调查工作中的采用数据支持这一点。在大约1200个用例的调查中,约32%在生产中——高于一年前的约15%——这意味着三分之二仍然不在生产中。Menninger直接将这个差距与整个小组讨论的约束联系起来,他特别指出构建和规模化运营代理所需的工具栈尚不成熟。

为了量化那个工具成熟度,Menninger引用了对AI平台"几十个供应商"的评级练习:

  • 只有17%在代理设计工具中被评为A或更好。
  • 只有11%在代理评估工具中被评为A或更好。

他提出了问题_如果你没有支持那些代理的基本工具,你如何构建和部署代理?_他得出的结论是商业现成工具还没有准备好用于主要用途。他用一个同一天的供应商简报的例子强化了这一点,建议路线图听起来很强,但能力仍然是"计划的"并且"尚未上市"。

这导致了经济影响和竞争影响,代理人工智能"全城热议",企业不会等待打包工具跟上。Menninger说他的研究显示自定义工具是目前人工智能应用中使用第二常见的工具,这自然赋予能够设计、集成和运营定制解决方案的组织优势。他对比了客户从应用程序供应商那里听到的内容——援引SAP吹嘘的"150个Joule代理"嵌入业务应用程序——与系统集成商在幕后正在做的事情。

根据他同事对服务提供商的可视性,Menninger说,他们会见的GSIs已经构建了数百个,在许多情况下数千个人工智能代理。这些复杂程度各异,但他强调大多数比通用工具需要的更专注, enabling更快的生产成果。因为他们不需要"煮沸海洋",他们可以界定问题,更快地发布,并更快地向企业客户交付价值。

在Menninger看来,需要现在实现代理成果的企业,加上不成熟的商业工具,使2026年成为服务提供商蓬勃发展而SaaS供应商被挤压的一年,不是因为代理失败了,而是因为运营化负担将价值转移到能够集成、定制和部署的人身上。

Kevin Petrie的回应:集成复杂性是障碍——这是为SIs量身定制的

Kevin Petrie同意Menninger的评估,指向他的研究显示集成复杂性是代理工作流成功的主要障碍。他论证说,许多组织理解要获得真正的好处,他们需要将功能整合到多步骤代理工作流中,而这一要求"是为SI协助量身定制的"。

Petrie还引用了指向咨询公司和SIs"顺风"的数据,援引了Shawn Rogers和Merv Adrian最近的一份报告。他揭示的关键发现是与外部咨询公司相比满意度高于内部IT部门。他承认这"并非史无前例",但强调它强化了SIs在企业尝试跨系统拼凑代理工作流时有大量价值可添加的观点。

2026年预测:Kevin Petrie警告OpenAI可能"绊倒"因为市场重新定价风险和切换成本上升

Kevin Petrie的2026年预测是对与OpenAI报道的1000亿美元融资相关的私人投资热情的直接挑战。OpenAI是比市场定价更高风险的赌注,它可能绊倒。 Petrie将预测锚定在他说他反复在创新繁荣中看到的历史模式——快速采用和兴奋可能导致技术专家和投资者忽视基本风险。

Petrie通过个人职业背景框架化了他的怀疑。他作为金融记者在互联网时代开始时,观察到"眼球比利润更重要"等指标最终崩溃。他做了第二个比较,2005年,当零售投资者将担保债务凭证视为进入抵押贷款的风险降低路径——另一个风险基本面被误解的案例。观点不是历史精确重复,而是人性重复。在繁荣时期,风险被低估,直到突然不被低估。

从那里,Petrie论证说,一个人不需要MBA就能对OpenAI感到担忧——只需"数字"和公司抱负的规模。他承认OpenAI的"令人眼花缭乱的成功"并引用了几个规模指标:7亿用户,他将其描述为全球每周活跃用户的8%,以及筹集600亿美元,"超过任何私人公司"。他的主要担忧是OpenAI"想要再筹集1000亿美元"的接下来是什么,他称之为"相当勇敢",指出这将超过任何公司在公开市场上筹集的资金。

Petrie然后转向资本的使用方式及其对可持续性的暗示。他估计OpenAI在2025年大约有130亿美元的收入,可能有200亿美元的退出运行率,但论证损失超过那个。他引用了从微软财务信息和其他来源推断的信息,仅第三季度就损失了110亿美元。他提出了一个进一步的担忧——明确称其为推测性的——OpenAI可能"每次推理任务都在亏损",暗示负经营利润和成本结构压力。

更大的战略批评,在Petrie的叙述中,是OpenAI正在做出巨大的基础设施承诺,追求可能与近从业者需求不匹配的人工通用智能。他说OpenAI已签署意向书,增加1.3万亿美元的数据中心容量来训练"超智能模型",而他的数据表明从业者现在想要的是数据质量、集成帮助和更好的训练有素的工人——而不是AGI。他还声称OpenAI"欠甲骨文公司3000亿美元",论证这创造了一个不舒服的情况,即新的筹款可能需要履行现有承诺。

Petrie将OpenAI的位置与谷歌进行对比。在他看来,Gemini现在有"相当的"模型性能,谷歌可以用现有现金资助投资,而不是依赖大规模资本筹集。他建议关于OpenAI的战略方向存在问题,因为它在做出"巨大赌注"追求AGI的同时,还试图学习芯片制造并与博通合作设计芯片。他论证OpenAI应该"画得更专注一些",并指出Anthropic作为比较。他说Anthropic更专注于安全,更少安全"爆发"和更大的战略清晰度。Petrie还引用了盈利时间表——Anthropic"预测在2027年"而"OpenAI是2029年",正如他所回忆的。

他对企业数据和人工智能领导者的指导是在承诺之前询问关于供应商稳定性的基本问题,因为切换成本正在上升。Petrie论证说,改变生成式人工智能模型变得越来越难,因为元数据与能力绑定,以及模型必须如何整合到治理架构中。含义是当切换昂贵时供应商风险增加,而在他的评估中,OpenAI"比Anthropic或谷歌等替代方案风险高得多"。

Andrew Brust的回应:OpenAI有品牌重力和先发优势,但跳跃是常态

Andrew Brust largely同意模型领导力是流动的,但对OpenAI的立场可以纯粹基于当前技术地位评估的观点投了反对票。他观察到许多他认识的聪明人正在使用Anthropic/Claude并发现它更优越,甚至将Claude Code用于非编码任务作为一种个人和商业人工智能。但他警告说,基础模型提供商正在"每几个月互相跳跃",使得很难基于当前时刻选择赢家。他引用了谷歌的复苏作为例子:许多人认为谷歌落后了,现在Gemini"享受着 great status"。

Brust还论证OpenAI有一种独特形式的先发优势——品牌默认。他将其比作"Kleenex"或"Google"作为通用动词。他提供了一个轶事, younger 用户简单地称ChatGPT为"Chat"("我在Chat里查了一下"),并将其与企业在影子人工智能[2]中的盛行联系起来——通常是ChatGPT——因为人们从家里开始使用它并且对它感到舒适。他建议这可能在以后变得有影响力。

最后,Brust画了一个历史类比,Amazon.com Inc.长期无盈利,看起来像一个资金坑,但跨商务市场的市场份额和先发优势最终占了上风。含义是长期亏损不会自动取消资格,如果公司可以将采用转化为可持续优势。

小组评论:亚马逊的"第二幕"、货币化、使用份额以及OpenAI是否"太大而不能倒"

小组的评论推动了辩论进一步。例如,亚马逊在零售方面盈利,但其真正的利润来自AWS——一个"第二幕"。没有AWS,亚马逊可能是一个"更大的Walmart.com"。那个评论建议OpenAI的真正问题是它是否能建立一个可比的相邻利润引擎,以及当前举措(例如,购物)是否显示那方面的证据。另一个评论更直接地质疑货币化,即广泛使用与付费使用不同("他在为此付费吗?")。

额外的小组讨论引入了使竞争分析复杂化的使用数据。在引用相同的1200个用例数据集时,虽然 "自定义"是第二常见的工具最常见的工具是ChatGPT。Gemini和Claude在该样本中大约有OpenAI三分之一的使用量。

提出的另一个问题:OpenAI是否"太大而不能倒?"——强化了规模和默认状态可以创造与近盈利性无关的韧性。虽然如果OpenAI陷入深陷困境政府不太可能拯救它,但行业集体(Nvidia Corp.、微软和其他人)很可能介入是相当可能的。

其他小组评论扩展了成本辩论,建议推理成本可能会随着基础设施改进而下降,这可能随着时间改变单位经济。与此同时,小组回到OpenAI抱负所暗示的收入轨迹的绝对规模,描述所需的增长"令人难以置信"。事实上一些预测[3]显示OpenAI在本十年末将超过3000亿美元的收入。

经过一些辩论,我们给了Petrie关于他预测的最后发言权。他以澄清他的主张关于推理负经营利润是推测性的来结束。他将来源归因于Ed Zitron,一个已知的"人工智能怀疑论者",他在11月写道他的估计是OpenAI的推理成本超过了当年迄今为止的收入。Petrie将其作为担忧的背景提供,而不是确定的财务陈述。

总体而言,Petrier的预测归结为一个警告,即OpenAI的采用和文化吸引力是不可否认的,但资本、承诺和战略广度的规模引入了数据和人工智能领导者不能忽视的风险概况——特别是随着切换成本上升和治理架构围绕选择的供应商固化。

2026年预测:Andrew Brust说企业人工智能停滞是因为治理跟不上自主性

Andrew Brust的2026年预测是一个警钟,警告企业人工智能今年将停滞——不是因为模型没准备好,而是因为治理没准备好。 在他看来,能力正在"gangbusters"加速,而控制滞后,企业无法容忍这种扩大的差距太久。结果是实验激增,试点发布,但规模化部署在风险增加时放缓或逆转。

Brust 的论点始于企业在基础控制方面建立标准,他认为代理式AI的发展速度已经超过了这些控制的建立和运营能力。他强调的关键缺失环节包括:控制自主性水平的具体机制、工作流审批、生命周期治理,以及在部署前测试代理的能力。布鲁斯特认为,在这些机制到位之前,许多正在讨论的生产力提升——无论是语义层面、上下文层面还是代理式工作流层面——在很大程度上仍然是理论上的。他的理由是,如果没有纪律,"几乎任何东西都会失控",而如果代理失控,它们将被部署然后回滚,因为"责任范围实在太广"。

Sanjeev Mohan的批评

Sanjeev Mohan 的后续发言并未将治理视为障碍,但质疑了治理会阻止发展的观点。Mohan 认为AI正在"到处流淌","你无法阻止它",因此企业将通过选择风险较低、影响范围较小、危机场景较少的用例来应对治理缺口。他认为,2026年可能是自ChatGPT发布以来该行业在治理方面开始取得真正进展的第一年——正是因为风险现在已经明显到无法忽视的程度。

然而,Mohan 认可了 Brust 的预测,并引用了当天早些时候与一家主要供应商的简报会,在那次会议上治理问题被强烈提出,供应商实际上承认他们并未达到预期的进度——"现在确实还没有什么现成的解决方案"。在Mohan看来,这一承认本身就是治理落后于市场能力曲线的证据,但也表明行业开始将其视为首要问题。

从那里开始,讨论扩展到了一系列相互强化的评论,汇聚成一个核心主题:企业部署的不是代理,而是问责制和代理能力的系统。一位评论者强调了"引力"——采用将落后于供应商提供与企业风险画像相匹配的治理的速度,甚至当组织推动部署向前推进时,如果代理无法以有纪律的方式控制,失望将引发放缓。另一位评论者将这一时刻重新定义为"需要组装"——就像孩子的圣诞礼物——暗示治理不会完全阻止部署,但企业在生产可行之前必须自行解决缺失的环节。

专家组还提出了其他实际细微差别。普遍认为代理式浪潮仍处于早期阶段——代理大约18个月前才进入主流讨论——现在就期望成熟是不现实的。更接地气的预期是,代理将首先出现在定义明确、自成一体的流程和专用角色中(包括例如数据科学代理的示例),而关于近期内企业范围内广泛的"代理式转型"的说法可能被夸大了。相关评论表明,许多被计入"生产中的代理"实际上可能是现有软件内的代理功能,而不是跨系统运行的自主多步骤工作流。

随着治理出现的另一个最终线索是,企业的机会是真实的,但障碍是多维的。专家组评论指出,在过去一年半里,数据质量已经成为首要障碍,还有"人员问题"——例如,培训员工和建立一致的企业使用运营模式。专家组还指出,企业内部知识工作者对AI的使用可能正在下降的信号——归因于工作安全焦虑、缺乏关注和缺乏可复制的流程——这进一步强化了治理和运营模式成熟是成功部署前提条件的观点。

总之,Brust 的预测强调了一个企业技术中的普遍真理:缺乏治理会产生风险,而风险会导致停滞。尽管如此,共识是AI不会为治理暂停,因此企业将通过有限制的用例来填补这一缺口,而行业将构建规模化代理式AI所需的问责系统。

感谢专家组的深思熟虑的预测。我们将在明年回来评估我们的准确性,并展望这个十年令人兴奋的下半段。


延伸思考

这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~

  • 如果“上下文”是下一个万亿美元的机会,但其定义如同当年的“数据网格”一样模糊且难以标准化,存储架构应如何演进以支撑这种高度动态且非结构化的“上下文图谱”?
  • 当AI代理从单任务工具转向跨系统的自主工作流时,我们该如何设计一套既能赋予代理“行动权”,又能确保企业“问责制”不缺位的治理框架,以避免预测中的“2026大停滞”?
  • 面对OpenAI等模型供应商高昂的切换成本与潜在的财务不稳定性,企业在构建AI基础设施时,应如何平衡“深度绑定获取性能”与“保持模型中立以规避风险”的矛盾?

原文标题:2026 data predictions: Scaling AI agents via contextual intelligence[4]

---【本文完】---

丰子恺-护生画集-遇赦

👇阅读原文,搜索🔍更多历史文章。


  1. https://siliconangle.com/author/dvellante/ ↩
  2. https://siliconangle.com/2025/03/17/shadow-ai-companies-struggle-control-unsanctioned-use-new-tools/ ↩
  3. https://thecuberesearch.com/297-breaking-analysis-ai-factories-face-a-long-payback-period-but-trillions-in-upside/ ↩
  4. https://siliconangle.com/2026/01/18/2026-data-predictions-scaling-ai-agents-via-contextual-intelligence/ ↩
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 王知鱼 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 回顾2025年预测
    • 2025年预测回顾:Sanjeev Mohan关于AI代理的崛起——黄色/绿色
    • 2025年预测回顾:Tony Baer关于"数据复兴"——黄色
    • 2025年预测回顾:Carl Olofson关于知识图谱的崛起——黄色/绿色
    • 2025年预测回顾:Dave Menninger关于"从LLM到LAM"以及为什么他给自己红色/黄色
    • 结束2025年回顾:Brad Shiman的"安全是扫兴的东西"——绿色
  • 过渡:从评分2026年预测格式到2026年预测
  • 2026年预测:Sanjeev Mohan说"上下文是强制性的"——但2026年将浪费在争论"上下文图谱"上
    • Tony Baer的回应:上下文是滑溜的,可能需要人工智能来帮助构建它,但挑战是真实的
    • 小组评论:辩论与实施以及构建企业"4D地图"的难度
  • 2026年预测:Tony Baer说语义层比上下文"更可实现",将固化为"语义势力范围"
    • Dave Menninger的回应:语义是关键的,但以SQL为中心的方法无法捕捉业务规则
    • 小组评论:语义层作为抽象、LLM的护栏以及迈向完整上下文的中间步骤
  • 2026年预测:Dave Menninger说SaaS供应商被挤压,服务提供商蓬勃发展
    • Kevin Petrie的回应:集成复杂性是障碍——这是为SIs量身定制的
  • 2026年预测:Kevin Petrie警告OpenAI可能"绊倒"因为市场重新定价风险和切换成本上升
    • Andrew Brust的回应:OpenAI有品牌重力和先发优势,但跳跃是常态
    • 小组评论:亚马逊的"第二幕"、货币化、使用份额以及OpenAI是否"太大而不能倒"
  • 2026年预测:Andrew Brust说企业人工智能停滞是因为治理跟不上自主性
    • Sanjeev Mohan的批评
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档