
马斯克再次引爆 AI 圈。就在刚刚,他通过自己的社交平台 X 宣布:
和 @xAI 团队通宵打磨 @Grok,进展不错。下一代模型将被称为 Grok 4,在独立日(7 月 4 日)之后就发布。还需针对专业编程模型进行一次重大调试。

(图注:马斯克于 2025 年 6 月 27 日发布的推文)
消息一出,瞬间激起千层浪。
最关键的信息点有三个:
这不仅是一次简单的版本迭代,更是一次充满戏剧性的战略转向。
就在几周前,整个行业还在等待被无限期推迟的 Grok 3.5,甚至有传言称 xAI 的开发遇到了瓶颈。而马斯克用这样一种「跃进」的方式,直接将所有人的目光重新聚焦到了 xAI 身上。

更令人瞩目的是他为 Grok 4 设定的宏大目标——重写全人类知识。
马斯克此前曾表示,他要用具备先进推理能力的 Grok,「重写整个人类知识库,补充缺失的信息,删除错误」,并在这个经过净化的数据集上重新训练模型。
他毫不留情地抨击现有大模型所依赖的训练数据是「垃圾」。
这究竟是一次力挽狂澜的战略奇袭,还是一场高风险的豪赌?Grok 4 的实力,真的能撑起马斯克「寻求终极真理」的野心吗?
要回答这些问题,我们必须回顾 Grok 3 充满争议的「价值观」之战。
在 Grok 4 横空出世之前,故事的主角本应是 Grok 3.5。
根据 xAI 今年春季的计划,Grok 3.5 原定于 4 月底向顶级订阅用户发布 Beta 版。它被描绘成一次推理能力的飞跃,目标是实现「第一性原理推理」——即模型不仅能检索信息,更能像科学家一样推导出关于火箭发动机或电化学等复杂问题的全新答案。
然而,承诺的发布日期悄然而过,Grok 3.5 却迟迟没有露面。直到 5 月中旬,有报道证实其发布已被推迟,官方给出的理由是模型「还不够成熟」。
类似的「跳票」并非孤例,了整个 AI 行业今年普遍面临模型能力提升的困境。无论是 Anthropic 还是 OpenAI,据报道都在下一代旗舰模型的开发上遇到了挑战。
AI 发展的「低垂果实」似乎已被采摘殆尽。过去依赖增加数据和算力的「暴力美学」——即所谓的缩放定律 (Scaling Law)——正遭遇瓶颈,回报越来越低。行业正进入一个更艰难的深水区,需要更复杂的强化学习和多步推理的智能体 (Agentic) 系统等新技术突破。
正是在这个背景下,马斯克选择直接放弃 3.5,官宣 Grok 4。
这可以看作一次高明的「叙事管理」。它成功地将公众的注意力从「延期」的负面消息,转移到了对「全新版本」的积极期待上。通过直接命名为 Grok 4,马斯克也巧妙地暗示了这次更新并非小修小补,而是需要根本性架构修订或完全重新训练的重大升级,从而为之前的延迟提供了一个合理的解释。
在 AI 领域,声量和势头至关重要。马斯克的这一招,让 xAI 重新夺回了舞台中央的聚光灯。
Grok 4 最引人遐想的,莫过于其承载的使命:用 AI 重写人类知识。
马斯克在 6 月 21 日明确表示:
我们将使用具有先进推理能力的 Grok 3.5(也许我们应该叫它 4),来重写整个人类知识库,补充缺失的信息并删除错误。然后在此基础上进行再训练。在未经校正的数据上训练的基础模型中,垃圾信息实在太多了。

这一表态的背后,是马斯克一直以来对主流 AI 模型价值观的批判。他多次指责 ChatGPT 等模型被植入了所谓的「觉醒偏见」(woke biases),为了政治正确而扭曲事实。因此,他立志将 Grok 打造成一个「最大程度追求真理」的 AI。
然而,理想与现实之间很快出现了裂痕。当 Grok 开始输出一些马斯克不认同的「真理」时,冲突爆发了。
例如,有用户询问「自 2016 年以来,是左翼还是右翼更暴力?」,Grok 回答称,「数据显示,右翼政治暴力更为频繁和致命」,并列举了国会山骚乱和大规模枪击案等事件。

(图注:马斯克对其 AI 聊天机器人的回答表示不满)
马斯克立刻回应:「这是重大失误,明显是虚假信息。Grok 只是在鹦鹉学舌地模仿传统媒体。我们正在解决这个问题。」

马斯克还在 Catturd 质疑 Grok 的贴子下面留言回复,称「Grok 十分可耻」,并说「Grok 的数据来源糟糕透顶,只有及其愚蠢的 AI 才会相信 Media Matters 和 Rolling Stone。本周就会对 Grok 进行更新。」

甚至,Grok 还曾评价其创造者,称马斯克是「X 平台上的头号虚假信息传播者之一」。

这些事件暴露了 xAI 最核心的矛盾:当 AI 基于海量数据得出的「真理」与创始人认定的「真理」相悖时,应该以谁为准?
这种强烈的、自上而下的意识形态校准目标,已经从一个哲学理念,演变成了一个严峻的技术瓶颈。有研究表明,大语言模型在学习人类现有文本数据时,会自然倾向于收敛到某种被认为是「政治自由派」的观点。想要强行扭转这一趋势,同时不损害模型的整体性能,是一项极其困难的工程挑战。
Grok 3.5 的延迟,以及如今 Grok 4 的诞生,很可能都与这场艰难的「真理」之战深度相关。
从技术层面,「重写全人类知识」,但,谁有资格来做这件事呢?
对此,支持者认为,Grok 4 会打破偏见,传递更多「真实信息」。
当然,反对者认为,Grok 4 不过是更加「宣传性」的 Grok 3,是「川粉定制版 ChatGPT」,为了「变得更右翼而对 Grok 3 进行额叶切割手术」。
也有中立者认为,AI 本没有价值取向,其回答内容基于训练数据和反馈偏好,在一个连人类都无法统一的价值体系里,苛求 AI 中立客观是无法迎合所有人的。
今年 2 月发布的 Grok 3,最耀眼的成就是在技术学科。在数学、科学推理和软件工程等领域,它展现了世界顶尖或极具竞争力的水平。
这得益于 xAI 倾尽资源的投入。其定制的 Colossus 超级计算机,据称使用了超过 10 万块英伟达 H100 GPU,为 Grok 3 提供了强大的算力支持。xAI 每天生成高达 40TB 的专门推理数据,用以训练模型的逻辑和解题能力。
真金白银的投入换来了实打实的成绩。在一系列行业标准基准测试中,Grok 3 表现出色。
Grok 3 被精心打造为一个「工程师的 AI」,在 STEM 相关任务上拥有巨大优势。这被视为 xAI 的一项精明战略:作为后来者,与其全面开战,不如集中优势兵力,在一个高价值的细分市场(开发者、工程师、科学家)建立绝对的护城河。
同时,Grok 3 在质性体验上确实独树一帜。
它的人格非常鲜明:风趣、时而带点叛逆,刻意模仿了马斯克的公众形象。这与 ChatGPT 等模型中立、谨慎的风格形成鲜明对比,吸引了一批喜欢更自然、更有趣对话的用户。
此外,Grok 3 提供了几个强大的独有功能:
Grok 3 的发布在消费市场引发了一场狂欢,但在企业市场却遭遇了一堵冰墙。
数据显示,企业用户的渗透率在 3 月达到峰值后便开始持续下滑。
企业之所以对 Grok 望而却步,原因有三:
xAI 的命运,或者说马斯克 AI 帝国的命运,悬于 Grok 4 的发布成绩。
看涨 xAI 的理由:
看空 xAI 的理由:
Grok 4 的发布将是第一个重要的试金石。它能否在性能上实现真正的飞跃,尤其是在其宣称的「专业编程能力」上?它能否在提供「真实」的同时,变得更可靠、更稳定,以赢得市场的信任?
我们将拭目以待。