Gemini 3 DeepThink 现已向 Google AI Ultra 订阅用户推出。
它代表谷歌在高级推理上的重大突破,专为攻克复杂数学、科学与逻辑问题而设计,性能达到行业领先水平。
顶尖性能:行业领先的推理基准
今天,谷歌正式在 Gemini 应用中为 Ultra 订阅者推出了 Gemini 3 DeepThink 模式。
Gemini 3 Deep Think 大幅领先 GPT-5.1(2.5 倍以上)。
一个具体的对比演示案例。
对比Gemini3 Pro和Gemini3 Deep Think。
这个演示展示了"Deep Think"(深度思考)模式的优势,在处理复杂编程和创意任务场景下,相对于标准版 Pro模式的强大之处。
这一新模式在推理能力上带来了质的飞跃,旨在挑战最先进的现有模型都感到棘手的复杂问题。
41.0%
在严苛的Humanity’s Last Exam基准测试中得分(未使用任何工具)
45.1%
在ARC-AGI-2测试中取得史无前例的成绩(启用代码执行)
🧠 技术核心:并行推理
如此卓越的表现,源于其采用的先进并行推理技术。
传统大语言模型(如 GPT)解决问题是线性推理:
首先...然后...再然后...最后。
等鸡排哥做完上一单,然后才轮到下一个。
Gemini 3 Deep Think 解决问题的思路是,针对复杂问题,进行多种假设路径,从中选取最佳路径。
好比规划路径,哪个近就选哪个。
它能同时探索多种假设,这一能力建立在近期在国际数学奥林匹克竞赛和国际大学生程序设计竞赛世界总决赛中获得金牌的 Gemini 2.5 DeepThink 变体之上。
此外,它在最具挑战性的GPQA Diamond(研究生级别物理化学考试)中取得了所有谷歌模型中最高分:0.938(93.8%)。
清晰定位:Gemini 3 家族如何选择?
Gemini 3 系列并非单一模型,而是由三个针对不同精度、推理和复杂度调整的版本组成。
理解它们的区别,有助于您选择最适合的工具。
选择Gemini 3,如果:
您是普通用户、学生或开发者,需要多模态协助、文档总结或创意生成。
选择Gemini 3 Pro,如果:
您是数据专家、工程师或研究人员,追求最高的事实准确性、数学严谨性和领域知识。
选择Gemini 3 DeepThink,如果:
您是高水平研究人员或进行AGI实验,需要解决现有模型无法处理的复杂逻辑与科学问题。
(目前仅限 Google AI Ultra 订阅者)
如何尝试与未来展望
Ultra 订阅者现已可以体验:在 Gemini 应用的提示栏中选择 “Deep Think” 模式,并在模型下拉菜单中选择 “Gemini 3 Pro”。
Gemini 3 DeepThink 仍处于深度测试阶段,正在进行更多的安全性评估。
谷歌对其施加严格的访问限制,正说明了它所具备的前沿能力。
它不仅是当前性能的巅峰,更可能预示着未来AI“慢思考”、深度推理的发展方向。
本文信息基于谷歌官方发布与早期技术分析。实际体验请以官方应用为准。