Gemini 2.0 Flash 正式发布,同时发布 Pro 系列新模型,这一高效模型在性能、推理能力和多模态处理上全面升级,为开发者和用户带来更智能的体验。
Gemini 2.0 Flash 现已在 Google AI Studio 和 Vertex AI 上线,适用于生产级 AI 应用,并在桌面和移动版 Gemini 应用开放。
同时在大模型竞技场**lmarena**[1]位于目前排名第一谷歌推理模型 Flash-Thinking-Exp-01-21 之下。
谷歌也放出了一张对比榜单,也是一个自傲到眼中没有其他模型的产商。
图像
我之前正好对比过 DeepSeek 和 O3,然而各家使用的数据集都不太相同。唯一能找到这三者共同使用的是 GPQA(diamond)版单,这是一个用于评估生物、物理和化学的数据集,而谷歌在这方面偏弱,即使是最强的 Pro 也没能进入第一梯队。虽然单个版单有失偏颇,但确实一般般。
图片3
最后,虽然各个排行版看起来不错,但个人感觉谷歌的大模型在 LLM 领域的影响力非常弱(相比于之前谷歌开源),完全不如 OpenAI、Anthropic 和 Meta,当然更不如 DeepSeek 了。或许是闭源的策略和本身模型能力,致使它的影响力非常有限。
[1]
lmarena: https://lmarena.ai/?leaderboard