随着DeepSeek-V3-0324在昨天下午正式发布,也宣告着它正式登上非推理模型的宝座。根据官网所发布的榜单显示,其在数学和编码任务提升非常显著,超越GPT-4.5和Claude 3.7!这或许也是X(Twitter)上各种前端物理编程测试,提升最明显之处。
有趣的是,OpenAI第一个坐不住,紧接着就发布了4o的图像生成能力,谷歌也跟着发布了Gemini 2.5。这是在打狙击战吧,真就前后脚。你说这是偶然,我是不信的。看起来更像是商业上的狙击行为,毕竟OpenAI、谷歌和Anthropic都开始政治叙事AI了,有人放了狗屁”只有民主国家才能拥有领先的AI“,笑掉大牙。但是,他们没想到的是DeepSeek这次只是发了一个V3-0324,连版本号都没升级,只是一次小更新。就把你俩炸出来了,有人放出来生图能力,有人吓得直接从2.0到了2.5,好像2.0发布也没多久啊!
接下来,让我们看看各家都拿出的货咋样。DS-V3-0324在北京时间03-25晚上22点发布,两小时后也就是加州时间早上9点,OpenAI发布了直播预告,随后发布了GPT-4o的图像生成功能,其多模态能力在上一层,文本理解与生成、语音输入与输出、图像理解与生成、视频生成都已经完全上线。似乎还没有视频理解?
谷歌,这个在大模型时代一直声名不显的前互联网之光,蹭着DeepSeek的流量发布了Gemini 2.5。Gemini 2.5是一款推理模型,着重强化数学和科学能力。从x上的热度也能看出,这三家只有谷歌的浏览量最低只有120K,DeepSeek是640K,而OpenAI则是1M。模型能力就不点评了,大家自己看图吧,懒得点评了,毕竟和V3不是一个赛道。
话说回来,我到现在都没有调用过谷歌的大模型API,应该不兼容OpenAI SDK吧?没有OpenAI的能力,又放不下身段,既不是最强,也排不上前3,我想不到谁用的好好的OpenAI SDK会改写低层调用模型代码去兼容另外一套。
最后,还是cue一下Meta,小扎你最近在弄啥嘞?Llama4哪里去了?