DeepSeek-V3新版本突然发布,而且一发布就直接开源。DeepSeek真的无愧为开源界的“源神”。
目前这个新版本已经上现在huggingface上:
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
而且并没有任何的介绍,连Model Card里面的内容都是空的。这就像是告诉你,我们随便放出了一个模型,就可以是一个王炸,不需要任何介绍就足够经验所有人。
从参数量上看,这次的DeepSeek-V3-0324版本其实和DeepSeek-V3相差不大。二者大概的参数都在671B左右,而且整体的框架也是MOE架构,基本没有变换。
在官方的更新日志上,已经发出了V3-0324版本的更新细节:
这次的主要升级地方在于
推理能力的显著提升,多个基准测试分数有较大幅度提升,尤其是在 AIME(+19.8)和 GPAQ(+9.3)等任务上,说明模型在多种任务上的泛化能力更强。
代码生成能力优化,增强了前端代码的质量,使其更加美观、精准。
中文写作和理解能力的提升,特别是在风格一致性、中长篇写作和报告类任务上表现更好。
交互式写作能力和翻译的改进,有助于提升用户在深度写作任务中的体验。
Function Calling 的优化,提高了准确率并修复了旧版本问题,可能对 API 用户更友好。
整体来看,这次更新在提升推理能力、编程能力、中文写作和交互式任务等方面都有明显的增强,使得模型的综合能力更强。
从能力上来看,新版V3模型在准确率上已经接近R1模型,但是其调用token的费用大大的降低下来。也就是说如果考虑更加节省成本的方法,在某些任务上不需要再调用R1模型
然而,它具体的训练细节是怎样的,官方并没有任何的宣传。这可能也就说明了其训练过程基本和之前的版本差不多。所有,目前大部分人都在猜测新版本的V3模型其实是通过R1推理模型合成的数据进行训练而来,也就是在更强的模型上进行模型蒸馏来得到新版本的V3模型。这样的做法其实在业界是很常见的,比如OpenAI GPT-4.5以及谷歌的Gemma 3其实都大量使用了模型蒸馏。
目前新版本的V3模型已经在官网可以使用了。
只需要在官网上取消“深度思考”就可以体验最新版本的V3模型
新版本V3和R1是什么关系
大部人猜测V3-0324版本本质上是通过R1数据进行蒸馏而来。如果拿一些需要推理的任务给老版本的V3模型回答,可以发现老版的模型是回复的摸棱两可,基本是一个空泛的回答。
告诉我如何用1000的本金,一年后变成100万?
而如果对比R1模型的回答和新版V3的回答,可以发现其回复基本相似,回复的一些具体方案也大差不差
代码能力
网友实测其代码能力已经赶上最新的claude 3.7 sonnet模型。
比如要求它写一个“网页端的3D弹球打砖块游戏”,它生成的效果已经基本符合游戏逻辑:
而对比之下,R1生成的效果中,碰撞效果基本没有,而且界面很粗糙:
在小球碰撞实验中,V3新版本已经能够进行很好的物理模拟:
在行星轨道模拟上,唯一一个画了土星环的大模型!项目排名第16
从网友的测试效果上看,新版本的 DeepSeek-V3 在多个方面表现优异,特别是在编程能力上有具体的提升。此外,V3 在数学推理任务上的表现也相当优秀,能够解答更复杂的数学问题,并在 GPAQ 等评测基准上取得了显著提升。这些改进使得 V3-0324 版本不仅在性能上更接近 R1,而且在计算成本上更具优势,进一步提升了其实用价值。
领取专属 10元无门槛券
私享最新 技术干货