就在3月24日晚上,DeepSeek官网又发布了一款最新的V3模型版本——DeepSeek V3-0324版本模型。
在原本的基础架构上,DeepSeek V3-0324模型对性能方面以及用户体验上的实际用途进行了深度优化。新模型延续了V3以往系列的核心架构,总占有提及参数为:6850亿,和之前模型的6710亿有些许微小的增长。就现在最新的模型已经可以在官方网站以及app或小程序等入口开放下载,开源的版本已经上到了开源社区。
首先,从模型性能来看,尽管DeepSeek并没有公布新版本模型的基准测试数据,但用户反馈显示,在生成复杂代码、解决数学问题以及前端设计任务等方面,其表现更加优越。特别是在前端代码能力上,用户的感受最为明显。有海外的AI博主指出,DeepSeek终于能够在代码领域与Anthropic的Claude3.5/3.7 Sonnet相抗衡,此外,一些专业用户在体验后认为,V3-0324的性能提升大约相当于从Sonnet3.5到Sonnet3.6的改进幅度。
例如,有国外博主提到,新的DeepSeekV3-0324能够仅凭一个提示创建一个市场网站,它可以自动决定名称、主题、颜色和内容,生成非常成熟且效果惊人的网站,这一能力“超越了所有其他编码模型”,使得非技术人员也能轻松创造出优秀的作品。
此外,在用户交互方面,新版模型默认关闭了“深度思考”模式,从而提高了模型的响应速度,更加适合快速迭代的任务。这一调整在满足实时需求的同时,也保持了复杂任务处理的平衡,现有的API用户无需修改代码即可实现无缝兼容。
还有就是该模型采用了更加灵活的开源协议。DeepSeek延续了其一直以来的开源传统,令开源社区倍感兴奋的是,新版模型的开源许可与R1相同,升级为MIT开源许可,相较于初代V3,其开源使用条件更加宽松。MIT开源许可因其对商业的友好性而广受欢迎,这意味着研究人员和开发者可以自由地下载、修改和部署模型,甚至可以将其与专有软件进行整合。
V3-0324的表现令人印象深刻,尽管这次的升级并不是传言中的V4或R2版本,但凭借6850亿参数的开源模型以及更加友好的开源协议,迅速吸引了全球开发者的目光。
与此同时,外界对DeepSeek的新模型充满期待。有分析师指出,V3-0324的发布时间和特点可能暗示它将成为DeepSeek-R2的基础模型。之前市场上曾有消息称DeepSeek-R2将提前推出,DeepSeek官方的企业咨询账号在用户群中则辟谣称R2的发布是不实消息。目前,DeepSeek官方尚未正式发布R2的具体发布日期和技术细节,市场普遍预计R2将在5月份推出。在这个充满变革与机遇的时代,开发者们不仅需要强大的模型支持,也需要高效的接口服务,布尔算力OpenAPI正是为此而生,致力于为各类项目提供强大的技术后盾。欲了解更多信息,可以访问 布尔算力官网openapi.cn。
领取专属 10元无门槛券
私享最新 技术干货