部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!

DeepSeek-V3发布:编程能力超过 Claude Sonnet 3.5!

作者头像
致Great
发布2024-12-27 08:33:57
发布2024-12-27 08:33:57
3230
举报
文章被收录于专栏:自然语言处理自然语言处理

备受期待的Deepseek V3终于开源!这款全新的AI模型在多语言编程能力上取得了重大突破,其在aider多语言编程测评中的表现,甚至超越了Claude3.5Sonnet V2等竞争对手,引发了业界广泛关注。

据了解,Deepseek V3相比之前的版本,在性能上实现了质的飞跃。Deepseek V2.5在aider测评中的成功率仅为17%,而V3则暴增至48%,这充分展现了其强大的进步。

编程能力暴增

DeepSeek V3 预览版低调发布,但是非常牛逼。 一句话重点:编程能力超过 Claude Sonnet 3.5。

这还只是预览版。

测试的基准是 Aider 的多语言基准,一个用于衡量模型编程能力的基准,具体介绍放在图2,官网放到回复里了。

几个模型的得分

  • 62% o1
  • 48% DeepSeek V3 预览
  • 45% Claude
  • 38% Gemini-exp-1206
  • 33% o1-mini

Aider Polyglot 排行榜, 预览得分48.4%,排名第二,仅次于 o1-2024-12-17 (high),领先于 Claude 3.5 Sonnet-20241022 和 Gemini Exp-1206。在 BigCodeBench-Hard 上排名第一

LiveBench排行榜中DeepSeek v3 是最佳开源LLM 和继“gemini-exp-1206”之后第二佳非推理LLM🔥

DeepSeek V3的项目地址

  • HuggingFace模型库:https://huggingface.co/deepseek-ai/DeepSeek-V3
  • 论文链接:https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

Deepseek V3采用了高达6850亿参数的混合专家(MoE)架构。该架构包含256个专家,并使用sigmoid路由方式,每次选取前8个专家(topk=8)参与计算,这种设计使得模型能够更加高效地处理复杂任务,并提高了性能。

参考资料

  • https://mp.weixin.qq.com/s/iFZOQsUNkpkXPDvOkE99wQ
  • https://ai-bot.cn/deepseek-v3/
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-12-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 编程能力暴增
  • DeepSeek V3的项目地址
  • 参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档