首页
学习
活动
专区
圈层
工具
发布

Deepseek-v3.2究竟更新了啥?一图带你看懂

今天,DeepSeek发布了两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

DeepSeek-V3.2已更新至官方网页端、App和API,而Speciale版本目前仅以临时API服务形式开放供社区评测与研究。

模型特点如下:

DeepSeek-V3.2目标是平衡推理能力与输出长度,适合日常问答和通用Agent任务,相比Kimi-K2-Thinking,输出长度大幅降低,减少计算开销和用户等待时间。

DeepSeek-V3.2-Speciale目标是将开源模型推理能力推向极致,是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力。该模型在复杂任务上消耗更多Tokens,成本更高,目前仅用于研究,不支持工具调用,未针对日常对话和写作任务优化。

此次更新,将思考融入工具调用:DeepSeek-V3.2是首个将思考融入工具使用的模型,支持思考模式和非思考模式的工具调用。

通过大规模Agent训练数据合成方法,构造了大量强化学习任务,提高了模型泛化能力。

在智能体工具调用评测中,V3.2达到开源模型最高水平,缩小了与闭源模型的差距。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OwSjMwP5egRBmZtRhs84RqDA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券