今天,DeepSeek发布了两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。
DeepSeek-V3.2已更新至官方网页端、App和API,而Speciale版本目前仅以临时API服务形式开放供社区评测与研究。
模型特点如下:
DeepSeek-V3.2目标是平衡推理能力与输出长度,适合日常问答和通用Agent任务,相比Kimi-K2-Thinking,输出长度大幅降低,减少计算开销和用户等待时间。
DeepSeek-V3.2-Speciale目标是将开源模型推理能力推向极致,是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力。该模型在复杂任务上消耗更多Tokens,成本更高,目前仅用于研究,不支持工具调用,未针对日常对话和写作任务优化。
此次更新,将思考融入工具调用:DeepSeek-V3.2是首个将思考融入工具使用的模型,支持思考模式和非思考模式的工具调用。
通过大规模Agent训练数据合成方法,构造了大量强化学习任务,提高了模型泛化能力。
在智能体工具调用评测中,V3.2达到开源模型最高水平,缩小了与闭源模型的差距。