Anthropic 发布Claude 3.5 Sonnet最新模型 新模型在推理、知识和编码能力评估方面超越了以前的版本和竞争对手GPT 4o模型,同时其运行速度是Claude 3 Opus的两倍。
该模型可在Claude.ai和Claude iOS应用上免费使用。 Claude 3.5 Sonnet的定价为每百万输入tokens 3美元和每百万输出tokens 15美元,具有200K tokens的上下文窗口。其性价比高,适合中高端应用场景。
Claude 3.5 Sonnet这是即将推出的 Claude 3.5 型号系列中的第一款产品。Claude 3.5 Sonnet 提高了行业智能标准,在各种评估中均优于竞争对手的型号和 Claude 3 Opus,同时速度和成本与我们的中端型号 Claude 3 Sonnet 相当。
Claude 3.5 Sonnet 现已在 Claude.ai 和 Claude iOS 应用上免费提供,而 Claude Pro 和 Team 计划订阅者可以以更高的速率限制访问它。它也可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 获得。该模型每百万输入令牌收费 3 美元,每百万输出令牌收费 15 美元,具有 200K 令牌上下文窗口。
以 2 倍速度获取前沿情报
Claude 3.5 Sonnet 为研究生水平推理 (GPQA)、本科生水平知识 (MMLU) 和编码能力 (HumanEval) 设定了新的行业基准。它在掌握细微差别、幽默和复杂指令方面表现出显著的进步,并且擅长以自然、亲切的语气撰写高质量的内容。
Claude 3.5 Sonnet 的运行速度是 Claude 3 Opus 的两倍。这种性能提升加上经济实惠的价格,使 Claude 3.5 Sonnet 成为复杂任务的理想选择,例如上下文相关的客户支持和协调多步骤工作流程。
在内部代理编码评估中,Claude 3.5 Sonnet 解决了 64% 的问题,优于 Claude 3 Opus(解决了 38%)。我们的评估测试了模型修复错误或向开源代码库添加功能的能力,前提是给出了所需改进的自然语言描述。在得到指导和相关工具后,Claude 3.5 Sonnet 可以独立编写、编辑和执行代码,并具有复杂的推理和故障排除功能。它可以轻松处理代码转换,使其特别适合更新旧版应用程序和迁移代码库。
最先进的视觉
Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型,在标准视觉基准上超越了 Claude 3 Opus。这些重大改进对于需要视觉推理的任务最为明显,例如解释图表和图形。Claude 3.5 Sonnet 还可以准确地从不完美的图像中转录文本 - 这是零售、物流和金融服务的核心功能,在这些服务中,AI 可以从图像、图形或插图中获得比仅从文本中更多的见解。
Artifacts——使用 Claude 的新方
今天,我们还将在 Claude.ai 上推出 Artifacts,这是一项新功能,可扩展用户与 Claude 的互动方式。当用户要求 Claude 生成代码片段、文本文档或网站设计等内容时,这些 Artifacts 会与对话一起显示在专用窗口中。这创建了一个动态工作区,用户可以在其中实时查看、编辑和构建 Claude 的创作,将 AI 生成的内容无缝集成到他们的项目和工作流程中。
此预览功能标志着 Claude 从对话式 AI 进化为协作式工作环境。这只是 Claude.ai 更广阔愿景的开始,该愿景很快将扩展以支持团队协作。在不久的将来,团队(最终是整个组织)将能够安全地将他们的知识、文档和正在进行的工作集中在一个共享空间中,而 Claude 将成为随时可用的队友。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文系转载,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。