马斯克 xAI 推出 Grok-1.5 大语言模型，128k上下文轻松处理

文章来源：企鹅号 - 网界

3月29日，马斯克旗下人工智能公司 xAI 在官方博客中宣布，正式推出 Grok-1.5 大语言模型。

Grok-1.5 以增强的推理功能及长达128k的上下文处理能力为显著特点，特别是在编码和数学任务上的性能有了大幅提升。

据悉，Grok-1.5将在近日向早期测试人员及现有Grok用户逐步开放，在平台上提供试用。在官方公布的测试结果中，Grok-1.5在MATH基准测试中取得了50.6%的优异成绩，同时在更具挑战性的GSM8K基准上也达到了90%的高分。这两个基准测试广泛覆盖了从小学到高中阶段的数学问题。此外，Grok-1.5还在HumanEval基准测试中表现出色，得分为74.1%，充分展现了其代码生成与问题解决的实力。

值得一提的是，Grok-1.5在处理长文本方面也有显著进步，其上下文窗口可容纳高达128k的tokens，这是前一代模型内存容量的16倍，为用户理解长篇幅文档提供了更强大的支持。

技术层面，Grok-1.5的构建基于JAX、Rust以及Kubernetes等先进技术打造的定制化分布式训练框架。该框架配备了智能训练协调器，能够实时检测并排除问题节点，确保训练过程的顺利进行。同时，xAI还对检查点、数据加载及训练重启等关键环节进行了优化，以在发生故障时最大限度地减少停机时间，提升整体系统的稳定性和效率。

发表于: 2024-03-292024-03-29 17:29:17
原文链接：https://page.om.qq.com/page/OCk14Bc_3jF48763L9Yxw1Ag0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

马斯克 xAI 推出 Grok-1.5 大语言模型，128k上下文轻松处理

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐