3月29日,马斯克旗下人工智能公司 xAI 在官方博客中宣布,正式推出 Grok-1.5 大语言模型。
Grok-1.5 以增强的推理功能及长达128k的上下文处理能力为显著特点,特别是在编码和数学任务上的性能有了大幅提升。
据悉,Grok-1.5将在近日向早期测试人员及现有Grok用户逐步开放,在平台上提供试用。在官方公布的测试结果中,Grok-1.5在MATH基准测试中取得了50.6%的优异成绩,同时在更具挑战性的GSM8K基准上也达到了90%的高分。这两个基准测试广泛覆盖了从小学到高中阶段的数学问题。此外,Grok-1.5还在HumanEval基准测试中表现出色,得分为74.1%,充分展现了其代码生成与问题解决的实力。
值得一提的是,Grok-1.5在处理长文本方面也有显著进步,其上下文窗口可容纳高达128k的tokens,这是前一代模型内存容量的16倍,为用户理解长篇幅文档提供了更强大的支持。
技术层面,Grok-1.5的构建基于JAX、Rust以及Kubernetes等先进技术打造的定制化分布式训练框架。该框架配备了智能训练协调器,能够实时检测并排除问题节点,确保训练过程的顺利进行。同时,xAI还对检查点、数据加载及训练重启等关键环节进行了优化,以在发生故障时最大限度地减少停机时间,提升整体系统的稳定性和效率。
领取专属 10元无门槛券
私享最新 技术干货