4月1日,马斯克旗下人工智能公司xAI发布了Grok 1.5版本。
Grok 1.5,是xAI的第一代多模式模型。除了强大的文本功能之外,还可以处理各种视觉信息,包括文档、图表、屏幕截图和照片。Grok 1.5V很快就会推给早期测试者和现有Grok用户。
Grok 1.5在新的 RealWorldQA 基准测试中表现优于同行:
Grok 1.5支持看图写代码:
用户:你能把它翻译成Python代码吗?
Grok 1.5:当然!您提供的流程图描述了一个简单的猜谜游戏,其中计算机生成一个随机数,用户必须猜测它。下面是代表流程图中逻辑的 Python 代码:
Grok 1.5理解现实的能力获得很大提升
xAI:提高我们的多模态理解和生成能力是构建能够理解宇宙的有益通用人工智能的重要步骤。在接下来的几个月中,我们预计将在图像、音频和视频等各种模式上对这两种功能进行重大改进。
领取专属 10元无门槛券
私享最新 技术干货