关于#谷歌# 正在开发大型语言模型的传闻已经流传许久。这个传闻终于在近日得到证实,谷歌 #DeepMind# 官宣了自家的大模型 Gemini,而它的对手正是 OpenAI 的 GPT-4。
Gemini 是谷歌迄今为止最大的人工智能进展之一,旨在与竞争对手 #OpenAI# 和微软争夺人工智能领域的领导地位。毫无疑问,该模型在各种功能上都被宣传为同类模型中最佳的,一些人甚至说它是一台“万能机器”。
谷歌及其母公司 Alphabet 的 CEO 桑达尔·皮查伊(Sundar Pichai)告诉《#麻省理工技术评论# 》:“这个模型天生更有能力,它是一个平台。人工智能是一个影响深远的平台转变,比网络或移动曾经带来的转变更大。因此,它代表着我们迈出了一大步。”
从演示中判断,它在很多方面都做得很好,但很少有我们以前没有见过的。Gemini 是多模态的,这意味着它被训练来处理多种输入方式:文本、图像和音频。它可以将这些不同的格式结合起来,回答从家务到大学数学再到经济的所有问题。
在发布会上给记者的演示中,谷歌展示了 Gemini 的能力,它可以拿着已有的图表截图,用新数据分析数百页的研究,然后用新信息更新图表。
在另一个例子中,Gemini 展示了在平底锅中烹饪煎蛋卷的照片,并被用语音问到“煎蛋卷是否已经熟了”。Gemini 回答说:“它还没做好,因为鸡蛋黄还没凝固。”
领取专属 10元无门槛券
私享最新 技术干货