首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Gemini演示视频“翻车”后,谷歌接连放大招:向云客户免费提供Gemini Pro,推出AI代码辅助工具,集成25家公司数据集

Gemini演示视频“翻车”后,谷歌接连放大招:向云客户免费提供Gemini Pro,推出AI代码辅助工具,集成25家公司数据集

作者头像
深度学习与Python
发布于 2023-12-20 11:17:44
发布于 2023-12-20 11:17:44
4520
举报

整理 | 凌敏、核子可乐

上周,谷歌公布了该公司有史以来体量最大、功能最强的 AI 模型 Gemini,这也是谷歌在推动 AI 实际落地过程中的重要一步。Gemini 模型共分为三个版本:Ultra 版、Pro 版与 Nano 版。谷歌已经开始在自家产品组合中引入 Gemini:从 Pixel 8 Pro 开始,Gemni Nano 将正式登陆 Android 系统;而经过专门微调的 Gemini Pro 则即将现身 Google Bard。

12 月 13 日,谷歌在其云平台上推出了一系列 AI 模型以供用户体验并实际应用:包括向开发者和企业开放 Gemini Pro、面向开发者和安全运营的 Duet AI、图像生成 Imagen 2 以及用于医疗保健场景的 MedLM。

1 谷歌正式开放 Gemini Pro

Gemini 属于完整的内容生成模型家族,据称采用了谷歌迄今为止最强大的大语言模型架构。在此之前,微软和包括谷歌在内的各家云服务及商业 IT 巨头纷纷在自家产品中引入所谓机器学习增强功能。而从目前的态势来看,这股潮流很可能会延续 2023 年全年,并在 2024 和 2025 年继续成为核心趋势。

Gemini 提供多种参数规模,其中 Nano 版最小、面向设备端工作负载;Pro 版居中;而体量最大的 Ultra 版则负责处理后端服务器上的高强度工作负载。

12 月 13 日,谷歌开始向开发者和企业开放 Gemini Pro,供其根据自有用例进行构建。据悉,谷歌将在未来几周到几个月内持续收集用户反馈,并据此对模型做进一步微调。明年初,在经过进一步微调、安全测试并收集来自合作伙伴的宝贵反馈之后,谷歌将正式推出 Gemini Ultra——这也是谷歌旗下体量最大、功能最强、可执行高度复杂任务的顶尖模型。谷歌还计划将 Gemini 引入更多开发者平台,包括 Chrome 和 Firebase。

关于 Gemini Pro 更多详细信息:

  • Gemini Pro 在各类研究性基准测试中的性能表现,优于其他同等体量的大语言模型。
  • 当前版本提供 32K 文本上下文窗口,后续版本的上下文窗口还将进一步扩大。
  • Gemini Pro 将在一定时段内提供免费使用,最终定价也将具有竞争力。
  • 它提供一系列功能:函数调用、嵌入、语义检索、自定义知识背景以及聊天功能等。
  • 它支持全球 180 多个国家和地区的 38 种语言。
  • 在当前版本中,Gemini Pro 接受文本作为输入,并可生成文本输出。谷歌此次还发布了专用的 Gemini Pro Vision 多模态端点,可接受文本和图像作为输入,并据此输出文本响应。
  • Gemini Pro 提供的 SDK 将帮助用户构建出可在任何地方运行的应用程序。Python、Android(Kotlin)、Node.js、Swift 和 JavaScript 均在支持之列。

Gemini Pro 的 SDK 可帮助用户构建出可在任何地方运行的应用程序

目前,Gemini Pro 的首个版本现可通过 Gemini API 进行访问:开发者可以使用此远程接口在 Gemini Pro 上构建自己的聊天机器人应用,还可以认真设计提示词并提交自有数据以对模型做出微调,再将其接入其他 API,借此在特定任务之上获得更好的处理能力与功能选项。如果希望在自己的应用程序中引入自然语言界面,Gemini Pro 应该会是个好选择,且使用体验与 OpenAI 的 ChatGPT 等同类产品基本一致。

Google AI Studio:速度最快的 Gemini 构建选项

谷歌还发布了一款基于 Web 的免费开发者工具——Google AI Studio,可帮助用户快速设计提示词,而后获取 API 密钥以用于应用程序开发。开发者可以使用谷歌账户登录 Google AI Studio 并享受免费配额,免费部分每分钟可接收 60 条请求,数量达到其他同类免费产品的 20 倍。准备就绪之后,只需单击“获取代码”即可将生成结果转移至指定的 IDE,也可以使用 Android Studio、Colab 或者 Project IDX 中提供的各种快速入门模板。为了帮助谷歌提高产品质量,在用户使用免费配额时,经过培训的审核人员可能会访问 API 及 Google AI Studio 上的输入和输出。谷歌表示,谷歌账户及 API 密钥中的身份信息均经过脱敏处理。

在 Google Cloud 使用 Vertex AI 进行构建

如果需要全托管 AI 平台,开发者也可以轻松从 Google AI Studio 转向 Vertex AI。后者允许通过全面的数据控制来自定义 Gemini,且充分享受 Google Cloud 提供的企业安全、隐私、数据治理与合规性保障。

借助 Vertex AI,同样可以访问 Gemini 模型,并能够:

  • 使用自有企业数据微调及蒸馏 Gemini,立足底层对模型进行增强,使其包含最新信息和扩展以获取实际功能。
  • 在低代码 / 无代码环境中构建 Gemini 支持的搜索和对话 agent,包括支持检索增强生成(RAG)、混合搜索、嵌入、对话 playbook 等。
  • 安心进行应用部署。谷歌不会利用 Google Cloud 上的客户输入或输出数据训练 Gemini 模型,相关数据与 IP 将始终归客户所有。

目前,开发者可以通过 Google AI Studio 免费访问 Gemini Pro 与 Gemini Pro Vision,每分钟最多支持 60 条请求,可以满足大部分应用开发需要。Vertex AI 计划于明年发布正式版本,在此之前开发者同样能以每分钟 60 条请求的方式访问 Gemini 基础模型。未来,Google AI Studio 与 Vertex AI 将以每 1000 字符 /1 张图片为单位收取费用。

2 面向开发者和安全运营的 Duet AI

谷歌此次还正式公布了 Duet AI for Developers。这是一项聊天机器人服务,旨在提高程序员群体的工作效率。很明显,这就是目前常见的编程助手产品。根据谷歌的介绍,它能与各种 IDE 配合使用,并尝试在开发者输入过程中 自动补全源代码、回答编码查询问题、帮助排除故障,并就如何使用 MongoDB、Crowdstrike 等第三方软件提供操作指导。

谷歌副总裁 Gabe Monroy 解释道,“例如,使用 MongoDB 编写代码的开发人员可以询问 Duet AI for Developers,“请按地理位置筛选过去 30 天内消费额超过 50 美元的客户订单,再计算各地区的总收入”。之后,Duet AI for Developers 就会使用 MongoDB 中的产品信息提供代码建议并完成任务。如此一来,开发人员的构建速度将得到显著提升。”

据悉,目前已经有超过 25 家供应商与谷歌合作,确保自家产品能够顺畅对接 Duet AI for Developers。

在未来几周内,负责为 Duet AI 服务提供支持的大语言模型也将全面升级为 Gemini。这项开发者服务计划免费开放至 2024 年 1 月 12 日。此外,Duet AI in Security Operations 这次也正式开放,这款聊天机器人将帮助处理基础设施保护、网络日志分析等查询任务。

3 图像生成 Imagen 2 模型与用于医疗保健场景的 MedLM 模型

本次,谷歌还更新了 Vertex AI 以引入 Imagen 2 模型。据介绍,这款文本到图像工具由 Google DeepMind 工程师开发而成,其最新版本已经能够生成极为逼真的图片并准确响应文本要求,大大降低了品牌宣传门槛。此外,Imagen 2 还能生成注释并回答与图像内容有关的问题。

社交应用 Snapchat、图形设计平台 Canva 以及图片库网站 Shutterstock 都在使用 Imagen。而且 Imagen 2 模型生成的所有图像都将包含人眼不可见的 SynthID 数字水印,可通过计算检测来判断该图像是否为 AI 合成。

此外,谷歌还推出了 MedLM,这是一个面向医疗保健用例的大语言模型家族。其中的两套模型均基于谷歌自家的 Med-PaLM 2 系列。其中较大、更强的模型专为较复杂的任务而设计,例如筛选学术论文及技术文档以提供潜在的新药研发线索;另一套模型则负责处理比较简单的杂务,例如总结医患对话和回应常见的医疗咨询问题。

MedLM 模型的早期采用者包括 HCA Healthcare 诊所、药物设计企业 BenchSci,以及埃森哲与德勤等。

谷歌表示,未来几周,MedLM 模型将正式入驻谷歌的开放 Model Garden,后续还将有更多基于 Gemini 的模型被纳入 MedLM 家族以提供更多功能。

参考链接:

https://blog.google/technology/ai/google-gemini-pro-imagen-duet-ai-update/

https://blog.google/technology/ai/gemini-api-developers-cloud/

https://www.theregister.com/2023/12/13/google_gemini_duet_ai/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-12-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 InfoQ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AI日报:谷歌Gemini Pro即将面向企业和开发者
谷歌通过其API让企业和开发者第一次看到了其最强大的大型语言模型Gemini。该型号有三种尺寸可供选择:Ultra、Pro和Nano。
Nowl
2024/01/18
2560
AI日报:谷歌Gemini Pro即将面向企业和开发者
谷歌连放大招:Gemini Pro支持中文,Bard学会画画,还上新了新模型
一是集成的Gemini Pro全面铺开,新增40多种语言支持,包括中文在内(之前只能用英文)。
量子位
2024/02/22
4440
谷歌连放大招:Gemini Pro支持中文,Bard学会画画,还上新了新模型
暴打GPT-3.5,谷歌Gemini大杀器官宣免费用!最强代码生成工具上线支持20+语言
目前,不管是Gemini Pro,还是Gemini Pro Vision,都可以免费体验。
新智元
2023/12/14
3760
暴打GPT-3.5,谷歌Gemini大杀器官宣免费用!最强代码生成工具上线支持20+语言
谷歌DeepMind联手复仇!Jeff Dean、Hassabis万字长文总结2023绝地反击
刚刚,Jeff Dean和Hassabis联手发文,一同回顾了Google Research和Google DeepMind在2023年的全部成果。
新智元
2023/12/28
2220
谷歌DeepMind联手复仇!Jeff Dean、Hassabis万字长文总结2023绝地反击
Gemini Pro 模型的初学者指南
上个月,谷歌宣布推出 Gemini 最新、最强大的人工智能模型,旨在与 OpenAI 的 GPT 正面交锋。Gemini 在构建时考虑到了多模态,这意味着它能够理解文本、图像、视频、音频和代码。
一个正经的AI
2024/01/24
3590
Gemini Pro 模型的初学者指南
谷歌发布 Gemini:我们还是一家强大的公司
过去半年, 在OpenAI 持续迭代,不断赚足大众视线之际,谷歌迟迟没有发声。直至今日凌晨,谷歌直接丢出了一个重磅炸弹,带着耗时一年之久的多模态模型 Gemini 来了。
AI科技评论
2023/12/11
3700
谷歌发布 Gemini:我们还是一家强大的公司
Gemini:我们最大最强的AI模型
每一次技术变革都提供了推进科学发现、加速人类进步和改善生活的机会。我相信我们现在看到的 AI 转型将是我们有生之年中最深远的一次,其影响远远超过之前的移动转型或网络转型。AI 有可能为全球各地的人们创造各种机会,从日常生活到非凡发现。
云云众生s
2024/03/28
3530
Gemini:我们最大最强的AI模型
关于谷歌多模态人工智能Gemini的一切
谷歌的Gemini是人工智能发展中的一个重要里程碑,标志着从单模态系统向更复杂的多模态模型的转变。
云云众生s
2024/03/28
7270
关于谷歌多模态人工智能Gemini的一切
Google 史上最强大模型 Gemini,全面「碾压」GPT-4 ?
在昨晚,谷歌CEO桑达尔·皮查伊官宣了一个令人振奋的消息:Google的全新AI大模型Gemini 1.0正式上线了!
吾非同
2023/12/11
3980
谷歌发布多模态大模型Gemini,性能超GPT-4!TPU v5p芯片性能提升2.8倍!
12月7日凌晨,谷歌CEO桑达尔・皮查伊和Deepmind CEO戴密斯·哈萨比斯在谷歌官网联名发文,宣布最新多模态大模型Gemini 1.0(双子星)版本正式上线,其性能有望超过OpenAI GPT-4 模型。与此同时,谷歌还推出了该公司“最强大”的可扩展且灵活的人工智能加速器Cloud TPU v5p 。
芯智讯
2023/12/12
7300
谷歌发布多模态大模型Gemini,性能超GPT-4!TPU v5p芯片性能提升2.8倍!
画个圈就能搜索!谷歌Gemini Pro植入旗舰,开启手机AI大战
近日,在加利福尼亚州圣何塞举行的Galaxy Unpacked活动中,三星推出了最新的Galaxy S24系列手机。
新智元
2024/01/23
3760
画个圈就能搜索!谷歌Gemini Pro植入旗舰,开启手机AI大战
谷歌Gemini语言模型入门指南
本文向您介绍两种访问谷歌Gemini语言模型的途径:Vertex AI和Google AI Studio,并详细阐述每种方法的使用入门指南。
云云众生s
2024/03/28
6290
谷歌Gemini语言模型入门指南
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
此外,谷歌的AI超算平台也进行了一系列重大升级——最强TPU v5p上线、升级软件存储,以及更灵活的消费模式,都让谷歌云在AI领域的竞争力进一步提升。
新智元
2024/04/12
1730
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?
官方说,这次是 Gemini 2.5 Pro 的升级预览版,是他们目前最聪明的模型。在五月份发布和 I/O 大会上展示的版本基础上又优化了。几周后,这个版本就会成为正式的稳定版,可以用于企业级应用了。
AI进修生
2025/06/08
4290
Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?
TPU 性能提升 10 倍,开源 A2A 颠覆智能体交互 | Google Cloud Next 25划重点
Google Cloud Next 25 重要发布概览:发布第七代 TPU Ironwood,提供更强的计算能力;存储、网络和计算方面的创新,有助于优化 AI 部署;Google 分布式云的优化,企业可以将 Gemini 模型部署到本地;Vertex AI 的创新,例如 Agent Development Kit 和 Agent2Agent 协议,可实现多智能体生态协同;Agentspace 的增强功能,使每个员工都能从 AI 中受益等。
深度学习与Python
2025/04/11
2300
TPU 性能提升 10 倍,开源 A2A 颠覆智能体交互 | Google Cloud Next 25划重点
冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂
本周三,该公司全面发布 Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite 以及新一代旗舰大模型 Gemini 2.0 Pro 实验版本,并且还在 Gemini App 中推出了其推理模型 Gemini 2.0 Flash Thinking。
机器之心
2025/02/06
5070
冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂
超越 ChatGPT-4,谷歌结合 AlphaGo 技术的多模态大模型 Gemini 已小范围内测
“ 谷歌的多模态AI系统Gemini正在小范围内测,这标志着它很快会对外开放。Gemini集成了文本、图像等多种模式,运用了AlphaGo中的强化学习等技术,目标是在规划、记忆、多模态方面进行创新。Gemini可能会成为继ChatGPT系列后又一个里程碑式的产品。”
技术人生黄勇
2024/07/19
1790
超越 ChatGPT-4,谷歌结合 AlphaGo 技术的多模态大模型 Gemini 已小范围内测
AI巨头集体放大招!DeepSeek优化、豆包变强、ChatGPT画图不靠DALL·E、Gemini 2.5挑战GPT-5?
3月25日,DeepSeek官方宣布其DeepSeek-V3模型完成了小版本升级,版本号更新为DeepSeek-V3-0324。用户可以通过官方网页、App或小程序访问对话界面,关闭“深度思考”功能以体验新版模型。API接口和使用方式保持不变。
福大大架构师每日一题
2025/03/31
2820
AI巨头集体放大招!DeepSeek优化、豆包变强、ChatGPT画图不靠DALL·E、Gemini 2.5挑战GPT-5?
一文看懂2025 Google I/O开发者大会 - 250刀Ultra会员、Veo3、Imagen4等等全线开花。
说个小插曲,本来我现在,人应该是在硅谷Google总部现场的,因为受到小红书和Google的邀请,喊我去现场看。。。
数字生命卡兹克
2025/05/21
2290
一文看懂2025 Google I/O开发者大会 - 250刀Ultra会员、Veo3、Imagen4等等全线开花。
谷歌Gemini1.5火速上线:MoE架构,100万上下文
Gemini 1.5 建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混合 (MoE) 架构使 Gemini 1.5 的训练和服务更加高效。
机器之心
2024/02/26
2600
谷歌Gemini1.5火速上线:MoE架构,100万上下文
推荐阅读
AI日报:谷歌Gemini Pro即将面向企业和开发者
2560
谷歌连放大招:Gemini Pro支持中文,Bard学会画画,还上新了新模型
4440
暴打GPT-3.5,谷歌Gemini大杀器官宣免费用!最强代码生成工具上线支持20+语言
3760
谷歌DeepMind联手复仇!Jeff Dean、Hassabis万字长文总结2023绝地反击
2220
Gemini Pro 模型的初学者指南
3590
谷歌发布 Gemini:我们还是一家强大的公司
3700
Gemini:我们最大最强的AI模型
3530
关于谷歌多模态人工智能Gemini的一切
7270
Google 史上最强大模型 Gemini,全面「碾压」GPT-4 ?
3980
谷歌发布多模态大模型Gemini,性能超GPT-4!TPU v5p芯片性能提升2.8倍!
7300
画个圈就能搜索!谷歌Gemini Pro植入旗舰,开启手机AI大战
3760
谷歌Gemini语言模型入门指南
6290
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
1730
Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?
4290
TPU 性能提升 10 倍,开源 A2A 颠覆智能体交互 | Google Cloud Next 25划重点
2300
冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂
5070
超越 ChatGPT-4,谷歌结合 AlphaGo 技术的多模态大模型 Gemini 已小范围内测
1790
AI巨头集体放大招!DeepSeek优化、豆包变强、ChatGPT画图不靠DALL·E、Gemini 2.5挑战GPT-5?
2820
一文看懂2025 Google I/O开发者大会 - 250刀Ultra会员、Veo3、Imagen4等等全线开花。
2290
谷歌Gemini1.5火速上线:MoE架构,100万上下文
2600
相关推荐
AI日报:谷歌Gemini Pro即将面向企业和开发者
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档