Gemma开源模型家族是实现让有用AI技术普及化这一承诺的基础。Gemma 3是一系列轻量级、最先进的开源模型,基于与Gemini 2.0模型相同的研究与技术构建。这些模型专为在设备上快速运行而设计——从手机、笔记本电脑到工作站——帮助开发者在任何需要的地方创建AI应用。Gemma 3提供多种规模(1B、4B、12B和27B),允许根据特定硬件和性能需求选择最佳模型。
构建全球最佳单加速卡模型:Gemma 3在其规模上提供了最先进的性能,在LMArena排行榜的初步人工偏好评估中,超越了同尺寸级别的其他模型。这有助于在单张GPU或TPU主机上构建引人入胜的用户体验。
覆盖140种语言:构建能够使用用户母语的应用程序。Gemma 3开箱即支持超过35种语言,并预训练支持超过140种语言。
利用扩展的上下文窗口处理复杂任务:Gemma 3提供128k token的上下文窗口,使应用程序能够处理和理解大量信息。
使用函数调用创建AI驱动的工作流:Gemma 3支持函数调用和结构化输出,帮助自动化任务并构建智能体体验。
量化模型提供更快的高性能:Gemma 3引入官方量化版本,在保持高精度的同时减小模型尺寸和计算需求。
开源模型需要仔细的风险评估,方法平衡创新与安全——根据模型能力调整测试强度。Gemma 3的开发包括广泛的数据治理、通过微调与安全策略对齐以及稳健的基准评估。针对其增强的STEM性能,进行了关于滥用可能性(如制造有害物质)的特定评估,结果显示风险较低。
与Gemma 3一同发布ShieldGemma 2,这是一个基于Gemma 3构建的强大4B图像安全检查器。它提供现成的图像安全解决方案,输出三个安全类别的标签:危险内容、色情内容和暴力内容。开发者可进一步定制以满足自身安全需求和用户需要。
Gemma 3和ShieldGemma 2无缝集成到现有工作流中:
Gemmaverse是由社区创建的Gemma模型和工具组成的庞大生态系统。为促进学术研究突破,推出了Gemma 3学术计划。学术研究者可申请某机构云积分(每项奖励价值$10,000)以加速基于Gemma 3的研究。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。