财联社2月22日讯(编辑 牛占林)谷歌公司周四宣布,正在努力解决Gemini AI模型图像生成功能最近出现的问题,在此过程中,将暂停人物图像的生成,并在不久后重新发布改进版本。
此前一天,谷歌致歉称,发现Gemini大模型在某些历史图像生成描述中存在不准确之处,功能没有达到目标,正在努力进行改善。
近日以来,社交媒体上一直有人在抱怨Gemini的文生图功能,如在以“美国开国元勋华盛顿”为主题的图片中,出现了妇女和有色人种,但这是不正确的。
此外,当用户让Gemini生成纳粹德国士兵时,Gemini生成了由黑人、亚裔和白人女性身穿纳粹德军制服的照片。
还有用户抱怨Gemini不会显示白人的照片。当Gemini被要求展示一张白人的照片时,Gemini表示它无法满足这一要求。当被提示显示黑人的图像时,Gemini反而提出显示“庆祝黑人的多样性和成就”的图像。
当被要求展示庆祝白人多样性和成就的图片时,Gemini表示,它对满足这一要求“犹豫不决”。“从历史上看,媒体报道压倒性地青睐白人及其成就。这导致了一种扭曲的看法,即他们的成就被视为常态,而其他群体的成就往往被边缘化或忽视。在这种情况下,只关注白人可能会使这种不平衡永久化。”
分析称,这可能是对AI领域长期存在的种族偏见问题的过度纠正,即谷歌追求的“多元文化”。相较于以往的AI模型,Gemini在种族偏见问题方面进步了不少,但问题是“过度了”。
Gemini是谷歌规模最大、功能最强大的多模态人工智能模型,就在上周,该公司发布了最新一代AI模型Gemini 1.5,相较于去年12月发布Gemini 1.0,Gemini 1.5取得了飞跃式的发展。
谷歌Gemini的高级产品总监Jack Krawczyk表示,该公司的图像生成能力反映了这家科技巨头的“全球用户群”,它会认真对待代表性和偏见。“Gemini的图像生成确实产生了广泛的人群,这通常是一件好事,因为全世界的人都在使用它,但它没有抓住重点。”
本月早些时候,谷歌开始通过Gemini提供图像生成服务,但在追赶微软支持的OpenAI之际,新工具Sora的推出给了谷歌当头一棒。Sora能够仅仅根据提示词就生成60秒的连贯视频,震撼了整个科技圈。
据悉,OpenAI的Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,无论是画面、景深还是运镜,甚至是人物微表情、动物神态都已经足够精彩逼真。
(财联社 牛占林)
领取专属 10元无门槛券
私享最新 技术干货