DeepSeek发布新一代图像生成模型
北京时间1月28日,中国人工智能公司DeepSeek正式发布了其新一代图像生成模型Janus-Pro。这一模型在多个基准测试中表现出色,成功超越了业界顶尖的模型,如OpenAI的DALL-E3和StableDiffusion。
Janus-Pro的核心创新
Janus-Pro系列的参数范围从10亿到70亿不等,显著提高了生成能力。其核心创新在于解耦的视觉编码框架,提高了模型在理解和生成任务之间的灵活性。这种设计不仅缓解了视觉编码器在理解和生成中的角色冲突,还提升了框架的灵活性。
测试表现
在GenEval和DPG-Bench两个AI评估基准上,最大的Janus-Pro模型成功击败了DALL-E3,包括PixArt-alpha、Emu3-Gen和StableDiffusionXL等其他竞争对手。具体而言,70亿参数的Janus-Pro-7B在多个基准测试中表现出色,测试准确率分别达到80%和84.2%,成功超越了业界顶尖的模型。
使用示例
DeepSeek在其发布会上展示了Janus-Pro-7B的一些使用示例,例如利用其生成的图像展现了一只金色的寻回犬躺在木质门廊上的景象,以及一个有雀斑的年轻女人站在金色麦田中。尽管其生成的图像具有丰富的细节,但当前版本只支持384×384的分辨率。
开源与商用
Janus-Pro的代码仓库已提供GitHub链接,用户可访问获取详细代码、使用指南和模型下载地址。该模型采用MIT许可证,在商用方面没有限制。
这一消息在全球人工智能技术蓬勃发展的背景下引发了剧烈波动,尤其是对芯片巨头英伟达(NVDA.US)的股价施加了沉重压力。业内对DeepSeek的创新表现给予了高度重视,认为其将对AI图像生成领域带来新的竞争格局。
领取专属 10元无门槛券
私享最新 技术干货