前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >腾讯混元:开源模型生图时间缩短75%!

腾讯混元:开源模型生图时间缩短75%!

作者头像
小腾资讯君
发布2024-06-06 19:21:41
2320
发布2024-06-06 19:21:41

先和大家汇报:

开源不到一个月,腾讯混元文生图大模型(混元DiT模型)的Github Star数已达到2.1k,位于开源社区热门DiT模型前列!

这是业内首个中文原生的DiT架构文生图开源模型,可供企业与个人开发者免费商用。

开源后,我们也听到了不少开发者的呼声:

需求收到,马上安排!👌

刚刚,腾讯混元针对文生图开源模型,发布一组「加速库」:

实测显示,加速后的生图时间缩短75%、生图速度提升4倍,大幅提升模型运行效率。

这也是业内首个由官方推出的加速库。

//生图速度,更快了

具体来说,这款加速器叠了两套buff:

一是,知识蒸馏

通过降低扩散模型迭代的步数实现加速(就像看学霸的笔记,跳过部分训练步骤,直接借鉴复杂模型的经验,掌握重点)。

使用蒸馏权重后,生成同等质量的图像,迭代步数减半。

二是,TensorRT推理加速

通过工程优化,减少冗余计算、合并层次、精简精度,让模型更快处理数据。

而且,它还支持与模型权重解耦(开发者可以在不影响模型权重的情况下,对模型进行优化和调整,满足不同的应用需求)。

为了提升开源模型易用性,我们还做了一些努力:

//使用方式,更简单了

现在,用户可以基于ComfyUI的图形化界面,使用腾讯混元文生图模型。

(ComfyUI是一款文生图领域的WebUI界面设计,用户可以通过图像化的工作流的方式使用模型,大幅降低开发者的使用门槛)

(混元DiT文生图模型的ComfyUI使用界面)

//生态组件,更丰富了

仅用三行代码,用户就能在Hugging Face的官方模型库Diffusers中调用混元DiT模型,无需下载原始代码库。

(Hugging Face的Diffusers是知名的AI开源社区,也是调用各种主流文生图大模型的通用库,已成为当今文生图大模型使用的社区标准)

(混元DiT文生图模型的Diffusers界面)

腾讯正在持续投入开源大模型生态建设。

我们希望,用更快的推理体验、更简单的使用方式、更丰富的生态组件,进一步降低大模型技术的使用门槛,惠及更多开发者和用户。

附腾讯混元文生图开源大模型(混元DiT模型)项目链接

官网:https://dit.hunyuan.tencent.com/

代码:https://github.com/Tencent/HunyuanDiT

模型:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

论文:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯混元大模型
腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档