前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >混元DIT环境指南

混元DIT环境指南

原创
作者头像
geru
发布2024-09-04 14:47:58
1840
发布2024-09-04 14:47:58
举报

一. 环境说明

环境中已预装混元DIT 1.2。python环境采用conda安装,进入方式:conda activate comfyui

请仔细阅读HunyuanDiT.ipynb中的流程,其中代码和大部分权重文件都已经下载好,无需再次下载

二. 使用说明

1. jupyter-lab

启动命令:HF_ENDPOINT=https://hf-mirror.com jupyter lab --port 443 --allow-root

访问方式:http://ip:端口?token=hai_hunyuan

默认token & 密码为:hai_hunyuan

2. ComfyUI

ComfyUI文件夹是comfyui的程序文件夹,可以用于灵活的配置模型的推理(具体可以网上学习下ComfyUI怎么搭建模型工作流)

启动命令:cd ComfyUI && python main.py --port 6889 --listen 0.0.0.0

访问方式:http://ip:端口

如果你训练好了lora想在ComfyUI做测试,可以直接把文件移动到ComfyUI/models/lora文件夹里,刷新或者重启ComfyUI后即可选择加载模型

3. kohya训练UI

启动命令:

conda activate hydit-kohya

python kohya_gui.py --listen 0.0.0.0 --port xxx

访问方式:http://ip:7860

三. 训练指南

1. 数据集一键打标

运行以下代码,即可为每张图片得到一个同名的txt文件,里面存放着对应图片的描述 "/root/demo_images_wukong" 可以替换为你自己上传解压后的数据集路径 如何解压自己上传的压缩包?命令:! unzip xxx.zip -d ./xxx

代码语言:txt
复制
# 演示用
! unzip /root/xxx.zip -d ./root/xxx
代码语言:txt
复制
# 一键打标数据集
%cd HunyuanDiT
! python mllm/caption_imgs_with_txt.py \
    --model_path "./ckpts/captioner" \
    --mode "caption_zh" \
    --image_folder "/root/demo_images_wukong"
%cd /root

2. 使用kohya_ss gui训练

勾选下面的选项以节省显存,防止显存不够用。(位置:Parameters -> Advanced -> Gradient Checkpointing)

image.png
image.png

点击下面按钮,开始训练。

image.png
image.png

3. 到ComfyUI测试模型效果

训练好lora后,可以在模型输出路径里(这里图上填写的是/root/kohya_ss/outputs)找到对应的模型权重文件(.safetensors格式结尾看最近时间的文件),复制到ComfyUI/models/loras/目录下使用ComfyUI做lora测试

代码语言:txt
复制
! cp /root/kohya_ss/outputs/last-step00001600.safetensors /root/ComfyUI/models/loras/ && echo "复制完成"

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一. 环境说明
  • 二. 使用说明
    • 1. jupyter-lab
      • 2. ComfyUI
        • 3. kohya训练UI
          • 1. 数据集一键打标
          • 2. 使用kohya_ss gui训练
          • 3. 到ComfyUI测试模型效果
      • 三. 训练指南
      相关产品与服务
      GPU 云服务器
      GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于生成式AI,自动驾驶,深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档