ComfyUI 原生工作流使用

2026年01月02日

ComfyUI 是一个开源的图像生成工具，可以利用各种模型生成各种图像。这篇文章简单整理一下ComfyUI的原生工作流使用方法。以及使用Qwen-Image-2512 模型进行图像生成。

前言 —— Qwen-Image-2512

Qwen-Image-2512是Qwen-Image文生图基础模型的12月更新版本，相较于8月的基础模型，它在图像质量和真实感方面有了显著提升。该模型特别在三大核心能力上实现了飞跃式进步：更真实的人物质感、更细腻的自然纹理以及更复杂的文字渲染。这些改进使得生成的图像在细节表现上更为出色，尤其是在处理文本元素时，能够实现更精确的布局和更高质量的呈现。

Qwen-Image-2512 的主要增强：

增强的人物真实感：显著减少”AI生成”的感觉，大幅提升整体图像真实性，尤其是人物主体
更精细的自然细节：风景、动物毛发和其他自然元素的渲染更加细腻
改进的文字渲染：提高文字元素的准确性和质量，实现更好的排版和更忠实的多模态（文字+图像）组合

官方链接：

支持的宽高比

宽高比	分辨率
1:1	1328x1328
16:9	1664x928
9:16	928x1664
4:3	1472x1104
3:4	1104x1472
3:2	1584x1056
2:3	1056x1584

CmomfyUI 安装

ComfyUI 安装可直接按照官方给的文档进行：https://docs.comfy.org/zh-CN/installation/system_requirements

安装成功后, 打开显示如下界面：

1767343519620

下载 JSON 工作流

下载 Qwen-Image-2512 工作流：link

将工作流拖入ComfyUI 界面中，即可看到如下界面：

1767343595422

将提示的文件模型都点击下载，等待完成后关闭弹窗：

1767343656818

1. 工作流文件说明

工作流包含两个子图：

Text to Image (Qwen-Image 2512)：标准 50 步生成
Text to Image (Qwen-Image 2512 4steps)：使用 Lightning LoRA 的 4 步加速生成

1767345739928

2. 模型说明

文本编码器

qwen_2.5_vl_7b_fp8_scaled.safetensors

LoRA（可选 - 用于 4 步 Lightning 加速）

Qwen-Image-Lightning-4steps-V1.0.safetensors

扩散模型

qwen_image_2512_fp8_e4m3fn.safetensors（推荐大多数用户使用）
qwen_image_2512_bf16.safetensors（如果您有足够的显存并想要更好的质量）

VAE

qwen_image_vae.safetensors

模型存储位置

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 loras/
│   │      └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│   ├── 📂 diffusion_models/
│   │      ├── qwen_image_2512_bf16.safetensors
│   │      └── qwen_image_2512_fp8_e4m3fn.safetensors
│   └── 📂 vae/
│          └── qwen_image_vae.safetensors