ComfyUI 原生工作流使用
ComfyUI 是一个开源的图像生成工具,可以利用各种模型生成各种图像。这篇文章简单整理一下ComfyUI的原生工作流使用方法。以及使用Qwen-Image-2512 模型进行图像生成。
前言 —— Qwen-Image-2512
Qwen-Image-2512是Qwen-Image文生图基础模型的12月更新版本,相较于8月的基础模型,它在图像质量和真实感方面有了显著提升。该模型特别在三大核心能力上实现了飞跃式进步:更真实的人物质感、更细腻的自然纹理以及更复杂的文字渲染。这些改进使得生成的图像在细节表现上更为出色,尤其是在处理文本元素时,能够实现更精确的布局和更高质量的呈现。
Qwen-Image-2512 的主要增强:
- 增强的人物真实感:显著减少”AI生成”的感觉,大幅提升整体图像真实性,尤其是人物主体
- 更精细的自然细节:风景、动物毛发和其他自然元素的渲染更加细腻
- 改进的文字渲染:提高文字元素的准确性和质量,实现更好的排版和更忠实的多模态(文字+图像)组合
官方链接:
支持的宽高比
| 宽高比 | 分辨率 |
|---|---|
| 1:1 | 1328x1328 |
| 16:9 | 1664x928 |
| 9:16 | 928x1664 |
| 4:3 | 1472x1104 |
| 3:4 | 1104x1472 |
| 3:2 | 1584x1056 |
| 2:3 | 1056x1584 |
CmomfyUI 安装
ComfyUI 安装可直接按照官方给的文档进行:https://docs.comfy.org/zh-CN/installation/system_requirements
安装成功后, 打开显示如下界面:

下载 JSON 工作流
下载 Qwen-Image-2512 工作流:link
将工作流拖入ComfyUI 界面中,即可看到如下界面:

将提示的文件模型都点击下载,等待完成后关闭弹窗:

1. 工作流文件说明
工作流包含两个子图:
- Text to Image (Qwen-Image 2512):标准 50 步生成
- Text to Image (Qwen-Image 2512 4steps):使用 Lightning LoRA 的 4 步加速生成

2. 模型说明
文本编码器
LoRA(可选 - 用于 4 步 Lightning 加速)
扩散模型
- qwen_image_2512_fp8_e4m3fn.safetensors(推荐大多数用户使用)
- qwen_image_2512_bf16.safetensors(如果您有足够的显存并想要更好的质量)
VAE
模型存储位置
1 | |
它默认给我们提供了一些提示词,是英文的。

我们可以修改所生成图片的长宽:

我们直接点击运行 按钮看看默认的提示词会生成怎样的图片

可以看到生成的图片如下:

质感还是不错的。

尝试修改提示词,看看效果如何:
一位身着淡雅水粉色交领襦裙的年轻女子背对镜头而坐,俯身专注地手持毛笔在素白宣纸上书写“走天高云淡”四个遒劲汉字。古色古香的室内陈设典雅考究,案头错落摆放着青瓷茶盏与鎏金香炉,一缕熏香轻盈升腾;柔和光线洒落肩头,勾勒出她衣裙的柔美质感与专注神情,仿佛凝固了一段宁静温润的旧时光。

Qwen-Image-2512 的免费在线平台
如果电脑硬件不支持的话,可以以通过 Qwen-Image-2512 的免费在线平台来进行使用:
https://huggingface.co/spaces/Qwen/Qwen-Image-2512
