ComfyUI 部署 FLUX.1 GGUF 量化模型完整技术教程
一、FLUX.1 模型简介
FLUX.1 是由 Black Forest Labs 团队研发的文生大模型,该团队核心成员为原 Stable Diffusion 项目主创人员。模型参数规模达 120 亿,采用多模态 Transformer + 扩散模型混合架构,在语义理解、图像生成表现上有显著优化。
官方共推出三个版本,定位与授权规则各不相同:
- FLUX.1 [pro]:闭源商业版本,仅支持 API 调用,图像生成质量最优;
- FLUX.1 [dev]:开放权重版本,禁止商用,生成效果接近 pro 版,支持本地部署;
- FLUX.1 [schnell]:基于 Apache 2.0 协议开源、可商用,生成速度相比 dev 版本提升约 10 倍,画质略有下降。
普通个人用户主要选择dev和schnell版本进行本地运行。
模型核心特性
- 提示词理解能力强:可精准解析包含多物体、空间位置关系的复杂描述,元素排布准确率优于同类型主流模型;
- 文字生成优化:改善传统 AI 绘图文字乱码、字符变形问题,图像内文字生成可用性大幅提升;
- 人体结构渲染改进:降低手指畸形、肢体扭曲等常见错误的出现概率;
- 分辨率适配广泛:支持 10 万~200 万像素区间、任意长宽比的图像生成,不局限于正方形画布;
- 本地离线运行:权重文件下载完成后,无需联网即可推理,适合批量生成、隐私化创作场景。
二、硬件要求说明
FLUX.1 原版模型硬件门槛较高,社区推出的 GGUF 量化版本大幅降低显存需求,同时还有 FP8 压缩版本可供选择。
1. 不同版本硬件参数
FP8 压缩版
- 显存:12GB ~ 16GB
- 内存:≥16GB
- 存储占用:约 17GB
GGUF 量化版(本文主力部署版本)
由社区开发者优化,提供多档量化精度,画质与显存占用呈梯度变化:
表格
| 量化档位 | 最低显存 | 文件体积 | 画质损耗 |
|---|---|---|---|
| Q2 | 6GB | 约 3.5GB | 画质下降明显 |
| Q4 | 6GB ~ 8GB | 约 6.5GB | 轻微损耗 |
| Q5 | 8GB | 约 8GB | 损耗极低 |
| Q6 | 10GB | 约 10GB | 几乎无损耗 |
| Q8 | 12GB | 约 13GB | 基本无损耗 |
补充实测:6GB 显存设备运行 Q4 版本,512×512 分辨率单图生成耗时数分钟;8GB 显存优先选择 Q5 版本,为综合体验最优方案。RTX 3060、RTX 4060 等主流消费级显卡均可适配 GGUF 量化版。
2. 整体运行环境
- 操作系统:Windows 10 / Windows 11(64 位)
- 运行环境:Python 3.10 及以上
- 显卡:NVIDIA 显卡,支持 CUDA 加速
- 内存:建议≥16GB,推荐 32GB
- 硬盘:可用空间≥20GB
三、主流文生模型横向对比
表格
| 对比维度 | FLUX.1 [dev] | Stable Diffusion 3 | Midjourney v6 | DALL·E 3 |
|---|---|---|---|---|
| 开源属性 | 开放权重(禁止商用) | 开放权重(可商用) | 闭源 | 闭源 |
| 本地部署 | 支持 | 支持 | 不支持(仅云端) | 不支持(仅云端 / API) |
| 参数规模 | 120 亿 | 20 亿 | 未公开 | 未公开 |
| 量化后最低显存 | 6GB(GGUF Q4) | 6GB | 不适用 | 不适用 |
| 提示词理解 | 优秀 | 中等 | 优秀 | 优秀 |
| 图像文字生成 | 较好 | 一般 | 中等 | 中等 |
| 人体 / 肢体渲染 | 较好 | 一般 | 较好 | 一般 |
| 生成速度 | 中等 | 中等 | 云端较快 | 云端较快 |
| 使用费用 | 本地免费 | 本地免费 | 订阅付费 | 按量 / 订阅付费 |
| 画布比例支持 | 全比例兼容 | 支持 | 支持 | 支持 |
| LoRA 扩展 | 生态逐步完善 | 生态成熟 | 不支持自定义扩展 | 不支持自定义扩展 |
| 商用权限 | 禁止商用 | 部分版本可商用 | 支持商用订阅 | 需商用协议 |
参考实测:在复杂构图场景下 FLUX.1 提示词跟随度表现突出;人像皮肤质感方面 Midjourney 略有优势,整体各有侧重。
四、部署前置资源准备
需要提前准备的文件:
- ComfyUI 整合包(内置 Python 环境,免去手动配置);
- ComfyUI-GGUF 专用插件;
- FLUX.1 GGUF 主模型(根据显存选择对应量化版本);
- T5-XXL(GGUF 版)文本编码器;
- CLIP-L 模型;
- ae.safetensors(VAE 模型)。
资源统一下载保存地址:https://pan.baidu.com/s/1P63ziOhxvUQqbHZC8OnHaA?pwd=5555 提取码: 5555
五、分步安装与部署教程
步骤 1:部署 ComfyUI 主程序
- 将下载的 ComfyUI 整合包解压,解压路径禁止包含中文、空格、特殊字符,示例路径:
D:\ComfyUI; - 进入解压目录,双击运行
run_nvidia_gpu.bat启动程序; - 命令行窗口出现
Prompt Server started即代表启动成功; - 打开浏览器,访问地址
http://127.0.0.1:8188,进入 ComfyUI 网页端界面。
步骤 2:安装 ComfyUI-GGUF 插件
FLUX.1 GGUF 格式模型需要该插件加载,提供两种安装方式:
方式一:ComfyUI Manager 在线安装(推荐)
- 网页端右上角点击
Manager,选择Custom Nodes Manager; - 搜索框输入
GGUF,找到ComfyUI-GGUF; - 点击 Install 完成安装,安装结束后重启 ComfyUI。
方式二:手动离线安装(网络异常时使用)
- 进入目录
ComfyUI\custom_nodes; - 地址栏输入
cmd唤起命令行,执行拉取命令:
bash
运行
git clone https://github.com/city96/ComfyUI-GGUF- 若无 Git 环境,可下载插件 ZIP 压缩包,直接解压至
custom_nodes文件夹; - 重启 ComfyUI 使插件生效。
步骤 3:分类放置模型文件
按照规则将模型放入对应子目录,目录均位于 ComfyUI 根目录下:
- FLUX.1 GGUF 主模型路径:
models\unet选型参考:6GB 显存选 Q4、8GB 显存选 Q5、12GB 及以上显存选 Q8。 - T5-XXL(GGUF)文本编码器路径:
models\clip建议选择 Q5_K_M 及以上版本,保障文本解析效果。 - CLIP-L 模型(clip_l.safetensors)路径:
models\clip - VAE 模型(ae.safetensors)路径:
models\vae,可重命名为flux_ae.safetensors方便区分。
步骤 4:搭建专属工作流
FLUX.1 不兼容传统 SD 工作流,需新增专用节点:
- 界面空白处双击,搜索并添加Unet Loader (GGUF),加载已放入的 FLUX.1 主模型;
- 再次双击空白处,添加CLIP Loader (GGUF),加载 T5-XXL 与 CLIP-L 模型,类型设置为
flux; - 添加VAE 加载器,选中对应的 VAE 模型;
- 补充两个 CLIP Text Encode(Prompt)节点(FLUX.1 不支持反向提示词,但节点必须保留,避免报错);
- 将各加载器输出端与采样器对应端口依次连接;
快捷方案:可直接导入网络现成的 FLUX.1 GGUF 工作流 JSON 文件,省去手动连线操作。
步骤 5:图像生成测试
- 在提示词输入框填写画面描述,建议描述内容具体、层次清晰;
- 点击界面右下角
Queue Prompt开始生成; - 节点依次变绿代表对应步骤执行中,全部完成后图像自动输出;
- 生成文件默认保存至
ComfyUI\output目录。
六、使用规范与参数建议
- 提示词规则:FLUX.1 不支持反向提示词,无需填写负面描述;内容描述越具体,生成结果越贴合预期;
- 分辨率适配:6GB 低显存设备优先使用 512×512 分辨率,降低显存占用;
- 后台设置:生成过程关闭其他高显存占用软件,避免显存溢出。
七、常见问题排查
问题:启动 / 生成时提示找不到模型排查:核对模型存放目录是否正确,检查文件路径、文件夹名称是否包含中文 / 空格。
问题:节点标红、功能报错排查:确认使用GGUF 专属加载节点,不可混用传统模型节点。
问题:生成速度过慢排查:低显存设备降低图像分辨率,或切换更低档位的量化模型。
问题:不同量化版本画质差异说明:常规场景下 Q4/Q5 版本肉眼差异较小;复杂画面、密集文字场景,高量化版本(Q6/Q8)细节表现更优。
八、补充总结
FLUX.1 GGUF 量化版有效降低了原模型的硬件门槛,让 6GB 及以上消费级显卡可以本地运行。该模型在语义理解、文字生成、人体结构方面相比传统 SD 系列有明显提升。
