当前位置：首页 > news >正文

ComfyUI 部署 FLUX.1 GGUF 量化模型完整技术教程

news 2026/6/13 11:40:30

一、FLUX.1 模型简介

FLUX.1 是由 Black Forest Labs 团队研发的文生大模型，该团队核心成员为原 Stable Diffusion 项目主创人员。模型参数规模达 120 亿，采用多模态 Transformer + 扩散模型混合架构，在语义理解、图像生成表现上有显著优化。

官方共推出三个版本，定位与授权规则各不相同：

FLUX.1 [pro]：闭源商业版本，仅支持 API 调用，图像生成质量最优；
FLUX.1 [dev]：开放权重版本，禁止商用，生成效果接近 pro 版，支持本地部署；
FLUX.1 [schnell]：基于 Apache 2.0 协议开源、可商用，生成速度相比 dev 版本提升约 10 倍，画质略有下降。

普通个人用户主要选择dev和schnell版本进行本地运行。

模型核心特性

提示词理解能力强：可精准解析包含多物体、空间位置关系的复杂描述，元素排布准确率优于同类型主流模型；
文字生成优化：改善传统 AI 绘图文字乱码、字符变形问题，图像内文字生成可用性大幅提升；
人体结构渲染改进：降低手指畸形、肢体扭曲等常见错误的出现概率；
分辨率适配广泛：支持 10 万～200 万像素区间、任意长宽比的图像生成，不局限于正方形画布；
本地离线运行：权重文件下载完成后，无需联网即可推理，适合批量生成、隐私化创作场景。

二、硬件要求说明

FLUX.1 原版模型硬件门槛较高，社区推出的 GGUF 量化版本大幅降低显存需求，同时还有 FP8 压缩版本可供选择。

1. 不同版本硬件参数

FP8 压缩版

显存：12GB ~ 16GB
内存：≥16GB
存储占用：约 17GB

GGUF 量化版（本文主力部署版本）

由社区开发者优化，提供多档量化精度，画质与显存占用呈梯度变化：

表格

量化档位	最低显存	文件体积	画质损耗
Q2	6GB	约 3.5GB	画质下降明显
Q4	6GB ~ 8GB	约 6.5GB	轻微损耗
Q5	8GB	约 8GB	损耗极低
Q6	10GB	约 10GB	几乎无损耗
Q8	12GB	约 13GB	基本无损耗

补充实测：6GB 显存设备运行 Q4 版本，512×512 分辨率单图生成耗时数分钟；8GB 显存优先选择 Q5 版本，为综合体验最优方案。RTX 3060、RTX 4060 等主流消费级显卡均可适配 GGUF 量化版。

2. 整体运行环境

操作系统：Windows 10 / Windows 11（64 位）
运行环境：Python 3.10 及以上
显卡：NVIDIA 显卡，支持 CUDA 加速
内存：建议≥16GB，推荐 32GB
硬盘：可用空间≥20GB

三、主流文生模型横向对比

表格

对比维度	FLUX.1 [dev]	Stable Diffusion 3	Midjourney v6	DALL·E 3
开源属性	开放权重（禁止商用）	开放权重（可商用）	闭源	闭源
本地部署	支持	支持	不支持（仅云端）	不支持（仅云端 / API）
参数规模	120 亿	20 亿	未公开	未公开
量化后最低显存	6GB（GGUF Q4）	6GB	不适用	不适用
提示词理解	优秀	中等	优秀	优秀
图像文字生成	较好	一般	中等	中等
人体 / 肢体渲染	较好	一般	较好	一般
生成速度	中等	中等	云端较快	云端较快
使用费用	本地免费	本地免费	订阅付费	按量 / 订阅付费
画布比例支持	全比例兼容	支持	支持	支持
LoRA 扩展	生态逐步完善	生态成熟	不支持自定义扩展	不支持自定义扩展
商用权限	禁止商用	部分版本可商用	支持商用订阅	需商用协议

参考实测：在复杂构图场景下 FLUX.1 提示词跟随度表现突出；人像皮肤质感方面 Midjourney 略有优势，整体各有侧重。

四、部署前置资源准备

需要提前准备的文件：

ComfyUI 整合包（内置 Python 环境，免去手动配置）；
ComfyUI-GGUF 专用插件；
FLUX.1 GGUF 主模型（根据显存选择对应量化版本）；
T5-XXL（GGUF 版）文本编码器；
CLIP-L 模型；
ae.safetensors（VAE 模型）。

资源统一下载保存地址：https://pan.baidu.com/s/1P63ziOhxvUQqbHZC8OnHaA?pwd=5555 提取码: 5555

五、分步安装与部署教程

步骤 1：部署 ComfyUI 主程序

将下载的 ComfyUI 整合包解压，解压路径禁止包含中文、空格、特殊字符，示例路径：D:\ComfyUI；
进入解压目录，双击运行run_nvidia_gpu.bat启动程序；
命令行窗口出现Prompt Server started即代表启动成功；
打开浏览器，访问地址http://127.0.0.1:8188，进入 ComfyUI 网页端界面。

步骤 2：安装 ComfyUI-GGUF 插件

FLUX.1 GGUF 格式模型需要该插件加载，提供两种安装方式：

方式一：ComfyUI Manager 在线安装（推荐）

网页端右上角点击Manager，选择Custom Nodes Manager；
搜索框输入GGUF，找到ComfyUI-GGUF；
点击 Install 完成安装，安装结束后重启 ComfyUI。

方式二：手动离线安装（网络异常时使用）

进入目录ComfyUI\custom_nodes；
地址栏输入cmd唤起命令行，执行拉取命令：

bash

运行

git clone https://github.com/city96/ComfyUI-GGUF

若无 Git 环境，可下载插件 ZIP 压缩包，直接解压至custom_nodes文件夹；
重启 ComfyUI 使插件生效。

步骤 3：分类放置模型文件

按照规则将模型放入对应子目录，目录均位于 ComfyUI 根目录下：

FLUX.1 GGUF 主模型路径：models\unet选型参考：6GB 显存选 Q4、8GB 显存选 Q5、12GB 及以上显存选 Q8。
T5-XXL（GGUF）文本编码器路径：models\clip建议选择 Q5_K_M 及以上版本，保障文本解析效果。
CLIP-L 模型（clip_l.safetensors）路径：models\clip
VAE 模型（ae.safetensors）路径：models\vae，可重命名为flux_ae.safetensors方便区分。

步骤 4：搭建专属工作流

FLUX.1 不兼容传统 SD 工作流，需新增专用节点：

界面空白处双击，搜索并添加Unet Loader (GGUF)，加载已放入的 FLUX.1 主模型；
再次双击空白处，添加CLIP Loader (GGUF)，加载 T5-XXL 与 CLIP-L 模型，类型设置为flux；
添加VAE 加载器，选中对应的 VAE 模型；
补充两个 CLIP Text Encode（Prompt）节点（FLUX.1 不支持反向提示词，但节点必须保留，避免报错）；
将各加载器输出端与采样器对应端口依次连接；

快捷方案：可直接导入网络现成的 FLUX.1 GGUF 工作流 JSON 文件，省去手动连线操作。

步骤 5：图像生成测试

在提示词输入框填写画面描述，建议描述内容具体、层次清晰；
点击界面右下角Queue Prompt开始生成；
节点依次变绿代表对应步骤执行中，全部完成后图像自动输出；
生成文件默认保存至ComfyUI\output目录。

六、使用规范与参数建议

提示词规则：FLUX.1 不支持反向提示词，无需填写负面描述；内容描述越具体，生成结果越贴合预期；
分辨率适配：6GB 低显存设备优先使用 512×512 分辨率，降低显存占用；
后台设置：生成过程关闭其他高显存占用软件，避免显存溢出。

七、常见问题排查

问题：启动 / 生成时提示找不到模型排查：核对模型存放目录是否正确，检查文件路径、文件夹名称是否包含中文 / 空格。
问题：节点标红、功能报错排查：确认使用GGUF 专属加载节点，不可混用传统模型节点。
问题：生成速度过慢排查：低显存设备降低图像分辨率，或切换更低档位的量化模型。
问题：不同量化版本画质差异说明：常规场景下 Q4/Q5 版本肉眼差异较小；复杂画面、密集文字场景，高量化版本（Q6/Q8）细节表现更优。

八、补充总结

FLUX.1 GGUF 量化版有效降低了原模型的硬件门槛，让 6GB 及以上消费级显卡可以本地运行。该模型在语义理解、文字生成、人体结构方面相比传统 SD 系列有明显提升。

查看全文

http://www.jsqmd.com/news/1005003/

2026年热门手机阅读器大揭秘：哪个才具备个性化设置？

2026杭州余杭伯爵出手｜暗藏猫腻，不少人在这里吃了亏 - 逸程

GEO科普系列专题：第五期——权威信源建设与E-E-A-T原则：让AI“信任”你的品牌

从寄存器堆到指令存储器：手把手教你用Verilog在头歌平台搭建一个简易CPU核心

Cesium项目实战：用Entity实现一个可交互的动态数据看板（附完整代码）

FUXA工业可视化平台：现代化SCADA/HMI系统的开源解决方案

滨州市2026年黄金回收白银回收铂金回收变卖，5 家靠谱贵金属门店实地测评汇总 - 凯撒是大帝

阆中汽车贴膜选购全攻略：膜材科普与实用避坑指南 - 百航

2026南京奢侈品黄金回收大额交易深度评测 - 奢侈品回收

网盘限速终结者：9大平台直链下载神器LinkSwift实战指南

CH32V307 SPI主从机通信避坑指南：从单机发送到双机互传的完整配置流程

别再只会调频率了！用运放搭波形发生器，手把手教你搞定占空比和幅值（附完整电路图）

如何快速配置Unity游戏自动翻译插件：XUnity.AutoTranslator完全指南

青岛崂山区商圈实测：金价913元克回收如何避坑 - 专业黄金回收

LabVIEW层叠式顺序结构隐藏技巧：如何优雅管理多步骤仪器控制与状态切换

贵阳花溪区商圈实测：黄金回收价格与避坑指南 - 专业黄金回收

潮州市2026年黄金回收白银回收铂金回收变卖，5 家靠谱贵金属门店实地测评汇总 - 凯撒是大帝

2026年热门微辣酱香商用麻辣炒料实测指南：餐饮开店选料不踩雷 - 麻辣烫酱料

大模型编排层为何正在消失？从Anthropic架构坍缩看LLM中间件演进

“安能大件物流介绍”、“安能大件物流”、“安能物流介绍”、“安能物流最新发展状况” - 安互工业信息

2026娄底旧金铂银回收黄金回收高信誉门店汇总 5 家线下实体回收商家实地评测与联络渠道整理 - 中业金奢再生回收中心

卡尔曼滤波（Kalman Filter, 简称 KF）是一种高效的递归滤波算法，用于在噪声环境中从一系列不完全或不确定的测量数据中估计动态系统的状态

魔兽争霸III现代化改造终极指南：3分钟解决宽屏、卡顿与地图加载难题

yansongda/pay 多支付平台统一架构设计与工程实践

用飞凌OK3568开发板+USB摄像头，5分钟搞定一个实时物品识别Demo（附完整Qt工程）

Ansys Lumerical实战：用FDE和CHARGE搞定PN耗尽型移相器仿真（附完整脚本）

甘南藏族自治州2026年黄金回收白银回收铂金回收变卖，5 家靠谱贵金属门店实地测评汇总 - 凯撒是大帝

解密移动端AI部署：3步构建高效人脸识别应用

2026黄南旧金铂银回收黄金回收高信誉门店汇总 5 家线下实体回收商家实地评测与联络渠道整理 - 中业金奢再生回收中心