当前位置：首页 > news >正文

Wan2.1 VAE与ComfyUI工作流集成：可视化节点式图像生成教程

news 2026/5/11 23:34:58

Wan2.1 VAE与ComfyUI工作流集成：可视化节点式图像生成教程

你是不是也对那些用代码生成图片的方式感到头疼？看着别人分享的复杂脚本，感觉无从下手。如果你更喜欢用直观、可视化的方式来“组装”你的AI创作流程，那么ComfyUI绝对是你的菜。它把图像生成的每一步都变成了可以拖拽、连接的节点，就像搭积木一样简单有趣。

今天，我们就来玩点不一样的：把Wan2.1 VAE模型接入ComfyUI。VAE你可以把它想象成AI画师的“翻译官”，它负责把模型内部那些你看不懂的“潜空间”数据，翻译成一张张你能欣赏的漂亮图片。不同的VAE，翻译出来的风格和细节质感会有所不同。Wan2.1 VAE在一些场景下，能带来更锐利、细节更丰富的出图效果。

这篇教程，就是带你一步步在ComfyUI这个可视化工厂里，把Wan2.1 VAE这个新“翻译官”请进来，并搭建一套完整的图像生成流水线。整个过程不需要你写一行代码，只需要动动鼠标，连一连线。准备好了吗？我们开始吧。

1. 准备工作：模型下载与环境确认

在开始连线之前，我们得先把“原材料”准备好。这里主要是两样东西：Wan2.1 VAE模型文件和已经安装好的ComfyUI。

1.1 获取Wan2.1 VAE模型

首先，你需要找到并下载Wan2.1 VAE模型文件。这个文件通常以.safetensors或.ckpt为后缀。你可以在一些知名的模型分享社区找到它，下载时请注意模型的安全性和来源可靠性。

下载完成后，我们需要把它放到ComfyUI能识别的位置。打开你的ComfyUI安装目录，找到models/vae这个文件夹。如果不存在，就手动创建一个。

将下载好的Wan2.1 VAE模型文件（例如wan2.1.vae.safetensors）复制或移动到这个vae文件夹内。这样，ComfyUI在启动时就会自动加载它。

1.2 确认ComfyUI运行环境

确保你的ComfyUI已经正确安装并能正常运行。如果你还没安装，可以去ComfyUI的官方GitHub页面，按照说明进行安装，通常只需要克隆仓库并安装依赖即可。

启动ComfyUI，你应该能看到一个空白的画布，左侧是节点选择面板。如果一切正常，我们的“舞台”就搭好了。

2. 核心节点介绍与工作流搭建思路

在动手连接之前，我们先快速认识一下接下来要用到的几个“积木块”，并了解它们要怎么拼在一起。

一个最基础的文生图工作流，通常包含这几个核心环节：

文本编码：把你写的文字描述（提示词）转换成模型能理解的数字信号。
随机种子与调度：控制图像生成的起点和过程，影响结果的随机性和稳定性。
采样器（潜空间扩散）：这是AI“创作”的核心大脑，在潜空间里一步步去噪，勾勒出图像轮廓。
VAE解码：把采样器产出的、人眼看不懂的潜空间数据，解码成最终的RGB像素图片。

在ComfyUI里，每一步都对应一个或一组节点。我们的任务就是找到这些节点，用线把它们按顺序连接起来，并在关键位置换上我们刚准备好的Wan2.1 VAE。

3. 分步构建完整工作流

现在，让我们回到ComfyUI的空白画布，开始真正的“搭积木”游戏。

3.1 第一步：加载检查点与VAE

首先，我们需要加载一个主模型（Checkpoint）。它包含了生成图像所需的大部分知识。

在节点面板找到Load Checkpoint节点，或者直接在画布上右键，搜索“Load Checkpoint”并点击添加。
这个节点会自动加载你models/checkpoints文件夹里的模型。点击节点上的下拉菜单，选择你想要使用的主模型，比如某个SDXL或SD1.5的模型。
你会看到这个节点输出三个连接点：MODEL,CLIP,VAE。默认情况下，VAE输出的是主模型内嵌的VAE。

接下来，我们要替换掉这个默认的VAE。

右键画布，搜索并添加Load VAE节点。
在这个节点的vae_name下拉菜单里，你应该能看到我们之前放入models/vae文件夹的wan2.1.vae.safetensors。选中它。
现在，将Load Checkpoint节点输出的VAE连接线断开（如果已连接），然后将Load VAE节点输出的VAE端口，连接到后续需要VAE的地方（先别急，我们知道后续需要就行）。

3.2 第二步：设置文本提示与参数

图像生成需要告诉AI我们想要什么。这里我们添加文本编码节点。

添加CLIP Text Encode (Prompt)节点。通常我们需要两个：一个用于正向提示词（希望画面里有什么），一个用于负向提示词（希望避免什么）。
在text输入框里填写你的描述。例如，正向提示词写“masterpiece, best quality, a beautiful sunset over mountains”，负向提示词写“worst quality, lowres, blurry”。
将这两个节点的CLIP输入端口，都连接到Load Checkpoint节点输出的CLIP端口。

接下来，控制生成过程的随机性和确定性。

添加Empty Latent Image节点。这个节点决定了生成图片的尺寸。设置你想要的width（宽）和height（高），例如1024和1024。
添加KSampler节点。这是最重要的控制台之一。
- 将model连接到Load Checkpoint的MODEL输出。
- 将positive和negative分别连接到两个CLIP Text Encode节点的CONDITIONING输出。
- 将latent_image连接到Empty Latent Image节点的LATENT输出。
- 设置seed（随机种子），一个固定的数字（如12345）可以产生可重复的结果，设为0则每次随机。
- 设置steps（采样步数），比如20。步数越多，细节可能越好，但生成越慢。
- 设置cfg（CFG scale，分类器指导尺度），比如7.5。这个值影响AI遵循提示词的程度，太高可能颜色饱和、构图僵硬，太低则可能偏离描述。

3.3 第三步：连接VAE解码并生成图像

现在，到了让Wan2.1 VAE登场，把潜空间数据变成图片的最后一步。

添加VAE Decode节点。
将这个节点的samples输入端口，连接到KSampler节点的LATENT输出端口。
最关键的一步：将VAE Decode节点的vae输入端口，连接到之前我们准备的Load VAE节点的VAE输出端口。这样，解码工作就交给了Wan2.1 VAE，而不是默认的VAE。
最后，添加一个Save Image节点，将其连接到VAE Decode节点的IMAGE输出。
点击右下角的Queue Prompt按钮，等待片刻，你的第一张由Wan2.1 VAE解码的图像就生成并保存了！

4. 调试与优化：让效果更出色

第一次生成的效果可能未必完美，别担心，我们可以通过调整几个关键“旋钮”来优化。

4.1 调整CFG Scale与采样步数

回到KSampler节点，这两个参数是最常调整的：

CFG Scale：如果你觉得图片颜色过于艳丽、对比度过强，或者构图显得生硬，可以尝试调低它，比如从7.5降到5.5。反之，如果觉得AI太“自由发挥”，不听话，可以适当调高。
Sampling Steps：如果图片细节模糊、有未完成的涂抹感，可以增加步数，比如从20加到30。但注意，步数增加会线性增加生成时间。通常20-30步是一个不错的平衡点。