当前位置：首页 > news >正文

day27-图生图

news 2026/3/27 2:26:58

图生图原理+实操

原理

图生图（Image-to-Image）的根本目标，是在利用输入图像的结构、构图、色彩等基础信息的前提下，根据新的指令对其进行有目的的改造。

我们可以用一个比喻来理解：

文生图：相当于你告诉画家：“画一个宇航员在月球上”。画家从一张白纸开始自由创作。
图生图：相当于你给画家一张维多利亚女性的肖像照片，然后说：“请保持她的姿势和背景感觉，但把她改造成一个长着蝴蝶翅膀的精灵。” 画家是在现有底稿上进行修改。

在ComfyUI中，这个“底稿”就是潜变量（Latent）。

提示词：photograph of victorian woman with wings, sky clouds, meadow grass

重点：“降噪”参数

该参数的取值是0-1之间。参数值越接近0（越小）则表示上传的参考图对生图的影响越大，参数值接近1（越大）则表示提示词对生图的影响就越大。例如当该参数值为0.6则表示提示词和参考图分别对最终生图造成影响的权重占比分别为60%和40%。

因此，在生图过程中需要不断尝试使用不同的降噪值来查看生图后的效果！

Lumi-Batcher节点

作用：可以实现进行工作流节点中相关参数测试和参数调优。

管理器安装comfyui-lumi-batcher节点

安装完成后需要重启服务：

重启后，在页面右上角可见：

实现对模型选择和降噪值批量测试

创建任务：
选择需要测试的参数
- 模型：
- 降噪：
提交任务：
浏览任务：

案例实操

将下面动漫图转换为真人古风的风格

由于原始图像大小为1915 x 1080，如果我们使用的生图模型支持最大分辨率为达不到1915 x 1080，我们可以使用ps将图片裁剪为指定大小即可。在线ps工具：https://ps.gaoding.com/#/

或者也可以使用【裁剪图像】节点进行裁剪：

降噪参数修改为：0.7

修改提示词：

masterpiece，highly detailed，Best quality,1girl, long black hair, straight hair, hair accessories, blue long dress, necklace, many flowers, smile, evening, white flowers, falling petals, Chinese, ancient costume, ancient style, beautiful, photorealistic

使用batcher节点找寻最合适的生图参数

降噪参数选择：
模型选择：
查看结果：

图像高清放大

注意：K采样器的降噪参数建议0.5-0.7之间

文生图或者图生图后发大都可以，下面简单测试图生图后高清放大后效果。下面是原始图生图工作流

基于K采样器的Laten后面添加一个缩放节点（可以成倍对原图进行高清缩放）：

添加缩放节点后，接下来基于图生图的形式进行缩放后结果的二次生图。因此需要再次添加一个K采样器：

基于原先的k采样器单机后ctrl-c复制，然后在空白处ctrl+shift+v进行带连线的粘贴

其原理就是将原先K采样器的潜空间输出的数据基于缩放节点进行缩放，缩放后的结果再次基于新的K采样器进行潜空间降噪处理，输出降噪后结果给VAE解码器即可。

然后将缩放节点的输出的latent连线到新K采样器的Latent图像中，将新K采样器的输出Latent连线到VAE解码节点的Latent中即可：

最后结果为：原先768x768的图片被放大到了1152x1152

模型放大

下载图像高清放大模型：

模型名称	训练数据/类型	核心优势	弱点	推荐场景
4x-UltraSharp.pth	自然图像 + 人工锐化增强	边缘锐化极强，细节纹理清晰	易产生锐化伪影（如金属反光过曝）	建筑/机械/需强线条感的图像
8x_NMKD-Superscale_150000_G.pth	动漫/游戏截图	色彩饱和度高，二次元线条流畅	写实照片易出现卡通化	动漫/插画/像素风游戏素材
BSRGAN.pth	真实场景照片	自然降噪，光影过渡柔和	细节修复偏保守（如发丝模糊）	写实/老照片修复/风景摄影
ESRGAN_4x.pth	通用图像（ESRGAN变体）	平衡细节与真实感，泛化性强	复杂纹理可能混乱（如密集树叶）	日常人像/商品展示图