当前位置: 首页 > news >正文

day27-图生图

图生图原理+实操

原理

图生图(Image-to-Image)的根本目标,是在利用输入图像的结构、构图、色彩等基础信息的前提下,根据新的指令对其进行有目的的改造

我们可以用一个比喻来理解:

  • 文生图:相当于你告诉画家:“画一个宇航员在月球上”。画家从一张白纸开始自由创作。
  • 图生图:相当于你给画家一张维多利亚女性的肖像照片,然后说:“请保持她的姿势和背景感觉,但把她改造成一个长着蝴蝶翅膀的精灵。” 画家是在现有底稿上进行修改。

在ComfyUI中,这个“底稿”就是潜变量(Latent)

image-20260118154207330

提示词:photograph of victorian woman with wings, sky clouds, meadow grass

重点:“降噪”参数

image-20260118154808346

该参数的取值是0-1之间。参数值越接近0(越小)则表示上传的参考图对生图的影响越大,参数值接近1(越大)则表示提示词对生图的影响就越大。例如当该参数值为0.6则表示提示词和参考图分别对最终生图造成影响的权重占比分别为60%和40%。

因此,在生图过程中需要不断尝试使用不同的降噪值来查看生图后的效果!

Lumi-Batcher节点

作用:可以实现进行工作流节点中相关参数测试和参数调优。

管理器安装comfyui-lumi-batcher节点

image-20260118155845896 image-20260118155924542

安装完成后需要重启服务:

image-20260118160012213

重启后,在页面右上角可见:

image-20260118160104438

实现对模型选择和降噪值批量测试

  • 创建任务:

    image-20260118161034768

  • 选择需要测试的参数

    image-20260118161102262

    • 模型:

      image-20260118161317689
    • 降噪:

      image-20260118161345551 image-20260118161405395

      image-20260118161442277

      image-20260118161508168
  • 提交任务:

    image-20260118161624361
  • 浏览任务:

    image-20260118161707282

案例实操

将下面动漫图转换为真人古风的风格

image-20260121084430288

由于原始图像大小为1915 x 1080,如果我们使用的生图模型支持最大分辨率为达不到1915 x 1080,我们可以使用ps将图片裁剪为指定大小即可。在线ps工具:https://ps.gaoding.com/#/

或者也可以使用【裁剪图像】节点进行裁剪:

image-20260121090215251

降噪参数修改为:0.7

修改提示词:

masterpiece,highly detailed,Best quality,1girl, long black hair, straight hair, hair accessories, blue long dress, necklace, many flowers, smile, evening, white flowers, falling petals, Chinese, ancient costume, ancient style, beautiful, photorealistic

使用batcher节点找寻最合适的生图参数

  • 降噪参数选择:

    image-20260121090946850

  • 模型选择:

    image-20260121091057607

  • 查看结果:

    image-20260121091318661

图像高清放大

注意:K采样器的降噪参数建议0.5-0.7之间

文生图或者图生图后发大都可以,下面简单测试图生图后高清放大后效果。下面是原始图生图工作流

image-20260121093804453

基于K采样器的Laten后面添加一个缩放节点(可以成倍对原图进行高清缩放):

image-20260121094044822

image-20260121094124787

添加缩放节点后,接下来基于图生图的形式进行缩放后结果的二次生图。因此需要再次添加一个K采样器:

基于原先的k采样器单机后ctrl-c复制,然后在空白处ctrl+shift+v进行带连线的粘贴

其原理就是将原先K采样器的潜空间输出的数据基于缩放节点进行缩放,缩放后的结果再次基于新的K采样器进行潜空间降噪处理,输出降噪后结果给VAE解码器即可。

然后将缩放节点的输出的latent连线到新K采样器的Latent图像中,将新K采样器的输出Latent连线到VAE解码节点的Latent中即可:

image-20260121094946788

最后结果为:原先768x768的图片被放大到了1152x1152

image-20260121095238056

模型放大

  • 下载图像高清放大模型:

    image-20260121100939657

    模型名称 训练数据/类型 核心优势 弱点 推荐场景
    4x-UltraSharp.pth 自然图像 + 人工锐化增强 边缘锐化极强,细节纹理清晰 易产生锐化伪影(如金属反光过曝) 建筑/机械/需强线条感的图像
    8x_NMKD-Superscale_150000_G.pth 动漫/游戏截图 色彩饱和度高,二次元线条流畅 写实照片易出现卡通化 动漫/插画/像素风游戏素材
    BSRGAN.pth 真实场景照片 自然降噪,光影过渡柔和 细节修复偏保守(如发丝模糊) 写实/老照片修复/风景摄影
    ESRGAN_4x.pth 通用图像(ESRGAN变体) 平衡细节与真实感,泛化性强 复杂纹理可能混乱(如密集树叶) 日常人像/商品展示图
  • 将模型存放到ComfyUI/models/upscale_models

  • 添加节点测试:

    image-20260121101718037

http://www.jsqmd.com/news/297364/

相关文章:

  • 2026年质量好的液压缸/无锡液压缸TOP实力厂家推荐榜
  • 2026年比较好的非标定制束带机/束带机厂家最新TOP实力排行
  • 2026年质量好的异型轴承座/滚动式轴承座厂家最新权威实力榜
  • MySQL 学习笔记(廖老师)
  • 如何用Open-AutoGLM打造专属手机AI助理?
  • verl + Megatron-LM:大规模模型训练整合
  • 训练自己的OCR模型?科哥镜像支持微调,操作很简单
  • 零基础入门大模型微调,Qwen2.5-7B一键部署实操指南
  • 创业团队福音:低成本实现专业级图像处理
  • GPEN与传统PS修复对比,AI增强效率高出10倍
  • 多语言环境挑战:CAM++对带口音普通话识别测试
  • NVIDIA Drive与Aurora联合仿真的实践路径
  • 照片噪点多?GPEN降噪功能实测效果很能打
  • Qwen3-0.6B模型结构解析,GQA机制通俗讲解
  • 快速见效!verl强化学习训练初体验报告
  • Qwen3-Embedding-0.6B功能详解:适合初学者的解读
  • Z-Image-Turbo图像放大技巧,提升细节表现力
  • 无需编程!fft npainting lama开箱即用实现智能图像修复
  • Kibana集成es数据库:超详细版配置指南
  • 测试开机启动脚本镜像功能测评,实用性超出预期
  • 手把手教你用YOLOv10镜像做工业视觉检测
  • 初学者常见问题:HAXM未安装的正确处理方式
  • 用Glyph做学术论文图解分析,效率翻倍
  • Z-Image-Turbo实战应用:快速生成商业级设计图
  • 工业级touch屏幕选型指南:从材质到环境适应性
  • Qwen-Image-2512 pose控制实战,人物姿态更准确
  • 一分钟生成动漫角色!Z-Image-Turbo实战应用揭秘
  • YOLOv9可视化分析:mAP、PR曲线查看技巧
  • 亲测有效!科哥构建的卡通化工具真不难用
  • L298N输入逻辑电平匹配问题全面讲解