当前位置: 首页 > news >正文

Stable-Diffusion模型中常见 Stable Diffusion Sampling 方法

在 Stable Diffusion 里,sampling 方法通常也叫 sampler / scheduler,本质是:模型从随机噪声开始,按某种反向去噪策略一步步生成图像。Diffusers 官方说明里,scheduler 会根据模型输出和 timestep 返回去噪后的 sample;训练时它定义加噪方式,推理时它定义如何更新 sample。([Hugging Face][1])

1. 常见 Stable Diffusion Sampling 方法

类别常见 sampler / scheduler特点适合场景
原始扩散采样DDPM最经典,随机性强,步数多,速度慢论文 baseline、研究原理
确定性采样DDIM可用较少步数生成,结果更稳定,便于复现img2img、可控生成、数据集复现
Pseudo NumericalPNDM / PLMSStable Diffusion 早期常用默认采样器,质量稳定通用生成、默认 baseline
Linear MultistepLMS / K-LMS多步数值解法,平滑稳定通用图像生成
Euler 系列Euler / Euler aEuler 稳定;Euler a 带 ancestral 随机性,多样性更强批量生成、多样化数据
Heun 系列Heun类似改进 Euler,质量较稳但略慢高质量生成
DPM2 系列DPM2 / DPM2 a / KDPM2 / KDPM2 a二阶 DPM 采样,a 版本随机性更强质量与多样性平衡
DPM-Solver 系列DPM-Solver / DPM-Solver++ / DPM++ 2M / DPM++ SDE高阶 ODE/SDE 求解器,少步数高质量当前最常用的数据生成采样器
Karras 噪声调度DPM++ 2M Karras / Euler Karras / LMS Karras改进 sigma/noise schedule,常提升稳定性和细节高质量批量合成数据
UniPCUniPCMultistepScheduler训练无关的快速 predictor-corrector 采样框架少步数快速生成
DEISDEISMultistepScheduler高效多步采样器快速高质量生成
LCM / Turbo 类LCMScheduler / SDXL-Turbo极少步数,LCM 常见 2–4 步,SDXL Turbo 可 1 步推理快速预览、大规模粗生成

Diffusers 官方的 scheduler 映射表中明确列出了 A1111/k-diffusion 中常见的DPM++ 2M、DPM++ 2M Karras、DPM++ SDE、DPM2、Euler、Euler a、Heun、LMS、UniPC、DEIS等采样器及其在 Diffusers 中的对应 scheduler。([Hugging Face][1])

2. 重点采样器说明

DDPM

DDPM 是最原始的扩散概率模型采样方式,理论基础清晰,但推理步数通常较多,速度较慢。适合做算法理解、论文复现和 baseline,不太适合高吞吐数据生成。([Hugging Face][2])

DDIM

DDIM 是对 DDPM 去噪过程的非马尔可夫扩展,常用于更少步数、更稳定的生成流程。它适合需要固定 seed、可重复生成、img2img 或自动标注数据构造的场景。([Hugging Face][3])

DPM-Solver / DPM++

DPM-Solver 和 DPM-Solver++ 是专门面向 diffusion ODE 的快速高阶求解器。Diffusers 文档说明,DPM-Solver 在 20 步时通常能生成高质量样本,10 步也能得到不错结果。([Hugging Face][4])

实际批量生成数据时,常用:

DPM++ 2M Karras DPM++ SDE Karras DPM++ 2M DPM++ 2S a Karras

其中DPM++ 2M Karras是很多 Stable Diffusion WebUI / ComfyUI 工作流中的通用高质量默认选择。

Euler / Euler a

Euler 系列简单、速度快。Euler更稳定,Euler a带 ancestral 随机性,生成结果变化更大。做合成数据增强时,如果你希望同一 prompt 生成更多风格变化,Euler a 比较有价值。Diffusers 官方映射中,Euler 对应EulerDiscreteScheduler,Euler a 对应EulerAncestralDiscreteScheduler。([Hugging Face][1])

UniPC

UniPC 是一种训练无关的快速采样框架,由 predictor 和 corrector 组成,支持多种 diffusion 模型和不同阶数,目标是少步数下提升采样质量。([Hugging Face][5])

LCM / SDXL Turbo

LCM 属于极少步数生成路线。Diffusers 文档说明,LCM 可以在2–4 步生成高质量图像,而不是传统 diffusion 常见的 20–30 步;LCMScheduler通常用于 1–8 步生成。([Hugging Face][6])

SDXL Turbo 是时间蒸馏后的 SDXL 模型,Diffusers 文档称其可以低至1 step推理。([Hugging Face][7])

3. 做“生成数据集”时的推荐选择

高质量、稳定、通用

DPM++ 2M Karras Steps: 20–30 CFG Scale: 5–8

适合生成商品图、目标检测训练图、风格较稳定的合成数据。

更高多样性

Euler a DPM++ 2S a Karras DPM2 a Karras Steps: 25–40

适合做数据增强,让姿态、背景、光照、纹理变化更丰富。

快速大规模粗生成

LCM LCM-LoRA SDXL Turbo Steps: 1–8

适合先快速生成大量候选图,再用 CLIP / 分类器 / 检测器过滤。

可复现、可控生成

DDIM PNDM DPM++ 2M

适合固定 seed、prompt 模板、类别标签,构建可追溯的数据生成 pipeline。

4. 结论

做 Stable Diffusion 数据生成,优先推荐:

首选:DPM++ 2M Karras 多样性:Euler a / DPM++ 2S a Karras 快速:LCM / SDXL Turbo 可复现:DDIM 研究 baseline:DDPM / PNDM

对于自动标注或训练集扩充,比较实用的组合是:

DPM++ 2M Karras 生成高质量主数据 Euler a 生成多样化增强数据 LCM / Turbo 生成大规模候选数据 CLIP / 检测器 / 人工审核做过滤

参考链接:
[1]: https://huggingface.co/docs/diffusers/en/api/schedulers/overview “Schedulers · Hugging Face”
[2]: https://huggingface.co/docs/diffusers/api/schedulers/ddpm “DDPMScheduler · Hugging Face”
[3]: https://huggingface.co/docs/diffusers/api/schedulers/ddim “DDIMScheduler · Hugging Face”
[4]: https://huggingface.co/docs/diffusers/en/api/schedulers/multistep_dpm_solver “DPMSolverMultistepScheduler · Hugging Face”
[5]: https://huggingface.co/docs/diffusers/en/api/schedulers/unipc “UniPCMultistepScheduler · Hugging Face”
[6]: https://huggingface.co/docs/diffusers/using-diffusers/inference_with_lcm?utm_source=chatgpt.com “Latent Consistency Model”
[7]: https://huggingface.co/docs/diffusers/using-diffusers/sdxl_turbo?utm_source=chatgpt.com “Stable Diffusion XL Turbo”

http://www.jsqmd.com/news/857971/

相关文章:

  • DDrawCompat完整指南:3步让Windows 11完美运行经典老游戏的终极兼容性修复方案
  • 【Appium 系列】第16节-WebView-H5上下文切换 — 混合应用的自动化难点
  • Cursor VIP共享方案终极指南:三步免费解锁AI编程神器的完整教程
  • 计算机专业生打 CTF 全指南:从新手小白到赛事拿分,附实战避坑手册_ctf比赛自己带电脑吗
  • Windows 10/11(64位)上安装 WinQSB——无需虚拟机
  • 3步构建现代P2P文件传输系统:探索小鹿快传的技术架构
  • 超实用逛展攻略,助您畅游第27届全国医院建设大会!5月23日,itc保伦股份与您不见不散~ - 品牌速递
  • 收藏!想进大模型行业?一文搞懂5大核心岗位,小白也能轻松入门!
  • 酷安UWP桌面客户端:在Windows电脑上高效刷酷安的完整指南
  • Frida+Fart实战:在ART Dex加载临界点精准dump二代壳内存Dex
  • 萝博派对获数千万美元天使+轮融资,开源双足人形机器人发展提速!
  • 专业联发科设备bootloader解锁与安全绕过实战指南
  • 2026年大型集团GEO优化服务商适配指南:3家专业机构深度解析 - 产业观察网
  • 关于开发社区网站小组发帖功能和多级回复的代码
  • 2026年AI大模型API中转站主流服务商实测排名 性能成本与落地能力全维度深度对比
  • GPT5.5做API文档生成实操从代码到Swagger全流程跑通
  • Java Map集合详解与实战
  • 英雄联盟Akari助手:一键智能配置,释放你的游戏潜能 [特殊字符]
  • codex ctl最新版本安装配置 - Leonardo
  • 3分钟快速上手:AutoCAD字体管理终极方案FontCenter完整教程
  • 四足机器人混合控制框架:强化学习与模型预测的协同创新
  • 如何高效免费下载百度文库文档:实用完整指南
  • 电弧喷涂技术在炊具行业的应用:导磁涂层、钛耐磨涂层工艺与优势
  • 情感演绎有多强?顶伯实测愤怒、喜悦、悲伤等 9 种语气
  • 如何在Hermes Agent项目中自定义Provider接入Taotoken多模型服务
  • 3个真实场景告诉你,为什么Windows用户需要Winhance中文版
  • 独立开发者如何利用Taotoken的多模型与透明计费构建小而美的AI应用
  • 2026乌鲁木齐租车哪家靠谱?高性价比租车品牌横向实测测评 - GrowthUME
  • 论文AIGC率太高?2026实测高效降AI工具合集
  • Whisky完全指南:在macOS上轻松运行Windows程序的终极方案