当前位置: 首页 > news >正文

扩散模型

论文:《Denoising Diffusion Probabilistic Models》(DDPM, NeurIPS 2020)

简述:

(大白话)

训练阶段:首先是将图片一步步进行加noise,将每一步加入noise生成的像素图片进行去噪,目标是预测噪声;

 

预测阶段:从标准高斯分布中采样一张纯噪声图片,将它放入已经生成的扩散模型中,通过多步迭代,让它预测加噪时添加的噪声。

 

完整总结:

训练阶段:

  1. 前向加噪:对原始图片x0执行 T 步逐步加噪,生成从 “轻微噪声(t=1)” 到 “纯噪声(t=T)” 的含噪图片序列\(x1, x2, ..., xT),每一步加噪遵循高斯分布规律;
  2. 反向去噪训练:随机选择一个时间步 t,将该步的含噪图片xt和时间步 t 输入模型,让模型预测 “前向加噪时添加的真实噪声€”;
  3. 优化目标:最小化 “模型预测的噪声€Θ” 与 “真实加噪噪声€” 的误差,让模型掌握 “任意噪声程度的图片→对应去噪结果” 的映射规律。

预测(推理)阶段:

  1. 初始化:从标准高斯分布中采样一张纯噪声图片xT
  2. 多步迭代去噪:对 t 从 T 到 1 逐步迭代,每次将当前含噪图片xt和时间步 t 输入训练好的模型,通过模型预测的噪声€Θ推导出去噪后的图片xt-1
  3. 输出结果:迭代完成后,最终得到的x0即为去噪(生成)的目标图片。

 

 
http://www.jsqmd.com/news/24029/

相关文章:

  • 20232303 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 衡量模型生成图片质量的指标
  • 代码大全2 第一章 与第二章
  • 第二十一天
  • 面试谈薪资指南:掌握主动权的关键策略
  • CF2018B
  • 10/27
  • 第7天(中等题 滑动窗口)
  • C++ 获取 const char* 字符串长度
  • 20251027——读后感2
  • window[-INPUT-] 还有哪些属性或方法
  • DeepSeek-DSA讲解
  • 【转载】‘tensorrt.tensorrt.Builder‘ object has no attribute ‘build_cuda_engine‘
  • paste
  • C#/.NET/.NET Core技术前沿周刊 | 第 59 期(2025年10.20-10.26)
  • Python write to file and read from file
  • Experiment3
  • 20232403 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • CF995F Cowmpany Cowmpensation
  • 背诵
  • 关系运算符逻辑运算符
  • WPF datagrid mvvm loaded 100M items,prism.wpf,prism.dryioc
  • 20232406 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 20232424 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • MLA原理讲解
  • LLM什么时候才能输出固定格式
  • MCP和Function Calling的区别
  • 《程序员修炼之道》 阅读笔记三
  • sg.绑定键盘事件
  • FastAPI 架构指南:用这份模版打造可扩展又安全的系统(附实战经验)