当前位置: 首页 > news >正文

深度学习·GAN系列

文章目录

  • GAN
  • 损失函数
    • 模式崩溃:mode collapse
    • BCE损失的问题 / 生成器和判别器学习不平衡
  • WGAN-GP
    • W-loss损失
      • 条件
      • 强制执行1-L 连续性性质
  • Conditional GAN
    • 损失函数
  • 控制生成
    • 挑战
  • P2P GAN
    • 判别器:PatchGAN
    • 生成器
    • 损失函数
    • 应用
  • CycleGAN
    • 损失函数
      • 最小二乘损失
      • 循环损失
      • 等价损失

GAN

损失函数

模式崩溃:mode collapse

多样性降低,生成器倾向于生成特定分布的特征

BCE损失的问题 / 生成器和判别器学习不平衡

  • 判别器只需要输出0-1标签,任务比生成器简单
  • 一开始生成器可以受到判别器的梯度,但是后面判别器的输出接近标签,导致生成器学习不到任何表示
  • 最后的结果,判别器过拟合,预测完全正确;生成器没有任何反馈,无法更新。双方的梯度都消失了

WGAN-GP

W-loss损失

条件

判别器的网络损失满足1-L 连续性性质
网络损失的增长是线性的。

强制执行1-L 连续性性质

  • 软约束:使用正则化,平方乘法梯度范数>1的情况
  • 注意:不能对所有图像都应用这个惩罚(太慢),适当选择真实和生成图像进行合成,然后检查这个梯度即可。


Conditional GAN

  • 生成所需类别的图像
  • 将类别标签y拼接到z-向量上

损失函数

  • 现在z是给定y的情况下:实际上是将标签向量与z拼接在一起

对于这种数据,只需要将标签作为新的特征加入到原始特征中的最后一列即可,相当于原始特征有n个,新的特征为n+1个。


条件GAN

控制生成

  • 旋转z向量(在z-space中)
  • 寻找方向
  • 应用方向

挑战

  • 特性高度相关

P2P GAN

配对图像翻译

判别器:PatchGAN

  • 生成器接受一对输入,包括原图,目标图像/GT,然后生成一个patch矩阵,对于每一个patch矩阵的真实性都进行预测(W-loss/BCE)

生成器

  • 给定一个原图,产生目标图像

损失函数

应用

  • 风格迁移
  • 图像翻译

CycleGAN

适用于无配对图像翻译任务
动机:斑马(Z),马(H),Z->H->Z’, Z = Z’

  • 基本架构与P2P GAN一致,生成器是Unet变体,判别器仍然是PatchGAN。
  • 两组生成器和判别器

损失函数

最小二乘损失

  • 将BCE换成MSE

循环损失

  • 损失函数更换为最小二乘损失

等价损失

  • 对于生成器H,给定马的图像,生成的图像与原图像应该一致,不需要改变风格。
http://www.jsqmd.com/news/545070/

相关文章:

  • 2026真空螺旋干燥机厂家推荐:苏能干燥科技有限公司,多型号设备满足工业需求 - 品牌推荐官
  • OpenClaw 飞书群聊与私聊模式详解
  • 交叉编译链
  • 2026年台车炉厂家推荐:江苏华海信德工业炉有限公司,全系列台车炉产品供应 - 品牌推荐官
  • 4大维度掌握MiniSat:写给开发者的SAT求解器实践指南
  • 不止是收发数据:挖掘常兴串口调试助手V5.01的5个隐藏效率神器(自动回复/进制转换/批量发送)
  • 短信营销API接口参考文档:涵盖字段定义、鉴权流程与多语言开发包
  • Grbl运动控制固件:从原理到实践的CNC开发全指南
  • ENVI 5.3波谱库实战:从自带库浏览到自定义库创建,遥感地物识别效率翻倍
  • AED厂家怎么选?2026年值得关注的AED厂家推荐 - 品牌2026
  • 尼伽司他(Nirogacestat):硬纤维瘤靶向治疗新突破
  • 附卖家精灵折扣码!2026亚马逊最值得布局的新打法 - 麦麦唛
  • 老款FBS4奔驰汽车钥匙进水维修技术
  • 2026年3月成都装修设计公司哪家好:口碑好的优质厂家盘点 - 深度智识库
  • 电气团队主导工业数据中心建设,哪些主流供应商覆盖接线端子、机柜布线与自动控制?——聚焦厂商类型划分、能力结构及边界界定
  • Android性能优化利器:深入剖析IdleHandler机制与实战应用
  • 7个维度解析开源字体解决方案:从技术实现到商业价值提升
  • nlp_structbert_sentence-similarity_chinese-large基础教程:3步完成本地语义相似度服务搭建
  • XCZU67DR的PS和PL怎么协同干活?一个案例讲透ARM核与FPGA联动处理高速ADC数据流
  • WiFi CSI感知技术解密:从信号到智能的无线革命
  • Qwen-Rapid-AIO:8秒完成专业级AI图像编辑的终极解决方案
  • Tailscale在CentOS7上的IP转发与伪装设置详解:避坑指南与性能优化
  • 口碑好的颗粒计数器企业:四大行业领军品牌深度解析 - 品牌推荐大师
  • 极致懒人配置:用LazyVim打造你的专属Neovim智能开发环境
  • 真我V70 realme RMX3946 解锁BL 刷机包 刷magisk root教程
  • Python 匿名函数(lambda)举例
  • 视频修复神器Untrunc:从损坏到完整的高效恢复方案
  • 解决国内网络环境下GitHub资源访问难题:GitHub加速计划一站式解决方案
  • 分子构象采样新范式:CREST工具解决药物研发核心挑战
  • 如何高效获取B站资源:DownKyi视频下载工具的完整指南