当前位置: 首页 > news >正文

MetaCloak-JPEG如何让你的照片不被拿去生成不可描述的图片?

MetaCloak-JPEG如何让你的照片不被拿去生成不可描述的图片?

论文简述:

大家通识的防滥用手段是在原图片添加肉眼不可见细节(对抗扰动)。但是很多社交媒体会进行JPEG压缩,这导致添加的扰动细节消失。MetaCloak-JPEG通过DiffJPEG和STE打通了JPEG梯度,实现了在压缩后也能防DreamBooth。

正文:

话说打完计算机设计大赛后,主包突然良心发现去找师兄问能不能去给他打点杂活!师兄很爽快跟主包说可以去做视觉的算法!(话说师兄也是心大)

主包一琢磨,我这一辈子唯一一次和CV打交道,恐怕是高中时,因为渣机给MC的光影包调过参数。。。

于是主包决定开一个专栏来记录主包的屑CV之路,后面也是会继续写这个专栏好吧

OK啊,今天主包找的论文也是非常之新啊,是4月20号出来的,名字也是十分之长,arxiv链接给到文章底部了

论文解决的问题

DreamBooth(DB,以下简称大宝) 是谷歌在2022年弄的一种扩散模型的微调方法。是专门拿来做个性化文生图的。简单来说,只要拿一组一个人的照片,再加几句描述,就能生成这个人的♂任♂意♂姿♂势♂的照片

这个也太可怕了,那么有没有什么能防止主包的帅照被拿去滥用呢?

一般来说,可以在照片中添加一些 微小的扰动(对抗扰动,Adversarial Perturbation),在人眼看不出区别的前提下,让大宝学不到任何特征。幸运的是,这个方法已经很成熟了

这种方法主要是看的 梯度,就是看改哪里,结果反应最大,就改哪里

然鹅,这个方法在实战应用时就是个屑,因为它压根就忽略了一个事实:坏人拿到的很多时候不是你的原照片!

原来很多社交媒体有一个很坑爹的地方:原始图片一般都很大,传输很慢,所以社交媒体一般要用JPEG压缩一下才会呈现这张图片

JPEG压缩有个工序叫 round(),这货干的就是四舍五入的活,把那些人眼不咋注意的部分直接给压缩掉。这下可好了,好不容易添加的干扰这下被压缩掉了!

这导致前面辛辛苦苦算的梯度,这下全被 round()给拦下来了,传不过去

这篇论文做的就是,让主包的帅照能够经历了压缩依旧让大宝学不到有用的特征

实现方法

让我们痛定思痛,再来观察下这个 round(),因为它本质上干的是四舍五入的活,所以它导致处处都是毛刺,导数为0,聪明的学过导数的你知道,此时自然也不能微分了,也就没有了梯度

论文提出了一个名为DiffJPEG的层:

  1. RGB → YCbCr (走流程,不重要)
  2. 每个像素减 128 (不重要)
  3. 切成 8×8 块 → DCT 变换 (不重要)
    4. STE量化 (非常重要)
  4. 逆 DCT、加回 128、转回 RGB (不重要)

STE(Straight-Through Estimator,直通估计器) 它主要只做一件事情:前向传播(压缩)时用和社交平台一毛一样的 round()进行压缩;后向传播(算梯度)的时候再直接假装 round()什么都没干

在一开始,我们有主包的帅照一张 photo.jpg

然后我们会生成一张保护加锁照片 protected_photo.jpg,在一开始,它就是原图

接下来我们会不断循环(200轮)如下操作(所谓的PGD算法):

  1. protected_photo.jpg 送到DiffJPEG里面
  2. DiffJPEG输出了压缩后的照片zip_photo.jpg
  3. 计算这张照片损失(就是评价下这个保护做的好不好,损失的越多,就越棒)
  4. 根据损失反向传梯度
  5. 走到了原来的STE和round那一步,梯度穿过去,不做阻拦
  6. 梯度回到了protected_photo.jpg
  7. 按照梯度计算哪里最能破坏AI学习又不影响观感(用了ℓ∞ 约束),微操修改图片

这使得梯度穿过了压缩!现在最头痛的部分已经解决掉了!这样一套下来,AI就学会了:不一定是在最高频的地方加修改,而是去那些不会被压缩删掉,梯度又不赖的部分加修改

每轮走完后还要来实战练习,也就是双层元学习,所谓双层元学习,也就是把protected_photo.jpg真的拿给大宝去学习(内层),看看它能不能学到东西(外层)

由于这个每轮都要做,大宝很吃显存,为了节约显存,作者采用了只更新交叉注意力层的方法,成功把这一步的显存压下去了,总显存压到了4.1GB

为了让结果更鲁棒(鬼知道社交平台的JPEG算法长什么样),论文还设计了一个变换的组合:

  1. 40%:只做 DiffJPEG
  2. 30%:先 JPEG,再翻转 / 模糊 / 裁剪
  3. 15%:先翻转,再 JPEG
  4. 10%:只做空间变换
  5. 5%:啥也不做

到目前为止,这个算法已经很复杂了,又是DiffJPEG又是这么多古怪的组合,如果上来就弄很高的压缩率,模型很容易学废(想象刚学会电脑开机就去手搓红黑树平衡树)

所以论文设计了一个课程:一开始训练时,只有95%的压缩率,几乎没压缩,然后一点一点加码,最后加到50%。这使得模型的训练就很稳定了

成效

以前都是丢失60-80%保护,本文直接把存活率拉到了91.3%,PSNR=32.7dB,肉眼看不出区别,9种JPEG指标全战胜了前SOTA(PhotoGuard),还特别省显存,只要4.1G

码字不易,希望能点个赞!

原论文链接(不要在意主包的屑格式):

T. R. Fardin, S. M. Z. Alam, M. H. Fahim, and M. F. Mahfuz, “MetaCloak-JPEG: JPEG-robust adversarial perturbation for preventing unauthorized DreamBooth-based deepfake generation,” arXiv preprint arXiv:2604.18537, Apr. 2026.
https://arxiv.org/abs/2604.18537

http://www.jsqmd.com/news/678840/

相关文章:

  • 德州扑克GTO求解器Desktop Postflop:如何用开源工具提升你的扑克决策水平
  • 如何实现Adobe Illustrator到Photoshop的无缝矢量转换?Ai2Psd脚本全解析
  • DeepSeek系列大模型技术全解析:从V3到R1再到Coder V2的深度技术演进
  • 告别官方库!手把手教你为ESP32移植STM32的ST7735驱动(附完整代码)
  • 上海研倍新材:深耕铝合金3D打印全链条,赋能高端制造轻量化未来 - 品牌企业推荐师(官方)
  • FastLED LED动画库高效实战指南:专业级微控制器灯光控制方案
  • 告别.bat文件!用更稳定的环境变量法配置Abaqus2019子程序开发环境(VS2019+Intel Fortran)
  • 用argparse给你的Python脚本加个‘说明书’:让小白用户也能轻松上手
  • 影刀RPA多平台铺货实战:上架前的数据准备如何通过AI实现全自动化?
  • 从项目复盘看Jetson Xavier NX:我们踩过的散热、内存和缺货这些坑,以及应对方案
  • 用C++模拟操作系统:手把手教你实现四种进程调度算法(附完整可运行代码)
  • 【Docker跨架构构建终极指南】:20年DevOps专家亲授ARM/AMD64/Apple Silicon一键多平台镜像构建实战
  • 高校大学生论文查重工具全面测评
  • 终极指南:如何用EverythingToolbar实现Windows文件搜索效率翻倍 [特殊字符]
  • 从仿真波形到硬件现象:手把手教你用Vivado验证Verilog流水灯设计
  • 如何解锁消费者级NVIDIA GPU的vGPU功能:完整实战指南
  • 树莓派Zero 2 W打造超低功耗家庭媒体服务器实战
  • 鸿蒙 Electron 跨平台应用开发:文字战斗系统与英雄系统进阶开发详解——自定义英雄参战
  • 【2026年唯一被.NET Foundation认证的AI加速框架】:从零构建支持MoE动态路由的C#推理引擎——仅需23行代码接入Qwen3-4B
  • 如何从iTunes备份中完整导出微信聊天记录:WeChatExporter终极指南
  • 【2026年最新600套毕设项目分享】微信小程序的智慧乡村旅游服务平台(30124)
  • Debian 11上Qt程序中文输入失效?手把手教你编译fcitx5-qt插件(Qt6/Qt5通用)
  • 保姆级教程:在Ubuntu 22.04上配置和使用软件看门狗softdog(附C语言喂狗代码)
  • 保姆级教程:用宝塔面板+EMQX Cloud,零服务器搭建物联网数据中台(MQTT到MySQL)
  • 开箱即用!ComfyUI Qwen人脸生成图像,无需代码一键生成
  • 别再纠结了!Ext4还是Btrfs?我根据你的实际使用场景帮你选(附2024年主流发行版默认文件系统分析)
  • Docker跨架构构建避坑清单:97%开发者忽略的QEMU陷阱、BuildKit配置与交叉编译验证(附CI/CD黄金配置模板)
  • 5分钟搞定B站视频转文字:免费开源神器bili2text终极指南
  • 暗黑破坏神2存档编辑器:5分钟掌握可视化修改D2/D2R游戏角色的完整指南
  • Git状态‘卡住’了怎么办?从‘Already up-to-date’到实战修复,保姆级清理暂存区指南