当前位置：首页 > news >正文

当 AI 学会欺诈：用 Python 训练一个对抗生成网络 (GAN)，自动生成绕过人脸识别的“假照片”

news 2026/3/27 2:02:43

😈 前言：AI 界的“猫鼠游戏”

传统的“造假”需要人类专家用 PS 一点点修图。而 GAN 不需要。
GAN 的核心思想是两个神经网络互相对抗：

生成器 (Generator, G)：负责造假。它的目标是生成让判别器分不清真假的照片。
判别器 (Discriminator, D)：负责打假。它的目标是练就火眼金睛，精准识别真图和假图。

它俩就像警察和造假钞的罪犯。随着训练的进行，警察鉴别能力越来越强，罪犯的造假技术也被迫越来越精湛，直到最后生成的假钞足以乱真。

🏗️ 一、架构设计：GAN 的左右互搏

我们使用最经典的DCGAN (深度卷积 GAN)架构。它利用卷积神经网络 (CNN) 来处理图像，生成的照片比纯全连接层的 GAN 清晰得多。

系统对抗流程图 (Mermaid):

🛠️ 二、环境与数据准备

我们使用PyTorch框架，数据集采用经典的CelebA(名人人脸数据集)，包含 20 万张照片。

安装依赖：

pipinstalltorch torchvision matplotlib numpy

下载数据集：PyTorch 可以自动下载。

💻 三、代码实战：定义 G 和 D

1. 判别器 (Discriminator)： AI 警察

它本质上是一个二分类 CNN。输入一张图片，输出一个 0 到 1 之间的概率（越接近 1 越真）。

importtorch.nnasnnclassDiscriminator(nn.Module):def__init__(self,channels_img,features_d):super(Discriminator,self).__init__()self.disc=nn.Sequential(# 输入: N x channels_img x 64 x 64nn.Conv2d(channels_img,features_d,kernel_size=4,stride=2,padding=1),nn.LeakyReLU(0.2),# Block 1: N x features_d x 32 x 32self._block(features_d,features_d*2,4,2,1),# Block 2: N x (features_d*2) x 16 x 16self._block(features_d*2,features_d*4,4,2,1),# Block 3: N x (features_d*4) x 8 x 8self._block(features_d*4,features_d*8,4,2,1),# 最终输出层，压缩成一个标量nn.Conv2d(features_d*8,1,kernel_size=4,stride=2,padding=0),nn.Sigmoid(),)def_block(self,in_channels,out_channels,kernel_size,stride,padding):returnnn.Sequential(nn.Conv2d(in_channels,out_channels,kernel_size,stride,padding,bias=False),nn.BatchNorm2d(out_channels),nn.LeakyReLU(0.2),)defforward(self,x):returnself.disc(x)

2. 生成器 (Generator)： AI 造假者

它是一个“反向的 CNN”（转置卷积）。输入是一串随机噪声，它需要把噪声逐渐放大、填充细节，最终变成一张 64x64 的人脸图片。

classGenerator(nn.Module):def__init__(self,channels_noise,channels_img,features_g):super(Generator,self).__init__()self.net=nn.Sequential(# 输入: N x channels_noise x 1 x 1self._block(channels_noise,features_g*16,4,1,0),# img: 4x4self._block(features_g*16,features_g*8,4,2,1),# img: 8x8self._block(features_g*8,features_g*4,4,2,1),# img: 16x16self._block(features_g*4,features_g*2,4,2,1),# img: 32x32# 最终层输出图像nn.ConvTranspose2d(features_g*2,channels_img,kernel_size=4,stride=2,padding=1),nn.Tanh(),# 输出范围 [-1, 1])def_block(self,in_channels,out_channels,kernel_size,stride,padding):returnnn.Sequential(nn.ConvTranspose2d(in_channels,out_channels,kernel_size,stride,padding,bias=False),nn.BatchNorm2d(out_channels),nn.ReLU(),)defforward(self,x):returnself.net(x)

3. 训练循环 (The Game Begins)

这是最关键的一步。每一轮训练，我们要分别更新 D 和 G 的权重。

# ... (初始化模型、优化器、数据加载器代码省略) ...# 使用二元交叉熵损失函数criterion=nn.BCELoss()forepochinrange(num_epochs):forbatch_idx,(real_img,_)inenumerate(dataloader):real_img=real_img.to(device)batch_size=real_img.shape[0]### 1. 训练判别器 D (让它更火眼金睛) ###noise=torch.randn(batch_size,z_dim,1,1).to(device)fake_img=gen(noise)# 判别真图，希望输出全为 1disc_real=disc(real_img).reshape(-1)loss_d_real=criterion(disc_real,torch.ones_like(disc_real))# 判别假图，希望输出全为 0disc_fake=disc(fake_img.detach()).reshape(-1)loss_d_fake=criterion(disc_fake,torch.zeros_like(disc_fake))# D 的总损失loss_d=(loss_d_real+loss_d_fake)/2disc.zero_grad()loss_d.backward()opt_d.step()### 2. 训练生成器 G (让它骗过 D) #### 这里的 fake_img 是上面生成的，不 detach，以便梯度回传给 Goutput=disc(fake_img).reshape(-1)# G 的目标是让 D 把假图判断为 1loss_g=criterion(output,torch.ones_like(output))gen.zero_grad()loss_g.backward()opt_g.step()# 打印进度...ifbatch_idx%100==0:print(f"Epoch [{epoch}/{num_epochs}] Loss D:{loss_d:.4f}, loss G:{loss_g:.4f}")# (这里可以保存生成的假照片看看效果)