当前位置：首页 > news >正文

Face Analysis WebUI实战教程：结合Pillow实现检测结果图自动裁剪保存

news 2026/6/24 19:34:16

Face Analysis WebUI实战教程：结合Pillow实现检测结果图自动裁剪保存

你是不是也遇到过这样的烦恼？用Face Analysis WebUI分析了一堆照片，得到了带有人脸框和关键点的结果图，但每次想单独保存某个人脸时，都得手动截图，既麻烦又容易出错。

今天，我就来分享一个超实用的技巧：如何结合Python的Pillow库，让Face Analysis WebUI自动裁剪并保存检测到的每一张人脸。这个功能特别适合需要批量处理证件照、制作头像集，或者从合影中提取单人脸的场景。

学完这篇教程，你将掌握：

理解Face Analysis WebUI的核心输出：知道它检测到了什么，数据在哪里。
使用Pillow库进行图像处理：学会如何根据坐标精准裁剪图片。
实现自动化裁剪保存逻辑：将检测结果与图像处理无缝结合，一键保存所有人脸。

教程会从修改代码开始，手把手带你实现这个功能，并提供完整的代码示例。即使你之前没怎么接触过图像处理，也能轻松跟上。

1. 环境准备与项目理解

在开始动手之前，我们先快速回顾一下Face Analysis WebUI项目，并确保你的环境已经就绪。

1.1 项目快速回顾

Face Analysis WebUI是一个基于Gradio构建的Web应用，核心是InsightFace这个强大的人脸分析模型。你上传一张图片，它就能告诉你：

人脸在哪里：用矩形框（Bounding Box）标出来。
人脸特征点：106个2D点或68个3D点，标出眼睛、鼻子、嘴巴的位置。
这个人是谁：进行人脸识别（如果提供了对比库）。
这个人的属性：预测年龄、性别，甚至分析头部的朝向（偏航、俯仰、翻滚角）。

它的输出主要分为两部分：

可视化结果图：一张在原图上画好了框、点和标注的新图片。
结构化数据：一个包含每个人脸位置、关键点坐标、属性信息的列表。我们自动化裁剪功能，关键就是要拿到这个“人脸位置”数据。

1.2 检查与安装Pillow

我们的裁剪功能将依赖Pillow库（Python Imaging Library，PIL的友好分支）。Face Analysis WebUI的基础环境通常已经包含了它，但我们最好确认一下。

打开你的终端，进入项目目录（例如/root/build），然后激活项目所用的Python环境（如果你使用了conda或virtualenv）。接着运行以下命令检查：

python -c "import PIL; print(f'Pillow版本: {PIL.__version__}')"

如果成功输出版本号（如9.5.0），说明Pillow已安装。如果提示ModuleNotFoundError，则需要安装：

pip install Pillow

准备工作完成！接下来，我们进入核心环节：修改代码，获取数据并实现裁剪。

2. 核心代码修改：获取人脸坐标并裁剪

我们要修改的主要是app.py文件。我们的目标是：在WebUI完成人脸分析后，除了显示结果，还能自动将检测到的每张人脸单独裁剪保存下来。

2.1 定位并修改分析函数

首先，用你喜欢的文本编辑器（如vim,nano或VS Code）打开/root/build/app.py文件。

找到处理图片上传和分析的核心函数。这个函数通常被gr.Interface或gr.Blocks装饰，负责接收上传的图片和用户选项，然后返回分析结果图和信息。函数名可能类似于analyze_image,process_image或inference。

找到这个函数后，我们需要在它的内部，在生成最终结果图之后、返回数据之前，插入我们的裁剪保存逻辑。

2.2 编写裁剪保存功能代码

假设我们找到的函数结构如下（你的实际代码可能略有不同，但逻辑相通）：

def analyze_image(input_image, show_landmarks=True, show_bbox=True, show_age_gender=True): """ 核心分析函数 Args: input_image: 上传的图片（PIL Image或numpy array） ... 其他选项参数 Returns: result_image: 标注后的结果图 info_text: 显示的信息文本 """ # ... [原有的代码：加载模型、推理、绘制结果图等] ... # 假设经过一系列处理，我们得到了： # 1. `faces`: 一个列表，包含所有检测到的人脸信息（每个元素有`bbox`等属性） # 2. `result_image`: 已经画好框和点的PIL Image对象或numpy数组 # 3. `img_cv` 或 `original_image`: 原始图片数据（用于裁剪） # ====== 我们新增的裁剪保存逻辑从这里开始 ====== import os from PIL import Image import numpy as np # 1. 准备保存目录 save_dir = "./cropped_faces" os.makedirs(save_dir, exist_ok=True) # 如果目录不存在就创建 # 2. 确保我们有一个PIL格式的原始图片用于裁剪 # 如果 original_image 是numpy数组（OpenCV格式），需要转换 if isinstance(original_image, np.ndarray): # OpenCV 使用 BGR，PIL 使用 RGB，需要转换 original_image_pil = Image.fromarray(cv2.cvtColor(original_image, cv2.COLOR_BGR2RGB)) else: # 如果已经是PIL Image，直接使用 original_image_pil = original_image # 3. 遍历每一张检测到的人脸进行裁剪和保存 cropped_paths = [] # 用来记录保存的文件路径，方便后续显示或返回 for i, face in enumerate(faces): # 获取人脸框坐标，格式通常是 [x1, y1, x2, y2] 或 [x1, y1, w, h] bbox = face.bbox.astype(int) # 转换为整数 # 处理不同的bbox格式 if len(bbox) == 4: # 假设是 [x1, y1, x2, y2] x1, y1, x2, y2 = bbox # 可选：给裁剪框加一点边距，避免太紧 margin = 5 x1 = max(0, x1 - margin) y1 = max(0, y1 - margin) x2 = min(original_image_pil.width, x2 + margin) y2 = min(original_image_pil.height, y2 + margin) else: # 如果是其他格式，可能需要调整，这里先跳过或打印日志 print(f"人脸 {i} 的bbox格式异常: {bbox}") continue # 4. 使用Pillow的crop方法进行裁剪 # crop参数是 (left, upper, right, lower) face_crop = original_image_pil.crop((x1, y1, x2, y2)) # 5. 生成文件名并保存 # 文件名可以包含索引、坐标等信息 timestamp = int(time.time()*1000) # 获取时间戳避免重名 filename = f"face_{i+1}_{timestamp}.jpg" save_path = os.path.join(save_dir, filename) face_crop.save(save_path, quality=95) # 保存为JPEG，质量95% cropped_paths.append(save_path) print(f"已保存人脸 {i+1} 到: {save_path}") # 可选：将裁剪文件的路径信息添加到返回结果中 # 例如，可以修改info_text，或者通过一个额外的输出组件返回 crop_info = f"\n\n✅ 已自动裁剪并保存了 {len(faces)} 张人脸图片到 '{save_dir}' 目录。" # 假设原函数返回 (result_image, info_text) info_text += crop_info # ====== 新增逻辑到此结束 ====== # ... [函数原有的返回语句] ... return result_image, info_text

代码要点解析：

导入与目录：确保导入了os和PIL.Image。创建了一个cropped_faces目录来存放裁剪后的人脸图。
格式统一：原始图片在流程中可能是PIL Image或OpenCV的numpy数组。PIL.Image.fromarray和cv2.cvtColor用于确保我们拿到一个RGB格式的PIL对象，这是crop方法需要的。
坐标处理：从人脸信息(face)中提取边界框(bbox)。我们假设它是[x1, y1, x2, y2]格式（左上角和右下角坐标）。添加一个小的margin（边距）可以让裁剪出来的人脸更舒适。
核心裁剪：original_image_pil.crop((x1, y1, x2, y2))是Pillow裁剪图片的核心方法，非常简单。
保存与记录：使用时间戳生成唯一文件名，用save方法保存图片。同时记录下保存路径。

2.3 适配你的实际代码

上面的代码是一个通用模板。你需要根据app.py的实际代码进行微调：

找到faces和original_image：在原有代码中，找到存储人脸检测结果的变量（可能叫faces,det_faces等）和原始图像数据的变量（可能叫img,image,orig_img等）。
确认bbox格式：打印一下face.bbox或类似属性的值，看看它的格式是[x1,y1,x2,y2]还是[x,y,w,h]（中心点坐标和宽高），并相应调整裁剪坐标的计算。
整合返回信息：决定如何告知用户裁剪已完成。最简单的方式是追加信息到info_text中。你也可以考虑在Gradio界面增加一个文件输出组件，但修改起来更复杂。

3. 功能测试与效果验证

代码修改完成后，让我们来测试一下。

3.1 重启WebUI服务

保存app.py文件后，需要重启Gradio服务以使修改生效。

如果你之前是用脚本启动的：

# 如果原进程在运行，先按 Ctrl+C 停止 bash /root/build/start.sh

或者直接运行：

/opt/miniconda3/envs/torch27/bin/python /root/build/app.py

3.2 上传图片并查看结果

打开浏览器，访问http://localhost:7860。
上传一张包含人脸的图片（单人或多人都可以）。
选择你需要的分析选项，点击“开始分析”。

分析完成后，除了看到标注好的结果图和人脸属性卡片，请特别注意信息输出区域（通常是文本框）。你应该能看到类似这样的提示：

✅ 已自动裁剪并保存了 3 张人脸图片到 './cropped_faces' 目录。

3.3 查看裁剪结果

回到服务器的终端，进入项目目录，列出cropped_faces文件夹的内容：

ls -la ./cropped_faces/

你应该能看到类似face_1_1645678901234.jpg、face_2_1645678901235.jpg的文件。

你可以用图像查看器打开它们，或者直接使用命令行工具（如果服务器支持）快速预览。每个文件都应该是从原图中精准裁剪出来的单张人脸。

恭喜！至此，自动裁剪保存的核心功能已经实现。

4. 进阶优化与实用技巧

基础功能跑通后，我们可以让它变得更强大、更好用。

4.1 按人脸属性分类保存

比如，你想把男性和女性的人脸自动保存到不同的文件夹。

# 在裁剪保存的循环内部，获取性别属性 # 假设 face 对象有 gender 属性，0表示女，1表示男，或者直接是字符串 gender = getattr(face, 'gender', 'unknown') if gender == 1 or gender == 'Male': gender_dir = 'male' elif gender == 0 or gender == 'Female': gender_dir = 'female' else: gender_dir = 'unknown' # 创建性别子目录 gender_save_dir = os.path.join(save_dir, gender_dir) os.makedirs(gender_save_dir, exist_ok=True) # 保存路径也相应改变 save_path = os.path.join(gender_save_dir, filename)

4.2 保存带标注的裁剪图

有时你可能想保存裁剪后的人脸，但保留关键点或年龄性别标签。这需要在裁剪前，在result_image（即画好标注的图）的对应区域进行裁剪，而不是在原始图上。

# 假设 result_image 是PIL Image # 注意：此时裁剪的坐标是基于已经画了标注的图，与原始图坐标一致 annotated_face_crop = result_image.crop((x1, y1, x2, y2)) annotated_face_crop.save(os.path.join(save_dir, f"annotated_face_{i}.jpg"))

4.3 在WebUI中直接下载裁剪结果

更优雅的方式是让Gradio直接提供裁剪后文件的下载链接。这需要修改函数，使其返回一个额外的gr.File组件对应的值（通常是文件路径列表）。

首先，在Gradio界面定义中添加一个gr.File组件用于输出。然后修改函数，使其返回裁剪文件的路径列表。Gradio会自动将这些路径打包成ZIP供用户下载。这需要对app.py的界面构建部分有更深的理解，这里不展开，但思路是：将cropped_paths列表作为函数的第三个返回值。

4.4 处理常见问题

裁剪框超出图片边界：我们在代码中已经用max(0, ...)和min(width, ...)做了保护。
图片保存格式：face_crop.save(save_path)会根据文件后缀自动选择格式。.jpg是有损压缩但文件小，.png是无损压缩但文件大。你可以根据需求选择。
性能考虑：如果处理大量高清图片，裁剪和保存可能成为瓶颈。可以考虑异步处理，或者先完成Web响应，再在后台进行保存操作。