当前位置：首页 > news >正文

使用Ubuntu20.04搭建Qwen-Image-Edit-F2P开发环境

news 2026/6/30 0:52:40

使用Ubuntu20.04搭建Qwen-Image-Edit-F2P开发环境

1. 环境准备与系统配置

在开始搭建Qwen-Image-Edit-F2P开发环境之前，我们先来了解一下这个工具能做什么。简单来说，这是一个基于人脸图像生成全身照片的AI模型，你只需要提供一张人脸照片，它就能生成各种风格和场景的全身图像，比如让同一个人穿上不同服装、站在不同背景中。

首先确保你的Ubuntu20.04系统已经更新到最新状态。打开终端，执行以下命令：

sudo apt update sudo apt upgrade -y

接下来安装一些基础依赖包：

sudo apt install -y python3-pip python3-venv git wget curl build-essential libssl-dev libffi-dev python3-dev

2. 安装Python环境与必要依赖

Qwen-Image-Edit-F2P需要Python 3.8或更高版本。Ubuntu20.04默认自带Python 3.8，所以我们直接创建虚拟环境：

python3 -m venv qwen_env source qwen_env/bin/activate

激活虚拟环境后，安装PyTorch和相关依赖。根据你的显卡情况选择安装命令：

对于CUDA 11.7的用户：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

对于只有CPU的用户：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu

然后安装其他必要的Python包：

pip install transformers diffusers accelerate safetensors pillow opencv-python insightface

3. 下载模型文件与代码库

现在我们来获取Qwen-Image-Edit-F2P的模型文件和代码：

git clone https://github.com/modelscope/DiffSynth-Studio.git cd DiffSynth-Studio pip install -e .

下载预训练模型文件：

from modelscope import snapshot_download snapshot_download("DiffSynth-Studio/Qwen-Image-Edit-F2P", local_dir="models/Qwen-Image-Edit-F2P")

这个过程可能会花费一些时间，因为模型文件比较大，大概有几个GB。如果你的网络连接不太稳定，可以考虑使用下载工具或者选择网络较好的时间段进行下载。

4. 配置人脸检测组件

Qwen-Image-Edit-F2P需要用到人脸检测功能来处理输入图像。我们需要安装和配置InsightFace：

pip install insightface

安装完成后，还需要下载人脸检测模型。首次运行时会自动下载，但如果网络有问题，可以手动下载：

from insightface.app import FaceAnalysis app = FaceAnalysis(name='antelopev2') app.prepare(ctx_id=0)

5. 测试环境是否正常工作

让我们写一个简单的测试脚本来验证环境是否配置正确：

# test_environment.py import torch from PIL import Image import sys print("Python版本:", sys.version) print("PyTorch版本:", torch.__version__) print("CUDA是否可用:", torch.cuda.is_available()) if torch.cuda.is_available(): print("GPU型号:", torch.cuda.get_device_name(0)) # 测试基本图像处理功能 try: img = Image.new('RGB', (100, 100), color='red') img.save('test_image.png') print("图像处理功能正常") except Exception as e: print("图像处理测试失败:", e)

运行测试脚本：

python test_environment.py

如果一切正常，你应该看到相关的版本信息和测试结果。

6. 常见问题与解决方案

在安装过程中可能会遇到一些问题，这里列举几个常见的：

问题1：CUDA版本不匹配如果遇到CUDA相关错误，可以先检查你的CUDA版本：

nvcc --version

确保安装的PyTorch版本与你的CUDA版本兼容。

问题2：内存不足模型需要较大的内存，如果遇到内存错误，可以尝试：

# 减少批量大小 export PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:128

问题3：依赖冲突如果遇到包冲突，可以尝试重新创建虚拟环境：

deactivate rm -rf qwen_env python3 -m venv qwen_env source qwen_env/bin/activate # 然后重新安装依赖

7. 运行第一个示例

现在让我们运行一个简单的示例来测试整个流程：

# first_example.py from diffsynth.pipelines.qwen_image import QwenImagePipeline, ModelConfig import torch from PIL import Image # 初始化管道 pipe = QwenImagePipeline.from_pretrained( torch_dtype=torch.bfloat16, device="cuda" if torch.cuda.is_available() else "cpu", model_configs=[ ModelConfig(model_id="Qwen/Qwen-Image-Edit"), ModelConfig(model_id="Qwen/Qwen-Image"), ] ) # 加载LoRA权重 pipe.load_lora(pipe.dit, "models/Qwen-Image-Edit-F2P/model.safetensors") # 准备输入图像和提示词 face_image = Image.new('RGB', (256, 256), color='red') # 替换为实际人脸图像 prompt = "摄影。一个年轻女性穿着黄色连衣裙，站在花田中。" # 生成图像 result = pipe(prompt, edit_image=face_image, seed=42, num_inference_steps=20) result.save("first_result.jpg") print("图像生成完成！保存为 first_result.jpg")