当前位置：首页 > news >正文

PhotoMaker终极指南：快速定制真实人像的AI神器

news 2026/8/3 3:30:01

PhotoMaker终极指南：快速定制真实人像的AI神器

【免费下载链接】PhotoMakerPhotoMaker [CVPR 2024]项目地址: https://gitcode.com/gh_mirrors/ph/PhotoMaker

PhotoMaker是一款基于CVPR 2024技术的AI绘图工具，能在几秒钟内快速定制真实人像，无需额外LoRA训练，即可实现令人印象深刻的身份保真度、多样性、文本可控性和高质量生成效果。

✨ 为什么选择PhotoMaker？

PhotoMaker作为一款强大的AI人像定制工具，具有三大核心优势：

1. 秒级定制，无需训练

传统的AI人像定制往往需要复杂的模型训练过程，而PhotoMaker采用创新的Stacked ID Embedding技术，只需上传几张参考照片，即可在几秒钟内生成个性化的人像，大大降低了使用门槛。

2. 高保真度与多样性并存

PhotoMaker能够精准捕捉人物的面部特征，确保生成的人像与参考照片高度相似，同时还能根据文本提示生成不同风格、不同场景下的多样化人像。

使用PhotoMaker生成的高保真度人像，alt文本：PhotoMaker AI生成真实人像示例

3. 灵活适配，扩展性强

PhotoMaker可以作为适配器与其他基础模型以及社区中的LoRA模块协作，为用户提供更多的创作可能性。无论是现实主义风格还是艺术化风格，都能轻松驾驭。

🚀 快速开始：安装与配置

环境要求

Python >= 3.8
PyTorch >= 2.0.0

一键安装步骤

克隆仓库

git clone https://gitcode.com/gh_mirrors/ph/PhotoMaker cd PhotoMaker

创建并激活虚拟环境

conda create --name photomaker python=3.10 conda activate photomaker

安装依赖

pip install -U pip pip install -r requirements.txt pip install git+https://github.com/TencentARC/PhotoMaker.git

📸 使用教程：从入门到精通

基本使用方法

1. 导入必要的库

import torch import os from diffusers.utils import load_image from diffusers import EulerDiscreteScheduler from photomaker import PhotoMakerStableDiffusionXLPipeline

2. 加载基础模型和PhotoMaker适配器

# 加载基础模型 pipe = PhotoMakerStableDiffusionXLPipeline.from_pretrained( base_model_path, # 可以更改为任何基于SDXL的基础模型 torch_dtype=torch.bfloat16, use_safetensors=True, variant="fp16" ).to(device) # 加载PhotoMaker检查点 pipe.load_photomaker_adapter( os.path.dirname(photomaker_path), subfolder="", weight_name=os.path.basename(photomaker_path), trigger_word="img" # 定义触发词 )

3. 准备输入的身份图片

# 定义输入的身份图片 input_folder_name = './examples/newton_man' image_basename_list = os.listdir(input_folder_name) image_path_list = sorted([os.path.join(input_folder_name, basename) for basename in image_basename_list]) input_id_images = [] for image_path in image_path_list: input_id_images.append(load_image(image_path))

用于生成的输入身份图片，alt文本：PhotoMaker输入身份图片示例

4. 生成个性化人像

# 注意：触发词`img`必须跟在类别词后面以实现个性化 prompt = "a half-body portrait of a man img wearing the sunglasses in Iron man suit, best quality" negative_prompt = "(asymmetry, worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), open mouth, grayscale" generator = torch.Generator(device=device).manual_seed(42) images = pipe( prompt=prompt, input_id_images=input_id_images, negative_prompt=negative_prompt, num_images_per_prompt=1, num_inference_steps=num_steps, start_merge_step=10, generator=generator, ).images[0] gen_images.save('out_photomaker.png')