当前位置：首页 > news >正文

JoyAI-Image-Edit-Plus核心功能解析：1-6张参考图+文本指令，轻松实现创意融合

news 2026/7/4 22:32:34

【免费下载链接】JoyAI-Image-Edit-Plus-ComfyUI项目地址: https://ai.gitcode.com/jd-opensource/JoyAI-Image-Edit-Plus-ComfyUI

想要在AI图像编辑中实现多图融合的创意效果吗？🎨 JoyAI-Image-Edit-Plus为您带来了革命性的多图像指令引导编辑体验！这款强大的AI图像编辑工具支持1-6张参考图结合文本指令，让您轻松实现创意融合，释放无限想象力。

JoyAI-Image-Edit-Plus是JD.com开发的多图像指令引导编辑模型，属于JoyAI-Image系列的重要成员。与传统的单图编辑工具不同，它能够同时处理最多6张参考图像，根据您的文本指令智能地融合多图元素，创造出全新的视觉作品。

这款模型专为ComfyUI平台优化，提供原生支持，无需额外自定义节点即可使用。无论是专业设计师还是AI艺术爱好者，都能快速上手，享受多图融合的创作乐趣！

JoyAI-Image-Edit-Plus最强大的功能就是支持1-6张参考图像的融合编辑。您可以将不同场景、不同元素的图片组合在一起，通过简单的文本指令指导AI进行智能融合。

只需输入简单的文本描述，如"将第一张图的人物放在第二张图的风景中"，模型就能理解您的创作意图，生成符合要求的融合图像。这种直观的交互方式大大降低了创作门槛。

模型采用1024-base buckets自动调整机制，能够智能处理不同分辨率的参考图像，确保输出质量稳定。无论参考图尺寸如何，都能获得优质的融合效果。

模型权重文件已针对ComfyUI进行优化，包含三个核心组件：

JoyAI-Image-Edit-Plus采用40层DiT（Diffusion Transformer）架构，具有4096的隐藏层大小和32个注意力头。每个参考图像都会独立进行分块处理，并通过3D RoPE（旋转位置编码）在序列维度上连接，支持不同分辨率的参考图像。

模型使用Qwen3VLForConditionalGeneration作为文本编码器，能够深度理解您的编辑指令。每个参考图像都会通过特殊的视觉标记块进行处理，确保指令与图像的精准对应。

采用AutoencoderKLWan变分自编码器，具有16维潜在空间和8倍空间下采样、4倍时间下采样能力，与单图编辑模型使用相同的VAE架构，保证了处理效率和质量。

克隆ComfyUI分支：

git clone -b joyimage-edit-pr https://github.com/feice-huang/ComfyUI.git cd ComfyUI pip install -r requirements.txt

下载模型权重：

hf download jdopensource/JoyAI-Image-Edit-Plus-ComfyUI \ --local-dir /path/to/ComfyUI/models

在ComfyUI中构建多图编辑工作流非常简单：

加载扩散模型：使用UNETLoader加载diffusion_models/joy_image_edit_plus_bf16.safetensors
加载CLIP编码器：使用CLIPLoader加载text_encoders/qwen3vl_joyimage_bf16.safetensors，类型选择joyimage
加载VAE：使用VAELoader加载vae/joy_image_edit_vae.safetensors
加载参考图像：为每张参考图使用LoadImage节点（1-6张）
文本编码：使用TextEncodeJoyImageEditPlus节点处理指令和参考图像
采样和解码：通过KSampler和VAEDecode生成最终图像

为了获得最佳效果，建议使用以下参数配置：