当前位置: 首页 > news >正文

ADM云GPU私有化部署Z-Image模型+ComfyUI远程访问

​ 上次我们介绍了在云切片上私有部署 LTC-Video 开源大模型的方法,很多朋友说不能用 ComfyUI,也不能远程访问。其实用点小技巧是可以的,不仅可以用 ComfyUI,也可以通过 API 远程访问云切片上的大模型。这次我们就用开源 Z-Image 大模型来演示一下如何用。(获取免费算力的推广链接:https://marketing.csdn.net/questions/Q2604140858304426315?utm_source=zhengwen&spm=1000.2115.3001.5952)

1 云切片上的部署

1.1 comfy 服务

​ 环境变量和 diffusers、hf、modelscope 软件的安装可参考上一篇,我们直接开始模型部署。Z-Image 已经是 ComfyUI 支持的模型了,安装 ComfyUI 是可以直接使用的,这给私有部署也带来了一些方便。大模型下载只需要从 Comfy-Org/z_image 下载已经是配好工作流的模型权重文件和 text_encoder 即可,简化了很多本地操作步骤。

​ 首先是安装 ComfyUI,在切片上启动一个终端,通过 git 拉取 ComfyUI:

git clone https://github.com/comfyanonymous/ComfyUI.git

如果遇到证书之类的问题,可使用带 -c http.sslVerify=false 参数的 git 命令。ComfyUI 的代码拉回来之后,不要按照 ComfyUI 中的方法启动 ComfyUI 服务,因为云切片有些特殊,它已经安装好了适配 ROCm 环境的 torch 和相关的软件包,如果按照文档的方法,创建一个独立的 env,在这个 env 中部署相关软件包,很多软件包的安装会失败。怀疑是当前环境的 ROCm 环境版本有关,我也没有仔细研究,反正我的方法就是直接在云切片上部署。云切片有个好处,就是每次 destroy 实例之后,切片都会恢复初始状态,适合折腾,非常 nice。

​ 进入 ComfyUI 目录,直接安装依赖软件包:

cd ComfyUI pip install -r requirements.txt

安装完成后,就可以下载模型文件了,我们选择使用 14B 的基础模型,因为显存够大。在 ComfyUI 上私有部署 Z-Image 大模型,需要三个模型文件:

(1)文本编码器(Text Encoder)
qwen_3_4b.safetensors,大约 8G,部署到 ComfyUI/models/text_encoders/ 目录中,从 modelscope 直接下载到这个目录即可:

modelscope download --model Comfy-Org/z_image split_files/text_encoders/qwen_3_4b.safetensors --local_dir /workspace/ComfyUI/models/text_encoders

(2)扩散模型(Diffusion Model)
z_image_bf16.safetensors,大约 12G,部署到 ComfyUI/models/diffusion_models/ 目录中,同样是直接下载到这个目录:

modelscope download --model Comfy-Org/z_image split_files/diffusion_models/z_image_bf16.safetensors --local_dir /workspace/ComfyUI/models/diffusion_models

(3)VAE 解码器
ae.safetensors,大约 335M,部署到 ComfyUI/models/vae/ 目录中,同样是直接下载:

modelscope download --model Comfy-Org/z_image split_files/vae/ae.safetensors --local_dir /workspace/ComfyUI/models/vae

准备完模型权文件后,剩下的工作就是导入模型工作流定义文件,然后启动 comfy 服务。工作流定义文件可以直接从 git 上取,位置在

https://github.com/Comfy-Org/workflow_templates/blob/main/templates/image_z_image.json

下载后放在 /workspace/ComfyUI/user/default/workflows/ 目录中,第一次运行 comfy 之前,这个目录可能还不存在,所以,必须时手工建立这个目录。最后使用下面的命令启动 comfy 服务:

python main.py --listen 0.0.0.0 --port 8188

因为云切片上查不了 ifconfig,所以就直接用了 0.0.0.0,表示监听所有本地网络上的连接,端口号用的是默认的 8188,这个可以改成其他端口。如果命令执行正常,最后看到打印 “To see the GUI go to: http://0.0.0.0:8188” 就算成功了。

1.2 打通网络

​ 此时再开启一个终端,执行这个命令:

curl http://0.0.0.0:8188

会看到正常的反馈,此时,说明通过 http 访问 comfy 服务是正常的。接下来要做的事情就是打通网络,让普通电脑能访让这个切片上的 comfyUI 服务。能做这个事情的东西很多,比如 Cpola,花生壳,还有 ngrok,我选择 ngrok,因为亲见有人做成过了。安装 ngrok 的方法就是照着别人的方法做就行了,首先用这个命令安装 ngrok:

curl -sSL https://ngrok-agent.s3.amazonaws.com/ngrok.asc \ | sudo tee /etc/apt/trusted.gpg.d/ngrok.asc >/dev/null \ && echo "deb https://ngrok-agent.s3.amazonaws.com buster main" \ | sudo tee /etc/apt/sources.list.d/ngrok.list \ && sudo apt update \ && sudo apt install ngrok

中间会看到一些 W: 开头的警告信息,但是不影响使用。然后就是准备客户端的事情,首先到 ngrok 网站上注册一个账号,直接访问:

https://dashboard.ngrok.com/signup

注册一个免费账号,注册成功后,就可以从这个网站得到一个 Authtoken,记下这个 token,然后在切片上执行这条命令:

ngrok config add-authtoken <你的 token>

然后在切片上打开一个映射端口,我们启动 comfy 用的是默认的 8188 端口,所以这里要指定 8188 端口:

ngrok http 8188

这条命令执行成功,会看到几条转换信息,记住其中最重要的一条:

https://****.ngrok-free.dev -> http://localhost:8188

这是个转换规则。有一点需要注意,免费用户的url 每次重启 ngrok 都会变化,客户端访问也要跟着变化。

2 远程访问大模型

2.1 连接 ComfyUI

​ 本地电脑的浏览器中输入那个 “****.ngrok-free.dev” 转换地址,等待浏览器反应。初次使用,会弹出一个 ngrok 的提示页面,点击“访问网站”确认,就可以访问云切片上的 comfy 服务了。这个过程有点慢,耐心等待,观察云切片中的两个服务主要不报错,最终就会看到一个 ComfyUI 的标准界面:

在这个页面中选择“模板”,在生成类型部分选择图像,在过滤中输入 z-image,此时 Z-Image 就会出现在前排,点击进入生图的界面。在左侧的模型库中能看到服务端已经配置好的模型:

​ 这时候就可以测试一下生图模型了,在“Text to Image” 窗口输入一段提示词:“【主体】北欧神话女神雅典娜,真人写实风格,西式性感着装(例如白色希腊长袍,露肩或单肩设计,带金色腰带),正面站立略微侧转(约3/4角度),身材修长,面容精致冷艳,金色长发微卷,整体占据画面绝大部分区域(约70%)。【背景】极简风格,颜色过渡平缓(如浅灰蓝到米白渐变),无明显纹理或复杂图案,适合叠加文字。【辅助元素】左上区域点缀北欧神话相关元素(如古代如尼文符文、简约的月桂花环或战矛与盾牌轮廓,需保持线条简洁、半透明淡金色)。【整体风格】线条干净利落,光影柔和,高饱和度但色调统一,商业插画感,强调画面留白以兼容文字排版。【画质】高细节,写实摄影质感。”

​ 点击右上角的蓝色“运行”按钮,等待一会儿就会看到生成的图像了。这个过程根据网络情况,可能会比较慢,此时可以看看切片上的运行状态,在 comfy 服务的运行状态,可以看到生图的进度,在 ngrok 服务的状态,可以看到 http request 状态纪录滚动。只要这俩货正常,等着就行了。这就是生图的结果:

2.2 API 访问

​ 有很多访问 comfy API 的客户端库,比如 comfyui_xy,comfy-api-client 等,我们选择简单的 comfyui_xy。用 pip 在客户端安装 comfyui_xy,然后运行这段代码:

import json from comfyui_api import ComfyUiClient # 将下面的 URL 替换为你实际的 ngrok 地址 client = ComfyUiClient(url="https://****.ngrok-free.dev") # 加载从 ComfyUI 导出的 API 格式工作流 JSON 文件 with open("workflow_api.json", "r", encoding="utf-8") as f: workflow = json.load(f) # 假设节点 ID 是 "3" # workflow["3"]["inputs"]["text"] = "一只在海边沙滩上奔跑的斑点狗,远处是大海,近处有几只螃蟹,右边是几棵椰子树" # 4. 执行工作流并等待结果 print("正在生成图片...") results = client.process_workflow(workflow) # 5. 保存生成的图片 for i, result in enumerate(results): print(f"生成文件: {result.filename}") result.save(f"output_{i}.png") # 如果是在 Jupyter 环境中,可以用 result.show() 直接预览

这里使用的 workflow_api.json 是 API 调用优化的“执行文件”。它去掉了界面布局相关的信息,只保留了生成图片所必需的节点类型(class_type)、节点输入(inputs)和节点间的连接,结构更精简,传输效率更高。它和放在 user/default/workflows/ 目录下的那个 workflow 不一样,不要用错了。我们要用的 workflow_api.json 要由 ComfyUI 生成。具体方法是在 ComfyUI 界面上点击左下角的“设置”图标(齿轮图标),在设置界面上打开"Enable Dev Mode Options"(启用开发者模式选项)。关闭设置窗口后,顶部菜单栏,点击 “图形(工作流操作)”,再弹出的菜单中选择“导出(API)”:

浏览器会下载这个文件,另存为 workflow_api.json,放在当前代码目录中(或者其他可访问到的地方)。关于关于提示词和模型推理参数的设置,都在这个文件中,可以直接修改文件,也可以在代码中对workflow 对象进行赋值。比如注释中的代码就是修改提示词例子。至于节点 ID,也是取决于你的 workflow_api.json 文件内容,打开文件,看看要修改的内容是哪个节点就可以了。

3 总结

​ 本次试验的结果符合设想的预期,即使用 AMD 的免费云算力,私有部署私有大模型,并远程访问大模型的道路是通的。我们不仅试验了 ComfyUI 图形界面操作,也试验了通过 comfy API 编写代码生成图像。这里的关键点除了使用 ngrok 打通网络之外,还有就是 ComfyUI 的部署不能完全按照文档的操作进行,因为切片上 ROCm 版本的特殊性,要利用切片环境上已经装好的 ROCm 环境。

参考资料

[1] ComfyUI 帮助
[2] 伍斌:《白嫖48G显存跑DeepSeek!ADM云GPU私有化部署实战》

http://www.jsqmd.com/news/1069248/

相关文章:

  • Windows系统文件d3d10core.dll丢失找不到问题解决
  • Godot 4.x 源码一级目录结构深度解读
  • 机器到底能不能做漆器?一手实测记录
  • Switch手柄连接电脑终极方案:一键解决所有兼容性问题
  • 微信智能客服如何避免“答非所问”与“消息漏回”?
  • 基于区块链浏览器的USDT链上交易追踪方法:以一起资金案件为例
  • 盟接之桥:看似简单实则关键,EDI对接前必须厘清的四大核心问题
  • Zetasizer下载安装教程(附安装包)Zetasizer Software超详细图文安装教程
  • 小红书内容下载器终极指南:3种高效方法快速保存小红书作品
  • Listen1:一站式音乐聚合解决方案的技术架构与应用实践
  • AlwaysOnTop:Windows窗口置顶工具的终极指南,彻底告别窗口遮挡烦恼
  • 【共创季稿事节】鸿蒙原生ArkTS布局方式之List+LazyForEach懒加载布局
  • 开源 AI 工具链:从碎片化拼装到极简编排的工程实践
  • 终极指南:联想拯救者工具箱如何彻底改变你的游戏本体验
  • AI领域简报(2026年6月16日—22日)
  • LLM中间层计算:为何不涉+1位置激活?
  • 网贷催收维权场景实测,复盘法务数字人 C 端落地实用性
  • 终极指南:5步快速解锁中兴光猫工厂模式,获取永久Telnet权限
  • 网盘直链下载助手:5分钟告别限速,实现免客户端高速下载
  • WarcraftHelper魔兽辅助工具:解决经典游戏在现代电脑上的兼容性问题
  • StringBuilder vs StringBuffer:2026年还需要线程安全字符串吗?
  • 2026年永康木门十大品牌,谁才是真专业?
  • C#:正则表达式与有限性验证
  • 软件许可证不够用怎么办?试试“许可复用“,一份许可多人干活
  • 微信聊天记录删了还能恢复吗?官方免费方法 + 专业第三方恢复渠道详解
  • GEO优化实战指南:外贸独立站AI搜索可见性提升方案
  • 计算机毕业设计之jsp广金二手竞价交易系统
  • Strix Halo 架构下运行大模型的能效比分析
  • 如何高效使用B站购票自动化工具:biliTickerBuy完整实战指南
  • ViGEmBus内核级虚拟设备驱动技术架构深度解析