当前位置：首页 > news >正文

Z-Image-Turbo自动化生成，Python脚本调用示例

news 2026/3/26 18:36:07

Z-Image-Turbo自动化生成，Python脚本调用示例

你是否还在手动点击UI界面生成图片？每次调整提示词都要重新打开浏览器、输入参数、等待加载？如果你已经熟悉了Z-Image-Turbo的基本使用，是时候迈出下一步：用Python脚本实现自动化图像生成。

本文将带你从零开始，掌握如何通过代码远程控制Z-Image-Turbo_UI界面，完成批量出图、动态参数替换、任务调度等高阶操作。无需深入模型架构，也不用研究底层推理逻辑——只要会写几行Python，就能让AI为你打工。

更重要的是，整个过程完全基于本地部署，不依赖任何云服务，数据安全可控，适合企业级应用和私有化部署场景。

1. 理解Z-Image-Turbo的运行机制

在动手写代码之前，先搞清楚这个模型是怎么工作的。这能帮你避免90%的常见错误。

1.1 模型启动后发生了什么？

当你执行下面这条命令：

python /Z-Image-Turbo_gradio_ui.py

系统实际上做了三件事：

加载预训练模型权重（.safetensors文件）
启动一个Gradio Web服务
监听127.0.0.1:7860端口，提供可视化交互界面

这意味着：模型本身是一个Web应用，而我们写的Python脚本，本质上是向这个Web服务发送HTTP请求。

1.2 UI界面背后的API逻辑

虽然官方文档没有明确开放API接口，但Gradio框架默认支持一种“隐藏”的编程访问方式——通过/queue/join接口提交任务，并监听结果。

不过更推荐的做法是：改用ComfyUI或自定义Flask/FastAPI中间层进行封装，这样更容易实现结构化调用。但为了保持与当前镜像的一致性，我们将采用直接模拟用户行为的方式，通过Selenium或Requests结合Session维持会话状态。

但由于该镜像为标准Gradio UI，其内部通信仍可通过分析前端请求来逆向调用。因此，最佳实践是启用Gradio的api_open=True选项（若支持），否则需借助浏览器自动化工具。

注意：当前镜像未显式开启REST API模式，所以我们需要退一步，采用“模拟点击”策略，确保兼容性和稳定性。

2. 准备自动化运行环境

要让Python脚本能顺利驱动Z-Image-Turbo，必须先搭建好基础环境。

2.1 安装必要依赖库

打开终端，安装以下Python包：

pip install requests selenium webdriver-manager beautifulsoup4 lxml

requests：用于发送HTTP请求
selenium+webdriver-manager：模拟浏览器操作
beautifulsoup4：解析页面内容（可选）

2.2 确认服务已正常启动

确保你在后台已经运行了模型服务：

python /Z-Image-Turbo_gradio_ui.py

当看到类似如下输出时，说明服务已就绪：

Running on local URL: http://127.0.0.1:7860

此时你可以手动访问http://localhost:7860验证页面是否加载成功。

3. 编写第一个自动化脚本

现在我们来写一个最简单的脚本：自动填写提示词并触发图像生成。

3.1 使用Selenium模拟用户操作

from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.chrome.service import Service from selenium.webdriver.chrome.options import Options from webdriver_manager.chrome import ChromeDriverManager import time # 设置无头浏览器（可选） chrome_options = Options() # chrome_options.add_argument("--headless") # 取消注释以静默运行 chrome_options.add_argument("--no-sandbox") chrome_options.add_argument("--disable-dev-shm-usage") # 启动浏览器 driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=chrome_options) try: # 访问Z-Image-Turbo UI driver.get("http://localhost:7860") time.sleep(5) # 等待页面加载 # 找到正向提示词输入框（根据实际HTML结构调整） prompt_input = driver.find_element(By.XPATH, '//textarea[@placeholder="Enter your prompt..."]') prompt_input.clear() prompt_input.send_keys("a beautiful garden with cherry blossoms, sunlight filtering through leaves, ultra-detailed, 4K") # 找到负向提示词输入框 negative_prompt_input = driver.find_element(By.XPATH, '//textarea[@placeholder="Enter negative prompt..."]') negative_prompt_input.clear() negative_prompt_input.send_keys("blurry, low quality, overexposed") # 点击生成按钮 generate_button = driver.find_element(By.XPATH, '//button[contains(text(), "Generate")]') generate_button.click() print(" 图像生成任务已提交，正在等待结果...") # 等待生成完成（可根据进度条或输出区域判断） time.sleep(30) # 根据硬件性能调整等待时间 # 可选：截图保存结果 driver.save_screenshot("z_image_turbo_result.png") print("📸 结果已截图保存") finally: driver.quit()

3.2 脚本说明

XPATH定位：由于Gradio生成的DOM结构较为复杂，建议使用//textarea[@placeholder="..."]这类属性匹配方式。
等待机制：time.sleep()是最简单的方法，但在生产环境中建议使用WebDriverWait配合元素可见性判断。
扩展性：你可以将提示词作为函数参数传入，实现多轮调用。

4. 实现批量生成与参数循环

单张图太不过瘾？我们可以轻松扩展成批量生成系统。

4.1 构建提示词模板库

prompts = [ { "positive": "cyberpunk city at night, neon lights, rain-soaked streets, cinematic lighting", "negative": "daylight, flat lighting, cartoonish" }, { "positive": "mountain lake at sunrise, mist rising, pine trees reflection, peaceful", "negative": "pollution, buildings, people" }, { "positive": "futuristic library, floating books, glowing shelves, soft ambient light", "negative": "cluttered, dark, broken furniture" } ]

4.2 批量执行函数

def batch_generate(prompts, delay=30): driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()), options=chrome_options) try: driver.get("http://localhost:7860") time.sleep(5) for i, p in enumerate(prompts): print(f" 正在生成第 {i+1}/{len(prompts)} 张图像...") # 填写提示词 prompt_input = driver.find_element(By.XPATH, '//textarea[@placeholder="Enter your prompt..."]') prompt_input.clear() prompt_input.send_keys(p["positive"]) negative_prompt_input = driver.find_element(By.XPATH, '//textarea[@placeholder="Enter negative prompt..."]') negative_prompt_input.clear() negative_prompt_input.send_keys(p["negative"]) # 点击生成 generate_button = driver.find_element(By.XPATH, '//button[contains(text(), "Generate")]') generate_button.click() # 等待生成完成 time.sleep(delay) # 截图命名区分 driver.save_screenshot(f"result_{i+1}.png") print(" 所有图像生成完毕！") finally: driver.quit()

调用它：

batch_generate(prompts, delay=25)

5. 自动化查看与管理生成结果

生成完图片后，你还得知道它们去哪儿了。

5.1 查看历史生成图片路径

根据文档，所有输出图片默认保存在：

~/workspace/output_image/

你可以在脚本中加入检查逻辑：

import os output_dir = "/root/workspace/output_image" if os.path.exists(output_dir): files = sorted(os.listdir(output_dir), key=lambda x: os.path.getctime(os.path.join(output_dir, x)), reverse=True) print("📄 最近生成的5张图片：") for f in files[:5]: print(f" - {f}") else: print("❌ 输出目录不存在，请检查路径")

5.2 清理旧文件防止磁盘占满

定期清理是个好习惯：

def clean_old_images(keep_last_n=50): files = sorted( [os.path.join(output_dir, f) for f in os.listdir(output_dir)], key=os.path.getctime, reverse=True ) to_delete = files[keep_last_n:] for file_path in to_delete: os.remove(file_path) print(f"🗑 删除旧文件: {file_path}") # 调用清理函数 clean_old_images(keep_last=30)

6. 提升效率的实用技巧

别让自动化变成“慢速自动化”。以下是几个关键优化建议。

6.1 固定分辨率减少计算负担

在UI中提前设置常用尺寸，如1024x1024或768x512，并在脚本中避免频繁切换。可以在页面加载后自动选择下拉菜单项：

resolution_select = driver.find_element(By.XPATH, '//select[@id="resolution"]') from selenium.webdriver.support.ui import Select Select(resolution_select).select_by_value("1024x1024")

6.2 使用显存优化参数

如果你的显卡是16G消费级（如RTX 3090/4090），建议在启动模型时添加低显存模式：

python /Z-Image-Turbo_gradio_ui.py --medvram

这能让模型在有限资源下更稳定运行，尤其适合长时间批量任务。

6.3 日志记录与异常处理

增强脚本健壮性：

import logging logging.basicConfig( level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s', handlers=[logging.FileHandler("automation.log"), logging.StreamHandler()] ) try: batch_generate(prompts) except Exception as e: logging.error(f"自动化任务失败: {str(e)}")