AI绘画工作流:OpenClaw+nanobot自动批量处理SD生成图片
AI绘画工作流:OpenClaw+nanobot自动批量处理SD生成图片
1. 为什么需要自动化绘画流水线
作为一名经常使用Stable Diffusion生成图片的内容创作者,我发现自己80%的时间都花在了重复性劳动上:手动调用API、下载图片、重命名文件、添加水印、调整尺寸和压缩。这些机械操作不仅枯燥,还容易出错——我曾多次因为命名混乱找不到特定风格的图片,也遇到过水印位置不一致影响作品集美观度的问题。
直到发现OpenClaw+nanobot这个组合,才真正实现了"生成即成品"的自动化流程。现在只需一个自然语言指令,系统就能自动完成从生成到归档的全过程。最让我惊喜的是,这套方案完全运行在本地环境,既保护了作品隐私,又能24小时不间断工作——有次我睡前提交了50张图的生成任务,第二天起床就看到了整理好的成品文件夹。
2. 核心组件搭建
2.1 硬件与基础环境
我的工作机是配备M1 Pro芯片的MacBook Pro,系统为macOS Sonoma 14.5。虽然nanobot对配置要求不高,但考虑到要同时运行Stable Diffusion和图像处理流程,建议至少满足:
- 内存:16GB以上(处理高分辨率图片时占用较大)
- 存储:500GB可用空间(原始图片和中间文件很占空间)
- 网络:稳定连接(调用云端SD API时需要)
2.2 关键软件组件
OpenClaw核心框架:通过Homebrew安装的v0.8.3版本,作为整个自动化流程的中枢神经系统。它负责接收指令、协调各组件工作,并监控任务状态。
brew install openclaw openclaw --version # 验证安装nanobot轻量引擎:使用平台提供的预置镜像快速部署。这个基于Qwen3-4B模型的智能体特别擅长理解创作类指令,能准确解析"生成赛博朋克风格角色图,尺寸1024x768,每天3张"这样的复杂需求。
docker pull registry.cn-hangzhou.aliyuncs.com/cloud-native/nanobot:latest docker run -p 8000:8000 -v ~/nanobot_data:/data nanobotStable Diffusion API:我使用的是本地部署的Automatic1111 WebUI的API接口,地址为http://localhost:7860/sdapi/v1/txt2img。如果读者没有本地环境,也可以替换成任何兼容的云端API服务。
3. 自动化流水线搭建实战
3.1 初始化配置
首先在OpenClaw配置文件中声明各服务端点。编辑~/.openclaw/openclaw.json:
{ "models": { "providers": { "nanobot": { "baseUrl": "http://localhost:8000", "api": "openai-completions", "models": [{ "id": "qwen3-4b-instruct", "name": "Nanobot Qwen" }] } } }, "tools": { "stable_diffusion": { "api_url": "http://localhost:7860/sdapi/v1/txt2img", "default_params": { "width": 512, "height": 512, "steps": 28 } } } }然后注册图片处理技能。这个自定义模块包含水印添加、尺寸调整和压缩逻辑:
clawhub install image-processor clawhub skills enable image-processor3.2 核心工作流设计
整个自动化流程分为四个阶段,通过OpenClaw的pipeline功能串联:
- 需求解析:nanobot将自然语言转换为结构化参数
- 图片生成:调用Stable Diffusion API并监控进度
- 后处理:添加水印、调整尺寸、压缩图片
- 归档存储:按日期-主题分类存储,生成元数据文件
创建~/openclaw/pipelines/artwork.yaml定义流程:
name: "AI Artwork Pipeline" steps: - type: "llm" task: "解析用户需求为SD参数" model: "nanobot" - type: "api" task: "调用Stable Diffusion生成图片" endpoint: "{{sd_api}}" save_to: "/tmp/raw_images" - type: "skill" task: "图片后处理" name: "image-processor" params: watermark: "assets/watermark.png" quality: 85 - type: "fs" task: "归档成品" actions: - move: "{{output_dir}}/{{date}}/{{theme}}" - write_meta: "description.txt"3.3 水印与样式配置
在assets/目录下准备:
watermark.png:半透明LOGO图片(建议200x60像素)style_presets.json:预置的风格参数,如:
{ "cyberpunk": { "prompt_suffix": "neon lights, rainy night, cyberpunk style", "sampler": "DPM++ 2M Karras", "cfg_scale": 7 }, "watercolor": { "prompt_suffix": "watercolor painting texture", "negative_prompt": "photorealistic, 3d render" } }4. 实战效果与优化心得
启动流水线只需在OpenClaw控制台输入:
开始执行艺术创作流程:生成3张赛博朋克风格角色立绘,女性主角,添加水印系统会依次完成:
- 通过nanobot解析出具体参数(包括自动补全的negative prompt)
- 调用SD API生成1920x1080分辨率图片
- 在右下角添加水印并压缩到1500x844尺寸
- 按
2024-03-15/cyberpunk目录结构存储 - 在description.txt中记录生成参数和耗时
性能数据:
- 单张图片处理耗时:约2.5分钟(生成+后处理)
- 内存占用峰值:9.8GB(处理4K图片时)
- 平均Token消耗:约1200 tokens/张
踩坑记录:
- 水印位置问题:最初使用绝对坐标导致不同尺寸图片水印偏移,改为相对右下角10%位置后解决
- 文件名冲突:后来增加了
时间戳+hash的命名方案避免覆盖 - 颜色失真:发现压缩时默认参数导致渐变色带,调整libjpeg参数后改善
5. 进阶技巧与扩展方向
这套基础框架可以根据需求无限扩展。我的当前版本已经增加了:
- 自动标签生成:通过BLIP模型分析图片内容生成关键词标签
- 风格一致性维护:使用LoRA保证系列作品的统一画风
- 异常重试机制:当SD API超时时自动降级重试
对于想要更复杂工作流的开发者,建议考虑:
- 将nanobot替换为更高性能的本地模型(如Qwen-72B)
- 增加NSFW过滤层避免生成违规内容
- 集成CDN上传工具实现发布自动化
最让我满意的是这套方案的弹性——上周我需要批量生成产品包装设计,只需在原有流程上增加一个"背景透明化"处理步骤,半小时就完成了适配。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。
